ORGANIZACIÓN DE LAS VARIABLES O DATOS:
Una vez recolectados los datos (variables) de una muestra se deben organizar u ordenar las variables, lo cual se lleva a cabo por medio de tablas, las cuales son de dos tipos:
- Tablas de datos simples y
- Tablas de datos agrupados en intervalos.
Dependiendo la variable a tabular (cuantitativas o cualitativas), estas tablas tienen algunas variables así.
.- Tablas de datos simples para variables cuantitativas discretas o discontinuas:
Estas tablas de datos simples se usan para organizar variables cuantitativas discretas o discontinuas, en la cual se organizan en columnas teniendo en cuenta las variables, las frecuencias absolutas, frecuencia absoluta acumulada y frecuencia relativa, así:
- Variables o datos: en las tablas simples se designan con X y un subíndice según el número del dato que le corresponda: X1, X2, X3…. Xn, donde n es número de datos. En forma genérica se designa en el encabezado de la tabla como Xi
- Frecuencia absoluta de cada variable o dato: corresponde al número de veces que se repite el dato en la serie de datos recolectados, lo cual se designa con la letra f y un subíndice que corresponden al mismo de la variable: f1, f2, f3…. fn, donde n es número de datos y por tanto la sumatoria de todas las frecuencias absolutas es igual a n (total de datos). En forma genérica se designa en el encabezado de la tabla como fi
- Frecuencia absoluta acumulada de las variables: corresponde a la frecuencia absoluta de cada variable más el acumulado de las anteriores y se utiliza para el cálculo de la mediana, los cuartiles, deciles y percentiles, lo cual se designa con la letra F y un subíndice que corresponden al mismo de la variable: F1, F2, F3…. Fn, donde n es número de datos y por tanto el valor de la frecuencia absoluta acumulada de la variable Xn o sea Fn es igual a n. En forma genérica se designa en el encabezado de la tabla como Fi
- Frecuencia relativa de las variables: corresponde a la proporción de la frecuencia de la variable entre todas las variables y se calcula dividiendo la frecuencia absoluta de la variable entre el número de datos (fi/n), cuyo valor puede registrarse como numero o como porcentaje, lo cual se designa con la letra h y un subíndice que corresponden al mismo de la variable: h1, h2, h3…. hn, donde n es número de datos. La suma de todas las frecuencias relativas debe ser igual a 1 o al 100% según como se exprese. En forma genérica se designa en el encabezado de la tabla como hi.
- Frecuencia relativa acumulada de las variables: corresponde a la frecuencia relativa de cada variable más el acumulado de las anteriores, lo cual se designa con la letra H y un subíndice que corresponden al mismo de la variable: H1, H2, H3…. Hn, donde n es número de datos y por tanto el valor de la frecuencia absoluta acumulada de la variable Xn o sea Hn es igual a 1 o 100%. En forma genérica se designa en el encabezado de la tabla como Hi.
.- Tablas de datos simples para variables cualitativas:
Son iguales que para las variables cuantitativas discretas, pero con las siguientes diferencias:
- La primera columna (Xi) corresponde a la descripción de la variable (nacionalidad, color de la piel, años escolares, etc.).
- No se calcula las frecuencias absolutas acumuladas ni las frecuencias relativas acumuladas, porque no es posible ordenar de menor a mayores datos no numéricos (se ordenan aleatoriamente por cada investigador).
.- Tabla de datos agrupados en intervalos para variables cuantitativas continuas
Estas tablas de datos agrupados en intervalos se usan para organizar variables cuantitativas continuas o también para variables cuantitativas discontinuas cuando los datos están muy dispersos o las frecuencias absolutas son muy bajas.
Para organizar los datos se sigue los siguientes pasos:
- Organizar los intervalos o clases: de un determinado valor (arbitrario) el cual debe estar abierto por la derecha, que se representa como [a,b[, que se explica : a ≤ Xi < b
- Calcular la marca de clase: el cual corresponde al promedio de los dos extremos del intervalo, calculándose (a+b)/2, el cual se representa como Xi (tal como se identifica la variable en las tablas de datos simples). La importancia de calcular la marca de clase se debe a que gracias a ésta el manejo de este tipo de tablas en lo sucesivo es homologado al manejo de las tablas de datos simples.
- Luego se obtienen los mismos datos de las tablas de datos simples o sea las frecuencias absolutas, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa acumulada, utilizando la misma nomenclatura.
Ejemplo: Las pesos de los alumnos de una clase son: 45.4, 55,2, 49, 51,3, 52, 54, 56.2, 50.2, 48,3, 51.3, 46.2, 53.1, 52.9, 50, 50.6, 59.8, 53.9, 52.4, 53.9, 48.4
1). Organizar intervalos de 3 unidades (arbitrariamente): [45,48[, [48,51[, [51,54[, [54,57[ y [57,60[.
2). Luego calculamos la marca de clase o sea la Xi: (45+48)/2 = 46.5……….
3). Luego calculamos fi, Fi , la hi y Hi.