Gráfico de caja
Sirve para representar variables cualitativas en escala ordinal y cuantitativas
discretas. Se construye un rectángulo de altura igual al recorrido intercuartílico,
dentro se traza un segmento en el punto correspondiente a la mediana y se
define los valores adyacentes o bigotes: el valor adyacente inferior es el valor
más pequeño de la distribución.
Cuartiles, Deciles, Percentiles
son medidas de localización, pero no central,
sino que localizan otros puntos de una distribución. Los cuartiles dividen
los datos en cuatro partes iguales, los deciles en diez partes iguales y los
percentiles, en cien partes iguales.
Moda
la moda es el valor que se observa con más frecuencia, el más
repetido. En el ejemplo anterior, (3 + 3 + 3 + 4 + 7 + 9 + 11 + 12) la moda
es 3 por ser el valor más repetido. Si no se repite ningún valor, la muestra
no tiene moda, es amodal.
La medida de tendencia central más conocida y utilizada es la media aritmética. Se obtiene sumando todos los valores observados y dividiéndolos por el número de observaciones de la muestra, representado como x.
Estadística descriptiva.
Representación de datos descriptivos
medidas de centralización
Las medidas de centralización definen los valores de la variable en torno a los
cuáles tienden a concentrarse las observaciones. Son: media, mediana, moda y
los cuartiles, deciles y percentiles
La media geometrica
Mediana
la media aritmética es la medida de centralización más conocida y
utilizada. Se calcula sumando todos los valores observados y dividiendo
por el número de observaciones de la muestra. Se representa como x
MEDIA
Polígono de frecuencias
Se utiliza la misma escala que el histograma para crear un polígono de frecuencias, uniendo los puntos medios de las áreas más altas de los rectángulos (mostrado en la figura 20). Como en el histograma, el área bajo el polígono es el valor más significativo y equivale al área del histograma correspondiente. En el polígono de frecuencias acumuladas, la frecuencia de cada intervalo se suma a las de los intervalos anteriores utilizando una línea para representar las frecuencias cada vez más acumuladas.
Histograma
Se utiliza para variables cuantitativas continuas. En el eje x se muestran los
datos de la variable, que por ser continuos requieren ser agrupados previamente en intervalos, y en el eje y se representa la frecuencia con la que aparece cada dato. La anchura del intervalo y la altura que alcanza determinan el
área de cada intervalo, que es proporcional a la frecuencia de cada intervalo.
Da una idea muy aproximada de la forma de la distribución que sigue la variable
Gráfico circular o de sectores
Es otro método empleado con frecuencia para datos cualitativos, en el que
un círculo representa el total, y un segmento o porción del pastel es la proporción o porcentaje de cada categoría de la variable (figura 24). Es el gráfico adecuado para variables con categorías mutuamente excluyentes (no se puede estar
soltero y casado a la vez).
Diagrama de barras
Se utiliza para variables cualitativas y cuantitativas discretas, y se construyen
de forma similar al histograma, pero las barras están separadas entre sí (indicando que la variable no ocupa todo el eje de abscisas, precisamente por ser discreta o cualitativa). El diagrama de barras compuesto representa dos o más variables en el mismo gráfico
Medidas de dispersió
Una vez definidos los valores de la variable en torno a los cuales tienden a
concentrarse las observaciones, el siguiente planteamiento es describir cómo
de agrupados o dispersos se encuentran los datos de la muestra en torno a esos
valores,
Representación gráfica
Una vez recopilada la información, es necesario presentarla de forma organizada y comprensible. La forma más fácil de conseguirlo es utilizar una Tabla, que muestre las variables, las categorías de cada variable y el número de sucesos por categoría.