Estadística descriptiva.
Representación de datos descriptivos

Representación gráfica

Una vez recopilada la información, es necesario presentarla de forma organizada y comprensible. La forma más fácil de conseguirlo es utilizar una Tabla, que muestre las variables, las categorías de cada variable y el número de sucesos por categoría.

Medidas de dispersió

Una vez definidos los valores de la variable en torno a los cuales tienden a
concentrarse las observaciones, el siguiente planteamiento es describir cómo
de agrupados o dispersos se encuentran los datos de la muestra en torno a esos
valores,

Diagrama de barras

Se utiliza para variables cualitativas y cuantitativas discretas, y se construyen
de forma similar al histograma, pero las barras están separadas entre sí (indicando que la variable no ocupa todo el eje de abscisas, precisamente por ser discreta o cualitativa). El diagrama de barras compuesto representa dos o más variables en el mismo gráfico

Gráfico circular o de sectores

Es otro método empleado con frecuencia para datos cualitativos, en el que
un círculo representa el total, y un segmento o porción del pastel es la proporción o porcentaje de cada categoría de la variable (figura 24). Es el gráfico adecuado para variables con categorías mutuamente excluyentes (no se puede estar
soltero y casado a la vez).

Histograma

Se utiliza para variables cuantitativas continuas. En el eje x se muestran los
datos de la variable, que por ser continuos requieren ser agrupados previamente en intervalos, y en el eje y se representa la frecuencia con la que aparece cada dato. La anchura del intervalo y la altura que alcanza determinan el
área de cada intervalo, que es proporcional a la frecuencia de cada intervalo.
Da una idea muy aproximada de la forma de la distribución que sigue la variable

Polígono de frecuencias

Se utiliza la misma escala que el histograma para crear un polígono de frecuencias, uniendo los puntos medios de las áreas más altas de los rectángulos (mostrado en la figura 20). Como en el histograma, el área bajo el polígono es el valor más significativo y equivale al área del histograma correspondiente. En el polígono de frecuencias acumuladas, la frecuencia de cada intervalo se suma a las de los intervalos anteriores utilizando una línea para representar las frecuencias cada vez más acumuladas.

medidas de centralización

Las medidas de centralización definen los valores de la variable en torno a los
cuáles tienden a concentrarse las observaciones. Son: media, mediana, moda y
los cuartiles, deciles y percentiles

La media geometrica

MEDIA

Mediana

la media aritmética es la medida de centralización más conocida y
utilizada. Se calcula sumando todos los valores observados y dividiendo
por el número de observaciones de la muestra. Se representa como x

la media aritmética es la medida de centralización más conocida y
utilizada. Se calcula sumando todos los valores observados y dividiendo
por el número de observaciones de la muestra. Se representa como x

La medida de tendencia central más conocida y utilizada es la media aritmética. Se obtiene sumando todos los valores observados y dividiéndolos por el número de observaciones de la muestra, representado como x.

Moda

la moda es el valor que se observa con más frecuencia, el más
repetido. En el ejemplo anterior, (3 + 3 + 3 + 4 + 7 + 9 + 11 + 12) la moda
es 3 por ser el valor más repetido. Si no se repite ningún valor, la muestra
no tiene moda, es amodal.

Cuartiles, Deciles, Percentiles

son medidas de localización, pero no central,
sino que localizan otros puntos de una distribución. Los cuartiles dividen
los datos en cuatro partes iguales, los deciles en diez partes iguales y los
percentiles, en cien partes iguales.

Gráfico de caja

Sirve para representar variables cualitativas en escala ordinal y cuantitativas
discretas. Se construye un rectángulo de altura igual al recorrido intercuartílico,
dentro se traza un segmento en el punto correspondiente a la mediana y se
define los valores adyacentes o bigotes: el valor adyacente inferior es el valor
más pequeño de la distribución.