Distribuciones de Frecuencia
Concepto de Estadística y su clasificacion recopilacion de datos
La estadística es la ciencia que se encarga de recopilar, organizar, procesar, analizar e interpretar datos con el fin de deducir las características de un grupo o población objetivo, su importancia radica en que es una fuente de información altamente confiable para la toma de decisiones.
Distribución de Frecuencia
Una distribución de frecuencias en estadística se refiere a la tendencia que siguen los datos organizados en grupos, categorías o clases, cuando a cada una se le asigna un número denominado frecuencia, el cual indica cuántos datos hay en cada grupo.
Histograma, polígonos de frecuencia
Un gráfico de ojiva traza la frecuencia acumulada en el eje y y los límites de clase a lo largo del eje x. Es muy similar a un histograma, solo que en lugar de rectángulos, una ojiva tiene una marca de un solo punto donde estaría la parte superior derecha del rectángulo.
Medidas de tendencia central para un conjunto de datos y datos agrupados
Las medidas de tendencia central señalan el valor alrededor del cual están los datos de una distribución. La más conocida es el promedio o media aritmética, que consiste en sumar todos los valores y dividir el resultado entre el número total de datos. Sin embargo, si la distribución consta de un gran número de valores y no se presentan de un modo ordenado, no resulta fácil realizar los cálculos necesarios para extraer la información valiosa que contienen.
Media, Media Ponderada
La media ponderada es una medida de posición central de la estadística descriptiva. Para calcular la media ponderada primero se debe multiplicar cada dato estadístico por su ponderación (o peso), luego sumar todos los productos, y finalmente dividir la suma ponderada entre la suma de todos los pesos.
FORMULA:
Para calcular la media ponderada se deben hacer los siguientes pasos:
Multiplicar cada dato estadístico por su peso correspondiente.
Sumar todos los productos calculados en el paso anterior.
Dividir la suma ponderada anterior entre la suma de todos los pesos.
El resultado obtenido es la media ponderada de la muestra estadística.
Mediana, Moda
La mediana, junto con la media y la varianza es un estadístico muy ilustrativo de una distribución. Al contrario que la media que puede estar desplazada hacia un lado o a otro, según la distribución, la mediana siempre se sitúa en el centro de esta.
La moda es una medida de tendencia central que indica el valor que más se repite en un grupo de números. En un mismo estudio puede haber más de una moda, esto ocurre cuando dos (bimodal) o más números (multimodal) se repiten la misma cantidad de veces siendo este es el máximo número de veces del conjunto.
Relacion entre Media, Mediana y Moda
La media se calcula sumando todos los valores de los datos y luego dividiendo por el número total de valores.
La mediana se calcula enumerando los valores de los datos en orden ascendente y luego encontrando el valor medio en la lista.
La moda se calcula contando cuantas veces ocurre cada valor. El valor que se presenta con mayor frecuencia es la moda.
En estadística, existe una relación entre la media, la mediana y la moda que tiene una base empírica. Las observaciones de innumerables conjuntos de datos han demostrado que la mayor parte del tiempo la diferencia entre la media y la moda es tres veces la diferencia entre la media y la mediana.
Medidas de Dispersión para un conjunto de datos y datos grupales
Las medidas de dispersión son las siguientes:
Desviación estándar (o desviación típica)
Varianza
Coeficiente de variación
Rango
Rango intercuartil
Desviación media
Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el coeficiente de variación (no confundir con coeficiente de determinación).
Rango y Dispersión media
El rango en estadística es un valor numérico que indica la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos1,2,3,4,5. El rango muestra la dispersión total o la distribución de los valores en una muestra o una población1,3,4.
La desviación media de un conjunto de datos es la media de las desviaciones absolutas, por lo tanto, la desviación media es igual al sumatorio de las desviaciones de cada dato respecto a la media aritmética dividido entre el número total de datos.Calcular la media aritmética del conjunto de datos estadísticos.
Calcular la desviación de cada dato respecto a la media, definido como el valor absoluto de la diferencia entre el dato y la media.
Sumar todas las desviaciones calculadas en el paso anterior.
Varianza, Desviación Estándar
varianza es una medida de dispersión que indica la variabilidad de una variable aleatoria. La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones.
Ten en cuenta que como residuo se entiende la diferencia entre el valor de un dato estadístico y la media del conjunto de datos.
En la teoría de la probabilidad, el símbolo de la varianza es la letra griega sigma elevada al cuadrado (σ2). Aunque también se suele representar como Var(X), siendo X la variable aleatoria de la cual se calcula la varianza.
Para calcular la varianza se deben hacer los siguientes pasos:
Hallar la media aritmética del conjunto de datos.
Calcular los residuos, definidos como la diferencia entre los valores y la media del conjunto de datos.
Elevar cada residuo al cuadrado.
Sumar todos los resultados calculados en el paso anterior.
La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución.
Coeficiente deVariacion
El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos.
Caracteristicas
Las características del coeficiente de variación son las siguientes:
El coeficiente de variación no posee unidades, es decir, es adimensional.
El coeficiente de variación depende de la desviación típica (o desviación estándar) y de la media del conjunto de datos.
En general, el coeficiente de variación suele ser menor que 1. Sin embargo, en algunas distribuciones de probabilidad puede llegar a ser 1 o más grande.
Para la correcta interpretación del coeficiente de variación todos los datos deben ser positivos. De este modo la media también será positiva.
Coeficiente de Asimetria de Pearson
El coeficiente de asimetría de Pearson es un coeficiente estadístico que permite determinar la asimetría de una distribución. Es decir, en estadística el coeficiente de asimetría de Pearson sirve para saber si una distribución es asimétrica positiva, asimétrica negativa o simétrica.
Ten en cuenta que en estadística hay más coeficientes de asimetría, como por ejemplo el coeficiente de Fisher o el coeficiente de Bowley. Lógicamente cada tipo de coeficiente de asimetría se calcula de manera diferente y es más o menos útil dependiendo de las características del conjunto de datos.