U4 Estadística
Concepto de población
Muestra aleatoria
Datos discretos y continuos
Fiabilidad de fuentes y sesgo de muestreo
Interpretación de valores atípicos
Presentación de datos.
Distribuciones de frecuencias
Histogramas
Frecuencia Acumulada (para hallar mediana)
Cuartiles y percentiles.
Valores que dividen al conjunto de datos en cuatro partes iguales. Estos valores, denotados Q1, Q2 y Q3 son el primero, segundo y tercer cuartiles, respectivamente; el valor Q2 coincide con la mediana.
Diagrama de caja y bigote
Correlación lineal
bidimensional
Coeficiente de Pearson r
(Solo sentido en correlaciones lineales)
Valores críticos de r
Diagrama de dispersión
(Ajuste óptimo pasa por la media)
Positiva, negativa,
fuerte, débil, sin correlación
Ecuación de la recta de regresión
para hacer predicciones
y = ax+b
significado a y b
Medidas de Dispersión
RIC
Rango Intercuartil, es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1)
Desviación típica
Varianza(cuadrado de la desviación típica)
Si sumo o resto un valor a cada dato la media aumenta o disminuye en ese valor, pero la des. tip. no varía
Si multiplico cada dato por un valor, la media y la des. tip se multiplica o divide por ese valor
Medidas de centralización
Mediana
La mediana de un conjunto de números acomodados en orden de magnitud (es decir, en una ordenación) es el valor central o la media de los dos valores centrales.
Media
Moda
De un conjunto de números es el valor que se presenta con más frecuencia. Puede no haber moda y cuando la hay, puede no ser única.
Clase moda
Si los datos están agrupados, la clase de mayor frecuencia se llama clase modal. A veces se toma la marca de clase de la clase modal como valor de la modal