Estadística
Estadística descriptiva
Medidas descriptivas
Distribucion de frecuencia
conjunto de puntuaciones ordenadas en sus respectivas categorías o valores.
Distribucion de frecuencias simples
1ºSe odenan los datos de menor a mayor
2ºse calcula frecuencia absoluta
3ºFrecuencia absoluta acumulada
4ºFrecuencia relativa
5ºFrecuencia relativa acumulada
distribución de frecuencias agrupadas
1ºSe obtiene el mínimo, máximo valor y se calcula:
_ el rango
_longitud del intervalo (k)
_intervalo de clase
2ºLimite inferior
3ºMarca de clase
4ºSe calculan frecuencias como en la tabla simple
Medidas de tendencia central
Moda
Es el valor que registra la mayor frecuencia absoluta
Unimodal
Una sola moda
Bimodal
2 modas
Polimodal
Más de 2 modas
Media
es el promedio de los valores que presenta el conjunto de datos
Mediana
valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma cantidad de elementos.
Media recortada
Al total de los datos se le quitan cierto porcentaje de los valores extremos superiores e inferiores
Medidas de poisson
Cuartiles
Q1
25% de los datos a la izquierda y el 75% a la derecha
Q2
Es igual a la mediana deja el 50% de los datos a la derecha y el otro 50% de la izquierda
Q3
75% de los datos se encuentran a la izquierda y 25% a la derecha
Percentiles
Divide a la distribución en cien partes
Quintiles
Divide la distribución en cinco partes
Deciles
Divide la distibución en diez partes
Rango intercuartiíico
Diferencia entre el tercer cuartil y el primer cuartil
Medidas de dispersión
Maxímo
Mínimo
Rango
Diferencia entre el máximo y el mínimo
Varianza: mide la dispersión de los valores respecto a un valor medio.
desviacion estandar
Coeficiente de variación
Medidas de forma de distribución
Asimetría
Asimetría <0 (asimetría negativa)
Asimetría = 0 (simétrica)
Asimetría >0 (asimétrica positiva)
Curtosis
Curva platicurtica (curtosis<0)
Curva mesocúrtica (curtosis=0)
Curva leptocúrtica (curtosis>0)
Estadística descriptiva bivariada
Variables bidimencionales
Diagrama de dispersión
Covarianza
medida de variabilidad conjunta de dos variables numéricas (cuantitativa)
Sxy>0 relacion lineal directa
Sxy relacion lineal inversa
Coeficiente de correlación de Pearson
Indica la intensidad de la relacion
Propiedades:
_Adimensional
_Toma valores entre -1 y 1
RELACION LINEAL MUY FUERTE entre las variables: r próximo a 1
VARIABLES INCORRELADAS, no existe relacion: r próximo a 0
Tablas de doble estrada
ejemplo:
60 chicos de una escuela los cuales 30 son chicas y 30 son chicos, algunos de ellos juegan al tenis y otros no practican este deporte.
Gráficos
Grafico de barras
Para variables cualitatias y variables cuantitativas, por ejemplo:
Grafico de sectores
Para variable cualitativa
Histogramas
Para variables cuantitativas continuas o discretas agrupadas.
Polígono de frecuencia
se obtiene generando primero el histograma
Ojiva
se obtiene generando primero el histograma de frecuencias acumuladas
Cajas y bigotes (boxplot)
Datos atípicos (outlets)
Se dice atípico si es menor que Bigote inferior o mayor que bigote superior
Introducción de los datos
Da una visión de los datos global
Conceptos
Población
Unidad de análisis
Entidad principal que se esta analizando.
Ejemplo: personas, familias, escuelas, casas, etc.
Entidad principal que se esta analizando en el estudio es el "que" se esta estudiando o a "quien" se está estudiando
Unidad de muestreo
cada uno de los elementos que comprende la base de la muestra
Finita
Se conoce la cantidad de unidades
Existe un registro de dichas unidades
Infinita
Se desconoce el total de elementos que la conforman
No existe registro documental
Parámetro
Función definida sobre los valores numéricos de características de una población
Muestra
Muestra Grande
Igual o mayor a 30
Muestra Chica
Menor a 30
Probabilísticas
Tienen la misma posibilidad de ser escogidos
No probabílísticas
Depende del proceso de toma de decición de una persona (decisiones subjetivas tienden a ser sesgadas)
Marco muestral
listado de todas las unidades de muestreo disponibles
Ejemplos: padrón electoral, guía telefónica, censo de habitantes, socios de un club u obra social.
Estadístico o Estadígrafo
Función definida sobre los valores observados de una muestra
Censo
Recopilación de datos sobre todos los elementos que componen a una población estadística.
Indec
Dato
Valor, categoría o modalidad
Estado en que se encuentra la variable en el momento de ser medida (posibles estados que puede tomar la variable)
Sistema de categorías
Exhaustividad
Ejemplos
Puntos Cardinales: Norte, Sur, Este, Oeste
Exclusión mutua
Ejemplos
Lugar de nacimiento en la provincia de Mendoza: Godoy Cruz, San Martín, Luján de Cuyo
Fuente de datos primaria
Los datos son producidos por el propio investigador a través de la aplicación de diferentes técnicas de
recolección de datos.
Fuente de datos secundaria
Los datos fueron producidos por otros investigadores o instituciones y son utilizados como
insumos para la propia investigación.
DIRECTA: Base de datos
INDIRECTA: Cuadros estadísticos
Basadas en relevamientos: censos, encuestas
Basadas en registros: registro civil; servicios estadísticos de salud, seguridad, etc
Clasificación de la variable no excluyentes
Según su naturaleza
Cuantitativa
Según su nivel de medición
Intervalar
Establecen un orden determinado por un intervalo numérico. El cero no significa la ausencia del valor.
Ejemplos
Puntuación en una prueba de matemáticas
Temperatura
Coeficiente intelectual
De razón
Existe un intervalo numérico. El cero no significa la ausencia del valor.
Ejemplos
N° de hijos: 0,1,2...
N° de accidentes con víctimas ocurrido en una ciudad en un día
N° de empleados en una empresa
Cualitativa
Según su nivel de medición
Nominal
Mutuamente excluyentes, no asignan un orden o jerarquía
Ejemplos
Grupo sanguíneo: A, B, AB, O
Sexo: Hombre, Mujer
Color: Azul, blanco, negro, rojo...
Ordinal
Establecen un orden entre las categorías
Ejemplos
Escolaridad: Primaria, secundaria, universitaria
Grado jerárquico de una escuela: Director, Vice director, Regente, Preceptores
Condición física de una persona: Alta, media, baja
Según el tratamiento del SOFT INFORMÁTICO
Numérica
Los datos son almacenados como números
Alfanumérica
Los datos son almacenados como caracteres, números y letras
Estadistica inferencial
Elección de la muestra depende de
Planteamiento del problema
Diseño del experimento
Recolección de datos
Análisis de los datos
Análisis de las conclusiones
Transformaciones no lineales
Transformación f(x)=x^2
Transformación f(x)= 1/x
Transformación logarítmica f(x)=ln(x)
La estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variable e incertidumbre sea una causa intrínseca de los mismos, asi como realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones
Distribución estadística
Distibución real
Los datos tienden a agruparse siguiendo una distribución
Distribución teórica