Estadística

Estadística

Estadística descriptiva

Medidas descriptivas

Distribucion de frecuencia

conjunto de puntuaciones ordenadas en sus respectivas categorías o valores.

Distribucion de frecuencias simples

1ºSe odenan los datos de menor a mayor
2ºse calcula frecuencia absoluta
3ºFrecuencia absoluta acumulada
4ºFrecuencia relativa
5ºFrecuencia relativa acumulada

distribución de frecuencias agrupadas

1ºSe obtiene el mínimo, máximo valor y se calcula:
_ el rango
_longitud del intervalo (k)
_intervalo de clase
2ºLimite inferior
3ºMarca de clase
4ºSe calculan frecuencias como en la tabla simple

Medidas de tendencia central

Moda

Es el valor que registra la mayor frecuencia absoluta

Unimodal

Una sola moda

Bimodal

2 modas

Polimodal

Más de 2 modas

Media

es el promedio de los valores que presenta el conjunto de datos

Mediana

valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma cantidad de elementos.

Media recortada

Al total de los datos se le quitan cierto porcentaje de los valores extremos superiores e inferiores

Medidas de poisson

Cuartiles

Q1

25% de los datos a la izquierda y el 75% a la derecha

Q2

Es igual a la mediana deja el 50% de los datos a la derecha y el otro 50% de la izquierda

Q3

75% de los datos se encuentran a la izquierda y 25% a la derecha

Percentiles

Divide a la distribución en cien partes

Quintiles

Divide la distribución en cinco partes

Deciles

Divide la distibución en diez partes

Rango intercuartiíico

Diferencia entre el tercer cuartil y el primer cuartil

Medidas de dispersión

Maxímo

Mínimo

Rango

Diferencia entre el máximo y el mínimo

Varianza: mide la dispersión de los valores respecto a un valor medio.

desviacion estandar

Coeficiente de variación

Medidas de forma de distribución

Asimetría

Asimetría <0 (asimetría negativa)
Asimetría = 0 (simétrica)
Asimetría >0 (asimétrica positiva)

Curtosis

Curva platicurtica (curtosis<0)
Curva mesocúrtica (curtosis=0)
Curva leptocúrtica (curtosis>0)

Estadística descriptiva bivariada

Variables bidimencionales

Diagrama de dispersión

Covarianza

medida de variabilidad conjunta de dos variables numéricas (cuantitativa)

Sxy>0 relacion lineal directa
Sxy relacion lineal inversa

Coeficiente de correlación de Pearson

Indica la intensidad de la relacion

Propiedades:
_Adimensional
_Toma valores entre -1 y 1

RELACION LINEAL MUY FUERTE entre las variables: r próximo a 1

VARIABLES INCORRELADAS, no existe relacion: r próximo a 0

Tablas de doble estrada

ejemplo:
60 chicos de una escuela los cuales 30 son chicas y 30 son chicos, algunos de ellos juegan al tenis y otros no practican este deporte.

Gráficos

Grafico de barras

Para variables cualitatias y variables cuantitativas, por ejemplo:

Grafico de sectores

Para variable cualitativa

Histogramas

Para variables cuantitativas continuas o discretas agrupadas.

Polígono de frecuencia

se obtiene generando primero el histograma

Ojiva

se obtiene generando primero el histograma de frecuencias acumuladas

Cajas y bigotes (boxplot)

Datos atípicos (outlets)

Se dice atípico si es menor que Bigote inferior o mayor que bigote superior

Introducción de los datos

Da una visión de los datos global

Conceptos

Población

Población

Unidad de análisis

Unidad de análisis

Entidad principal que se esta analizando.
Ejemplo: personas, familias, escuelas, casas, etc.

Entidad principal que se esta analizando en el estudio es el "que" se esta estudiando o a "quien" se está estudiando

Unidad de muestreo

Unidad de muestreo

cada uno de los elementos que comprende la base de la muestra

Finita

Se conoce la cantidad de unidades

Existe un registro de dichas unidades

Infinita

Se desconoce el total de elementos que la conforman

No existe registro documental

Parámetro

Parámetro

Función definida sobre los valores numéricos de características de una población

Muestra

Muestra

Muestra Grande

Igual o mayor a 30

Muestra Chica

Menor a 30

Probabilísticas

Tienen la misma posibilidad de ser escogidos

No probabílísticas

Depende del proceso de toma de decición de una persona (decisiones subjetivas tienden a ser sesgadas)

Marco muestral

Marco muestral

listado de todas las unidades de muestreo disponibles

Ejemplos: padrón electoral, guía telefónica, censo de habitantes, socios de un club u obra social.

Estadístico o Estadígrafo

Estadístico o Estadígrafo

Función definida sobre los valores observados de una muestra

Censo

Censo

Recopilación de datos sobre todos los elementos que componen a una población estadística.

Indec

Indec

Dato

Dato

Valor, categoría o modalidad

Valor, categoría o modalidad

Estado en que se encuentra la variable en el momento de ser medida (posibles estados que puede tomar la variable)

Sistema de categorías

Exhaustividad

r

Esta condición se cumple cuando el sistema de categorías comprende a todos los valores posibles que podría tomar la variable en función de su naturaleza.

Ejemplos

Puntos Cardinales: Norte, Sur, Este, Oeste

Exclusión mutua

r

Esta condición se cumple cuando se define sin ambigüedad a cada una de las categorías de una variable. 

Ejemplos

Lugar de nacimiento en la provincia de Mendoza: Godoy Cruz, San Martín, Luján de Cuyo

Fuente de datos primaria

Los datos son producidos por el propio investigador a través de la aplicación de diferentes técnicas de
recolección de datos.

Fuente de datos secundaria

Los datos fueron producidos por otros investigadores o instituciones y son utilizados como
insumos para la propia investigación.

DIRECTA: Base de datos

INDIRECTA: Cuadros estadísticos

Basadas en relevamientos: censos, encuestas

Basadas en registros: registro civil; servicios estadísticos de salud, seguridad, etc

Clasificación de la variable no excluyentes

Clasificación de la variable no excluyentes

Según su naturaleza

Cuantitativa

Según su nivel de medición

Intervalar

Intervalar

Establecen un orden determinado por un intervalo numérico. El cero no significa la ausencia del valor.

Ejemplos

Puntuación en una prueba de matemáticas

Temperatura

Coeficiente intelectual

De razón

De razón

Existe un intervalo numérico. El cero no significa la ausencia del valor.

Ejemplos

N° de hijos: 0,1,2...

N° de accidentes con víctimas ocurrido en una ciudad en un día

N° de empleados en una empresa

Cualitativa

Según su nivel de medición

Nominal

Nominal

Mutuamente excluyentes, no asignan un orden o jerarquía

Ejemplos

Grupo sanguíneo: A, B, AB, O

Sexo: Hombre, Mujer

Color: Azul, blanco, negro, rojo...

Ordinal

Ordinal

Establecen un orden entre las categorías

Ejemplos

Escolaridad: Primaria, secundaria, universitaria

Grado jerárquico de una escuela: Director, Vice director, Regente, Preceptores

Condición física de una persona: Alta, media, baja

Según el tratamiento del SOFT INFORMÁTICO

Numérica

Numérica

Los datos son almacenados como números

Alfanumérica

Alfanumérica

Los datos son almacenados como caracteres, números y letras

Estadistica inferencial

Elección de la muestra depende de

Elección de la muestra depende de

Planteamiento del problema

Diseño del experimento

Recolección de datos

Análisis de los datos

Análisis de las conclusiones

Transformaciones no lineales

Transformación f(x)=x^2

Transformación f(x)= 1/x

Transformación logarítmica f(x)=ln(x)

La estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variable e incertidumbre sea una causa intrínseca de los mismos, asi como realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones

Distribución estadística

Distibución real

Los datos tienden a agruparse siguiendo una distribución

Distribución teórica

Con junto de técnicas que a partir de datos de una muestra infieren parámetros a una población.

Se dedica a analizar, resumir, interpretar y presentar resultados con el fin de describir apropiadamente las diversas caracteristicas de un conjunto de datos

Medidas descriptivas

Medidas descriptivas