se representan por medio de

Estadística Descriptiva

Medidas

Dispersión

Máximo

Mínimo

Rango

Varianza

Coeficiente de variación

Desviación tipica

Centrales

Media

Mediana

Moda

Posición

Cuantiles

Percentiles

Representaciones gráficas

Gráfico de barras

Gráfico de sectores

Histogramas

Polígonos de frecuencia

Diagrama de dispersión

Gráfica de caja y bigote

Es la rama de la estadística que se dedica a describir las características de un conjunto de datos

A través de

Cálculo de medidas de resumen

Clasificación y agrupamiento

Represenación gráfica

Tablas estadísticas

Variables

Cualitativas

Nivel de medición

Nominal

Ej: Estado civil de una persona: soltero, casado, divorciado,viudo.

Ordinal

Ej: Medallas de una competición: oro,plata, bronce.

Cuantitativas

Pueden ser

Continuas

Ej: La altura de 4 amigos: 1,73 , 1,80 , 1,78 , 1,84

Discreta

Ej: El numero de hermanos de 4 amigos: 2.1.3.1

Nivel de medición

Intervalo

Ej: La temperatura observada con un termómetro graduado en grados centígrados enteros: 15°C, 22!C

De razón

Ej: El peso de 4 amigos: 85,5 , 90 , 93,2 , 88,1

Población

Conjunto de datos formado por todas las medidas tomadas sobre un conjunto de elementos que tienen alguna característica en común

N= tamaño de la población

Unidad de análisis

Es la entidad principal que se está analizando en un estudio

Unidad de muestreo

Cada uno de los elementos que comprende la base de la muestra y que figuran numerados e individualizados en el registro

Parámetros

Función definida sobre los valores numéricos de características de una población

μ=promedio poblacional

σ 2= varianza poblacional

Tipos de población

Finita

Infinita

Blanco

Accesible

Muestra

Es un subconjunto de casos representativos de la población en estudio

Muestras probabilisticas

Todos los elementos de la población tienen la misma posibilidad de ser elegidos

Muestras no probabilisticas

Depende del proceso de toma de desiciones de una persona, tienden a ser sesgadas

Estadígrafos

Función definida sobre los valores observado de una muestra

x̄= media muestral

S2= varianza muestral

Elementos

Marco muestral

Listado de todas las unidades de muestreo disponibles que tienen probabilidad de formar parte de la muestra.

GuIa telefónica, padrón electoral

Tamaño muestral

Cantidad de unidades de estudio en la muestra y usualmente se simboliza con la letra n minúscula

n<30 muestra pequeña

n> 30 muestra grande

Alcance

# Descripción de características
# Resúmenes de casos
# Visualización e interpretación
# Identificación de tendencias

Dato

Es el registro de lo observado

Estructura tripartita

Unidad de Análisis

Variable

Valor, categoría o modalidad

Fuente de datos

Primaria

Los datos son producidos por el propio investigador

Secundaria

Los datos fueron producidos por otros investigadores

Directas

Indirectas

Variables bidimensionales

Tablas de contingencia

Es una tabla estadística que reúne en una
sola estructura toda la información
contenida en dos o más variables.

Usos mas frecuentes

Describir la composición de distintos subgrupos.

Comparar la composición de distintos subgrupos.

Observar la influencia de una variable sobre otra (VI -> VD).

Elaboración de conjeturas / formulación de hipótesis.

TABLAS p*k (p columnas * k filas)

Se construyen utilizando tablas de frecuencias

Frecuencias condicionales (en el interior de la tabla)

Frecuencias marginales de las filas

Frecuencias marginales de las columnas

Totales (de filas y columnas)

Es conveniente expresar en porcentajes las frecuencias marginales y totales

¿Cómo se interpreta su información?

TRATAMIENTO SIMÉTRICO

Se comparan los porcentajes obtenidos sobre el total del cuadro.

TRATAMIENTO ASIMÉTRICO

UNA VARIABLE ES “CAUSA” DE LA OTRA

Variable Independiente (VI) y Variable Dependiente(VD)

Se calculan los porcentajes en el sentido del factor causal (VI)

Se comparan los porcentajes obtenidos en el sentido contrario (VD)

Por convención

La variable Independiente se ubica en columnas

La variable Dependientese ubica en filas

Covarianza

Sxy

Sxy>0 indica relacion lineal directa

Sxy<0 indica relacion lineal inversa

Sxy=0

Puede indicar que

Las variables son independientes

Hay dependencia entre las variables, aunque la covarianza sea nula

Coeficiente de correlacion r de Pearson

r = Sxy /(Sx*Sy)

Dividimos la covarianza por el producto de las
desviaciones típicas de cada variable, obtenemos un
coeficiente adimensional

Propiedades

Carece de unidades de medida (Adimensional).

Es invariante para transformaciones lineales de las variables

Solo toma valores comprendidos entre -1 y 1.

Cuando lrl esté próximo a 1, se tiene que existe una relación lineal muy fuerte entre las variables.

Cuando r tiende a 0, puede afirmarse que no existe relación lineal entre las variables (variables incorreladas).

Estadística Inferencial

A partir de una muestra infieren parámetros a una población.

# Se basan en la Teoria de Probabilidad
# Realizan estimaciones de parámetros
# Identifican relaciones entre variables
# Descubren patrones de los datos
# Construyen modelos predictivos

Pretende conocer las características de una población sin necesidad de tomar mediciones de todos y cada uno de sus elementos

moda, varianza