Categorías: Todo - estadística - datos - gráficos - muestra

por Juan Ignacio Zamarija hace 4 años

376

Estadística Descriptiva

Denna text behandlar beskrivande statistik, en gren av statistiken som fokuserar på att beskriva egenskaperna hos en datamängd. Det görs genom användning av statistiska tabeller, grafiska representationer och beräkningar av sammanfattande mått.

Estadística Descriptiva

moda, varianza

Estadística Inferencial

Pretende conocer las características de una población sin necesidad de tomar mediciones de todos y cada uno de sus elementos

# Se basan en la Teoria de Probabilidad # Realizan estimaciones de parámetros # Identifican relaciones entre variables # Descubren patrones de los datos # Construyen modelos predictivos

A partir de una muestra infieren parámetros a una población.

Estadística Descriptiva

Variables bidimensionales

Coeficiente de correlacion r de Pearson
Propiedades

Cuando r tiende a 0, puede afirmarse que no existe relación lineal entre las variables (variables incorreladas).

Cuando lrl esté próximo a 1, se tiene que existe una relación lineal muy fuerte entre las variables.

Solo toma valores comprendidos entre -1 y 1.

Es invariante para transformaciones lineales de las variables

Carece de unidades de medida (Adimensional).

Dividimos la covarianza por el producto de las desviaciones típicas de cada variable, obtenemos un coeficiente adimensional
r = Sxy /(Sx*Sy)
Covarianza
Sxy

Sxy=0

Puede indicar que

Hay dependencia entre las variables, aunque la covarianza sea nula

Las variables son independientes

Sxy<0 indica relacion lineal inversa

Sxy>0 indica relacion lineal directa

Tablas de contingencia
¿Cómo se interpreta su información?

TRATAMIENTO ASIMÉTRICO

Por convención

La variable Dependientese ubica en filas

La variable Independiente se ubica en columnas

UNA VARIABLE ES “CAUSA” DE LA OTRA

Se comparan los porcentajes obtenidos en el sentido contrario (VD)

Se calculan los porcentajes en el sentido del factor causal (VI)

Variable Independiente (VI) y Variable Dependiente(VD)

TRATAMIENTO SIMÉTRICO

Se comparan los porcentajes obtenidos sobre el total del cuadro.

Se construyen utilizando tablas de frecuencias

Es conveniente expresar en porcentajes las frecuencias marginales y totales

Totales (de filas y columnas)

Frecuencias marginales de las columnas

Frecuencias marginales de las filas

Frecuencias condicionales (en el interior de la tabla)

TABLAS p*k (p columnas * k filas)
Usos mas frecuentes

Elaboración de conjeturas / formulación de hipótesis.

Observar la influencia de una variable sobre otra (VI -> VD).

Comparar la composición de distintos subgrupos.

Describir la composición de distintos subgrupos.

Es una tabla estadística que reúne en una sola estructura toda la información contenida en dos o más variables.

Dato

Fuente de datos
Secundaria

Indirectas

Directas

Los datos fueron producidos por otros investigadores

Primaria

Los datos son producidos por el propio investigador

Estructura tripartita
Valor, categoría o modalidad
Variable
Unidad de Análisis
Es el registro de lo observado

Alcance

# Descripción de características # Resúmenes de casos # Visualización e interpretación # Identificación de tendencias

Muestra

Elementos
Tamaño muestral

Cantidad de unidades de estudio en la muestra y usualmente se simboliza con la letra n minúscula

n> 30 muestra grande

n<30 muestra pequeña

Marco muestral

Listado de todas las unidades de muestreo disponibles que tienen probabilidad de formar parte de la muestra.

GuIa telefónica, padrón electoral

Estadígrafos
Función definida sobre los valores observado de una muestra

S2= varianza muestral

x̄= media muestral

Muestras no probabilisticas
Depende del proceso de toma de desiciones de una persona, tienden a ser sesgadas
Muestras probabilisticas
Todos los elementos de la población tienen la misma posibilidad de ser elegidos
Es un subconjunto de casos representativos de la población en estudio

Población

Tipos de población
Accesible
Blanco
Infinita
Finita
Parámetros
Función definida sobre los valores numéricos de características de una población

σ 2= varianza poblacional

μ=promedio poblacional

Unidad de muestreo
Cada uno de los elementos que comprende la base de la muestra y que figuran numerados e individualizados en el registro
Unidad de análisis
Es la entidad principal que se está analizando en un estudio
Conjunto de datos formado por todas las medidas tomadas sobre un conjunto de elementos que tienen alguna característica en común
N= tamaño de la población

Variables

Cuantitativas

De razón

Ej: El peso de 4 amigos: 85,5 , 90 , 93,2 , 88,1

Intervalo

Ej: La temperatura observada con un termómetro graduado en grados centígrados enteros: 15°C, 22!C

Pueden ser

Discreta

Ej: El numero de hermanos de 4 amigos: 2.1.3.1

Continuas

Ej: La altura de 4 amigos: 1,73 , 1,80 , 1,78 , 1,84

Cualitativas
Nivel de medición

Ordinal

Ej: Medallas de una competición: oro,plata, bronce.

Nominal

Ej: Estado civil de una persona: soltero, casado, divorciado,viudo.

Es la rama de la estadística que se dedica a describir las características de un conjunto de datos

A través de
Tablas estadísticas
Represenación gráfica
Clasificación y agrupamiento
Cálculo de medidas de resumen

Representaciones gráficas

Gráfica de caja y bigote
Diagrama de dispersión
Polígonos de frecuencia
Histogramas
Gráfico de sectores
Gráfico de barras

Medidas

Posición
Percentiles
Cuantiles
Centrales
Moda
Mediana
Media
Dispersión
Desviación tipica
Coeficiente de variación
Varianza
Rango
Mínimo
Máximo