Categorie: Tutti - varianza - datos - medida - desviación

da Marttha Irachetta mancano 3 anni

211

Organizador parte 2. Capítulo 4 Análisis descriptivo de variables cuantitativas.

En el análisis descriptivo de variables cuantitativas, es fundamental comprender las medidas de dispersión, que indican el grado de similitud o diferencia entre los datos. Una de las principales medidas es la varianza, que se define como el promedio de las desviaciones cuadráticas respecto a la media.

Organizador parte 2. Capítulo 4 Análisis descriptivo de variables cuantitativas.

Organizador parte 2. Capítulo 4 Análisis descriptivo de variables cuantitativas.

Medidas universales

Formas de distribución
índices de asimetría y curtosis

tipos

momento 4

Constituye la base de un índice de curtosis

momento 3

Constituye la base de un índice de asimetría

momento 2

- Es el numerador de la fórmula de la varianza

momento 1

-Vale cero (las desviaciones de la media suman cero)

El momento de orden (r) respecto a la media

momento respecto a la media

En la tendencia central y de dispersión

Detectar valores repetitivos o muy diferentes

análisis descriptivo y exploratorio

herramientas exploratorias

detectar posibles anomalías

herramientas descriptivas

caracterización apropiada de los datos

Gráficos para variables cuantitativas

por gráficos

Histograma

parecido al gráfico de barras, Histograma pero con las barras juntas

formar intervalos agrupando unos pocos valores consecutivos

el plano definido por dos ejes cartesianos.

Polígono de frecuencias

A partir de la unión de con una línea los puntos medios de los bordes superiores de cada barra del histograma

Diagrama de caja

formarse una idea muy rápida sobre las tres propiedades esenciale

centro

forma

dispersión

Diagrama de tallo y hojas

comprobar si existen valores que se repiten mucho o valores que no aparecen

valorar dos características

curtosis

A grado de apuntamiento.

forma de su distribución de frecuencias/probabilidad

asimetría

A la forma en que los datos se distribuyen por encima y por debajo del centro

Las distribuciones a cada lado del centro tienen la misma forma

Medidas de dispersión
El grado de parecido entre los datos en el sentido de concentración o alejamiento entre ellos.

Donde la dispersión

Es baja

La mayoría de los valores se encuentran próximos al centro

Es alta

La mayoría de los valores se encuentran alejados del centro

Precisar si el centro de una distribución es o no un buen representante del resto de valores

Medir a traves de estadisticos

¿Cuáles son?

Comparación entre estadísticos de dispersión

Desviación típica un estadístico no resistente pero servicial

Funciona de mejor forma al pasar de la fase descriptiva a la inferencial.

El estadístico más resistente es la mediana de las desviaciones

Las amplitudes son el total

Intercuartil basada en la distancia entre 2 valores

La desviación promedio basada en las distancias al centro de la distribución

Amplitud sensible a casos anómalos

Ser concretos en lo que se desea conocer

25% de datos desechados

La dispersión siempre es positiva

Baja, media o alta pero nunca negativa

No se altera cuando sufre suma o resta pero si cuando se multiplica o divide

La varianza no es realmente útil

Coeficiente de variación

CV: Desviación típica / media

Se define como el cociente o la división entre la desviación típica y la media.

Se usa para comparar la variabilidad o dispersión de datos con diferentes unidades de medida

Es una medida de dispersión relativa.

3. Varianza y desviación típica

Desviación típica

la raíz cuadrada de la varianza

La raíz cuadrada de la medida de los cuadrados de las puntuaciones de desviación

SY= √ (ΣYi - Y)2/ (n - 1)

SY = √ Σyi2/ (n - 1)

denominador se está utilizando n - 1

desviación típica insesgada.

Varianza

no permite formarse una idea acertada del grado de dispersión de una variable.

Que las distancias a la media están elevadas al cuadrado

Intentar medir la distancia física entre dos puntos utilizando una medida de superficie en lugar de una medida de longitud.

El promedio de las desviaciones cuadráticas de la media, es decir, el promedio de las desviaciones de la media elevadas al cuadrado.

comparar entre sí distintos grupos y saber en cuál de ellos hay mayor dispersión

S2Y(n) = (ΣYi - Y)2/n

S2Y(n) = Σyi2/n

El subíndice n indica el valor del denominador

Varianza muestral

un valor muestral que tiende a ser menor que el valor poblacional.

simplemente restando 1 al tamaño muestral en el denominador

varianza insesgada o también puede encontrarse con el nombre de cuasivarianza.

un programa informático como el SPSS

Que se obtiene es la varianza insesgada.

S2Y

S2Y(n) = ΣYi2/n - 1

Varianza poblacional

El subíndice Y identifica a la variable.

2. Desviaciones promedio

Media de las desviaciones

Las desviaciones se toman en valor absoluto y su suma se divide por el número de puntuaciones

La desviación promedio:

La desviación que una puntuación experimenta respecto de la media de su distribución.

el grado de dispersión de esa puntuación.

La suma de todas las desviaciones de un conjunto de datos

la dispersión total del conjunto

1. Amplitudes

amplitud intercuartil

AIQ = Q3 - Q1

AIQ

En la distancia existente entre los cuartiles primero y tercero

amplitud total

AT

En calcular la diferencia entre el valor más grande (Y máx) y el más pequeño (Y mín).

rango, recorrido o amplitud

AT= Ymáx - Ymin