de una
Cuando son
Entre
Procedimiento
Utilidad
Dividida entre
esto denota que
de
de la
para

ESTADÍSTICA PARA LAS CIENCIAS DEL COMPORTAMIENTO
José Angel Solano Santos

CONCEPTOS MATEMÁTICOS Y DE MEDICIÓN BÁSICOS

Notación Matemática

Datos en estadística

Agrupados

Obtenidos de

Muestras

Poblaciones

Representados por símbolos matemáticos

Letra X mayuscula

Variable

Subíndices: Se agregan cuando existen muchos valores

Letra Y mayúscula

Medidas

Subtema

Sumatoria (sumar)

Operación frecuente en estadistica

Suma de todos o parte de los datos

Abreviatura simbolica

Letra griega sigma (Σ) en mayúscula

Escalas de medición

El tipo de escala determina el tipo de prueba que se empleará

Atributos Matemáticos (desde el punto de vista teórico)

Magnitud

Intervalo igual entre unidades adyacentes

Cero absoluto

4 clases

Nominal

Nivel mínimo de medición

Variables

Cualitativas
(no cuantitativas)

Equivalencia

Todos los miembros de una categoría son iguales

Desde el punto de vista de la variable de clasificación

Categorías

Son unidades de escala

Dividen

Variables

Miden

Clasifican

Operaciones de conteo

Clasificación de objetos en categorías mutuamente excluyentes

Ejemplos

Marcas de zapatos

Dias de la semana

Ordinal

Segundo/siguiente nivel de medición

Objetos medidos de acuerdo a Jerarquia

Si poseen

Más

La variable medida

Menos

Ordenes relativos

No tiene la propiedad de intervalos iguales entre unidades adyacentes

No se puede saber el nivel absoluto de la variable

Ejemplo

Primeros 5 lugares en un concurso

Clasificación de un maraton

De intervalo

Nivel superior de medición con respecto a ala escala ordinal

Propiedades

Magnitud

Igualdad de intervalo

Entre unidades adyacentes

Hay cantidades iguales de la variable entre las unidades adyacentes

No tiene cero absoluto

Posee propiedades de la escala ordinal

Diferencias equivalentes entre números de la escala

Representan diferencias de la misma magnitud en la variables

Ejemplo

Escala celsius

Razón/proporción

Máximo nivel de medición

Tiene cero absoluto

Pueden usarse en las proporciones

Ejemplo

Escala Kelvin

Tiene un cero absoluto (punto de congelación en 0º Kelvin)

La escala celsius tiene un cero arbitrario que es punto de congelación del agua (273 º Kelvin)

Longitud

Peso

En las ciencias del comportamiento

Muchas escalas utilizadas se consideran como si fueran intervalos

Las escalas en realidad tienen intervalos iguales entre unidades adyacentes

Cuando el instrumento de medición es estandar

Variables se consideran como si fuesen medidas en escalas de intervalos

Como el WAIS

Es discutible considerar como escala de intervalos las escalas poco estándar y que miden variables psicológicas

2 posturas

1. Uso de ciertas pruebas

T de Student

Análisis de Varianza

Deben usar datos que pertenece a escalas de

Intervalos

Proporciones

2. Contrara a la 1

Estas pruebas pueden usarse con datos

Nominales

Ordinales

Este tema surge en estadística inferencias

Vaiables

Definición

Propiedad

Característica

Algo que puede asumir mas de un valor

Tipos

Continuas

Puede asumir teóricamente un número infinito de valores entre las unidades adyacentes de una escala

Decimales

Ejemplos

Peso

Altura

Limites reales de una variable continua

Todas los valores de una variable continua

son aproximados

Límites reales

Valores por arriba o debajo de los valores registrados, a una distancia que es igual a la mitad ed la unidad de medida mínima en la escala

Limite real superior

Acercarse al valor real

Limite real inferior

Ejemplo: 179 libras

Limite real inferior

179.5 libras

Limite real superior

180.5 libras

Limites reales

Discretas

No existen valores posibles entre las unidades adyacentes de una escala

No decimales

Cambia por cantidades fijas

Ejemplo

Numero de hijos de una familia

Numero de estudiantes en un grupo

Cifras significativas

Residuos decimales de los cálculos matemáticos realizados

Por lo general disivisón

En las ciencias físicas

Cifras significativas = cifras en bruto

Es decirse usa el mismo número de cifras significativas que las que hay en bruto

Ejemplo: 173+156+162+175/5= 166.2= 166

En ciencias comportamentales

Resultados se dan con cifras decimales

Redondeo

Para determinar el valor del ultimo dígito en caso de haber decimales

Procedimiento

1. Dividir número en

Respuesta potencial

Residuo

2.Colocar punto decimal al frente del primer dñigito de residuo

Para crear un residuo decimal

3. Si el resultado es

Mayor que 1/2

Sumar 1 dígito al último número de la respuesta

Menor que 1/2

Dejar el ultimo número de la respuesta sin cambio

Igual a 1/2

Sumar 1 al último diigito si es impar

Si es par, dejar sin cambio

DISTRIBUCIÓN DE FRECUENCIAS

Definición

Aquella que presenta los valores y su frecuencia de aparición

Al presentarse en una tabla

Valores de los datos se enumeran por orden

Dato menor

Parte inferior de la tabla

Dato superior

Parte superior de la tabla

Datos agrupados

Muchos datos en un rango muy amplio, se agrupan en intervalos de clase

Al agrupar datos es importante considerar la amplitud del intervalo

Mientras más amplio el intervalo

Se perderá mas información

Mientras más pequeño se el intervalo

Mas fiel a los datos originales

Dilema

Perder información

Tener presentación visual significativa

Se debe elegir un ancho de intervalo

No muy ancho

No muy angosto

Construcción de una distribución de frecuencias de datos agrupados

1. Determinar rango de datos

2. Determinar amplitud de cada intervalo de clase

3. Enumerar los límites de cada intervalo de clase

Intervalo con dato mínimo

Parte inferior

4. Contar los datos en bruto en los intervalos de clase adecuados

5. Sumar las cuentas de cada intervalo

Distribución de frecuencias

Relativas

Proporción del numero total de datos que aparecen en cada intervalo

Acumuladas

Número de datos que están por debajo del límite real superior de cada intervalo

Porcentajes acumulados

Porcentaje de datos que está por debajo del limite real superior de cada intervalo

Percentil o punto percentil

Definición

Valor sobre la escala de medida, debajo del cual cae el 60% de los datos en la distribución

Rangos perceptiles

Definición

Porcentaje de datos con valores menores que el del dato en cuestión

Graficación de las distribuciones de frecuencias

Las distribuciones de frecuencias se presenta como

Gráficas

Facilita la ubicación de las caracteristicas importantes de los datos mencionados

Representa datos de manera visual

Se basan en tablas de datos

No contienen información nueva

Generalidades

Dos ejes

Eje vertical

Eje de las ordenadas

Eje Y

Eje vertical

Eje de las abscisas

Eje X

Datos

localizados en eje horizontal

Características

Eje vertical

Se deben elegir las unidades adecuadas para localizar los datos en el eje

Se coloca la intersección de los dos ejes en cero, posteriormente se eligen las escalas

Cada eje debe tener

Etiqueta

Título breve y explícito

De barras

Utilidad

Distribución de datos

Nominales

Ordinales

Una barra para cada categoría

La altura representa

Frecuencia

Número de miembros de esa categoría

No existe relación numérica ente las categorías de datos nominales

Se pueden organizar diferentes categorías

En el eje horizontal

En cualquier orden

Historiograma

Utilidad

Representar las distribuciones de frecuencias pertenecientes por

Datos intervalares

Datos de proporciones

Se traza una barra por cada intervalo de clase

Localización

Intervalos de clase

Eje horizontal

Limites reales del intervalo

Donde comienzan

Donde terminan

Polígono de Frecuencias

Utilidad

Representar los datos de

intervalos

proporciones

Localización

Eje horizontal

Igual al del historiograma

Usa puntos no barras

Denota el punto medio de cada intervalo

Los puntos se unen con lineas rectas

Linea que une los puntos se extiende para cortar el eje horizontal y forma un polígono

Curva de porcentaje acumulado

Utilidad

Representar distribuciones de

Frecuencia acumulada

Porcentaje acumulado

Localización

Unidades de porcentaje acumulados

Eje vertical

Puntos medio de cada intervalo de clase

Limite real superior del intervalo

La curva de frecuencia (ojiva)

Percentiles

Rasgos percentiles

Se pueden leer directamente a partir de ella

Percentiles

Rasgos percentiles

Formas

Simétrica

Sus lados coinciden al doblarlas a la mitad

Asimétrica

Mayor parte de los daros aparecen en valores menores del eje horizontal

Curva se reduce hacia el extremo superior

Asimétrica en forma negativa

Los datos aparecen en los valores mayores y la curva se reduce hacia el extremo inferior del eje horizontal

Análisis exploratorio de datos

Diagramas de tallo y hojas

Desarrollados

Por John Turkey

En Princeton University

Alternativa sencilla al historiograma

Utilidad

Resumir

Datos cuando no pasan de 100

Describir

No pierde los datos originales

Localización

Datos

Tallo

A la izquiera

Hojas

A la derecha

Linea vertical

Valores se pueden repetir

Alarga el tallo

Crear mas intervalos

Desplegar datos

MEDIDAS DE TENDENCIA CENTRAL

1. Media

Definición

Suma de los datos

Número de los mismos

Propiedades

1. La media es sensible al valor exacto de todos los datos en la distribución

2. La suma de las desviaciones con respecto a la media es cero

3. La media es muy sensible a los datos extremos

4. La suma de los cuadrados de las desviaciones de todos los daros en torno a su media es la minima posible

5. Para un gran numero de circunstancias, de todas las medidas utilizadas para calcular la tendencia central, la media es la que menos se sujeta a la variación debido al muestreo

Media global

Calcular la media de varios grupos de datos juntos

Suma de todos los datos

Número de datos

2. Mediana

Definición

Valor de la escala

Debajo del cual esta el 50% de los datos

Proceso para determinarla

Datos en bruto

1. se ordenan los datos

2. Si

Número impar

Mediana es el dato central

Numero par

Mediana es el promedio de los dos datos centrales

Propiedades

1. La mediana es menos sensible que la media a los datos extremos

2. Bajo circunstancias usuales, la mediana está más sujeta a la variabilidad de la muestra que la media, pero menos sujeta a la variabilidad de la muestra que la moda

3. Moda

Definición

Dato más frecuente en la distribución

Determinación

Examinando los datos

No se necesitan cálculos

Distibuciones

Unimodales

Solo tienen una moda

Más comunes

Bimodales

Tienen
dos modas

Menos comunes

MEDIDAS DE VARIABILIDAD

Rango

Definición

Diferencia entre los datos

Máximo

Distribución

Mínimo

Cálculo

Mide dispersión

Datos extremos

No intermedios

Solo proporciona una medida

Relativamente inexacta

Función

Cuantificar la extensión de la dispersión

Desviacion

Puntuaje de desviación

Definición

Indica que tan lejos está el dato en bruto con respecto a la media de su distribución

Propiedades de la desviación estándar

Nos da una medida de la dispersión con respecto a la media

La desviación estándar es sensible a cada dato de la distribución

Al igual que la media la desviación estándar es estable con respecto a las variaciones debido al muestreo

La media y la desviación estándar se pueden manipular de manera algebráica

Varianza

Definición

El cuadrado de la desviación estandar

Utilidad

No se utiliza muy seguido en la estadística descriptiva

Proporciona unidades de medida elevadas al cuadrado

Se utiliza con frecuencia en estadística inferencial