ESTADÍSTICA PARA LAS CIENCIAS DEL COMPORTAMIENTO
José Angel Solano Santos
CONCEPTOS MATEMÁTICOS Y DE MEDICIÓN BÁSICOS
Notación Matemática
Datos en estadística
Agrupados
Obtenidos de
Muestras
Poblaciones
Representados por símbolos matemáticos
Letra X mayuscula
Variable
Subíndices: Se agregan cuando existen muchos valores
Letra Y mayúscula
Medidas
Subtema
Sumatoria (sumar)
Operación frecuente en estadistica
Suma de todos o parte de los datos
Abreviatura simbolica
Letra griega sigma (Σ) en mayúscula
Escalas de medición
El tipo de escala determina el tipo de prueba que se empleará
Atributos Matemáticos (desde el punto de vista teórico)
Magnitud
Intervalo igual entre unidades adyacentes
Cero absoluto
4 clases
Nominal
Nivel mínimo de medición
Variables
Cualitativas
(no cuantitativas)
Equivalencia
Todos los miembros de una categoría son iguales
Desde el punto de vista de la variable de clasificación
Categorías
Son unidades de escala
Dividen
Variables
Miden
Clasifican
Operaciones de conteo
Clasificación de objetos en categorías mutuamente excluyentes
Ejemplos
Marcas de zapatos
Dias de la semana
Ordinal
Segundo/siguiente nivel de medición
Objetos medidos de acuerdo a Jerarquia
Si poseen
Más
La variable medida
Menos
Ordenes relativos
No tiene la propiedad de intervalos iguales entre unidades adyacentes
No se puede saber el nivel absoluto de la variable
Ejemplo
Primeros 5 lugares en un concurso
Clasificación de un maraton
De intervalo
Nivel superior de medición con respecto a ala escala ordinal
Propiedades
Magnitud
Igualdad de intervalo
Entre unidades adyacentes
Hay cantidades iguales de la variable entre las unidades adyacentes
No tiene cero absoluto
Posee propiedades de la escala ordinal
Diferencias equivalentes entre números de la escala
Representan diferencias de la misma magnitud en la variables
Ejemplo
Escala celsius
Razón/proporción
Máximo nivel de medición
Tiene cero absoluto
Pueden usarse en las proporciones
Ejemplo
Escala Kelvin
Tiene un cero absoluto (punto de congelación en 0º Kelvin)
La escala celsius tiene un cero arbitrario que es punto de congelación del agua (273 º Kelvin)
Longitud
Peso
En las ciencias del comportamiento
Muchas escalas utilizadas se consideran como si fueran intervalos
Las escalas en realidad tienen intervalos iguales entre unidades adyacentes
Cuando el instrumento de medición es estandar
Variables se consideran como si fuesen medidas en escalas de intervalos
Como el WAIS
Es discutible considerar como escala de intervalos las escalas poco estándar y que miden variables psicológicas
2 posturas
1. Uso de ciertas pruebas
T de Student
Análisis de Varianza
Deben usar datos que pertenece a escalas de
Intervalos
Proporciones
2. Contrara a la 1
Estas pruebas pueden usarse con datos
Nominales
Ordinales
Este tema surge en estadística inferencias
Vaiables
Definición
Propiedad
Característica
Algo que puede asumir mas de un valor
Tipos
Continuas
Puede asumir teóricamente un número infinito de valores entre las unidades adyacentes de una escala
Decimales
Ejemplos
Peso
Altura
Limites reales de una variable continua
Todas los valores de una variable continua
son aproximados
Límites reales
Valores por arriba o debajo de los valores registrados, a una distancia que es igual a la mitad ed la unidad de medida mínima en la escala
Limite real superior
Acercarse al valor real
Limite real inferior
Ejemplo: 179 libras
Limite real inferior
179.5 libras
Limite real superior
180.5 libras
Limites reales
Discretas
No existen valores posibles entre las unidades adyacentes de una escala
No decimales
Cambia por cantidades fijas
Ejemplo
Numero de hijos de una familia
Numero de estudiantes en un grupo
Cifras significativas
Residuos decimales de los cálculos matemáticos realizados
Por lo general disivisón
En las ciencias físicas
Cifras significativas = cifras en bruto
Es decirse usa el mismo número de cifras significativas que las que hay en bruto
Ejemplo: 173+156+162+175/5= 166.2= 166
En ciencias comportamentales
Resultados se dan con cifras decimales
Redondeo
Para determinar el valor del ultimo dígito en caso de haber decimales
Procedimiento
1. Dividir número en
Respuesta potencial
Residuo
2.Colocar punto decimal al frente del primer dñigito de residuo
Para crear un residuo decimal
3. Si el resultado es
Mayor que 1/2
Sumar 1 dígito al último número de la respuesta
Menor que 1/2
Dejar el ultimo número de la respuesta sin cambio
Igual a 1/2
Sumar 1 al último diigito si es impar
Si es par, dejar sin cambio
DISTRIBUCIÓN DE FRECUENCIAS
Definición
Aquella que presenta los valores y su frecuencia de aparición
Al presentarse en una tabla
Valores de los datos se enumeran por orden
Dato menor
Parte inferior de la tabla
Dato superior
Parte superior de la tabla
Datos agrupados
Muchos datos en un rango muy amplio, se agrupan en intervalos de clase
Al agrupar datos es importante considerar la amplitud del intervalo
Mientras más amplio el intervalo
Se perderá mas información
Mientras más pequeño se el intervalo
Mas fiel a los datos originales
Dilema
Perder información
Tener presentación visual significativa
Se debe elegir un ancho de intervalo
No muy ancho
No muy angosto
Construcción de una distribución de frecuencias de datos agrupados
1. Determinar rango de datos
2. Determinar amplitud de cada intervalo de clase
3. Enumerar los límites de cada intervalo de clase
Intervalo con dato mínimo
Parte inferior
4. Contar los datos en bruto en los intervalos de clase adecuados
5. Sumar las cuentas de cada intervalo
Distribución de frecuencias
Relativas
Proporción del numero total de datos que aparecen en cada intervalo
Acumuladas
Número de datos que están por debajo del límite real superior de cada intervalo
Porcentajes acumulados
Porcentaje de datos que está por debajo del limite real superior de cada intervalo
Percentil o punto percentil
Definición
Valor sobre la escala de medida, debajo del cual cae el 60% de los datos en la distribución
Rangos perceptiles
Definición
Porcentaje de datos con valores menores que el del dato en cuestión
Graficación de las distribuciones de frecuencias
Las distribuciones de frecuencias se presenta como
Gráficas
Facilita la ubicación de las caracteristicas importantes de los datos mencionados
Representa datos de manera visual
Se basan en tablas de datos
No contienen información nueva
Generalidades
Dos ejes
Eje vertical
Eje de las ordenadas
Eje Y
Eje vertical
Eje de las abscisas
Eje X
Datos
localizados en eje horizontal
Características
Eje vertical
Se deben elegir las unidades adecuadas para localizar los datos en el eje
Se coloca la intersección de los dos ejes en cero, posteriormente se eligen las escalas
Cada eje debe tener
Etiqueta
Título breve y explícito
De barras
Utilidad
Distribución de datos
Nominales
Ordinales
Una barra para cada categoría
La altura representa
Frecuencia
Número de miembros de esa categoría
No existe relación numérica ente las categorías de datos nominales
Se pueden organizar diferentes categorías
En el eje horizontal
En cualquier orden
Historiograma
Utilidad
Representar las distribuciones de frecuencias pertenecientes por
Datos intervalares
Datos de proporciones
Se traza una barra por cada intervalo de clase
Localización
Intervalos de clase
Eje horizontal
Limites reales del intervalo
Donde comienzan
Donde terminan
Polígono de Frecuencias
Utilidad
Representar los datos de
intervalos
proporciones
Localización
Eje horizontal
Igual al del historiograma
Usa puntos no barras
Denota el punto medio de cada intervalo
Los puntos se unen con lineas rectas
Linea que une los puntos se extiende para cortar el eje horizontal y forma un polígono
Curva de porcentaje acumulado
Utilidad
Representar distribuciones de
Frecuencia acumulada
Porcentaje acumulado
Localización
Unidades de porcentaje acumulados
Eje vertical
Puntos medio de cada intervalo de clase
Limite real superior del intervalo
La curva de frecuencia (ojiva)
Percentiles
Rasgos percentiles
Se pueden leer directamente a partir de ella
Percentiles
Rasgos percentiles
Formas
Simétrica
Sus lados coinciden al doblarlas a la mitad
Asimétrica
Mayor parte de los daros aparecen en valores menores del eje horizontal
Curva se reduce hacia el extremo superior
Asimétrica en forma negativa
Los datos aparecen en los valores mayores y la curva se reduce hacia el extremo inferior del eje horizontal
Análisis exploratorio de datos
Diagramas de tallo y hojas
Desarrollados
Por John Turkey
En Princeton University
Alternativa sencilla al historiograma
Utilidad
Resumir
Datos cuando no pasan de 100
Describir
No pierde los datos originales
Localización
Datos
Tallo
A la izquiera
Hojas
A la derecha
Linea vertical
Valores se pueden repetir
Alarga el tallo
Crear mas intervalos
Desplegar datos
MEDIDAS DE TENDENCIA CENTRAL
1. Media
Definición
Suma de los datos
Número de los mismos
Propiedades
1. La media es sensible al valor exacto de todos los datos en la distribución
2. La suma de las desviaciones con respecto a la media es cero
3. La media es muy sensible a los datos extremos
4. La suma de los cuadrados de las desviaciones de todos los daros en torno a su media es la minima posible
5. Para un gran numero de circunstancias, de todas las medidas utilizadas para calcular la tendencia central, la media es la que menos se sujeta a la variación debido al muestreo
Media global
Calcular la media de varios grupos de datos juntos
Suma de todos los datos
Número de datos
2. Mediana
Definición
Valor de la escala
Debajo del cual esta el 50% de los datos
Proceso para determinarla
Datos en bruto
1. se ordenan los datos
2. Si
Número impar
Mediana es el dato central
Numero par
Mediana es el promedio de los dos datos centrales
Propiedades
1. La mediana es menos sensible que la media a los datos extremos
2. Bajo circunstancias usuales, la mediana está más sujeta a la variabilidad de la muestra que la media, pero menos sujeta a la variabilidad de la muestra que la moda
3. Moda
Definición
Dato más frecuente en la distribución
Determinación
Examinando los datos
No se necesitan cálculos
Distibuciones
Unimodales
Solo tienen una moda
Más comunes
Bimodales
Tienen
dos modas
Menos comunes
MEDIDAS DE VARIABILIDAD
Rango
Definición
Diferencia entre los datos
Máximo
Distribución
Mínimo
Cálculo
Mide dispersión
Datos extremos
No intermedios
Solo proporciona una medida
Relativamente inexacta
Función
Cuantificar la extensión de la dispersión
Desviacion
Puntuaje de desviación
Definición
Indica que tan lejos está el dato en bruto con respecto a la media de su distribución
Propiedades de la desviación estándar
Nos da una medida de la dispersión con respecto a la media
La desviación estándar es sensible a cada dato de la distribución
Al igual que la media la desviación estándar es estable con respecto a las variaciones debido al muestreo
La media y la desviación estándar se pueden manipular de manera algebráica
Varianza
Definición
El cuadrado de la desviación estandar
Utilidad
No se utiliza muy seguido en la estadística descriptiva
Proporciona unidades de medida elevadas al cuadrado
Se utiliza con frecuencia en estadística inferencial