Estadística Aplicada a la industria
Estadistica descriptiva
Base de datos
Variable: Es una característica que puede fluctuar y cuya variación es susceptible a adoptar diferentes valores, los cuales pueden medirse u observarse
Discreta: Es una variable que no puede tomar algunos valores dentro de un mínimo conjunto numerable
Continua: Puede tomar un valor fijo dentro de un intervalo determinado. Y siempre entre dos valores observables va a existir un tercer valor intermedio
Individuo: Cada uno de los elementos que forman parte de la población.
Muestra: Cualquier subconjunto de una población.
Tipos de Datos
Cualitativo
Se asigna a la variable un valor no numérico
Cuantitativo Datos de carácter numérico
Cualitativos Ordinales
Valores que se pueden ordenar.
Cualitativos nominales
Valores que no pueden ser ordenados
Cualitativos nominales binarios
Valores asignados a las variables que solo tienen dos opciones
Cuantitativos discretos
El dato se obtiene de procesos de conteo.
Cuantitativos continuos.
Se obtienen de un proceso de medición y entre un rango.
Cuantitativo Continúo de rango
Son aquellos datos cuantitativos en los cuales el 0 no indica ausencia de valor
Cuantitativo de Razón.
El 0 significa ausencia de valor.
Análisis de datos
Gráfico
Gráfico de Barras: Tiene barras rectangulares con longitudes proporcionales a los valores que representan. Las gráficas de barras se utilizan para comparar dos o más valores.
Pastel: Es un círculo dividido en partes, donde el área de cada parte es proporcional al número de datos de cada categoría
Línea: Muestran una serie como un conjunto de puntos conectados mediante una sola línea
Caja: Es una herramienta que permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc.
Histograma: Es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados.
Índices
Posición
Cuartil: Son cuantiles que se multiplican por un cuarto de un conjunto de datos
Percentil: Es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo.
Centralización
Media: Es el valor característico de una serie de datos cuantitativos
Mediana: Es un conjunto de números es el número medio en el conjunto (después que los números han sido arreglados del menor al mayor)
Moda: Es el valor que tiene mayor frecuencia absoluta
Dispersión
Rango: Es el intervalo entre el valor máximo y el valor mínimo
Desviación estándar: Es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media
Varianza: Es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media
Coeficiente de variación: Nos permite tener una medida de dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones.
Forma
Sesgo: Tendencia a subestimar los resultados experimentales inesperados o no deseados, atribuyendo los resultados a errores de muestreo
Curtosis: Es una medida de forma que mide cuán escarpada o achatada está una curva o distribución
Topic principal
Estadística de probabilidad
La probabilidad asociada a un suceso o evento aleatorio es una medida del grado de certidumbre de que dicho suceso pueda ocurrir. Se suele expresar como un número entre 0 y 1, donde un suceso imposible tiene probabilidad cero y un suceso seguro tiene probabilidad uno.
Discreta
Describe la probabilidad de ocurrencia de cada valor de una variable aleatoria discreta. Una variable aleatoria discreta es una variable aleatoria que tiene valores contables
Hipergeométrica
Es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo.
Poisson
Es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo.
Binomial
Es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos.
Bernalli
Es una distribución de probabilidad discreta, que toma valor 1 para la probabilidad de éxito y valor 0 para la probabilidad de fracaso.
Continua
Describe las probabilidades de los posibles valores de una variable aleatoria continua, solo los rangos de valores pueden tener una probabilidad diferente de cero.
T - Student
Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño.
Normal
Es una distribución con forma de campana O también conocdida como de Gauss, donde las desviaciones estándar sucesivas con respecto a la media establecen valores de referencia para estimar el porcentaje de observaciones de los datos.
Estandar
El promedio siempre es 0 y su desviación estándar de 1. También es llamada distribución
z.
Valor Z.
Es una forma de
convertir el valor de
cualquier distribución
normal a la distribución
normal estándar. Las tablas
de valores z leen el área
bajo la curva
de una distribución normal
estándar
Ji Cuadrada
Es una distribución de probabilidad continua con un parámetro que representa los grados de libertad de la variable aleatoria Donde son variables aleatorias normales independientes de media cero y varianza uno.
Estadística Inferencial
Muestreo
Tipos de muestreo
Probabilístico
Aleatorio Simple
Se extrae al azar un numero determinado de elementos
Aleatorio Sistemático
Se trabaja bajo un proceso seriado
Estratificado
Subdivide la población en estratos mismos de los que se extrae la muestra
Conglomerados
Se utiliza cuando los individuos constituyen grupos
No probabilístico
Accidental o causal
Una muestra que este al alcance
Internacional
Los elementos se escogen de modo directo
Intervalos de confianza
Determinación de tamaños muéstrales
Para estimar μ
Para estimar proporción
Para medias poblacionales
Muestras grandes
Muestras pequeñas
Para proporciones poblacionales
Determinación de los tamaños muéstrales
Controlando el ancho de un intervalo
Cambio del nivel de confianza
Cambio del tamaño muestral
Teorema del limite central
Distribución de medias muestrales > 30 siguen aprox. distribución normal.
Media poblacional es igual a medio muestral
La varianza de la distribución de las medias muestrales será σ²/n (varianza de la población dividido entre el tamaño de la muestra).
Conceptos
Población
Grupo definido o indefinido que abarca el total de los individuos u observaciones de interés para un investigador en un caso particular
Muestra
Cualquier subconjunto de un población, esta se compone de los individuos, seleccionados de la población
Parámetro
Cuantificación representativa de cualquier característica numérica de una población, este es un valor.
Estadístico
Cuantificación representativa de cualquier característica numérica de una muestra, es un valor, un dato.