Estadística para ingeniería
INTEGRANTES
• Esparza Aguilar Arlette Naomi
• Hernández Gutiérrez Laura Leticia
• Ibarra Ruíz Ana Patricia
• Pedroza López Jesús Antonio
• Ramírez Ramos Patricia
• Ramos Carillo José
UNIDAD I
Fundamentos de estadística inferencial
Población
Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes, "Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones".
Parámetro
Se llama parámetro a un valor representativo de una población, como la media aritmética, una proporción o su desviación típica.
Muestra
La muestra es una pieza de la población a estudiar que sirve para representarla.
Estadistico
Es el elemento que describe una muestra y sirve como una estimación del parámetro de la población correspondiente.
Muestreo aleatorio sistemático
Esta técnica consiste en extraer elementos de la población mediante una regla sistematizadora que previamente hemos creado (sencillamente cada K elementos) . Así ; numerada la población , se elige(aleatoriamente) un primer elemento base , partiendo de éste se aplica la regla para conseguir los demás hasta conseguir el tamaño muestral adecuado . Este procedimiento conlleva el riesgo de dar resultados sesgados si en la población se dan periodicidades o rachas .
Muestreo aleatorio estratificado
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen una gran homogeneidad interna (poca varianza interna) y no obstante son heterogéneos entre sí (mucha varianza entre estratos) . La muestra se distribuye ( se extrae de ) entre los estratos predeterminados según la naturaleza de la población (ejemplo : sexo , lugar geográfico,etc.).
Muestreo por conglomerados
La unidad muestral es un grupo de elementos de la población que forman previsiblemente una unidad de comportamiento representativo. Dicha unidad es el conglomerado cuyo comportamiento interno puede ser muy disperso (varianza grande) pero que presumiblemente poseerá un comportamiento próximo a otros conglomerados (varianza entre conglomerados , pequeña). Los conglomerados se estudian en profundidad hasta conseguir el tamaño muestral adecuado.
Teorema del límite central.
describe la distribución de la media de una muestra aleatoria proveniente de una población con varianza finita.
Intervalo de confianza
es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. ubtopic
UNIDAD II
Prueba de hipótesis
Fundamentos de estadística descriptiva y Probabilidad.
Estadística descriptiva
Es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos, con el objetivo de describir las características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.
Probabilidad
La probabilidad es el cálculo matemático que evalúa las posibilidades que existen de que una cosa suceda cuando interviene el azar.
Población
Conjunto finito o infinito de elementos, sobre los que realiza observaciones.
Muestra
Subconjunto finito de una población. El número de elementos que forman la muestra se denomina tamaño muestral.
Individuo
Un individuo o unidad estadista es cada uno de los elementos que componen la población.
Variable
Es cada una de las características o cualidades poseen los individuos de una población.
Cuantitativas
estas variables se expresan por medio de un número, lo que permite utilizarlas para operaciones aritméticas.
Continuas
este tipo de variables puede adquirir valores existentes entre dos números.
Discretas
esta variable no puede adquirir valores intermedios entre dos números, sino aislados.
Cualitativas
hace alusión a aquellas cualidades que no se las puede medir numéricamente.
ordinal o cuasicuantitativa
este tipo de variables presentan modalidades no numéricas en las que hay un orden
ordinal
en este tipo de variables, en cambio, las modalidades numéricas no pueden ser ordenadas bajo ningún criterio.
Aleatorias
son aquellas funciones que asocian un número real a cada elemento del espacio muestral E
aleatoria discreta
esta variable solamente puede adquirir valores enteros.
aleatoria continua
a diferencia de la discreta, puede adquirir cualquier valor dentro de un intervalo de la recta real.
aleatoria binominal
con esta variable se muestra el número de éxitos que se adquirieron en cada prueba de un experimento. Es como la discreta, que sólo adquiere valores enteros, pero de acuerdo a las pruebas realizadas.
Independiente
los valores de este tipo de variables no dependen del de otras, son representadas en el eje de las abscisas y en las funciones con la letra X.
Datos
es la información recopilada de las variables de los elementos como resultado de estudio de un fenómeno o proceso.
cualitativos
Cuando la característica o variable en estudio es no numérica, se le denomina dato cualitativo o de atributo.
cuantitativos
En una dato cuantitativo la información es reportada numéricamente. Los datos cuantitativos pueden ser discretos o continuos
Medidas de Centralización
Las medidas de centralización o de tendencia central expresan el valor en torno al cual se sitúan los datos de una muestra.
Media
La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.
Moda
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser lo que más se lleva
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a mayor.
Medidas de posicion
parámetros estadísticos que dividen a la población en otras cuantías distintas.
Los cálculos son similares a los de la mediana, variando la posición a buscar y el intervalo en el que se encuentra el cuantil.
Cuartiles
Dividen a la población de datos en cuatro partes iguales, correspondiendo cada uno de ellos al 25% de los datos. Tenemos por tanto tres cuartiles que denotamos como Q1, Q2, Q3, y se les llama primer, segundo y tercer cuartil.
El segundo cuartil coincide con la mediana.
Deciles
Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al 10% de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2, D3, ..., D9
El quinto decil coincide con la mediana.
Percentiles
Tenemos 99 percentiles que dividirían a la población en 100 partes iguales, denotados por P1, P2, ..., P98, P99.
Los percentiles 25, 50 y 75 coinciden con los cuartiles.
Medidas de dispersión
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable
Rango
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una población o muestra estadística. Su fórmula es:
R = Máxx – Mínx
Varianza
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones
Desviación típica
La desviación típica es otra medida que ofrece información de la dispersión respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de la varianza.
Coeficiente de variación
Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión.
Diagrama de cajas
son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
histograma
Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua.
Distribución Normal estándar
es una distribución con forma de campana donde las desviaciones estándar sucesivas con respecto a la media establecen valores de referencia para estimar el porcentaje de observaciones de los datos. Estos valores de referencia son la base de muchas pruebas de hipótesis, como las pruebas Z y t.
Medidas de forma
permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
Asimetría
El concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética)
Curtosis
analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.