Estadística descriptiva.
1.3 Medidas de tendencia central
Media aritmética
el conjunto finito de números que es igual a la suma de todos los valores dividido entre el número de sumando que intervienen.
Media geométrica
(MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN) es la raíz N-ésima del producto de los N elementos.
Media ponderada
(MP) es una medida de centralización. Consiste en otorgar a cada observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la importancia de cada elemento.
Mediana
es el número medio en el conjunto (después que los números han sido arreglados del menor al mayor) -- o, si hay un número par de datos, la mediana es el promedio de los dos números medios.
Moda
es el número que aparece más a menudo.
Medidas de
dispersión
Parámetros estadísticos que indican como se alejan los datos respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.
Varianza
Se trata de una palabra impulsada por el matemático y científico inglés Ronald Fisher (1890–1962) y sirve para identificar a la media de las desviaciones cuadráticas de una variable de carácter aleatorio, considerando el valor medio de ésta.
Desviación estándar
es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
Desviación media
es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
La desviación media se representa por signo Dx.
Desviación mediana
El criterio que guía esta estadística, radica en el uso de diferencias de cada dato respecto a la mediana muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran variabilidad, y si son pequeñas se espera que la variabilidad sea pequeña.
Naturalmente que el criterio que parece más apropiado es agrupar las discrepancias individuales y tratarlas en conjunto.
Rango
es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos (sin considerar la afectación de los valores extremos).
1.2 Descripción de datos
Datos agrupados
son aquellos que se encuentran ordenados y clasificados. Cuando la muestra consta de 30 o mas datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de las muestras y por consiguiente las de la población de donde fue tomada.
Datos no agrupados
son el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos.
Frecuencia de clase
es el numero de veces que se repite o aparece un mismo dato estadístico en un conjunto de observaciones de una investigación determinada, las frecuencias se les designan con las letras Fi, y por lo general se les llaman frecuencias absolutas.
Frecuencia relativa
el resultado de dividir la frecuencia absoluta de un determinado valor entre el número total de datos, se representa por ni . La suma de la frecuencias relativas es igual a 1. Lo cual puede verse fácilmente si se factoriza N .
Punto medio
es el valor medio de un conjunto de datos. Para un conjunto de datos con un número impar de miembros, es el miembro del conjunto de datos con apenas tantos valores menos que su valor como mayor que él. Para un conjunto de datos con un número par de miembros, es el promedio de los dos valores medios del conjunto de datos. El punto medio se utiliza en estadísticas para analizar un conjunto de datos.
Límites
es una magnitud fija a la que se acercan de manera progresiva los términos que conforman una secuencia infinita de magnitudes. De esta forma puede hablarse del límite de una función, el límite de una sucesión, etc.
1.1 Conceptos básicos de estadística
Definición
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953.
Teoría de decisión
El paradigma canónico de la teoría de la decisión se caracteriza por contar con un individuo que ha de tomar una decisión (cualquiera) y de quien se dan por supuestas sus preferencias; así la teoría de la decisión no entra a considerar la naturaleza de las preferencias de los individuos, ni por qué éstos prefieren unas cosas en vez de otras; lo único que importa es que dichas preferencias satisfagan ciertos criterios básicos de consistencia lógica
Población
Es un conjunto de sujetos o elementos que presentan características comunes. Sobre esta población se realiza el estudio estadístico con el fin de sacar conclusiones.
Muestra aleatoria
una muestra es la selección de un numero de observaciones de a partir de una población objeto de investigación; una muestra aleatoria es cuando la elección sigue un método impredecible.El muestreo aleatorio puede referirse también a tomar una serie de observaciones independientes de la misma distribución de probabilidad.
Parámetros aleatorios
una medida usada para describir alguna característica de una población, tal como una aritmética, una mediana o una deviación estándar de una población.