Estadística descriptiva.

1.3 Medidas de tendencia central

Media aritmética

el conjunto finito de números que es igual a la suma de todos los valores dividido entre el número de sumando que intervienen.

Media geométrica

(MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN) es la raíz N-ésima del producto de los N elementos.

Media ponderada

(MP) es una medida de centralización. Consiste en otorgar a cada observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la importancia de cada elemento.

Mediana

es el número medio en el conjunto (después que los números han sido arreglados del menor al mayor) -- o, si hay un número par de datos, la mediana es el promedio de los dos números medios.

Moda

es el número que aparece más a menudo.

Medidas de
dispersión

Parámetros estadísticos que indican como se alejan los datos respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.

Varianza

Se trata de una palabra impulsada por el matemático y científico inglés Ronald Fisher (1890–1962) y sirve para identificar a la media de las desviaciones cuadráticas de una variable de carácter aleatorio, considerando el valor medio de ésta.

Desviación estándar

es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.

Desviación media

es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

La desviación media se representa por signo Dx.

Desviación mediana

El criterio que guía esta estadística, radica en el uso de diferencias de cada dato respecto a la mediana muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran variabilidad, y si son pequeñas se espera que la variabilidad sea pequeña.
Naturalmente que el criterio que parece más apropiado es agrupar las discrepancias individuales y tratarlas en conjunto.

Rango

es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos (sin considerar la afectación de los valores extremos).

1.2 Descripción de datos

Datos agrupados

son aquellos que se encuentran ordenados y clasificados. Cuando la muestra consta de 30 o mas datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de las muestras y por consiguiente las de la población de donde fue tomada.

Datos no agrupados

son el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos.

Frecuencia de clase

es el numero de veces que se repite o aparece un mismo dato estadístico en un conjunto de observaciones de una investigación determinada, las frecuencias se les designan con las letras Fi, y por lo general se les llaman frecuencias absolutas.

Frecuencia relativa

el resultado de dividir la frecuencia absoluta de un determinado valor entre el número total de datos, se representa por ni . La suma de la frecuencias relativas es igual a 1. Lo cual puede verse fácilmente si se factoriza N .

Punto medio

es el valor medio de un conjunto de datos. Para un conjunto de datos con un número impar de miembros, es el miembro del conjunto de datos con apenas tantos valores menos que su valor como mayor que él. Para un conjunto de datos con un número par de miembros, es el promedio de los dos valores medios del conjunto de datos. El punto medio se utiliza en estadísticas para analizar un conjunto de datos.

Límites

es una magnitud fija a la que se acercan de manera progresiva los términos que conforman una secuencia infinita de magnitudes. De esta forma puede hablarse del límite de una función, el límite de una sucesión, etc.

1.1 Conceptos básicos de estadística

Definición

"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953.

Teoría de decisión

El paradigma canónico de la teoría de la decisión se caracteriza por contar con un individuo que ha de tomar una decisión (cualquiera) y de quien se dan por supuestas sus preferencias; así la teoría de la decisión no entra a considerar la naturaleza de las preferencias de los individuos, ni por qué éstos prefieren unas cosas en vez de otras; lo único que importa es que dichas preferencias satisfagan ciertos criterios básicos de consistencia lógica

Población

Es un conjunto de sujetos o elementos que presentan características comunes. Sobre esta población se realiza el estudio estadístico con el fin de sacar conclusiones.

Muestra aleatoria

una muestra es la selección de un numero de observaciones de a partir de una población objeto de investigación; una muestra aleatoria es cuando la elección sigue un método impredecible.El muestreo aleatorio puede referirse también a tomar una serie de observaciones independientes de la misma distribución de probabilidad.

Parámetros aleatorios

una medida usada para describir alguna característica de una población, tal como una aritmética, una mediana o una deviación estándar de una población.