Tema 14. Parámetros estadísticos

Deberás:

  • Calcular la media, la moda y la mediana
  • Calcular la varianza y la desviación típica
  • Calcular el coeficiente de variación
  • Calcular cuartiles y percentiles
  • Representar un diagrama de caja y bigotes
Parámetros de centralización

La Media Aritmética

Cinco amigos se han presentado a un concurso y han conseguido 100 euros de premio, ¿cómo se reparten en dinero? Si has pensado que 20 euros para cada uno estás calculando la media aritmética μ.
Ese valor sería el que deberían tener todos los elementos de una población si todos ellos fueran iguales (que seguramente no lo serán).

El valor de la media aritmética μ se calcula sumando todos los valores y dividiendo entre el total de datos sumados. Como puede ser que haya muchos números que sumar, se utiliza la tabla de frecuencias anterior para ayudarnos de las operaciones. Observa la nueva tabla.

xi (Puntos) ni (Recuento) xi · ni
1 3 3
2 6 12
3 9 27
4 13 52
5 20 100
6 25 150
7 16 112
8 11 88
9 6 54
10 2 20
SUMAS N = 111 618

Ahora, calculamos μ = 618 : 111 = 5,57 puntos.

La Moda

Llamamos Moda al valor de la variable esadística que tiene mayor frecuencia absoluta.

Si observas los datos de la tabla anterior el valor de nota 6 puntos es el que más veces aparece con 25 casos. Luego, Moda = 6 puntos.

La Mediana

La Mediana es un número que deja al menos la mitad de los datos por debajo o igual a ese valor, y al menos la mitad por encima o igual a ese valor.

Sólo lo veremos este curso con variables con un tamaño finito de datos. Primero, se ordenan los datos de menor a mayor valor. Se pueden dar dos casos, según sea par o impar el número de datos en estudio.

  • Si el número de datos es par, se toma el valor intermedio a los dos centrales.
  • Si el número de datos es impar, se toma el valor central.

En nuestro ejemplo, tenemos N = 111 datos; es un número impar. El valor central corresponde al lugar dato que ocupa el lugar 56º (Piensa por qué). El valor que posee ese elemento dela población es de 6 puntos. Luego, La mediana vale 6 puntos.

Realiza los ejercicios 1 y 2 de la página 268; y el ejercicio 1 de la página 270.

Parámetros de dispersión

El rango o recorrido

Es la diferencia entre el mayor y menor valor obtenidos. En nuestro ejemplo, serían 9 puntos (10 -1).

La varianza y la desviación típica

Antes calculamos para la media el valor de μ = 5,57 puntos. ¿Crees que sería «justo» asignar a todos los alumnos esa puntuación de 5,57 puntos? ¿Habrá muchos alumnos beneficiados y perjudicados por esa nota final de 5,57 puntos? Eso dependerá de si hay muchos o pocos alumnos con puntuaciones cercanas a la media obtenida. Si todos hubieran obtenido entre 5 y 6 puntos no habría muchos problemas, pero no es el caso, ¿verdad?
Para saber si son muchos o pocos los alumnos que tienen notas cercanas a la media, existe en Estadística un parámetro que ayuda a valorar si están los datos muy conncentrados junto a la media aritmética, o están muy dispersos: es la varianza, σ2. Se calcula así (durante este curso):

  • Se resta al valor del dato la media aritmética obtenida.
  • Se eleva al cuadrado el resultado de la resta obtenida.
  • Se multiplica por la frecuencia absoluta de cada dato y se escribe el resultado en la tabla de frecuencias.
  • Se suman todos los valores y se escribe en la fila de las sumas.
  • La suma obtenida se divide entre el total de datos que hay.

Observa la nueva tabla de frecuencias:

xi (Puntos) ni (Recuento) xi · ni (xi - μ )2 · ni
1 3 3 62,65
2 6 12 76,47
3 9 27 59,44
4 13 52 32,04
5 20 100 6,50
6 25 150 4,62
7 16 112 32,72
8 11 88 64,95
9 6 54 70,59
10 2 20 39,25
SUMAS N = 111 618 449,24

Obtenemos un valor de σ2 = 449,24 : 111 = 4,047.

Otro parámetro muy utilizado en Estadítica es la desviación típica, σ, que se define como la raíz cuadrada de la varianza (observa que no lleva el 2 de superíndica).
En nuestro ejemplo, haciendo la raíz cuadrada obtenemos un valor de σ = 2,01.

Realiza los ejercicios 3 y 4 de la página 269; y los ejercicios 2, 3 y 4 de la página 271.

Coeficiente de variación

Es el cociente entre la desviación típica y la media aritmética; suele expresarse en porcentaje. Nos permite comparar la homogeneidad de las poblaciones (Se explicará en clase).

En nuestro ejemplo, sabemos que σ=2,01 y que μ=5,57. Luego,
C.V. =2,01 / 5,57 = 0,3609 =36,09%

Realiza el ejercicio 2 de la página 275.

Parámetros de posición

Dividen la población en partes proporcionales (la mediana divide por la mitad la población).

Tenemos tres tipos: deciles, cuartiles y percentiles

Primer cuartil Q1
El valor que deja al menos a la cuarta parte de los datos por debajo o igual a ese valor
Tercer cuartil Q3
El valor que deja al menos a las tres cuartas partes de los datos por debajo o igual a ese valor
Rango intercuartílico RIC.
Es la diferencia entre el tercer cuartil y el primer cuartil; es decir, R.I. = Q3 - Q1.

¿Cuál es el segundo cuartil Q2?

Percentiles

Es análogo a los cuartiles, pero en porcentaje. P80 es el percentil 80; número que deja el 80% de los datos al menos por debajo de ese número y al menos el 20% de los datos por encima.

Realiza los ejercicios 1 y 2 de la página 276.

Diagrama de caja y bigotes

Es una representación de los datos basado en los valores de los cuartiles y de la mediana que nor permite detectar valores anómalos de la población. Se construye de la siguiente forma:

  • Obtener el máximo y el mínimo valor de los datos.
  • Hallar Q1, Q3 y la mediana.
  • Hallar el RIC.
  • Hallar la longitud de los bigotes
    • Bigote inferior: Li = Q1 - 1,5 · RIC.
    • Bigote superior: Ls = Q1 + 1,5 · RIC.
  • Se consideran atípicos los valores que sean inferiores a Li o superiores a Ls.
  • Si no hay valores atípicos, se considera como nueva longitud del bigote la de aquel valor de los datos que no exceda el intervalo correspondiente (Li , Ls).

Ejemplo. A partir de los datos siguientes:
1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 9, 9, 10, 17.
Se obtiene el diagrama de caja y bigotes representado. El rectángulo central se corresponde con los valores de los cuartiles. La barra central es el correspondiente al valor de la mediana. La cruz marca el valor atípico de 17.

Realiza los ejercicios 3 y 4 de la página 277.

Ejercicios de refuerzo

Realiza la autoevaluación de la página 283.