Deberás:
- Diferenciar entre población y muestra
- Reconocer variables estadísticas cualitativas y cuantitativas
- Confeccionar una tabla de frecuencias
- Realizar gráficos estadísticos más importantes
- Hallar la media aritmética, la moda, la mediana, el recorrido y la varianza.
Población y muestra
- Variable estadística
- Propiedad que queremos conocer de un conjunto de elementos (cosas, personas, etc.).
- Población
- Conjunto de elementos donde hacemos el estudio de una variable estadística.
- Muestra
- Una parte de la población.
- Tamaño poblacional o de la población
- Número de elementos que tiene la población.
- Tamaño muestral
- Número de elementos que tiene la muestra.
Ejemplo. Queremos saber las notas onbtenidas por los 150 alumnos de un centro educativo de ESO en la asignatura de Matemáticas.
- La variable estadística es la nota de Matemáticas.
- La población son todos los alumnos del centro educativo.
- El tamaño poblacional es 150.
Como son muchos alumnos, decidimos preguntar a 30 de ellos elegidos al azar.
- La muestra serán los alumnos seleccionados de esa población.
- El tamaño muestral es 30.
Variables estadísticas
Estamos interesados en conocer determinadas características de una población; peso, altura, sueldos, número de hijos, etc., para saber como debemos actuar o planificar determinadas acciones sobre ella.
Haremoa la siguiente clasificación de las variables estadísticas:
Tabla de frecuencias
Organizaremos los datos que tengamos en forma tabular. En uuna columna pondremos los resultados y en otra columna el recuento de cada resultado obtenido. Además, aprovecharemos esta tabla para añadir columnas que recogerán las operaciones realizadas con los datos obtenidos para poder calcular determinados parámetros estadísticos de la población.
Ejemplo. En un examen de matemáticas los alumnos de un centro educativo han obtenido las siguientes notas (x es la nota, n es el número de alumnos que han obtenido la nota x):
| xi (Puntos) | ni (Recuento) |
|---|---|
| 1 | 3 |
| 2 | 6 |
| 3 | 9 |
| 4 | 13 |
| 5 | 20 |
| 6 | 25 |
| 7 | 16 |
| 8 | 11 |
| 9 | 6 |
| 10 | 2 |
Observa que los resultados se escriben ordenados de menor a mayor valor.
Gráficos estadísticos
En este curso no vamos a trabajar con las variables estadísticas continuas (las dejamos para otro curso por falta de tiempo). Para representar los datos de la tabla de frecuencias usaremos principalmente el diagrama de barras (para variables cualitativas) y el polígono de frecuencias.
Otro diagrama bastante utilizado es el diagrama de sectores. Observa que al haber muchas sectores (quesitos) no queda muy bien este diagrama.
Realiza el ejercicio 1 de la página 278.
Parámetros de centralización
La Media Aritmética
Cinco amigos se han presentado a un concurso y han conseguido 100 euros de premio, ¿cómo se reparten en dinero? Si has pensado que 20 euros para cada uno estás calculando la media aritmética μ.
Ese valor sería el que deberían tener todos los elementos de una población si todos ellos fueran iguales (que seguramente no lo serán).
El valor de la media aritmética μ se calcula sumando todos los valores y dividiendo entre el total de datos sumados. Como puede ser que haya muchos números que sumar, se utiliza la tabla de frecuencias anterior para ayudarnos de las operaciones. Observa la nueva tabla.
| xi (Puntos) | ni (Recuento) | xi · ni |
|---|---|---|
| 1 | 3 | 3 |
| 2 | 6 | 12 |
| 3 | 9 | 27 |
| 4 | 13 | 52 |
| 5 | 20 | 100 |
| 6 | 25 | 150 |
| 7 | 16 | 112 |
| 8 | 11 | 88 |
| 9 | 6 | 54 |
| 10 | 2 | 20 |
| SUMAS | N = 111 | 618 |
Ahora, calculamos μ = 618 : 111 = 5,57 puntos.
La Moda
Llamamos Moda al valor de la variable esadística que tiene mayor frecuencia absoluta.
Si observas los datos de la tabla anterior el valor de nota 6 puntos es el que más veces aparece con 25 casos. Luego, Moda = 6 puntos.
La Mediana
La Mediana es un número que deja al menos la mitad de los datos por debajo o igual a ese valor, y al menos la mitad por encima o igual a ese valor.
Sólo lo veremos este curso con variables con un tamaño finito de datos. Primero, se ordenan los datos de menor a mayor valor. Se pueden dar dos casos, según sea par o impar el número de datos en estudio.
- Si el número de datos es par, se toma el valor intermedio a los dos centrales.
- Si el número de datos es impar, se toma el valor central.
En nuestro ejemplo, tenemos N = 111 datos; es un número impar. El valor central corresponde al lugar dato que ocupa el lugar 56º (Piensa por qué). El valor que posee ese elemento dela población es de 6 puntos. Luego, La mediana vale 6 puntos.
Realiza el ejercicio 1, 2 y 3 de las páginas 280 y 281.
Parámetros de dispersión
El rango o recorrido
Es la diferencia entre el mayor y menor valor obtenidos. En nuestro ejemplo, serían 9 puntos (10 -1).
La varianza y la desviación típica
Antes calculamos para la media el valor de μ = 5,57 puntos. ¿Crees que sería «justo» asignar a todos los alumnos esa puntuación de 5,57 puntos? ¿Habrá muchos alumnos beneficiados y perjudicados por esa nota final de 5,57 puntos? Eso dependerá de si hay muchos o pocos alumnos con puntuaciones cercanas a la media obtenida. Si todos hubieran obtenido entre 5 y 6 puntos no habría muchos problemas, pero no es el caso, ¿verdad?
Para saber si son muchos o pocos los alumnos que tienen notas cercanas a la media, existe en Estadística un parámetro que ayuda a valorar si están los datos muy conncentrados junto a la media aritmética, o están muy dispersos: es la varianza, σ2. Se calcula así (durante este curso):
- Se resta al valor del dato la media aritmética obtenida.
- Se eleva al cuadrado el resultado de la resta obtenida.
- Se multiplica por la frecuencia absoluta de cada dato y se escribe el resultado en la tabla de frecuencias.
- Se suman todos los valores y se escribe en la fila de las sumas.
- La suma obtenida se divide entre el total de datos que hay.
Observa la nueva tabla de frecuencias:
| xi (Puntos) | ni (Recuento) | xi · ni | (xi - μ )2 · ni |
|---|---|---|---|
| 1 | 3 | 3 | 62,65 |
| 2 | 6 | 12 | 76,47 |
| 3 | 9 | 27 | 59,44 |
| 4 | 13 | 52 | 32,04 |
| 5 | 20 | 100 | 6,50 |
| 6 | 25 | 150 | 4,62 |
| 7 | 16 | 112 | 32,72 |
| 8 | 11 | 88 | 64,95 |
| 9 | 6 | 54 | 70,59 |
| 10 | 2 | 20 | 39,25 |
| SUMAS | N = 111 | 618 | 449,24 |
Obtenemos un valor de σ2 = 449,24 : 111 = 4,047.
Otro parámetro muy utilizado en Estadítica es la desviación típica, σ, que se define como la raíz cuadrada de la varianza (observa que no lleva el 2 de superíndica).
En nuestro ejemplo, haciendo la raíz cuadrada obtenemos un valor de σ = 2,01.
Realiza los ejercicios 1 y 2 de las páginas 282 y 283.