Lo que debes aprender en este tema es:
- Comprender el concepro de estimación puntual y por intervalos de confianza.
- Estimar la media de una población normal por intervalos de confianza para una población normal de varianza conocida.
- Estimar la media de una población normal por intervalos de confianza para una población normal de varianza desconocida y de tamaño grande.
- Estimar la proporción de una población.
- Conocer la relación entre el tamaño muestral, el error máximo de estimación y el nivel de confianza.
Estimación de un parámetro de una población
¿Sabes cuál es la nota media en Matemáticas de los alumnos de segundo bachillerato? Para saberla tendrías que tener todas las notas de los alumnos (que no disponemos), sumarlas todas y dividir por el número total de alumnos; ese valor es la media μ. Como no puedes saber su verdadero valor puedes optar por inventártelo y decir que μ = 6,3. Pero esto de inventarte el resultado así, sin más motivo que el propio capricho, no es una buena idea.
Supón que tuvieras todas las notas de los alumnos y que te pidieran hacer su tabla de frecuencias y el histograma correspondiente. Puedes pensar ...
1. Habrá pocos alumnos con notas malísimas.
2. Habrá pocos alumnos con notas buenísimas.
3. Habrá mucha gente cerca de un cierto valor intermedio, que será la media.
4. El número de alumnos que tiene menos nota que la media será parecido al número de alumnos que tienen más nota.
Si te fijas son características de una campana de Gauss. No lo será, pero se asemejará bastante. Cuánto es ese «bastante» no lo vamos a estudiar este curso (eso queda para los universitarios). Lo importante es que si acepto que es normal (se parece tanto) puedo calcular los porcentajes o las probabilidades de que un valor de la nota esté dentro de un intervalo. Esto lo hemos hecho ya, y espero que estéis cansados de este tipo de ejercicios.
También sabemos que existe un resultado teórico muy importante: el «teorema central del límite». Una de las cosas que asegura es que la media de la distribución de medias muestrales de cualquier tamaño muestral coincide con la de la población μ.
Supongamos que conozco las notas de cinco alumnosde la clase: a saber; 4,1 , 3,7, 5,5, 8,3, 2,4.
Si hago la media aritmética de esta muestra de tamaño 5 obtengo Media = 4,8 puntos (compruébalo tu mismo). Basándome en estos datos muestrales, puedo decir que la media de la población es la de la media de la muestra que tengo. Seguramente no lo es, pero es mejor «estimar» un valor conseguido con datos verdaderos que no inventados. Si la muestra es representativa (¿recuerdas este concepto del tema anterior?) tal vez esté la media que deseo conocer proxima a este valor.
Pues este método de estimar la media poblacional a partir de la media muestral es lo que se llama «Estimación Puntual». ¿Pero cuánto de cerca estamos? No se puede saber con certeza plena. Dirás que si hubiéramos elegido cinco alumnos diferentes el resultado hubiera sido otro. Y llevas toda la razón. El resultado depende del azar en cierto modo; depende de qué alumnos (muestra) tomemos.
La «Estimación por Intervalos de Confianza» va a responder a nuestra pregunta y resolver nuestras dudas. En lugar de dar un valor para la media de la población, propondremos un intervalo que sea muy probable que «cubra» el verdadero valor μ. Todas estas ideas se justifican teóricamente (creételo, por favor) y durante este curso vas a aprender esta técnica para tres situaciones diferentes:
1. Estimar la media de una población normal cuya varianza es conocida.
2. Estimar la media de una población normal cuya varianza es desconocida, pero que el tamaño de la muestra es «grande» (Tienes que saber que grande es n mayor o igual que 30).
3. Estimar la proporción de una población.
Además, aprenderás conceptos tales como:
1. Nivel de confianza. (Es el área de la campana de Gauss sobre el intervalo: 1- α)
2. Error máximo de estimación (Es la mitad de la amplitud del intervalo)
3. Amplitud del intervalo de confianza. (longitud total del intervalo)
4. La relación que existe entre Error, tamaño muestral y nivel de confianza.
Y deberás interpretar correctamente lo que significa un intervalo de confianza. (Cuesta de entender al principio, pero con el trabajo y los ejemplos se comprende finalmente.)
Estimación de la media de una población normal de varianza conocida
Para trabajar, descarga la hoja de cálculo
La teoría dice:
Veamos un ejemplo:
«El grado de conocimiento en historia de una población se distribuye normalmente con desviación típica 2,3 puntos. Para estimar la media de la población se realiza un muestreo aleatorio simple de 100 estudiantes, obteniendo una media de 6,32 puntos. Halla el intervalo de confianza de la media de la población a un nivel de confianza del 95%.»
3. El tamaño muestral es n = 100.
La amplitud del I.C. es 6,77 - 5,87 =0,9. Y el Error Máximo Admisible (EMax) = 0,45 (la mitad).
Observa que de la fórmula del I.C. se obtiene la expresión del Error Máximo Admisible:
La expresión anterior da la relación entre Nivel de confianza, Error Máximo Admisible y tamaño muestral. Si conocemos dos de estos valores, con esta expresión hallaremos el tercero resolviendo la ecuación que nos proporciona.
TAREA:
Estimación de la media de una población normal de varianza desconocida y tamaño muestral grande
Descarga la siguiente hoja de cálculo para trabajar.
Aplicaremos la misma que para varianza conocida para obtener el intervalo de confianza. Pero como no conocemos la varianza de la población debemos estimarla. Te diré que también existen técnicas para hallar un I.C. para la varianza de una población, pero eso es para los universitarios. Nosotros nos vamos a conformar con una estimación puntual (un valor) para la varianza. Algo importante que debes saber es que no hay unanimidad en llamar al estadístico usado para este fin. Según que textos leas, o que profesores te lo expliquen, verás que lo llaman «cuasivarianza», «varianza muestral», «varianza de la muestra», etc. También hay muchas formas de representación o escritura.
Lo que hay que hacer ...
1. Comprobamos que es n mayor o igual que 30 (Tamaño muestral grande)
2. Estimamos la varianza por la cuasivarianza. Obtenemos σ = Sn-1
3. Continuamos como el caso de varianza conocida.
Estudia los ejemplos resueltos del libro de texto y realiza los ejercicios 14, 20, 27 y 32 de las páginas 305 y 306, y el ejercicio 5 de la autoevaluación.
Estimación de la proporción de una población
Descarga la siguiente hoja de cálculo para trabajar esta parte.
El resultado teórico que deberemos aprender es el siguiente:
Estudia ahora las páginas 312 y 313 del libro de texto y realiza los ejercicios.
Debes aprender también la fórmula del intervalo de confianza para la proporción de una población,
Estudia las páginas 314 y 315 de tu libro de texto y realiza los ejercicios correspondientes.
Relación entre el error, el tamaño muestral y el nivel de confianza
La fórmula que debes memorizar es la siguiente:
OBSERVACIÓN: cuando σ es desconocida se sustituye por la cuasidesviación s. Y para el caso de una proporción, σ2 = p·(1-p); y el valor de p siempre será 0,5 salvo que se diga otra cosa en el enunciado.
IMPORTANTE: La amplitud de un intervalo es la longitud total que tiene; mientras que el error máximo de estimación es la mitad de esa longitud.
Observa que de la fórmula anterior se deduce que a partir de dos datos podemos conocer el tercero (supuesto que la varianza de la población es conocida). Comprueba y practica con la siguiente hoja de cálculo.
Realiza los ejercicios 1 de la página 298; el ejercicio 2 de la página 299; y el ejercicio 4 (autoevaluación) de la página 321.
En la siguiente hoja de cálculo (descárgala) se calculan 100 intervalos de confianza para la media de una población normal estándar N(0,1). Es una simulación de 100 muestreos diferentes (como si hubiera hecho 100 ejercicios de lo mismo, para que lo entiendas) de 50 muestras en cada uno de ellos. Se ha simulado muestreo aleatorio simple (¿Qué significa esto?). Para cada caso se ha calculado la media y la cuasi-desviación típica (a mano es una paliza). El porqué de calcular la cuasi-desviación típica es porque simulamos que desconocemos el valor de la varianza de la población (aunque sí que lo sabemos, pero es por hacer el ejemplo. Cuando el profesor pone una ecuación, él ya sabe lo que tiene que salir, pero te pide que la halles de todas maneras) Debes recordar que la varianza de la población la estimamos con la cuasi-varianza muestral (no con la varianza muestral) y el motivo lo sabrás en cursos posteriores. Se calculan los intervalos de confianza para el nivel de confianza puesto en la celda correspondiente con la correspondiente fórmula (¿Cuál?) y, puesto que sabemos el verdadero valor de la media (μ = 0) se ha escrito «CORRECTO» o «INCORRECTO» según el intervalo cubra o no el valor de la media poblacional.
Es importante que observes el porcentaje de intervalos correctos que hay y que varíes tú mismo/a en tu computadora el nivel de confianza. ¿Qué observas?
Espero que tú hayas sido capaz de deducir el significado del «nivel de confianza».