Laboratorio Virtual > Pruebas de Bernoulli > 1 2 [3] 4 5 6 7

3. La Proporción de Éxitos


Suponga nuevamente que nuestro experimento aleatorio consiste en realizar  Pruebas de Bernoulli I1, I2, ... Recuerde que el número de éxitos en las primeras n pruebas, Xn, tiene la distribución binomial con parámetros n y p. En esta sección, estudiaremos la  variable aleatoria  que da la proporción de éxitos en las primeras n pruebas:

Mn = Xn / n = (I1 + I2 + ··· + In) / n.

Note que Mn toma los valores k / n dónde k = 0, 1, ..., n.

La Función Densidad

Es fácil expresar la función densidad de la proporción de éxitos Mn en términos de la función densidad del número de éxitos Xn:

Mathematical Exercise 1. Demostrar que

P(Mn = k / n) = C(n, k) pk (1 - p)n-k para k = 0, 1, ..., n.

Simulation Exercise 2. En el  Experimento binomial de la moneda, seleccione la proporción de caras. Varíe  n y p con las barras de desplazamiento y tome nota de la forma de la función densidad. Ahora fije n = 20 y p = 0.3 y haga correr el experimento con una frecuencia de actualización de 10. Observe la convergencia aparente de la función frecuencia relativa a la función densidad.

Propiedades

La proporción de éxitos también puede ser pensada como el valor promedio de las variables indicadoras. En términos estadísticos, las variables indicadoras forman una muestra aleatoria, desde el momento que son independientes e identicamente distribuidas, y en este contexto, Mn es un caso especial de la media de la muestra. La proporción de éxitos Mn se usa típicamente para estimar la probabilidad de éxito p cuando esta probabilidad es desconocida. Es básico para la mismisima noción de probabilidad, que si el número de pruebas es grande, luego Mn debería estar cerca de p. La formulación matemática de esta idea es un caso especial de la ley de los grandes números.

Mathematical Exercise 3. Utilice las propiedades básicas del  valor esperado para demostrar que para todo n,

E(Mn) = p.

En términos estadísticos, esto significa que Mn es un estimador no polarizado de p.

Mathematical Exercise 4. Utilice las propiedades básicas de la varianza para demostrar que

var(Mn) = p(1 - p) / n.

Note que para  p fijo, la var(Mn) decrece a 0 a medida que el número de pruebas tiende a infinito. Esto significa que la estimación mejora a medida que se incrementa n; en términos estadísticos, esto se conoce como consistencia.

Simulation Exercise 5. En el experimento binomial de la moneda, seleccione la proporción de caras. Varíe n y p con las barras de desplazamiento y note la forma de la función densidad. Note que a medida que usted varía n y p, la distribución Mn se centra en p, pero a medida que se incrementa n, la distribución es más concentrada cerca de p. Ahora fije n = 50 y p = 0.5 y haga correr el experimento con una frecuencia de actualización de10. Observe la convergencia aparente de la función frecuencia relativa a la función densidad.

Simulation Exercise 6. En el experimento binomial de la moneda, seleccione la proporción de caras. Fije n = 10 y p = 0.4. Haga correr el experimento 100 veces, actualizando después de cada simulación. Después de las 100 simulaciones, calcule la raíz cuadrada del promedio de los errores al cuadrado, cuando utilizamos Mn para estimar p. Este número es una medida de la calidad de la estimación.

Simulation Exercise 7. En el experimento binomial de la moneda, seleccione la proporción de caras. Fije n = 10 y p = 0.4. Haga correr el experimento 100 veces, actualizando después de cada simulación. Después de las 100 simulaciones, calcule la raíz cuadrada del promedio de los errores al cuadrado, cuando utilizamos Mn para estimar p. Compare con el ejercicio anterior.

Data Analysis Exercise 8.In the cicada data, calcule la proporción de hembras en toda la muestra, y la proporción de hembras de cada especie en la muestra. ¿Usted piensa que estas proporciones de la muestra son buenas estimaciones de las proporciones de la población correspondiente?

Data Analysis Exercise 9. In the M&M data, acumule las carteras de manera de crear una gran muestra de carteras M&M. Ahora calcule la proporción de carteras M&M coloradas. ¿Usted piensa que esta proporción de la muestra es una buena estimación de la proporción de la verdadera población?

Mire el capítulo de Estimación de Intervalos para una propuesta diferente al problema de estimar p.

La Aproximación Normal

El  teorema del límete central se aplica a la proporción de éxitos de la misma manera que lo hace para el número de éxitos.

Mathematical Exercise 10. Demuestre que la distribución de la variable estandarizada

(Mn - p) / [p(1 - p) / n]1/2.

converge a la distribución normal estándar a medidad que se incrementa el número de pruebas.

Simulation Exercise 11. En el experimento binomial de la moneda, seleccione la proporción de caras. Fije n = 30, p = 0.6. Haga correr el experimento 1000 veces con una frecuencia de actualización de 100. Calcule y compare cada uno de los siguientes incisos:

  1. P(0.5 M30 0.7)
  2. La frecuencia relativa del evento {0.5 M30 0.7}
  3. La aproximación normal a P(0.5 M30 0.7)

Un Test de Hipótesis

A veces no estamos realmente interesados en estimar p, pero sí en determinar si p es un cierto valor ó está en una cierta región. A grandes rasgos, tomamos la decisión realizando n pruebas de Bernoulli, observando el número de éxitos, y comparando esta observación con lo que la distribución binomial prediciría, dados nuestros supuestos sobre p. En términos estadísticos, estamos realizando un  test de hipótesis.

Por ejemplo, suponga que estamos interesados en determinar si una moneda está trucada ó no. Tomaremos nuestra decisión basados en el resultado de 10 lanzamientos de la moneda. 

Mathematical Exercise 12. Demostrar que 10 lanzamientos de una moneda no trucada producirán entre 3 y 7 caras aproximadamente el 89% de las veces.

Por lo tanto, podriamos decidir declarar la moneda como no trucada si el número de caras se encuentra entre 3 y 7 y declarar la moneda como trucada en otro caso. De esta manera, si la moneda no está trucada realmente, nuestro test nos llevará a la decisión coorrecta el 89% de las veces. Aproximadamente el 11% de las veces, concluiremos erroneamente que una moneda no trucada está polarizada; en términos estadísticos, este es un error de tipo 1.

Mathematical Exercise 13. Suponga que la moneda tiene una probabilidad de caras p dada abajo. Con el test dado anteriormente, encuentre la probabilidad de que concluiremos correctamente que la moneda está trucada. Encuentre la probabilidad de que concluiremos incorrectamente que la moneda no está trucada; en términos estadísticos, este es un error de tipo 2.

  1. p = 0.6
  2. p = 0.7
  3. p = 0.8
  4. p = 0.9

Simulation Exercise 14. En el experimento binomial de la moneda, fije n = 10. Para cada uno de los siguientes valores de p, haga correr la simulación 100 veces, actualizando luego de cada simulación. En cada simulación realice un test de hipótesis. Calcule la frecuencia relativa de las decisiones correctas y la frecuencia relativa de los errores.

  1. p = 0.5
  2. p = 0.6
  3. p = 0.7
  4. p = 0.7
  5. p = 0.9.

Mathematical Exercise 15. Una candidata para un puesto político afirma que se ve favorezida por el 40% de los votantes. Sin embargo, en una encuesta a 100 votantes, sólo 30 favorecían a la candidata. ¿Usted cree en la afirmación de la candiata? Calcule la aproximación normal de la probabilidad de que una variable binomial con  n = 100 y p = 0.4 producirá 30 ó menos éxitos.