Laboratorio Virtual > Pruebas de Bernoulli  > 1 [2] 3 4 5 6 7

2. La Distribución Binomial


Suponga que nuestro experimento aleatorio es hacer Pruebas de Bernoulli I1, I2, .... En esta sección estudiaremos la variable aleatoria Xn que nos da el número de éxitos en los primeros n intentos. Esta variable tiene una expresión simple en términos de las variables indicadoras: 

Mathematical Exercise 1. Demostrar que Xn = I1 + I2 + ··· + In.

La Función Densidad

Mathematical Exercise 2. Suponga que  K N = {1, 2, ..., n} y  #(K) = k. Use las suposiciones de las pruebas de Bernoulli para demostrar que

P(Ij = 1 para  j K y Ij = 0 para  j N - K) = pk(1 - p)n -k.

Tenga en cuenta que el número posible de subconjuntos de tamaño k de un conjunto de tamaño n es el coeficiente binomial

C(n, k). = n!/[k!(n - k)!}

Mathematical Exercise 3. Use el  Ejercicio 2 y las propiedades básicas de probabilidad para demostrar que

P(Xn = k) = C(n, k)pk(1 - p)n-k para k = 0, 1, ..., n.

La distribución con esta función densidad se conoce como la distribución binomial con parámetros n y p. La familia binomial de distribuciones es una de las más importantes en probabilidad. 

Simulation Exercise 4. En el experimento binomial de la moneda, varíe n y p con las scrollbars, y tome nota de la forma y posición de la función densidad. Ahora con n = 10 y p = 0.7, haga correr la simulación 1000 veces, actualizando cada 10 simulaciones. Tome nota de la aparente convergencia de la función frecuencia relativa a la función densidad.

Mathematical Exercise 5. Un dado justo es arrojado 5 veces. De explícitamente la función densidad del número de unos. 

Mathematical Exercise 6. Un estudiante da un exámen de tipo multiple choice de 10 preguntas con 4 opciones cada una. Si el estudiante adivina ciegamente, encuentre la probabilidad de que al menos conteste 5 preguntas en forma correcta.

Mathematical Exercise 7. Use el teorema binomial para demostrar que la función densidad binomial es realmente una función densidad (discreta). 

Mathematical Exercise 8. Demostrar que

  1. P(Xn = k) > P(Xn = k - 1) si y solo si k < (n + 1)p.
  2. P(Xn = k) = P(Xn = k - 1) si y solo si (n + 1)p es un entero entre 1 y n, y k = (n + 1)p

Por lo tanto, la función densidad al principio crece y después decrece, alcanzando su valor más grande en floor[(n + 1)p]; este entero es la moda de la distribución. (Recuerde que  floor(x) es el entero más grande que no es mayor a x). En el caso que m = (n + 1)p es un entero entre 1 y n, hay dos modas consecutivas, en m - 1 y m. En cualquier evento, la forma de la distribución binomial es unimodal.

Mathematical Exercise 9. Suponga que U  es una variable aleatoria que tiene distribución binomial con parámetros  n y p. Demostrar que n - U tiene distribución binomial con parámetros n and 1 - p.

  1. Elabore una demostración probabilistica, basada en las pruebas deBernoulli 
  2. Elabore una demostración analítica, basada en las funciones densidad

Problemas Famosos

En 1693, Samuel Pepys le pregunto a Isaac Newton si era más probable obtener al menos un uno en 6 lanzamientos de un dado ó al menos dos unos en 12 lanzamientos de un dado. Este problema se conoce como un problema de Pepys; naturalmente, Pepys pensaba en un dado no trucado.

Simulation Exercise 10. Adivine la respuesta al problema de Pepys basándose en datos empíricos. Con un dado no trucado y  n = 6, haga correr la  simulación del experimento con el dado 500 veces y calcule la frecuencia relativa de al menos un uno. Ahora con n = 12, haga correr la simulación 500 veces y calcule la frecuencia relativa de al menos dos unos. Compare los resultados.

Mathematical Exercise 11. Resuelva el problema de Pepys utilizando la distribución binomial. 

Mathematical Exercise 12. ¿Qué es más probable: al menos un uno en 4 lanzamientos de un dado no trucado ó al menos un doble uno en 24 lanzamientos de dos dados no trucados? Este se conoce como el problema de  DeMere's, llamado después de Chevalier De Mere

Momentos

Calcularemos la media y la  varianza de la distribución binomial en varias formas diferentes. El método que utiliza las variables indicadoras es el mejor.

Mathematical Exercise 13. Use el  Ejercicio 1 y propiedades básicas del valor esperado para demostrar que

E(Xn) = np.

Esto tiene sentido intuitivo, ya que  p debería ser aproximadamente la proporción de éxitos en un número grande de pruebas.

Mathematical Exercise 14. Calcule la media utilizando la función densidad.

Mathematical Exercise 15. Use el Ejercicio 1 y propiedades de la varianza para demostrar que

var(Xn) = np(1 - p)

Mathematical Exercise 16. Realice el gráfico de la varianza como una función de p. Note en particular que la varianza es máxima cuando  p = 1/2 y mínima cuando p = 0 ó p = 1.

Mathematical Exercise 17. Calcule la varianza utilizando la función densidad.

Mathematical Exercise 18. Demostrar que la  función generadora de probabilidad está dada por

E(tXn) = (1 - p + pt)n para t en R

Mathematical Exercise 19. Use la función generadora de probabilidad del Ejercicio 18 para calcular la media y la varianza.

Mathematical Exercise 20. Use la identidad jC(n, j) = nC(n - 1, j - 1) para n, j = 1, 2, ... para demostrar que

E(Xnk) = npE[(Xn - 1 + 1)k - 1] para n, k = 1, 2, ...

Mathematical Exercise 21. Use el resultado recursivo del Ejercicio 20 para dar aún una derivación más de la media y la varianza.

Simulation Exercise 22. En el experimento binomial de la moneda, varíe n y p con las scrollbars y note la posición y el tamaño de la barra media/desviación estándar. Ahora con p = 0.7, haga correr la simulación 1000 veces, actualizando cada 10 simulaciones. Note la aparente convergencia entre la media y desviación estándar de la muestra y la media y la desviación estándar de la distribucion.

Mathematical Exercise 23. Un cierto tipo de misil tiene una probabilidad de fallar de 0.02. Calcule la media y la desviación estándar del número de fallas en 50 lanzamientos.

Mathematical Exercise 24. Un dado no trucado es arrojado 1000 veces. De la media y la desviación estándar del número de unos.

La Tabla de Galton

La Tabla de Galton es un arreglo triangular de clavijas. Las filas están numeradas   0, 1, ... desde la punta hacia abajo. La fila n tiene n + 1 clavijas numeradas desde 0 a la izquierda hasta n a la derecha. Por lo tanto una clavija puede ser identificada unicamente por el par ordenado (n, k) dónde n es el número de la fila y k es el número de clavija en esa fila. La Tabla de Galton se llama así debido a  Francis Galton.

Ahora suponga que una pelota es arrojada detrás de la la clavija de la punta (0, 0). Cada vez que la pelota choca con una clavija, esta rebota hacia la derecha con probabilidad p y hacia la izquierda con probabilidad  1 - p, independientemente de rebote a rebote.

Mathematical Exercise 25. Demostrar que el número de clavija que la pelota choca en la fila n tiene distribución binomial con parámetros  n y p.

Simulation Exercise 26. En el Experimento de la tabla de Galton, fije n = 10 y p = 0.1. Cliquee step varias veces y observe las pelotas callendo a través de las clavijas. Repita para p = 0.3, 0.5, 0.7, y 0.9.

Simulation Exercise 27. En el  Experimento de la tabla de Galton, fije n = 15 y p = 0.1. Haga correr la simulación 100 veces, actualizando después de cada simulación. Note la forma general de los caminos a través de la tabla. Repita para p = 0.3, 0.5, 0.7, y 0.9.

Suma de Variables Binomiales Independientes

A continuación estableceremos una propiedad de invarianza importante de la distribución binomial.

Mathematical Exercise 28. Use la representación en términos de las variables indicadoras para demostrar que si m y n son enteros positivos luego

  1. Xm+n - Xm tiene la misma distribución que Xn (binomial con parámetros n y p).
  2. Xm+n - Xm y Xm son independientes.

Por lo tanto, el proceso aleatorio Xn, n = 1, 2, ... tiene incrementos estacionarios, independientes.

Mathematical Exercise 29. Demostrar que si U y V son variables aleatorias independientes para un experimento, y que U tiene distribución binomial con parámetros m y p, y V tiene distribución binomial con parámetros n y p, entonces U + V tiene distribución binomial con parámetros m + n and p.

  1. De una demostración probabilistica, utilizando el Ejercicio28.
  2. De una demostración analítica utilizando funciones densidad.
  3. De una demostración analítica utilizando funciones generadoras de probabilidad.

Conexión con la Distribución Hipergeométrica

Mathematical Exercise 30. Suponga m < n. Demostrar que

P(Xm = j | Xn = k) = C(m, j) C(n - m, k - j) / C(n, k) para j = 0, 1, ..., m.

Interesantemente, la distribución del Ejercicio 30 es independiente de p. Esta es conocida como la Distribución Hipergeométrica con parámetros n, m y k. Intente interpretar este resultado probabilisticamente.

Mathematical Exercise 31. Una moneda es arrojada 100 veces y resultan 30 caras. Encuentre la función densidad del número de caras en los primeros 20 lanzamientos.

La Aproximación Normal

Simulation Exercise 32. En el experimento binomial de la línea de tiempo , fije p = 0.1. Comience con n = 1 y sucesivamente incremente n de a 1. Note la forma de la función densidad cada vez. Con n = 100, haga correr el experimento 1000 veces, actualizando cada 10. Repita para p = 0.3, 0.5, 0.7, y 0.9.

La forma de campana característica que usted debería observar en el Ejercicio 32 es un ejemplo del teorema del límite central, debido a que la variable binomial puede ser escrita como una suma de n variables aleatorias independientes, identicamente distribuidas (las variables indicadoras).

Mathematical Exercise 33. Demuestre que la distribución de la variable estandarizada dada abajo converge a la distribución normal estándar a medida que crece n

(Xn - np) / [np(1 - p)]1/2.

Esta versión del teorema del límite central es conocida como el teorema de DeMoivre-Laplace, y es llamado así debido a Abraham DeMoivre y Simeon Laplace. Desde un punto de vista práctico, el Ejercicio 33 significa que, para n grande, la distribución de Xn es aproximadamente normal, con media np y varianza np(1 - p). Qué tan grande tiene que ser n para que la aproximación normal funcione bien depende del valor de p. La experiencia nos dice que necesitamos que np y n(1 - p) sean al menos 5.

Simulation Exercise 34. En el  experimento binomial de la línea de tiempo , fije p = 0.5 y n = 15. Haga correr el experimento 1000 veces con una frecuencia de actualización de 100. Calcule y compare lo siguiente:

  1. P(5 X15 10)
  2. La frecuencia relativa del evento{5 X15 10}
  3. La aproximación normal a P(5 X15 10)

Simulation Exercise 35. En el  experimento binomial de la linea de tiempo , fije p = 0.3 y n = 20. Haga correr el experimento 1000 veces con una frecuencia de actualización de 100. Calcule y compare lo siguiente:

  1. P(5 X20 10)
  2. La frecuencia relativa del evento {5 X20 10}
  3. La aproximación normal a P(5 X20 10)

Simulation Exercise 36. En el  experimento binomial de la linea de tiempo , fije p = 0.8 y n = 30. Haga correr el experimento 1000 veces con una frecuencia de actualización de 100. Calcule y compare lo siguiente:

  1. P(22 X30 27)
  2. La frecuencia relativa del evento {22 X30 27}
  3. La aproximación normal a P(22 X30 27)

Mathematical Exercise 37. Suponga que en una cierta ciudad, el 40% de los votantes empadronados prefieren al candidato A. Se selecciona una muestra de 50 votantes empadronados.

  1. De la media y la varianza del número de votantes en la muestra que prefieren a A.
  2. Encuentre la probabilidad de que menos de 19 votantes en la muestra prefieran a A.
  3. Calcule la aproximación normal a  la probabilidad en (b).

Confiabilidad

La distribución binomial aparece frecuentemente en el contexto de la confiabilidad. Suponga que un sistema consiste de n componentes los cuales operar en forma independiente. Cada componente o es bueno, con probabilidad p, ó es defectuoso, con probabilidad1 - p. Por lo tanto, los componentes son pruebas de Bernoulli. Ahora suponga que un sistema visto como un todo funciona correctamente si y sólo si al menos k de los n componentes son buenos. En términos de confiabilidad, un sistema tal es llamado, en forma suficientemente apropiada, sistema de k entre n. La probabilidad del que el sistema funcione correctamente se llama la confiabilidad de sistema.

Mathematical Exercise 38. Comente acerca de la razonabilidad de las suposiciones de que los componentes se comportan como pruebas de Bernoulli.

Mathematical Exercise 39. Demuestre que la confiabilidad de un sistema k entre n es Rn,k(p) = P(X >= k) donde  X tiene distribución binomial con parámetros n y p.

Mathematical Exercise 40. Demuestre que Rn,n(p) = pn. Un sistema de n entre n es llamado un sistema serie.

Mathematical Exercise 41. Demuestre que  Rn,1(p) = 1 - (1 - p)n. Un sistema de 1 entre n es llamado un sistema paralelo.

Simulation Exercise 42. En el experimento binomial de la moneda  fije n = 10 y p = 0.9 y haga correr la simulación 1000 veces, actualizando cada 100 simulaciones. Calcule la confiabilidad empírica y compárela con la confiabilidad real en cada uno de los siguientes casos:

  1. Sistema de10 entre 10 (serie).
  2. Sistema de 1 entre 10 (paralelo).
  3. Sistema de 4 entre 10.

Mathematical Exercise 43. Considere un sistema con  n = 4 componentes. Dibuje los gráficos de  R4,1, R4,2, R4,3, y R4,4 en el mismo conjunto de ejes.

Mathematical Exercise 44. Un sistema de  n entre 2n - 1 es un sistema de las reglas mayoritarias.

  1. Calcule la confiabilidad de un sistema de 2 entre 3.
  2. Calcule la confiabilidad de un sistema de 3 entre 5.
  3. ¿Para qué valores de p es un sistema de 3 entre 5 mas confiable que un sistema de 2 entre 3?
  4. Dibuje los gráficos de R3,2 y R5,3 en el mismo conjunto de ejes..

Simulation Exercise 45. En el  experimento de la moneda binomial, calcule la confiabilidad empírica, basada en 100 simulaciones, en cada uno de los siguientes casos. Compare sus resultados con las probabilidades reales.

  1. Un sistema de 2 entre 3 con p = 0.3
  2. Un sistema de 3 entre 5 con p = 0.3
  3. Un sistema de 2 entre 3 con p p = 0.8
  4. Un sistema de 3 entre 5 con p p = 0.8

Mathematical Exercise 46. Demostrar que R2n - 1, n(1/2) = 1/2.