Laboratorio Virtual > Distribuciones > [1] 2 3 4 5 6 7 8 9

1.  Distribución Discreta


 Densidades discretas

Supongamos que tenemos un experimento aleatorio con espacio muestral R, y medida de probabilidad P. Una variable aleatoria X de un experimento que toma valores en un conjunto numerable S se dice que tiene una  distribución discreta. La  función de densidad en probabilidad (discreta) de X es una función f de S en R definida por

f(x) = P(X = x) para x en S.

Mathematical Exercise 1. Pruebe que f satisface las siguiente propiedades::

  1. f(x) gteq.gif (844 bytes) 0 para x en S.
  2. sumx en S f(x) = 1
  3. sumx en A f(x) = P(X in A) para A S.

La propiedad (c) es particularmenete importante dado que prueba que la dsitribucion de probabilidad de una variable aleatoria discreta esta totalmente determinada por su función de densidad. Reciprocamente,cualquier función que satisfaga las propiedades  (a) y (b) es una densidad (discreta), y la propiedad  (c) puede ser usada para construir una distribución de probabilidad discreta en  S. Tecnicamente,  f es la densidad de X relativa a una medida de conteo en  S.

Generalmente, S es un subconjunto numerable de un conjunto mayor, como  Rn para algun n. Podemos siempre  extender f, si deseamos, a un conjunto mayor definiendo f(x) = 0 para  x no perteneciente a S. A veces esta extension simplifica fórmulas y notacion.

Un elemento  x en S que maximiza la densidad f se llama un  modo de la distribución. Cuando hay un solo modo, este puede ser utilizado como una medida del centro de la distrubucion.

Interpretación

Una distribución de probabilidad discreta es equivalente a una masa de distribución discreta, con masa total 1. En esta analogia, S es el conjunto (numerable) de puntos de masas (point masses), y f(x) es la masa de un punto x en S. La propiedad (c) en el Ejercicio 1 significa que la masa de un conjunto A puede ser hallada sumando las masas de los puntos en A.

Para una interpretacion probabilistica, suponga que creamos un nuevo experimento  repitiendo el experimento original indefinidamente.En el nuevo experimento, tenemos variables aleatorias independientes X1, X2, ..., cada una con la misma distribución que  X (estas son  "copias independientes" de X). Para cada x en S, sea

fn(x) = #{i in {1, 2, ..., n}: Xi = x} / n,

la frecuencia relativa de  x en las primeras n corridas (el número de veces que  x ocurre, dividido por n). Note que para cada  x, fn(x) es una variable aleatoria para el nuevo experimento. Por la  ley de los grandes númerosfn(x) debe converger a f(x) cuando n crece. La función  fn se llama la  función de densidad empírica; esta funciónes aparecen en la mayoria de las simulaciones relacionadas con variables discretas.

Ejemplos

Mathematical Exercise 2. Suponga que dos dados son arrojados y sean (X1, X2) los valores obtenidos. Encuentre la función de densidad de

  1. (X1, X2)
  2. Y = X1 + X2, la suma de  los valores obtenidos
  3. U = min{X1, X2}, el mínimo valor obtenido
  4. V = max{X1, X2}, el máximo valor obtenido
  5. (U, V)

Simulation Exercise 3. En el experimento del dado, seleccione n = 2 dados. Seleccione las siguientes variables aleatorias y note la forma y posicion de la función de densidad .Corra el experimento  1000 veces, actualizando cada  10 corridas. Para cada variable, note la aparente convergencia de la función de densidad empírica a la función de densidad.

  1. Suma de los puntos.
  2. Mínimo de los puntos.
  3. Máximo de los puntos.

Mathematical Exercise 4. Un elemento  X es elegido aleatoriamente de un conjunto finito S.

  1. Pruebe que X tiene función de densidad de probabilidad f(x) = 1 / #(S) para x en S.
  2. Pruebe que P(X in A) = #(A) / #(S) para A subset S.

La distribución en el último ejercicio se llama distribución discreta uniforme en  S. Muchas de las variables aleatorias que surgen en experimentos combiantorios son transformaciones de variables distribuidas uniformemente.

Mathematical Exercise 5. Suponga que  n elementos son elegidos aleatoriamente, sin ser restituidos, de un conjunto D con N elementos. Si X  denota la sucesion ordenada de elementos elegidos. Pruebe que  X es uniformemente distribuida en un conjunto S de permutaciones de tamano n  de D:

P(X = x) = 1 / (N)n para cada x en S.

Mathematical Exercise 6.  Suponga que  n elementos son elegidos aleatoriamente, sin ser restituidos, de un conjunto D con N elementos.. Si W  denota el conjunto de elementos elegidos desordenadamente. Pruebe que  W es uniformemente distribuida en el conjunto T de combinaciones de tamano n elegidas de D:

P(W = w) = 1 / C(N, n) para w en T.

Mathematical Exercise 7. Una urna contiene  N bolillas; R son rojas y N - R son verdes. Una muestra de tamano  n es elegida aleatoriamente (sin ser restituidas). Si  Y denota el número de bolillas rojas de esta muestra, pruebe que Y tiene función de densidad de probabilidad

P(Y = k) = C(R, k) C(N - R, n - k) / C(N, n) para k = 0, 1, ..., n.

La  distribución definida por la función de densidad del último ejercicio es la distribución hipergeométrica con parametros N, R, y n. La distribución hipergeométrica   es estudiada en detalle en el capitulo Modelos de muestras finitas, que contiene una rica variedad de distribuciones que estan basadas en distribuciones uniformes discretas.

Mathematical Exercise 8. Una urna contiene  30 bolillas rojas y 20 verdes. Una muestra de 5 bolillas es tomada aleatoriamenta. Si Y  denota el número de bolillas rojas de la muestra.

  1. Obtenga la función de densidad de Y explicitamente.
  2. Grafique la función de densidad e identifique el/los modo/s.
  3. Halle P(Y > 3).

Simulation Exercise 9. En el experimento de las bolillas y la urna, selecione una muestra sin retitucion . Corra el experimento 1000 veces, actualizando cada  10 corridas, y note la convergencia aparente de la función de densidad empírica de Y a la función de densidad teórica.

Mathematical Exercise 10. Una moneda con probabilidad de cara  p es arrojada n veces. Para j = 1, ..., n, sea Ij = 1 si  en la arrojada  j se obtuvo cara y Ij = 0 si se obtuvo ceca. Pruebe que  (I1, I2, ..., In) tiene función de densidad de probabilidad

f(i1, i2, ..., in) = pk(1 - p)n - k para ij en {0, 1} para cada j, donde k = i1 + i2 + ··· + in.

Mathematical Exercise 11. Una moneda con probabilidad  p de cara es lanzada n veces. Si X denota el número de caras, pruebe que  X tiene función de densidad de probabilidad

P(X = k) = C(n, k) pk (1 - p)n - k para k = 0, 1, ..., n.

La distribución definida por la función de densidad del ejercico anterior se llama distribución binomial con parametros n y p. La distribución binomial es estudiada en detalle en el capitulo Ensayos de Bernoulli .

Mathematical Exercise 12. Suponga que una moneda con probabilidad de cara p = 0.4 es lanzada 5 veces. Si X denota el número de  caras.

  1. Halle la función de densidad de X explicitamente.
  2. Grafique la función de densidad e identifique el modo.
  3. Halle P(X > 3).

Simulation Exercise 13. En el   experimento de la moneda, sea n = 5 y p = 0.4. Corra el experimento 1000 veces, actualizando cada 10 corridas,y note la convergencia aparente de la función de densidad empírica de  X a la función de densidad.

Mathematical Exercise 14. Sea ft(n) = exp(-t) tn / n! para n = 0, 1, 2, .... donde t > 0 es un parametro.

  1. Pruebe que ft es una función de densidad de probabildad para cada t > 0.
  2. Pruebe que  ft(n) > ft(n - 1) si y solo si n < t.
  3. Pruebe que el modo ocurre  at floor(t) si  t no es un entero, y en  t -1 y t si  t es un entero.

La distribución definida por la función de densidad del ejercicio anterior es la distribución de Poisson con parametro t, llamada asi en honor a  Simeon Poisson. La distribución de Poisson es estudiada en detalle en el capitulo Procesos de Poisson, y es utilizada para modelar el número de "puntos aleatorios" en una region de tiempo o espacio. El parametro t es proporcional al tamano de la region de tiempo o espacio.

Mathematical Exercise 15. Suponga que el número de misprints N en una pagian web tiene distribución de Poisson con parametro 2.5.

  1. Halle el modo.
  2. Halle P(N > 4).

Simulation Exercise 16. En el  proceso de Poisson, seleccione parametro 2.5. Corra la simulacion 1000 veces actualizando cada  10 corridas. Note la aparente convergencia de la función de densidad empírica a la verdadera función de densidad.

Mathematical Exercise 17. En el experimento del dado-moneda, un dado es lanzado y luego se tira la moneda tantas veces como indica el dado. Si I denota la sucesion de los resultados de la moneda (0 por ceca, 1 por cara). Encuentre la densidad de I (note que  I toma valores en un conjunto de sucesiones que varian su longitud).

Construccion de densidades

Mathematical Exercise 18. Suponga que  g es una función no negativa definida en un conjunto numerable S y que

c = sumx en S g(x).

Pruebe que si c es positiva y finita, entonces f(x) = g(x) / c parar x en S define una función de densidad discreta en  S.

La constante  c en el último ejemplo es llamada la  constante de normalizacion.Este resulatdo es util para construir funciónes de densidad con alguna propiedad deseada (dominio, forma, simetria, etc.).

Mathematical Exercise 19. Sea g(x) = x2 para x en {-2, -1, 0, 1, 2}.

  1. Encuentre la función de densidad en probabilidad f que es proporcional a g.
  2. Grafique la función de densidad e identifique los modos.
  3. Halle la P(X {-1, 1, 2}) donde X  es uan variable aleatoria con la densidad en (a).

Mathematical Exercise 20.Sea g(n) = qn para n = 0, 1, 2, ... donde  q es un parametro en (0,1).

  1. Encuentre la función de densidad en probabilidad f que es proporcional a g
  2. Halle  P(X < 2) donde X  es uan variable aleatoria con la densidad en (a).
  3. Find the probability that X is even.

La distribución construida en el último ejercicio es una version de la  distribución geometrica, y es estudiada en detalle en le capitulo de Bernoulli Trials.

Mathematical Exercise 21. Sea g(x, y) = x + y para (x, y) {0, 1, 2}2.

  1. Encuentre la función de densidad en probabilidad f que es proporcional a g
  2. Halle el modo de la distribución.
  3. Halle P(X > Y) donde (X, Y) es un vector aleatorio con la densidad en (a).

Mathematical Exercise 22. Sea g(x, y) = xy parar (x, y) {(1, 1), (1, 2), (1, 3), (2, 2), (2, 3), (3, 3)}.

  1. Encuentre la función de densidad en probabilidad f que esproporcional a g
  2. Encuentre el modo de la distribución.
  3. Halle P([(X, Y) {(1, 2), (1, 3), (2, 2), (2, 3)}] donde  (X, Y) es vector aleatorio con la densidad en (a).

 Densidades condicionadas

La función de densidad de una variable aleatoria X esta basada, desde ya, en la medida de probabilidad  P utilizada en  el espacio muestral R del experimento. Esta medida puede ser una medida de probabilidad condicional, condicionada en un evento dado E (con  P(E) > 0). La notacion usual es

f(x | E) = P(X = x | E) para x in S.

El siguiente ejercicio prueba que, excepto por notacion, no hay conceptos nuevos. Luego, todos los resultados para densidades en general tienen su analogo para densidades condicionadas.

Mathematical Exercise 23. Pruebe que como función de x pra un E fijo, f(x | E) es una función de densidad discreta. Es decir, pruebe que las propiedades  (a) y (b) del Ejercicio 1 se satisfacen, y pruebe que la propiedad (c) se convierte en

P(X A | E) = sumx en A f(x | E) para A S.

Mathematical Exercise 24. Suponga que B S y P(X B) > 0. Pruebe que la densidad condicional de  X dado que X B es

  1. f(x | X B) = f(x) / P(X B) para x B.
  2. f(x | X B) = 0 si x Bc.

Mathematical Exercise 25. Suponga que X es uniformemente distribuida en un conjunto finito S y que  B es un subconjunto no vacio de  S. Pruebe que la distribución condicional de X dado X B es uniforme en B.

Mathematical Exercise 26. Suponga que  X tiene función de densidad de probabilidad f(x) = x2 / 10 para x = -2, -1, 0, 1, 2. Encuentre la densidad condicional de X dado que X > 0.

Mathematical Exercise 27. Un par de dados es arrojado. Si Y denota la suma de los valores obtenidos y U el mínimo valor obtenido. Encuentre la densidad condicional de  U dado Y = 8.

Simulation Exercise 28. Corra el   experimento del dado 200 veces, actualizando luego de cada corrida.  Calcule la densidad condicional empírica de U dado Y = 8 y compare con la densidad condicional de último ejercicio.

Ley de la Probabilidad Total y Teorema de Bayes

Suponga que  X es una variable aleatoria discreta que toma valores en un conjunto numerable S, y que  B es un evento del experimento (esto es, un sunconjunto del espacio muestral R).

Mathematical Exercise 29. Pruebe la  ley de la probabilidad total:

P(B) = sumx en S P(X = x) P(B | X = x).

Este resulatdo es util, naturalmente, cuando la distribución de X y la probabilidad condicional de  B dados los valores de X son conocidos. Decimos que estamos conditioning en X.

Mathematical Exercise 30. Pruebe el  Teorema de Bayes, de Thomas Bayes:

P(X = x | B) = P(X = x) P(B | X = x) / sumy en S P(X = y) P(B | X = y) para x en S.

El teorema de Bayes es una  fórmula para la densidad condicional de X dado B. Como la ley de la Pribabilidad Total, es util cuando las cantidades de la derecha son conocidas. La  distribución (inconditional) de X es referred to as the prior distribution and the conditional density as the posterior density.

Mathematical Exercise 31. En el experimento de la moneda-dado, un dado es lanzado y luego se arroja la moneda tantas veces como indica el dado.

  1. Encuentre la probabilidad de que haya exactamente dos caras.
  2. Dado que salieron dos caras, halle la densidad condicional del dado.

Simulation Exercise 32. Realice el  experimento de la moneda-dado 200 veces, actualizando luego de cada realizacion.

  1. Calcule al probabilidad empírica de que salgan exactamente dos caras y compare con la probabilidad obrtenida en el último ejercicio.
  2. Calcule la densidad condicional empririca del dado dado que salieron dos caras y compare con la densidad condicional obtenida en el último ejercicio.

Mathematical Exercise 33. Suponga que una bolsa contiene 12 monedad: 5 son  regulares, 4 tienen probabilidad de cara 1/3; y 3 tienen doble cara. Una moneda es elegida aleatoriamente de la bolsa y lanzada dos veces.

  1. Halle la probabilidad de que salgan exactamente dos caras.
  2. Dado que salieron dos caras, hallle la densidad condicional del tipo de moneda

Compare los ejercicios 31 y 33. En el  Ejercicio 31, lanzamos la moneda con una probabilidad fija de caras un número aleatorio de veces. En el  Ejercicio 33, lanzamos una moneda con una probabilidad de cara aleatoria un número fijo de veces.

Mathematical Exercise 34. En el experimento moneda-dado, una moneda regualar es lanzada. Si la moneda sale ceca, entonces un dado es lanzado.Si la moneda sale cara, entonces un dado irregular es lanzado (1 y 6 tienen probabilidad 1/4 cada uno, mientras que 2, 3, 4, 5 tiene probabilidad 1/8 cada uno). Encuentre la función de densidad de los valores obtenidos con el dado. 

Simulation Exercise 35. Realice el  experimento de la moneda-dado 1000 veces, actualizando cada 10 realizaciones. Compare la densidad empírica del dado con la densidad teórica en el último ejercicio.

Mathematical Exercise 36. Una fábrica tiene  3 plantas que producen chips de memoria.La planta 1 produce 50% de los chips y produce un 4% defectuosos; la  planta 2 produce un  30% de los chips y tiene un error de 5%; la planta 3 produce el  20% de los chips y tiene un error del 1%. Un chip es elegido aleatoriamente de la producción.

  1. Halle la probabilidad de que salga un chip defectuoso.
  2. Dado que el chip es defectuoso, halle densidad condicional de la planta que produjo el chip.

Ejercicios de Análisis de Datos

Data Analysis Exercise 37. En el  dato M&M , si R denota el número de velas rojas y  N el total de velas. Calcule y grafique la densidad empírica de

  1. R
  2. N
  3. R dado N > 57.

Data Analysis Exercise 38. En los  datos de la Cigarra, si G denota especies, S denota tipo de especies , y W denota peso del cuerpo (en gramos). Calcule la densidad empírica de

  1. G
  2. S
  3. (G, S)
  4. G dado W > 0.20 gramos.