Laboratorio virtual > Distribuciones > 1 [2] 3 4 5 6 7 8 9

2. Distribuciones Continuas


 Distribuciones Continuas

 Suponga que se tiene un experimento aleatorio con espacio muestral y medida de probabilidad P. Una variable aleatoria  X tomando valores en un subconjunto S de Rn se dice que tiene una distribución continua si

P(X = x) = 0 para cada x en S.

El hecho de quer X tenga en cada valor particular probabilidad 0 puede parecer paradójico en principio, pero conceptualmente esto es lo mismo que el hecho de que un intervalo en R puede tener medida positiva aun cuando esté compuesto por puntos que tengan medida 0. Similarmente, una región de R2 puede tener area positiva aun cuando este formada por puntos ( o curvas) de areas 0.

Mathematical Exercise 1. Pruebe que si  C es un subconjunto numerable de S, entonces P(X in C) = 0.

Luego, las distribuciones continuas estan en completo contraste con las distribuciones discretas, en las cuales toda la masa de probabilidad esta concentrada en un conjunto discreto. Para distribuciones continuas, la masa de probabilidad esta continuamente dristribuida sobre S. Note tambien que  S no puede ser numerable.

Densidad de Distribuciones Continuas

Suponga nuevamente que X tiene distribución continua en un subconjunto S de Rn. Una función a valores reales  f definida en S se dice que es una  función de densidad de probabilidad para X si f satisface las siguientes propiedades:

  1. f(x) gteq.gif (844 bytes) 0 para x en S.
  2. integralS f(x)dx = 1.
  3. integralA f(x)dx = P(X in A) para A subsetS.

Si n > 1, las integrales en las propiedades (b) y (c) son integrales multiples sobre subconjuntos de Rn, y

dx = dx1 dx2 ··· dxn donde x = (x1, x2, ..., xn).

De hecho, técnicamente,  f es la densidad de X relativa a una   medida n-dimensional mn, la cual está dada por

mn(A) = integralA 1dx para A subsetRn.

Note que mn(S) debe ser positivo (quizas infinito). En particular,

  1. si n = 1, S debe ser un subconjunto de R con medida positiva;
  2. si n = 2, S debe ser un subconjunto de R2 con área positiva;
  3. si n = 3, S debe ser un subconjunto de R3 con volúmen positivo.

Los casos de dimensiones (n = 1, 2, 3) no tienen un rol especial en probabilidad, simplemente sirven para la exposición. Los experimentos aleatorios interesantes casi siempre envuelven varias variables aleatorias (esto es, un vector aleatorioa); raramente tenemos una sola variable aleatoria. Finalmente, note que podemos siempre extender f a una densidad a todo R definiendo f(x) = 0 para todo x que no este en S. Esta extension a veces simplifica la notacion.

La propiedad (c) es particularmente importante dado que implica que la distribución de probabilidad de X esta completamente determinada por la función de densidad. Reciprocamente, cualquier función que satisfaga las propiedades (a) y (b) es una función de densidad de probabilidad, y luego la propiedad (c) puede ser utilizada para definir una distribución continua en S.

Un elemento x en S que maximiza la densidad  f se llama modo de la distribución. si hay un solo modo, este suele ser utilizado como una medida del centro de la distribución.

En diferencia con el caso discreto, la función de densidad de distribuciones continuas no es unica. Note que los valores de f en un conjunto finito (o aun numerable) de puntos puede cambiar a otro valor no negativo y las propiedaes (a), (b), y (c) aun cumplirse. El hecho importante es que solo la integral de  f es lo que interesa. Otra diferencia es que f(x) puede ser mayor que 1; en realidad, f puede ser no acotada en S. Mantenga en mente que f(x) no es una probabilidad; es una densidad de probabilidad: f(x)dx es aproximadamente la probabilidad de que X este en un caja n-dimensional en x con longitudes dx1, ..., dxn, si estas longitudes son pequenas.

Ejemplos

Mathematical Exercise 2. Sea f(t) = r exp(-rt) para t > 0, donde r > 0 es un parametro. Pruebe que  f es una función de densidad de probabilidad.

La distribución definida por la densidad del ejemplo anterior se llama distribución exponencial con parametro r. Esta distribución es frecuentemente usada para modelar tiempos aleatorios, bajo ciertas suposiciones. La distribución exponencial es estudiada en detalle en el capitulo de Procesos de Poisson.

Mathematical Exercise 3. El tiempo de vida de cierto recurso (en unidades de1000 horas) tiene una distribución exponencial con parametro1/2. Halle P(T > 2).

Simulation Exercise 4. En el experimento exponencial, sea r = 1/2. Ejecute el experimento 1000 veces, actualizando cad 10 realizaciones, y note la convergencia aparente de la densidad empirica a la función de densidad real.

Mathematical Exercise 5. En el  problema de Bertrand, una cierta variable aleatoria de angulo A tiene función de densidad  f(a) = sin(a), 0 < a < pi / 2.

  1. Pruebe que f realmente es una función de densidad.
  2. Grafique f e identifique el modo.
  3. Halle P(A < pi / 4).

Simulation Exercise 6. En el experimento de Bertrand, elija el modelo con distancia uniforme.Realice la simulacion 200 veces, actualizando en cada corrida, y calcule la probabiliad empirica del evento {A < pi / 4}. Compare con la verdadera probabilidad del ejercicio previo.

Mathematical Exercise 7.Sea gn(t) = exp(-t) tn / n! para t > 0 donde n es un paremetro entero no negativo.

  1. Pruebe que  gn es uan función de densidad de probabilidad para cada n.
  2. Pruebe que  gn(t) es creciente para t < n y decreciente para t > n, por lo que el modo ocurre en  t = n.

 En la ultima seccion de distribuciones discretas vimos que ft(n) = gn(t) es una función de densidad sobre los enteros no negativos para t > 0. La distribución definida por la densidad gn es la distribución gamma; n + 1 se llama el parametro de forma.(is called the shape parameter). La distribución gamma es estudiada en detalle en el capitulo de  Procesos de Poisson.

Mathematical Exercise 8. Suponga que el tiempo de vida de un recursoT (en unidades de1000 horas) tiene la distribución gamma con n = 2. Halle P(T > 3).

Simulation Exercise 9. En el experimento gamma, sea r = 1 y k = 3. Realice el experimeno 200 veces, actualizando en cada corrida. Calcule la probabilidad empirica del evento {T > 3} y compare con la probabilidad teorica del ejercicio anterior.

Construcción de densidades

Mathematical Exercise 10. Suponga que g es una función no negativa en S. Sea

c = integralS g(x)dx.

Pruebe que si c es positiva y finita, entonces f(x) = g(x) / c para x en S define una función de densidad de probabilidad en  S.

Note que el grafico de  gf lucen iguales, excepto por un cambio de escala en el eje vertical. Esto es, el resultado del ultimo ejercicio puede ser utilizado para la construccion de funciónes de densidad con ciertas propiedades deseadas (dominio, forma, simetria, etc.). La constante  c a veces se llama  constante de normalizacion.

Mathematical Exercise 11. Sea g(x) = x2(1 - x) para 0 < x < 1.

  1. Bosqueje el grafico de g.
  2. Halle la función de densidad de probabilidad  f proporcional a g.
  3. Halle P(1/2 < X < 1) donde X es una variable aleatoria con la densidad de (b).

La distribución defina en el ultimo ejercicio es uan ejemplo de una distribución beta.

Mathematical Exercise 12. Sea g(x) = 1 / xa parar x > 1, donde a > 0 es un parametro.

  1. Realice el grafico de g.
  2. Para 0 < a <= 1, pruebe que no existe una función de densidad de probabilidad proporcional a g.
  3. Para a > 1, pruebe que la constante de normalizacion es 1 / (a - 1)..

La distribución definida en el ultimo ejercicio es conocida la distribución de Pareto con parametro de forma a.

Mathematical Exercise 13. Sea g(x) = 1 / (1 + x2) para x en R.

  1. Realice el graficode g.
  2. Pruebe que la constante de normalizacion es pi.
  3. Halle P(–1 < X < 1) donde X tiene la función de densidad proporcional a  g.

La distribución definida en el ultimo ejercio es conocida como la distribución de Cauchy, en honor a Augustin Cauchy. Esta pertenece a la familia de las distribuciones t Student.

Simulation Exercise 14. En el experimento de la variable aleatoria, elija la distribución t student. Set n = 1 to get the Cauchy distribution. Realice la simulacion 1000 veces, actualizando cada 10 realizaciones. Note cuan bien la densidad empirica aproxima a la densidad real.

Mathematical Exercise 15. Sea g(z) = exp(-z2 / 2).

  1. Realice el grafico de g.
  2. Pruebe que la constante de normalizacion es (2pi)1/2. Pista: Si c denota la constante de normalizacion, exprese c2 tiene una integral doble y convierta a coordenadas polares.

La distribución definida en el ultimo ejercicio es la distribución normal standard, quizas la distribución mas importante en probabilidades.

Simulation Exercise 16. En el experimento de la variable aleatoria, elija la distribución normal (the default parameters give the standard normal distribution). Realice la simulacion 1000 veces, actualizando cadad 10 realizaciones. Note cuan bien la densidad empirica aproxima la densidad real.

Mathematical Exercise 17. Sea f(x, y) = x + y para 0 < x < 1, 0 < y < 1.

  1. Pruebe que  f es una función de densidad de probabilidad
  2. Halle P(Y > 2X) donde (X, Y) tiene la densidad en (a).

Mathematical Exercise 18. Sea g(x, y) = x + y para 0 < x < y < 1.

  1. Halle la función de densidad de probabilidad f que es proporcional a g.
  2. Halle P(Y > 2X) donde (X, Y) tiene la densidad de (a).

Mathematical Exercise 19. Sea g(x, y) = x2y para 0 < x < 1, 0 < y < 1.

  1. Halle la función de densidad f que es proporcional a g.
  2. Halle P(Y > X) donde (X, Y) tiene la densidad de (a).

Mathematical Exercise 20. Sea g(x, y) = x2y para 0 < x < y < 1.

  1. Halle la función de densidad f que es proporcional a g.
  2. Halle P(Y > 2X) donde (X, Y) tiene la densidad de (a).

Mathematical Exercise 21. Sea g(x, y, z) = x + 2y + 3z para 0 < x < 1, 0 < y < 1, 0 < z < 1.

  1. Halle la función de densidad f que es proporcional a g.
  2. Halle P(X < Y < Z) donde (X, Y, Z) tiene la densidad de (a).

Distribuciones Continuas Uniformes

Los siguientes ejercicios describen una importante clase de distribuciones continuas.

Mathematical Exercise 22. Suponga que S es un subconjunto de Rn con medida positiva y finita mn(S). Pruebe que

  1. f(x) = 1 / mn(S) para x en S define una función de densidad de probabilidad en S.
  2. P(X in A) = mn(A) / mn(S) para  A subsetS si X tiene la función de densidad de (a).

Una variable aleatoria X con la función de densidad en el Ejercico 14 se dice distribución continua uniforme en S. La distribución uniforme en un recatngulo en el plano tiene importante utilidad en Modelos Geometricos.

Mathematical Exercise 23. Suponga que (X, Y) es uniformemente distribuida en un cuadrado S = (-6, 6)2. Halle P(X > 0, Y > 0).

Simulation Exercise 24. En el bivariate uniform experiment, select square in the list box. Realice la simulacion 100 veces, actualizando en cada realizacion. Mire los puntos en el scatter plot. Calcule la probabilidad empirica del evento{X > 0, Y > 0} y compare con la probabilidad real.

Mathematical Exercise 25. Suponga que (X, Y) es uniformemente distribuida en el triangulo S = {(x, y): -6 < y < x < 6}. Halle P(X > 0, Y > 0)

Simulation Exercise 26. En el  bivariate uniform experiment, select triangle in the list box. Realice la simulacion 100 veces, actualizando en cada corrida. Mire los puntos en el scatter plot. Calcule la probabilidad empirica del evento {X > 0, Y > 0} y compare con la probabilidad real.

Mathematical Exercise 27. Suponga que (X, Y) es uniformemente distribuida en el circulo S = {(x, y): x2 + y2 < 36}. Halle P(X > 0, Y > 0).

Simulation Exercise 28. En el bivariate uniform experiment, select circle in the list box. Realice la simulacion 100 veces, actualizando en cada realizacion. Mire los puntos en el scatter plot. Calcule la probabilidad empirica del evento {X > 0, Y > 0} y compare con la probabilidad real.

Mathematical Exercise 29. Suponga que  (X, Y, Z) es uniformemente distribuida en el cubo (0, 1)3. Halle P(X < Y < Z)

  1. Usando la función de densidad.
  2. Usando combinatora Pista: Pruebe que cada una de las 6 permutaciones de (X, Y, Z) deben ser iguales.

Mathematical Exercise 30. El tiempo T (en minutos) requerido para realizar un cierto trabajo esta uniformente distribuido en el intervalo (15, 60).

  1. Halle la probabilidad de que el trabajo lleve mas de 30 minutos
  2. Dado que el trabajo no se termino en 30 minutos, halle la probabilidad de que el trabajo requiera mas de 15 minutos adicionales.

Densidades Condicionadas

Suponga que X es una variable aleatoria tomando valores S de Rn, con distribución continua con función de densidad f. La función de densidad de X, desde ya, esta basada en la medida de probabilidad P del espacio muestral del experimento, al que denotaremos por  R. Esta medida podria ser una medida de probabilidad condicional, condicionada en una evento E dado (subconjunto de R), con P(E) > 0. La notacion usual es

f(x | E), x in S.

Note que excepto por la notacion, no hay nuevos conceptos. La función anterior es una función de densidad continua. Esto es, satisface las propiedades (a) y (b) mientras que la propiedad  (c) seria

integralA f(x | E)dx = P(X in A | E) para A subsetS.

Todos los resultados que se verifican para densidades en general tienen su analogo para densidades condicionadas.

Mathematical Exercise 31. Suponga que B subset S con P(X in B) = integralB f(x)dx > 0. Pruebe que la densidad condicional de X dado que X in B es

  1. f(x | X in B) = f(x) / P(X in B) para x in B.
  2. f(x | X in B) = 0 para x in Bc.

Mathematical Exercise 32. Suponga que S es un subconjunto de Rn con medida positiva y finita mn(S) y que B subset S con mn(B) > 0. Pruebe que si X es uniformemente distribuida en S, entonces la distribución condicional de X dado que X in B es uniforme en B.

Mathematical Exercise 33. Suponga que (X, Y) tiene una función de densidad f(x, y) = x + y para 0 < x < 1, 0 < y < 1. Halle la función de densidad condicional de (X, Y) dado que X < 1/2, Y < 1/2.

Ejercicios de Análisis de Datos

Si {x1, x2, ..., xn}subset Rn es un conjunto de datos de una variable aleatoria continua X, entonces una función de densidad empirica puede ser calculada particionando el rango de datos en subconjuntos de tamano menor, y calculando la densidad de puntos en cada uno de estos suconjuntos.Funciónes de densidad empirica son estudiadas con mayor detalle en el capitulo de Muestras aleatorias.

Data Analysis Exercise 34. Para el datos de la cigarra, BW denota el peso de los cuerpos, BL la longitud de los cuerpos, y G genero. Construya una densidad empirica para cada una de las siguientes y grafique cada una en un grafico de barras:

  1. BW
  2. BL
  3. BW dado que G = femenino.

Data Analysis Exercise 35. Para el cicada data, WL denota longitud de las alas y WW la anchura. Construya una función de densidad empirica para (WL, WW).

Distribuciones Continuas Degeneradas

Salvo para el caso discreto, la existencia de la función de densidad para distribuciones continuas es un supuesto que estamos haciendo.Una variable aleatoria puede tener una distribución continua en un subconjunto S de Rn pero sin función de densidad; la distribución se suele llamar degenerada. En esta subseccion, exploraremos en que casos esta distribución puede ocurrir.

Primero, suponga que X es una variable aleatoria que toma valores en un subconjunto S de Rn con mn(S) = 0. Esto es posible para X teniendo una distribución continua, pero X puede no tener una densidad relativa a mn. En particular, la propiedad (c) en la definicion puede no verificarse, dado que la integral de la izquierda seria 0 para cualquier subconjunto A en S. Sin embargo, en muchos casos, X puede ser definida en terminos de variables aleatorias continuas en espacios de dimension menor que si tengan densidad.. (may be defined in terms of continuous random variables on lower dimensional spaces that do have densities.)

Por ejemplo, suponga que U es una variable aleatoria con distribución continua en un subconjuntoT de Rk (donde k < n), y que  X = h(U) para alguna función continua h de T en Rn. Cualquier evento definido en terminos de X puede ser cambiado en un evento definido en terminos de U. Los siguientes ejercicios ilustran esta situacion

Mathematical Exercise 36. Suponga que U es uniformemente distribuida en un intervalo (0, 2). Sea X = cos(U), Y = sin(U).

  1. Pruebe que (X, Y) tiene una distribución continua e el circulo C = {(x, y): x2 + y2 = 1}.
  2. Pruebe que (X, Y) no tiene una función de densidad en  C (con respecto a m2).
  3. Halle P(Y > X).

Otra situacion ocurre cuando  un vector aleatorio X en Rn (n > 1) tiene algunas componenets con distribución continuas y otras  discretas. Tales distribucións con componentes mixtas son estudiadas en detalle en el capitulo distribuciones mixtas; de todas maneras, el siguiente ejercicio da una ilustracion.

Mathematical Exercise 37. Suponga que X es uniformemente distribuida en {0, 1, 2}, Y es uniformemente distribuida en (0, 2), y que X e Y son independientes.

  1. Pruebe que (X, Y) tiene distribución continua en {0, 1, 2} × (0, 2).
  2. Pruebe que (X, Y) no tiene una función de densidad (2-dimensional) en S (con respecto a m2).
  3. Halle P(Y > X).

Finalmente, tambien es posible tener una distribución continua en un subconjunto S de Rn con mn(S) > 0,  aun sin función de densidad. Tales distribuciones se dicen que son singulares, y son raras en probabilidad aplicada. Como ejemplo vea Bold Play en el capítulo Rojo y  Negro.