Continuous Distributions

2. Distribuciones Continuas

Distribuciones Continuas

Suponga que se tiene un experimento aleatorio con espacio muestral y medida de probabilidad P. Una variable aleatoria X tomando valores en un subconjunto S de Rⁿ se dice que tiene una distribución continua si

P(X = x) = 0 para cada x en S.

El hecho de quer X tenga en cada valor particular probabilidad 0 puede parecer paradójico en principio, pero conceptualmente esto es lo mismo que el hecho de que un intervalo en R puede tener medida positiva aun cuando esté compuesto por puntos que tengan medida 0. Similarmente, una región de R² puede tener area positiva aun cuando este formada por puntos ( o curvas) de areas 0.

$Mathematical Exercise$ 1. Pruebe que si C es un subconjunto numerable de S, entonces P(X C) = 0.

Luego, las distribuciones continuas estan en completo contraste con las distribuciones discretas, en las cuales toda la masa de probabilidad esta concentrada en un conjunto discreto. Para distribuciones continuas, la masa de probabilidad esta continuamente dristribuida sobre S. Note tambien que S no puede ser numerable.

Densidad de Distribuciones Continuas

Suponga nuevamente que X tiene distribución continua en un subconjunto S de Rⁿ. Una función a valores reales f definida en S se dice que es una función de densidad de probabilidad para X si f satisface las siguientes propiedades:

f(x) 0 para x en S.
_S f(x)dx = 1.
_A f(x)dx = P(X A) para A S.

Si n > 1, las integrales en las propiedades (b) y (c) son integrales multiples sobre subconjuntos de Rⁿ, y

dx = dx₁ dx₂ ··· dx_n donde x = (x₁, x₂, ..., x_n).

De hecho, técnicamente, f es la densidad de X relativa a una medida n-dimensional m_n, la cual está dada por

m_n(A) = _A 1dx para A Rⁿ.

Note que m_n(S) debe ser positivo (quizas infinito). En particular,

si n = 1, S debe ser un subconjunto de R con medida positiva;
si n = 2, S debe ser un subconjunto de R² con área positiva;
si n = 3, S debe ser un subconjunto de R³ con volúmen positivo.

Los casos de dimensiones (n = 1, 2, 3) no tienen un rol especial en probabilidad, simplemente sirven para la exposición. Los experimentos aleatorios interesantes casi siempre envuelven varias variables aleatorias (esto es, un vector aleatorioa); raramente tenemos una sola variable aleatoria. Finalmente, note que podemos siempre extender f a una densidad a todo Rⁿ definiendo f(x) = 0 para todo x que no este en S. Esta extension a veces simplifica la notacion.

La propiedad (c) es particularmente importante dado que implica que la distribución de probabilidad de X esta completamente determinada por la función de densidad. Reciprocamente, cualquier función que satisfaga las propiedades (a) y (b) es una función de densidad de probabilidad, y luego la propiedad (c) puede ser utilizada para definir una distribución continua en S.

Un elemento x en S que maximiza la densidad f se llama modo de la distribución. si hay un solo modo, este suele ser utilizado como una medida del centro de la distribución.

En diferencia con el caso discreto, la función de densidad de distribuciones continuas no es unica. Note que los valores de f en un conjunto finito (o aun numerable) de puntos puede cambiar a otro valor no negativo y las propiedaes (a), (b), y (c) aun cumplirse. El hecho importante es que solo la integral de f es lo que interesa. Otra diferencia es que f(x) puede ser mayor que 1; en realidad, f puede ser no acotada en S. Mantenga en mente que f(x) no es una probabilidad; es una densidad de probabilidad: f(x)dx es aproximadamente la probabilidad de que X este en un caja n-dimensional en x con longitudes dx₁, ..., dx_n, si estas longitudes son pequenas.

Ejemplos

$Mathematical Exercise$ 2. Sea f(t) = r exp(-rt) para t > 0, donde r > 0 es un parametro. Pruebe que f es una función de densidad de probabilidad.

La distribución definida por la densidad del ejemplo anterior se llama distribución exponencial con parametro r. Esta distribución es frecuentemente usada para modelar tiempos aleatorios, bajo ciertas suposiciones. La distribución exponencial es estudiada en detalle en el capitulo de Procesos de Poisson.

$Mathematical Exercise$ 3. El tiempo de vida de cierto recurso (en unidades de1000 horas) tiene una distribución exponencial con parametro1/2. Halle P(T > 2).

4. En el experimento exponencial, sea r = 1/2. Ejecute el experimento 1000 veces, actualizando cad 10 realizaciones, y note la convergencia aparente de la densidad empirica a la función de densidad real.

$Mathematical Exercise$ 5. En el problema de Bertrand, una cierta variable aleatoria de angulo A tiene función de densidad f(a) = sin(a), 0 < a < / 2.

Pruebe que f realmente es una función de densidad.
Grafique f e identifique el modo.
Halle P(A < / 4).

6. En el experimento de Bertrand, elija el modelo con distancia uniforme.Realice la simulacion 200 veces, actualizando en cada corrida, y calcule la probabiliad empirica del evento {A < / 4}. Compare con la verdadera probabilidad del ejercicio previo.

$Mathematical Exercise$ 7.Sea g_n(t) = exp(-t) tⁿ / n! para t > 0 donde n es un paremetro entero no negativo.

Pruebe que g_n es uan función de densidad de probabilidad para cada n.
Pruebe que g_n(t) es creciente para t < n y decreciente para t > n, por lo que el modo ocurre en t = n.

En la ultima seccion de distribuciones discretas vimos que f_t(n) = g_n(t) es una función de densidad sobre los enteros no negativos para t > 0. La distribución definida por la densidad g_n es la distribución gamma; n + 1 se llama el parametro de forma.(is called the shape parameter). La distribución gamma es estudiada en detalle en el capitulo de Procesos de Poisson.

$Mathematical Exercise$ 8. Suponga que el tiempo de vida de un recursoT (en unidades de1000 horas) tiene la distribución gamma con n = 2. Halle P(T > 3).

9. En el experimento gamma, sea r = 1 y k = 3. Realice el experimeno 200 veces, actualizando en cada corrida. Calcule la probabilidad empirica del evento {T > 3} y compare con la probabilidad teorica del ejercicio anterior.

Construcción de densidades

$Mathematical Exercise$ 10. Suponga que g es una función no negativa en S. Sea

c = _S g(x)dx.

Pruebe que si c es positiva y finita, entonces f(x) = g(x) / c para x en S define una función de densidad de probabilidad en S.

Note que el grafico de g y f lucen iguales, excepto por un cambio de escala en el eje vertical. Esto es, el resultado del ultimo ejercicio puede ser utilizado para la construccion de funciónes de densidad con ciertas propiedades deseadas (dominio, forma, simetria, etc.). La constante c a veces se llama constante de normalizacion.

$Mathematical Exercise$ 11. Sea g(x) = x²(1 - x) para 0 < x < 1.

Bosqueje el grafico de g.
Halle la función de densidad de probabilidad f proporcional a g.
Halle P(1/2 < X < 1) donde X es una variable aleatoria con la densidad de (b).

La distribución defina en el ultimo ejercicio es uan ejemplo de una distribución beta.

$Mathematical Exercise$ 12. Sea g(x) = 1 / x^a parar x > 1, donde a > 0 es un parametro.

Realice el grafico de g.
Para 0 < a 1, pruebe que no existe una función de densidad de probabilidad proporcional a g.
Para a > 1, pruebe que la constante de normalizacion es 1 / (a - 1)..

La distribución definida en el ultimo ejercicio es conocida la distribución de Pareto con parametro de forma a.

$Mathematical Exercise$ 13. Sea g(x) = 1 / (1 + x²) para x en R.

Realice el graficode g.
Pruebe que la constante de normalizacion es .
Halle P(–1 < X < 1) donde X tiene la función de densidad proporcional a g.

La distribución definida en el ultimo ejercio es conocida como la distribución de Cauchy, en honor a Augustin Cauchy. Esta pertenece a la familia de las distribuciones t Student.

14. En el experimento de la variable aleatoria, elija la distribución t student. Set n = 1 to get the Cauchy distribution. Realice la simulacion 1000 veces, actualizando cada 10 realizaciones. Note cuan bien la densidad empirica aproxima a la densidad real.

$Mathematical Exercise$ 15. Sea g(z) = exp(-z² / 2).

Realice el grafico de g.
Pruebe que la constante de normalizacion es (2)^1/2. Pista: Si c denota la constante de normalizacion, exprese c² tiene una integral doble y convierta a coordenadas polares.

La distribución definida en el ultimo ejercicio es la distribución normal standard, quizas la distribución mas importante en probabilidades.

16. En el experimento de la variable aleatoria, elija la distribución normal (the default parameters give the standard normal distribution). Realice la simulacion 1000 veces, actualizando cadad 10 realizaciones. Note cuan bien la densidad empirica aproxima la densidad real.

$Mathematical Exercise$ 17. Sea f(x, y) = x + y para 0 < x < 1, 0 < y < 1.

Pruebe que f es una función de densidad de probabilidad
Halle P(Y > 2X) donde (X, Y) tiene la densidad en (a).

$Mathematical Exercise$ 18. Sea g(x, y) = x + y para 0 < x < y < 1.

Halle la función de densidad de probabilidad f que es proporcional a g.
Halle P(Y > 2X) donde (X, Y) tiene la densidad de (a).

$Mathematical Exercise$ 19. Sea g(x, y) = x²y para 0 < x < 1, 0 < y < 1.

Halle la función de densidad f que es proporcional a g.
Halle P(Y > X) donde (X, Y) tiene la densidad de (a).

$Mathematical Exercise$ 20. Sea g(x, y) = x²y para 0 < x < y < 1.

Halle la función de densidad f que es proporcional a g.
Halle P(Y > 2X) donde (X, Y) tiene la densidad de (a).

$Mathematical Exercise$ 21. Sea g(x, y, z) = x + 2y + 3z para 0 < x < 1, 0 < y < 1, 0 < z < 1.

Halle la función de densidad f que es proporcional a g.
Halle P(X < Y < Z) donde (X, Y, Z) tiene la densidad de (a).

Distribuciones Continuas Uniformes

Los siguientes ejercicios describen una importante clase de distribuciones continuas.

$Mathematical Exercise$ 22. Suponga que S es un subconjunto de Rⁿ con medida positiva y finita m_n(S). Pruebe que

f(x) = 1 / m_n(S) para x en S define una función de densidad de probabilidad en S.
P(X A) = m_n(A) / m_n(S) para A S si X tiene la función de densidad de (a).

Una variable aleatoria X con la función de densidad en el Ejercico 14 se dice distribución continua uniforme en S. La distribución uniforme en un recatngulo en el plano tiene importante utilidad en Modelos Geometricos.

$Mathematical Exercise$ 23. Suponga que (X, Y) es uniformemente distribuida en un cuadrado S = (-6, 6)². Halle P(X > 0, Y > 0).

24. En el bivariate uniform experiment, select square in the list box. Realice la simulacion 100 veces, actualizando en cada realizacion. Mire los puntos en el scatter plot. Calcule la probabilidad empirica del evento{X > 0, Y > 0} y compare con la probabilidad real.

$Mathematical Exercise$ 25. Suponga que (X, Y) es uniformemente distribuida en el triangulo S = {(x, y): -6 < y < x < 6}. Halle P(X > 0, Y > 0)

26. En el bivariate uniform experiment, select triangle in the list box. Realice la simulacion 100 veces, actualizando en cada corrida. Mire los puntos en el scatter plot. Calcule la probabilidad empirica del evento {X > 0, Y > 0} y compare con la probabilidad real.

$Mathematical Exercise$ 27. Suponga que (X, Y) es uniformemente distribuida en el circulo S = {(x, y): x² + y² < 36}. Halle P(X > 0, Y > 0).

28. En el bivariate uniform experiment, select circle in the list box. Realice la simulacion 100 veces, actualizando en cada realizacion. Mire los puntos en el scatter plot. Calcule la probabilidad empirica del evento {X > 0, Y > 0} y compare con la probabilidad real.

$Mathematical Exercise$ 29. Suponga que (X, Y, Z) es uniformemente distribuida en el cubo (0, 1)³. Halle P(X < Y < Z)

Usando la función de densidad.
Usando combinatora Pista: Pruebe que cada una de las 6 permutaciones de (X, Y, Z) deben ser iguales.

$Mathematical Exercise$ 30. El tiempo T (en minutos) requerido para realizar un cierto trabajo esta uniformente distribuido en el intervalo (15, 60).

Halle la probabilidad de que el trabajo lleve mas de 30 minutos
Dado que el trabajo no se termino en 30 minutos, halle la probabilidad de que el trabajo requiera mas de 15 minutos adicionales.

Densidades Condicionadas

Suponga que X es una variable aleatoria tomando valores S de Rⁿ, con distribución continua con función de densidad f. La función de densidad de X, desde ya, esta basada en la medida de probabilidad P del espacio muestral del experimento, al que denotaremos por R. Esta medida podria ser una medida de probabilidad condicional, condicionada en una evento E dado (subconjunto de R), con P(E) > 0. La notacion usual es

f(x | E), x S.

Note que excepto por la notacion, no hay nuevos conceptos. La función anterior es una función de densidad continua. Esto es, satisface las propiedades (a) y (b) mientras que la propiedad (c) seria

_A f(x | E)dx = P(X A | E) para A S.

Todos los resultados que se verifican para densidades en general tienen su analogo para densidades condicionadas.

$Mathematical Exercise$ 31. Suponga que B S con P(X B) = _B f(x)dx > 0. Pruebe que la densidad condicional de X dado que X B es

f(x | X B) = f(x) / P(X B) para x B.
f(x | X B) = 0 para x B^c.

$Mathematical Exercise$ 32. Suponga que S es un subconjunto de Rⁿ con medida positiva y finita m_n(S) y que B S con m_n(B) > 0. Pruebe que si X es uniformemente distribuida en S, entonces la distribución condicional de X dado que X B es uniforme en B.

$Mathematical Exercise$ 33. Suponga que (X, Y) tiene una función de densidad f(x, y) = x + y para 0 < x < 1, 0 < y < 1. Halle la función de densidad condicional de (X, Y) dado que X < 1/2, Y < 1/2.

Ejercicios de Análisis de Datos

Si {x₁, x₂, ..., x_n} Rⁿ es un conjunto de datos de una variable aleatoria continua X, entonces una función de densidad empirica puede ser calculada particionando el rango de datos en subconjuntos de tamano menor, y calculando la densidad de puntos en cada uno de estos suconjuntos.Funciónes de densidad empirica son estudiadas con mayor detalle en el capitulo de Muestras aleatorias.

34. Para el datos de la cigarra, BW denota el peso de los cuerpos, BL la longitud de los cuerpos, y G genero. Construya una densidad empirica para cada una de las siguientes y grafique cada una en un grafico de barras:

BW
BL
BW dado que G = femenino.

35. Para el cicada data, WL denota longitud de las alas y WW la anchura. Construya una función de densidad empirica para (WL, WW).

Distribuciones Continuas Degeneradas

Salvo para el caso discreto, la existencia de la función de densidad para distribuciones continuas es un supuesto que estamos haciendo.Una variable aleatoria puede tener una distribución continua en un subconjunto S de Rⁿ pero sin función de densidad; la distribución se suele llamar degenerada. En esta subseccion, exploraremos en que casos esta distribución puede ocurrir.

Primero, suponga que X es una variable aleatoria que toma valores en un subconjunto S de Rⁿ con m_n(S) = 0. Esto es posible para X teniendo una distribución continua, pero X puede no tener una densidad relativa a m_n. En particular, la propiedad (c) en la definicion puede no verificarse, dado que la integral de la izquierda seria 0 para cualquier subconjunto A en S. Sin embargo, en muchos casos, X puede ser definida en terminos de variables aleatorias continuas en espacios de dimension menor que si tengan densidad.. (may be defined in terms of continuous random variables on lower dimensional spaces that do have densities.)

Por ejemplo, suponga que U es una variable aleatoria con distribución continua en un subconjuntoT de R^k (donde k < n), y que X = h(U) para alguna función continua h de T en Rⁿ. Cualquier evento definido en terminos de X puede ser cambiado en un evento definido en terminos de U. Los siguientes ejercicios ilustran esta situacion

$Mathematical Exercise$ 36. Suponga que U es uniformemente distribuida en un intervalo (0, 2). Sea X = cos(U), Y = sin(U).

Pruebe que (X, Y) tiene una distribución continua e el circulo C = {(x, y): x² + y² = 1}.
Pruebe que (X, Y) no tiene una función de densidad en C (con respecto a m₂).
Halle P(Y > X).

Otra situacion ocurre cuando un vector aleatorio X en Rⁿ (n > 1) tiene algunas componenets con distribución continuas y otras discretas. Tales distribucións con componentes mixtas son estudiadas en detalle en el capitulo distribuciones mixtas; de todas maneras, el siguiente ejercicio da una ilustracion.

$Mathematical Exercise$ 37. Suponga que X es uniformemente distribuida en {0, 1, 2}, Y es uniformemente distribuida en (0, 2), y que X e Y son independientes.

Pruebe que (X, Y) tiene distribución continua en {0, 1, 2} × (0, 2).
Pruebe que (X, Y) no tiene una función de densidad (2-dimensional) en S (con respecto a m₂).
Halle P(Y > X).

Finalmente, tambien es posible tener una distribución continua en un subconjunto S de Rⁿ con m_n(S) > 0, aun sin función de densidad. Tales distribuciones se dicen que son singulares, y son raras en probabilidad aplicada. Como ejemplo vea Bold Play en el capítulo Rojo y Negro.