Laboratorio Virtuale > Distribuciones > 1 2 3 4 5 [6] 7 8 9

6. Funciones de Distribución


Definición

Como siempre, empezamos con un experimento aleatorio teniendo un espacio muestral y una medida de probabilidad P. Suponga que X es una  variable aleatoria a valores reales para el experimento. La función de distribución (acumulativa) de X es la función  F dada por

F(x) = P(X <= x) para x en R.

Esta función es importante porque toma sentido para todo tipo de variable aleatoria, mas alla de si la distribución es discreta, continua, o mixta, y porque determina completamente la dsitribucion de X.

Abreviaremos algunos límites de F de la siguiente manera:

Propiedades basicas

Las propiedades en los siguientes ejercicios caracterizan completamente las funciones de distribución. Los teoremas de continuidad de probabilidad seran utiles para las demostraciones.

Mathematical Exercise 1. Pruebe que F es creciente: si x <= y entonces F(x) <= F(y).

Mathematical Exercise 2. Pruebe que F(x+) = F(x) para x en R. Esto es, F es continua por derecha:

Mathematical Exercise 3. Pruebe que F(x-) = P(X < x) para x en R. Esto es, F tiene límite por izquierda:

Mathematical Exercise 4. Pruebe que F(infinity) = 1.

Mathematical Exercise 5. Pruebe que F(-infinity) = 0.

El siguiente ejercicio prueba como la función de distribución puede ser utilizada para calcular la probabilidad de que X  esté en un intervalo. Recuerde que la distribución de probabilidad en R está completamente determinada por la probabilidad de los  intervalos; esto significa que  la función de distribución determina la distribución de X. En cada caso, lo que se necesita es que

P(B intersectAc) = P(B) - P(A) si A subset B.

Mathematical Exercise 6. Suponga que a y b están en R con a < b. Pruebe que

  1. P(X = a) = F(a) - F(a-)
  2. P(a < X b) = F(b) - F(a)
  3. P(a < X < b) = F(b-) - F(a)
  4. P(a X b) = F(b) - F(a-)
  5. P(a X < b) = F(b-) - F(a-)

Mathematical Exercise 7. Pruebe que si  X tiene una distribución continua, entonces la función de distribución F es continua en el sentido usual.

Relación con las funciones de densidad

Hay una relación simple entre la función de distribución y la función de densidad.

Mathematical Exercise 8. Suponga que X tiene distribución discreta con función de densidad  f y función de distribución F. Pruebe que para x en R,

  1. F(x) = sumt <= x f(t).
  2. f(x) = F(x) - F(x-)

Esto es, es una función con saltos en los valores de X que tienen probabilidad positiva; el tamańo del salto en x es la función de densidad en x. Hay un resultado análogo para una distribución continua con una densidad.

Mathematical Exercise 9. Suponga que X tiene una distribución continua con función de densidad  f y función de dsitribución  F. Pruebe que

  1. F(x) = integralt <= x f(t)dt.
  2. f(x) = F'(x)

Para distribuciones mixtas tenemos una combinacion de los resultados de los dos ejercicios anteriores.

Mathematical Exercise 10. Suponga que X tiene una distribución mixta con densidad parcial discreta g ,  y parcial continua hF denota la función de distribución. Pruebe que

  1. F(x) = sumt <= x g(t) + integralt <= x h(t)dt.
  2. g(x) = F(x) - F(x-) si F es discontinua en x.
  3. h(x) = F'(x) si F es continua en x.

Naturalmente, la función de distribución puede ser definida relativa a cualquiera de las distribuciones condicionales que hemos discutido No hay nuevos conceptos, y todos lo resultados previos se verifican.

Mathematical Exercise 11. Suponga que X tiene una distribución continua en R con función de densidad  f que es simetrica con respecto a un punto a:

f(a + t) = f(a - t) para t en R.

Pruebe que la función de dsitribucion F satisface

F(a - t) = 1 - F(a + t) para t en R.

Ejercicios computacionales

Mathematical Exercise 12. Suponga que un par de dados es lanzado y sea (X1, X2) la sucesión de valores obtenidos. Halle la función de  distribución de

  1. Y = X1 + X2, la suma de los puntos.
  2. V = max (X1, X2), el máximo punto.
  3. Y dado V = 5.

Mathematical Exercise 13. Suponga que X es uniformemente distribuida en el intervalo (a, b) donde a < b.

  1. Halle la función de distribución de X.
  2. Bosqueje los gráficosde la función de densidad y de la función de distribución.

Mathematical Exercise 14. Suponga que X tiene función de densidad f(x) = 12x2(1 - x), 0 < x < 1. Esto es, X tiene una distribución beta.

  1. Halle la función de distribución de X.
  2. Bosqueje los gráficos de la función de densidad y de la función de distribución.

Mathematical Exercise 15. Suponga que X tiene función de densidad f(x) = r exp(-rx), x > 0 donde r > 0 es un parametro. Esto es, X tiene una distribución exponencial con parametro r.

  1. Halle la función de distribución de X.
  2. Bosqueje los gráficosde la función de densidad y de la función de distribución.

Mathematical Exercise 16. Suponga que X tiene función de densidad f(x) = a / xa+1 para x > 1 donde a > 0 es un parametro. Esto es X tiene distribución de Pareto con parametro de forma a.

  1. Halle la función de distribución de X.
  2. Bosqueje los gráficos de la función de densidad y de la función de distribución.

Mathematical Exercise 17. Suponga que X tiene función de densidad f(x) = 1 / [ (1 + x2)] para x en R. Es decir, X tiene distribución de Cauchy.

  1. Halle la función de distribución de X.
  2. Bosqueje los gráficosde la función de densidad y de la función de distribución.

Simulation Exercise 18. En el applet cuantil, varíe los parámetros y observe la forma de la función de densidad y de la función de distribución para cada una de las siguientes distribuciones:

  1. La distribución normal 
  2. La distribución gamma 
  3. La distribución beta 
  4. La distribución de Pareto 

Mathematical Exercise 19. Sea F la función definida como sigue:

  1. Pruebe que F es la función de distribución para una distribución discreta.
  2. Halle la función de densidad  f correspondiente.
  3. Realice los gráficos de  f y F.
  4. Halle P(2 <= X < 3) donde X tiene esta distribución.

Mathematical Exercise 20. Sea F(x) = 0 para x < 0, F(x) = x / (x + 1) para 0 x.

  1. Pruebe que F es la función de distribución para una distribución discreta.
  2. Halle la función de densidad  f correspondiente.
  3. Realice los gráficos de  f y F.
  4. Halle P(2 <= X < 3) donde X tiene esta distribución.

Mathematical Exercise 21. Sea F la función definida por

  1. Realice el grafico de F.
  2. Pruebe que F es la función de distribución de una distribución mixta.
  3. Halle la densidad de la parte discreta.
  4. Halle la densidad de la parte conntinua.
  5. Halle P(2 <= X < 3) donde X tiene esta distribución.

Cuantiles

Sea X una variable aleatoria con función de distribución F. Suponga que p in (0, 1). Un valor de x tal que

F(x -) = P(X < x) <= p y F(x) = P(X <= x) >= p

se llama un cuantil de orden p para la distribución. Es decir, un cuantil de orden p es el valor donde la distribución acumulada cruza  p.

Note que existe una relación inversa entre los cuantiles y los valores de la distribución acumulada. Para analizar esta relacion, supongamos primero que F es la función de distribución de una distribución continua en un intervalo abierto S. (Dado que la distribución es continua no hay perdida de generalidad en suponer el intevalo abierto). Es mas, suponga que F es estrictamente creciente, y manda S en (0, 1). (Esto significa que todo subintervalo abierto de S tiene probabilidad positiva, de forma que la distribución es supported en S.) Entonces F tiene una inversa F-1 bien definida que manda (0, 1) en S.

Mathematical Exercise 22. Bajo las condiciones anteriores, pruebe que F-1(p) es el unico cuantil de orden p.

Par el cálculo de cuantiles, y para muchos otros casos, resulta útil extender la definición de inversa a una función de distribución F arbitraria. Esto es, para p en (0, 1), se define la función cuantil; por

F-1(p) = inf{x in R: p <= F(x)}.

Desde ya, si S es un intervalo y F es estrictamente creciente en S, entonces F-1 es la inversa de F  definida anteriormente. El siguiente ejercicio justifica el nombre: F-1(p) es el mínimo de los cuantiles de orden p.

Mathematical Exercise 23. Para p en (0, 1), pruebe que

  1. F-1(p) es un cuantil de orden p.
  2. Si x es otro cuantil de orden p entonces F-1(p) < x.

Las otras propiedades basicas estan dadas en los dos ejercicios siguientes.

Mathematical Exercise 24. En general, pruebe que

  1. F-1 es creciente en (0, 1).
  2. F-1[F(x)] <= x para cualquier x en R con 0 < F(x) < 1.
  3. F[F-1(p)] p para cualquier p en (0, 1).

Mathematical Exercise 25. Pruebe que para x en R y p en (0, 1),

F-1(p) <= x si y solo si p <= F(x).

Un cuartil de orden 1/2 se llama una mediana de la distribución. Cuando hay una sola mediana, ésta se suele usar como una medida del centro de la distribución. Un cuartil de orden 1/4 se llama un primer cuartil y el cuartil de orden 3/4 se llama tercer cuartil. Una mediana es un segundo cuartil. Asumiende unicidad, si q1, q2, y q3 denotan la primer, segunda, y tercer quartil de X, note que el intevalo de q1 a q3 da la mitad de la distribución, y el  rango intercuartil se define como

IQR = q3 - q1,

y es a veces utilizadad como una medida de la  spread de la distribución con respecto a la mediana. Si a y b denotan el  valor mínimo y  máximo de X, respectivamente (asumiendo que son finitos). Los cinco parametros

a, q1, q2, q3, b

son conocidos como el resúmen de los cinco números. Estos parametros dan una gran cantidad de informacuion sobre la distribución en terminos del centro, spread, and skewness. Graficamente, los cinco numeros son frecuentemente distribuidos como un boxplot, que consiste de una linea extendida dede el máximo valor a a el mínimo valor b, con una caja rectangulra desde q1q3, and tick marks at the a, the median q2, and b.

Simulation Exercise 26. En el  applet del histograma, seleccione boxplot. Set the class width to 0.1 y contruya una distribución discreta con como mínimo 30 valores década uno de lo tipos indicados debajo. Note la forma del boxplot y las posiciones relativas de los parametros en los cinco numeros summary:

  1. Una distribución uniforme.
  2. Una distribución simétrica, unimodal.
  3. Una distribución unimodal  que es asimétrica hacia la derecha.
  4. Una distribución unimodal  que es asimétrica hacia la izquierda.
  5. Una distribución simétrica bimodal.
  6. Una distribución con forma de u .

Mathematical Exercise 27. Suponga que F es una función de distribución para la distribución uniforme en [a, b].

  1. Halle la función cuantil  F-1(p).
  2. Halle los cinco numeros summary y realice el  boxplot.

Mathematical Exercise 28. Suponga que F es una función de distribución para la distribución exponencial con parametro r.

  1. Halle la función cuantil F-1(p).
  2. Halle la mediana, el primer y tercer cuartil, y el rango (and the interquartile range).
  3. Con r = 2, realice el grafico de la función de densidad y muestre el primer y tercer cuartil.

Mathematical Exercise 29. Suponga que F es una función de distribución para la distribución Pareto con parametro de forma a.

  1. Halle la función cuantil F-1(p).
  2. Halle la mediana, el primer y tercer cuartil, y el rango ( and the interquartile range).
  3. Con a = 2, realice el grafico de la función de densidad y muestre el priemr y tercer cuartil.

Mathematical Exercise 30. Suponga que F es una función de distribución para la distribución de Cauchy.

  1. Halle la función cuantil F-1(p).
  2. Halle la mediana, el primer y tercer cuartil, y el rango ( and the interquartile range).
  3. Realice el grafico de la función de densidad y muestre el priemr y tercer cuartil.

Mathematical Exercise 31. Halle la función cuantil F-1 para la función de distribución F en el ejercicio19.

Mathematical Exercise 32.  Halle la función cuantil F-1 para la función de distribución F en el ejercicio 20.

Mathematical Exercise 33.  Halle la función cuantil F-1 para la función de distribución F en el ejercicio 21.

Simulation Exercise 34. En el  applet del cuartil, halle la mediana y el primer y tercer cuartil para cada una de las siguientes distrinuciones.En cada caso, observe la función de densidad y la función de distribución.

  1. La distribución normal standard (mu = 0, sigma = 1)
  2. La distribución  gamma con parametro de forma 2 y parametro de escala 1.
  3. La distribucon beta con a = 1.5 y b = 2.
  4. La distribución Pareto con parametro de forma 2.

Mathematical Exercise 35. Suponga que X tiene una distribución continuas en R con densidad f que es simetrica respecto a un punto a:

f(a - t) = f(a + t) para t en R.

Pruebe que si a + t es un cuantil de orden p entonces a - t es un cuantil de orden 1 - p.

La Función de Distribución de la Cola Derecha

Suponga que X es una variable aleatoria con función de distribución  F. Una función que claramente da la misma informacion que F es la función de distribución de la cola derecha:

G(x) = 1 - F(x) = P(X > x) para x in R.

Mathematical Exercise 36. De las propiedades matemáticas de la función de distribución de la cola derecha, análogas a las propiedades en el Ejercicio 1-5.

Suponga que T es una variable aleatoria con distribución continua en (0, infinity). Si interpretamos T como el tiempo de vida de un cierto producto, entonces la función de distribución de la cola derecha de G se llama  la función de confiabilidad: G(t) es la probabilidad de que el producto tarde cuanto mucho  t unidades de tiempo. Ademas, la función h definida debajo es llamada la función de velocidad de falla:

h(t) = f(t) / G(t).

Mathematical Exercise 37. Pruebe que h(t) dt ~ P(t < T < t + dt | T > t) si dt es pequeno.

Es decir, h(t) dt es la probabilidad de que el producto falle en las proximas dt unidades de tiempo, habiendo llegado hasta el tiempo t. Además, la función de velocidad de falla determina completamente la distribución de T.

Mathematical Exercise 38. Preube que

G(t) = exp[-integral(0, t) h(s)ds] para t > 0.

Mathematical Exercise 39. Pruebe que la  failure rate función h satisface las siguientes propiedades:

  1. h(t) >=0 para t > 0.
  2. integral(t: t > 0) h(t)dt = infinity.

Mathematical Exercise 40. Reciprocamente, suponga que h satisface las condiciones del ejercicio 39. Pruebe que la formula en el ejercicio 38 define la reliability function.

Mathematical Exercise 41. Considere la distribución con failure rate function h(t) = tk, t > 0.

  1. Halle la correspondiente función de confianza.
  2. Halle la correspondiente función de densidad.

La dsitribucion del ejercicio previo es la distribución de Weibull con parametro de forma k, nombrada en honor a Walodi Weibull.

Funciones de Distribución Multivariadas 

Supose que X e Y son variables aleatorias a valores reales de un experimento, tales que (X, Y) es un vector aleatorio tomando valores en un subconjuntode R2. La función de distribución  de (X, Y) es la función F definida por

F(x, y) = P(X <= x, Y <= y).

Como en el caso de una sola variable, la función de distribución de (X, Y) determina completamente la distribución de (X, Y).

Mathematical Exercise 42. Si F denota la función de distribución de (X, Y), y  G y H, respectivamente, denotan las funciones de distribución de X e Y. Pruebe que

  1. G(x) = F(x, infinity)
  2. H(y) = F(infinity, y)

Mathematical Exercise 43. En el contexto del ultimo ejercicio, pruebe que X e Y son independientes si y solo si

F(x, y) = G(x)H(y) para todo x, y.

Mathematical Exercise 44. Suponga que (X, Y) tiene función de densidad f(x, y) = x + y para 0 < x < 1, 0 < y < 1.

  1. Halle la función de distribución de (X, Y).
  2. Halle la función de distribución de X.
  3. Halle la función de distribución de Y.
  4. Halle la función de distribución condicional de X dado Y = y (0 < y < 1).
  5. Halle la función de distribución condicional de Y dado X = x (0 < x < 1)
  6. Son  X, Y independientes?

Todos los resultados de ésta subsección se pueden  generalizar fácilmente a vectores aleatorios de dimensión n .

La Función de Distribución Empirica

Suponga que {x1, x2, ..., xn} es un subconjunto de datos observados de una variable aleatoria a valores reales. La función de distribución empírica se define por

Fn(x) = #{i in {1, 2, ..., n}: xi <= x} / n para x in R.

Es decir,  Fn(x) da la fraccion de valores en el conjunto de datos que menores o iguales que x.

Data Analysis Exercise 45. Para los M&M datos, calcule al función de distribución empirica del numero total de candies.

Data Analysis Exercise 46. Para los datos de la cigarra , si L denota la longitud del cuerpo y si G denota genero. Calcule la función de distribución empirica de las siguientes variables:

  1. L
  2. L dado G = masculino
  3. L dado G = femenino.
  4. Cree que L y G son independientes?

Para la versión estática de algunos de los topicos de esta sección, vea los capítulos Muestra aleatorias, y en particular, las secciones distribuciones empíricas y estadísitca de orden.