Laboratorio Virtual > Espacios de Probabilidad > 1 2 3 4 [5] 6 7 8

5. Probabilidad Condicional


Definición

Como en general, supongamos que tenemos un  experimento aleatorio con espacio muestral S, y  medida de probabilidad  P. Supongamos tambien que sabemos que ha ocurrido un evento B . En general, esta información podría claramente modificar las probabilidad que asignamos a otros eventos. En particular, si  A es otro evento entonces A ocurre si y solo si A y B ocurren; efectivamente, el espacio muestral ha sido reducido a  B. Así, la probabilidad de  A, dado que sabemos que  B ha occurrido, sería proporcional a  P(A B). Sin embargo, la probabilidad condicional, dado que  B ha ocurrido, sería aún un medida de probaiblidad, es decir que debe satisfacer los  axiomas de la  probabilidad. Esto fuerza a que la constante de proporcionalidad sea 1 / P(B). Así, llegamos inexorablemente a la definición siguiente:

Sean A y B eventos en un experimento aleatorio con P(B) > 0. La  probabilidad condicional de A dado B se define como 

P(A | B) = P(A intersect B) / P(B).

Este argumento estuvo basado en la definición axiomática de probabilidad. Exploremos la idea de probabilidad condicional a partir de la noción menos formal y más intuitiva de la  frequencia relativa. Así, supongamos que repetimos el esperimento. Para un evento arbitratio C, sea Nn(C) el número de veces que  C ocurre en las primeras n realizaciones.

Si Nn(B) es grande, la probabilidad condicional de que  A ha ocurrido dado que B ha ocurrido debería ser parecida a la  frequencia relativa condicional de A dado B, es decir la frecuencia relativa de  A para las realizaciones en que B occurrió:

Nn(A intersect B) / Nn(B).

Pero para otra aplicación de la idea de la frecuencia relativa,

Nn(A intersect B) / Nn(B) = [Nn(A intersect B) / n] / [Nn(B) / n] converges to P(A intersect B) / P(B) as n converges to infinity.

luego nuevamente llegamos a la misma definición.

En algunos casos, las probabilidades condicionales pueden calcularse  directamente, reduciendo efectivamente el espacio muestral al evento dado. En otros casos, la fórmula de arriba es mejor.

Propiedades

Mathematical Exercise 1. Muestre que como una función de  A, para  B fijo, P(A | B) es una medida de probabilidad.

El Ejercicio 1 es la propiedad más importante de la probabilidad condicional porque significa que todo resultado que se cumple para medidas de probabilidad, en general también se cumple para probabilidad condicional, siempre y cuando el evento que está condicionando se mantenga fijo.

Mathematical Exercise 2. Supongamos que A y B son eventos en un experimento aleatorio con  P(B) > 0. Pruebe cada uno de los siguientes:

  1. Si B A entonces P(A | B) = 1.
  2. Si A B entonces P(A | B) = P(A) / P(B).
  3. Si A y B son disjuntos entonces P(A | B) = 0.

Mathematical Exercise 3. Supongamos que  A y B son eventos en un experimento aleatorio, cada uno teniendo probabilidad positiva. Muestre que

  1. P(A | B) > P(A) if and only if P(B | A) > P(B) if and only if P(A intersect B) > P(A)P(B)
  2. P(A | B) < P(A) if and only if P(B | A) < P(B) if and only if P(A intersect B) < P(A)P(B)
  3. P(A | B) = P(A) if and only if P(B | A) = P(B) if and only if P(A intersect B) = P(A)P(B)

En el caso (a), A y B se dice que están  correlacionados positivamente . Intuitivamente, la ocurrencia de cada evento significa que el otro evento es más probable.  En el caso (b), A y B se dice que están  correlacionados negativamente . Intuitivamente, la ocurrencia de cada evento significa que el otro evento es menos probable. En el caso (c), A y B se dice que son  independientes. Intuitivamente, la ocurrencia de cada evento no cambia la probablidad del otro evento.

Algunas veces las probabilidades condicionales se conocen y pueden usarse para encontrar las probabilidades de otros eventos.

Mathematical Exercise 4. Supongamos que  A1, A2, ..., An son eventos en un experimento aleatorio cuya intersección tiene probabilidad postiva. Pruebe la regla de multiplicación  de la probabilidad.

P(A1 intersect A2 intersect ··· intersect An) = P(A1)P(A2 | A1)P(A3 | A1 intersect A2) ··· P(An | A1 intersect A2 intersect ··· An-1)

La regla de multiplicacion es particularmente útil para experimentos que consisten de etapas dependientes, donde  Ai es un evento en la etapa  i. Compare la regla de multiplicación de la probabilidad con la  regla de multiplicación de combinatoriaa. 

Ejercicios

Mathematical Exercise 5. Supongamos que  A y B son eventos en un experimento con  P(A) = 1 / 3, P(B) = 1 / 4, P(A intersect B) = 1 / 10. Encuentre cada una de las siguientes:

  1. P(A | B)
  2. P(B | A)
  3. P(Ac | B)
  4. P(Bc | A)
  5. P(Ac | Bc)

Mathematical Exercise 6. Considere el experimento que consiste en tirar  2 dados justos y registrar la secuencia de los resultados de cada dado (X1, X2). Sea Y la suma de los resultados. Para cada uno de los siguientes pares de eventos, encuentre la probabilidad de cada evento y la probabilidad condicional de cada evento dado el otro. Determine si los eventos están correlacionados positivamente, negativamente, o si son independientes.

  1. {X1 = 3}, {Y = 5}
  2. {X1 = 3}, {Y = 7}
  3. {X1 = 2}, {Y = 5}
  4. {X1 = 2},{X1 = 3}

La correlación no es transitiva. A partir del ejercicio anterior, por ejemplo, observe que  {X1 = 3}, {Y = 5} están correlacionados positivamente, {Y = 5}, {X1 = 2} están correlacionados positivamente, pero {X1 = 3}, {X1 = 2} están correlacionados negativamente.

Simulation Exercise 7. En el experimento con dados , fije n = 2. Corra el experimento 500 times. Calcule las probabilidades condicionales empíricas que corresponden a la s probabilidades condicionales en el último ejercicio.

Mathematical Exercise 8. Considere el  experimento con cartas  que consiste en tomar 2 cartas de un mazo estándard y registrar la secuencia de las cartas dadas. Para i = 1, 2, sea Qi el evento de que la carta i sea una reina y el evento  Hi el evento de que la carta  i sea un corazón. Para cada uno de los siguientes pares de eventos, calcule la probabilidad de cada evento, y la probabilidad condicional de cada evento dado el otro. Determine si los eventos son correlacionados positivamente, negativamento, o son independientes.

  1. Q1, H1.
  2. Q1, Q2.
  3. Q2, H2.
  4. Q1, H2.

Simulation Exercise 9. En el experimento con cartas , fije n = 2. Realice el experimento 500 veces. Calcule las frecuencias relativas condicionales correspondientes a las probabilidades condicionales en el último ejercicio.

Mathematical Exercise 10. Considere el experimento con cartas con n = 3 cartas. Encuentre la probabilidad de los siguientes eventos:

  1. Las tres cartas son corazones.
  2. Las primeras dos cartas son corazones y la tercera es una  spade.
  3. The first and third cards are hearts and the second is a spade.

Simulation Exercise 11. In the card experiment, set n = 3 and run the simulation 1000 times. Compute the empirical probability of each event in the previous exercise and compare with the true probability.

Mathematical Exercise 12. In a certain population, 30% of the persons smoke and 8% have a certain type of heart disease. Moreover, 12% of the persons who smoke have the disease.

  1. What percentage of the population smoke and have the disease?
  2. What percentage of the population with the disease also smoke?
  3. Are smoking and the disease positively correlated, negatively correlated, or independent?

Mathematical Exercise 13. Suppose that A, B, and C are events in a random experiment with P(A | C) = 1 / 2, P(B | C) = 1 / 3, and P(A intersect B | C) = 1 / 4. Find each of the following:

  1. P(A intersect Bc | C)
  2. P(A union B | C)
  3. P(Ac intersect Bc | C).

Mathematical Exercise 14. Suppose that A and B are events in a random experiment with P(A) = 1 / 2, P(B) = 1 /3 , P(A | B) = 3 / 4. Find each of the following

  1. P(A intersect B).
  2. P(A union B).
  3. P(B union Ac).
  4. P(B | A).

Data Analysis Exercise 15. For the M&M data set, find the empirical probability that a bag has at least 10 reds, given that the weight of the bag is at least 48 grams.

Data Analysis Exercise 16. For the Cicada data,

  1. Find the empirical probability that a cicada weighs at least 0.25 grams given that the cicada is male.
  2. Find the empirical probability that a cicada weighs at least 0.25 grams given that the cicada is the tredecula species.

Conditional Distributions

Again, suppose that we have an experiment with sample space S and probability measure P. Suppose that X is a random variable for the experiment that takes values in a set T. Recall that the probability distribution of X is the probability measure on T given by

P(X in B) for B T.

Analogously, if A is an event with positive probability, the conditional distribution of X given A is the probability measure on T given by

P(X in B | A) for B T.

Mathematical Exercise 17. Consider the experiment that consists of rolling 2 fair dice and recording the sequence of scores (X1, X2). Let Y denote the sum of the scores. Find the conditional distribution of (X1, X2) given that Y = 7.

Mathematical Exercise 18. Suppose that the time X required to perform a certain job (in minutes) is uniformly distributed on the interval (15, 60).

  1. Find the probability that the job requires more than 30 minutes.
  2. Given that the job is not finished after 30 minutes, find the probability that the job will require more than 15 additional minutes.
  3. Find the conditional distribution of X given X > 30.

Mathematical Exercise 19. Recuerde que el experimento de la moneda de Buffon  consiste en revolear una moneda con radio r 1/2 aleatoriamente en un piso cubierto con baldozas cuadradas de lado con longitud 1. Las coordenadas (X, Y) del centro de la moneda se registran con respecto a los ejes que pasan a través del centro del cuadrado, paralelo a los ejes.

  1. Encuentre P(Y > 0 | X < Y)
  2. Encuentre la distribución condicional de (X, Y) dado que la moneda no tocó los lados del cuadrado.

Simulation Exercise 20. Realice el  experimento de la moneda de Buffon  500 veces. Calcule la probabilidad empírica que Y > 0 dado que  X < Y, y compare con la probabilidad en el último ejercicio.

La ley de  Probability Total y el Teorema de Bayes

Supongamos que {Aj: j in J} es una colección contable de eventos que forma una  partición del espacio muestral  S. Sea B otro evento  y supongamos que conocemos  P(Aj) y P(B | Aj) para cada j in J.

Mathematical Exercise 21. Pruebe la ley de  probabilidad total:

P(B) = sumj P(Aj) P(B | Aj).

Mathematical Exercise 22. Pruebe el  Teorema de Bayes, llamado así  Thomas Bayes: for k in J,

P(Ak | B) = P(Ak)P(B | Ak) / sumj P(Aj) P(B | Aj).

En el contexto del Teorema de Bayes, P(Aj) es la  probabilidad a-priori  de Aj y P(Aj | B) es la probabilidad a posteriori  of Aj. Estuadiaremos versiones más generales de la leey de probabilidad total y del teorema de  Bayes en el capítulo sobre Distributions.

Mathematical Exercise 23.En el experimento con el dado y la moneda, se tira un dado justo y luego se revolea una moneda el número de veces que mostró el dado.

  1. Encuentre la probabilidad de que todas las veces salió cara en la moneda.
  2. Dado que todas las moneda son caras, encuentre la probabilidad de que el resultado del dado haya sido  i para cada i = 1, 2, 3, 4, 5, 6.

Simulation Exercise 24. Corra el  experimento con el dado y la moneda 200 veces.

  1. Calcule la probabilidad empírica del evento de obtener todas caras en la moneda y compare con la probabilidad en el ejercicio anterior.
  2. Para i = 1, 2, ..., 6, calcule la probabilidad empírica del evento de que el resultado del dado sea  i dado que en todas las veces la moneda resultó cara. Compare con la probabilidad en el ejercicio anterior.

Mathematical Exercise 25. Suppose that a bag contains 12 coins: 5 are fair, 4 are biased with probability of heads 1/3; and 3 are two-headed. A coin is chosen at random from the bag and tossed.

  1. Find the probability that the coin is heads.
  2. Given that the coin is heads, find the conditional probability of each coin type.

Compare Exercises 23 and 25. In Exercise 23, we toss a coin with a fixed probability of heads a random number of times. In Exercise 25, we effectively toss a coin with a random probability of heads a fixed number of times.

Mathematical Exercise 26. In the coin-die experiment, a fair coin is tossed. If the coin lands tails, a fair die is rolled. If the coin lands heads, an ace-six flat die is tossed (1 and 6 have probability 1/4 each, while 2, 3, 4, 5 have probability 1/8 each).

  1. Find the probability that the die score is i, for i = 1, 2, ..., 6.
  2. Given that the die score is 4, find the conditional probability that the coin landed heads and the conditional probability that the coin lands tails.

Simulation Exercise 27. Corra el experimento con monedas-dados  500 veces.

  1. Calcule la probabilidad empírica del evento de obtener  i como resultado en el dado, para cada i, y compare con la probabilidad en el ejerccio previo
  2. Calcule la probabilidad empírica del evento de que la moneda resulte con cara, dado que en el dado haya resultado un 4 y  compare con la probabilidad en el ejercicio previo.

Mathematical Exercise 28. A plant has 3 assembly lines that produces memory chips. Line 1 produces 50% of the chips and has a defective rate of 4%; line 2 has produces 30% of the chips and has a defective rate of 5%; line 3 produces 20% of the chips and has a defective rate of 1%. A chip is chosen at random from the plant.

  1. Find the probability that the chip is defective.
  2. Given that the chip is defective, find the conditional probability for each line.

Mathematical Exercise 29. The most common form of colorblindness (dichromatism) is a sex-linked hereditary condition caused by a defect on the X chromosome. Thus, it is much more common in males than females; 7% of males are colorblind but only 0.5% of females are colorblind. (For more on sex-linked hereditary disorders, see the discussion of hemophilia.) In a certain population, 50% are male and 50% are female.

  1. Find the percentage of colorblind persons in the population.
  2. Find the percentage of colorblind persons that are male.

Mathematical Exercise 30. An urn initially contains 6 red and 4 green balls. A ball is chosen at random and then replaced along with 2 additional balls of the same color; the process is repeated. This an example of Pólya's urn scheme, named after George Pólya.

  1. Find the probability that the first 2 balls are red and the third ball is green.
  2. Find the probability that the second ball is red.
  3. Find the probability that the first ball is red given that the second ball is red.

Mathematical Exercise 31. Urn 1 contains 4 red and 6 green balls while urn 2 contains 7 red and 3 green balls. An urn is chosen at random and then a ball is chosen from the selected urn.

  1. Find the probability that the ball is green.
  2. Given that the ball is green, find the conditional probability that urn 1 was selected.

Mathematical Exercise 32. Urn 1 contains 4 red and 6 green balls while urn 2 contains 6 red and 3 green balls. A ball is selected at random from urn 1 and transferred to urn 2. Then a ball is selected at random from urn 2.

  1. Find the probability that the ball from urn 2 is green.
  2. Given that the ball from urn 2 is green, find the conditional probability that the ball from urn 1 was green.

Diagnostic Testing

Suppose that we have a random experiment with an event A of interest. When we run the experiment, of course, event A will either occur or not occur. However, we are not able to observe the occurrence or non-occurrence of A directly. Instead we have a test designed to indicate the occurrence of event A; thus the test that can be either positive for A or negative for A. The test also has an element of randomness, and in particular can be in error. Here are some typical examples of the type of situation we have in mind:

Let T be the event that the test is positive for the occurrence of A. The conditional probability P(T | A) is called the sensitivity of the test. The complementary probability

P(Tc | A) = 1 - P(T | A)

is the false negative probability. The conditional probability P(Tc | Ac) is called the specificity of the test. The complementary probability

P(T | Ac) = 1 - P(Tc | Ac)

is the false positive probability. In many cases, the sensitivity and specificity of the test are known, as a result of the development of the test. However, the user of the test is interested in the opposite conditional probabilities:

P(A | T), P(Ac|Tc).

Mathematical Exercise 33. Use Bayes' Theorem to show that

P(A | T) = P(T | A)P(A) / [P(T | A)P(A) + P(T | Ac)P(Ac)].

For a concrete example, suppose that the sensitivity of the test is 0.99 and the specificity of the test is 0.95. Superficially, the test looks good.

Mathematical Exercise 34. Find P(A | T) as a function of p = P(A). Show that the graph has the following shape:

P(A | T) as a function of p = P(A)

Mathematical Exercise 35. Show that P(A | T) as a function of P(A) has the values given in the following table:

P(A) P(A | T)
0.001 0.019
0.01 0.167
0.1 0.688
0.2 0.832
0.3 0.895

The small value of P(A | T) for small values of P(A) is striking. The moral, of course, is that P(A | T) depends critically on P(A), not just on the sensitivity and specificity of the test. Moreover, the correct comparison is P(A | T) with P(A), as in the table, not P(A | T) with P(T | A).