Trực giác đằng sau công thức xác suất có điều kiện là gì?


30

Công thức cho xác suất có điều kiện của xảy ra khi đã xảy ra là:AP ( AB

P(A | B)=P(AB)P(B).

Sách giáo khoa của tôi giải thích trực giác đằng sau điều này theo sơ đồ Venn.

nhập mô tả hình ảnh ở đây

Cho rằng đã xảy ra, cách duy nhất để xảy ra là sự kiện rơi vào giao điểm của và .A A BBAAB

Trong trường hợp đó, xác suất của chỉ bằng với xác suất của ngã tư , vì đó là cách duy nhất để sự kiện có thể xảy ra? Tôi đang thiếu gì? A BP(A|B)AB


7
Bạn có hiểu biết trực quan về xác suất có điều kiện "là gì" không, nếu chúng ta quên mất một lúc thì làm thế nào để tính toán nó?
Juho Kokkala

4
Bằng cách điều hòa trên B (sự kiện đã xảy ra), bạn chỉ giới hạn không gian kết quả của mình từ (toàn bộ mặt phẳng) đến B. Bạn quên mọi thứ ở bên ngoài B. Xác suất của sự kiện A phải được đo bằng sự tôn trọng B, vì xác suất nằm trong khoảng từ 0 đến 1.Ω
Vladislavs Dovgalecs

1
Bạn đang thiếu thực tế là phần trắng của Vòng tròn Sự kiện không còn là một phần của dân số khi bạn biết Sự kiện B xảy ra.
Monty Harder

4
Trực giác không chính xác, cũng không phải là số ít, vậy tại sao lại hỏi về trực giác chính xác (số ít)? Một trực giác hữu ích đủ, nhưng không phải tất cả các đề xuất sẽ hữu ích cho tất cả mọi người.
John Coleman

Câu trả lời:


23

Một trực giác tốt được đưa ra là B xảy ra tình huống có hoặc không có A, xác suất của A là bao nhiêu? Tức là, chúng ta đang ở trong vũ trụ, trong đó B đã xảy ra một vòng tròn bên phải. Trong vòng tròn đó, xác suất của A là diện tích của A cắt B chia cho diện tích của hình tròn.


5
Nói cách khác - tôi nói với bạn đã xảy ra, có nghĩa là chúng ta sống trong vòng trònTrong thế giới đó, bao nhiêu% sự kiện trong ống kính ( )? B A BBBAB
MichaelChirico

18

Tôi sẽ nghĩ về nó như thế này: Tôi chấp nhận rằng bạn hiểu trực giác cho đến khi:

Cho rằng B đã xảy ra, cách duy nhất để A xảy ra là cho chẵn rơi vào giao điểm của A & B.

và tôi sẽ bình luận hình ảnh thứ hai bạn đã đăng:

  1. Hãy tưởng tượng rằng toàn bộ hình chữ nhật màu trắng là không gian mẫu của bạn .Ω

    Gán xác suất cho một tập hợp có nghĩa là bạn đang đo theo một nghĩa nào đó mà tập hợp đó. Nó giống như khi bạn đo diện tích của hình chữ nhật nhưng xác suất là một loại thước đo khác có các thuộc tính cụ thể (tôi sẽ không nói gì thêm về điều này).

  2. Bạn biết rằng và điều này được diễn giải như sau:P(Ω)=1

    Ω đại diện cho tất cả các sự kiện có thể xảy ra và điều gì đó phải xảy ra để chúng tôi có xác suất 100% có chuyện gì đó xảy ra.

  3. Tương tự tập có một xác suất đó là tỷ lệ thuận với khả năng của không gian mẫu . Nói về mặt đồ họa, bạn thấy rằng do đó số đo của (xác suất ) phải nhỏ hơn . Lý do cùng có giá trị trong tập . Bộ này có thể được đo và số đo của nó là .AΩ Một Ω Một P ( A ) P ( Ω ) Một B P ( A B )P(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. Nếu bây giờ bạn được thông báo rằng đã xảy ra, bạn phải nghĩ như thể là "người mới" . Nếu là bạn "mới" sau đó bạn có thể chắc chắn 100% rằng mọi thứ xảy ra trong tập .B Ω B Ω BBBΩBΩB

    Và thế có nghĩa là gì? Điều đó có nghĩa là bây giờ, trong cuộc thi "mới" và bạn phải hủy bỏ tất cả các biện pháp xác suất, có tính đến việc chúng phải được thể hiện dưới dạng không gian mẫu "mới" . Đó là một tỷ lệ đơn giản.BP(BB)=1B

    Trực giác của bạn gần như đúng khi bạn nói rằng:

xác suất của P (A | B) đơn giản bằng với xác suất của giao điểm B

và "gần như" là do thực tế là bây giờ không gian mẫu của bạn đã thay đổi ( bây giờ là ) và bạn muốn bán lại tương ứng.P ( A B )BP(AB)

  1. P ( A B ) BP(AB) là bạn trong thế giới mới, nơi không gian mẫu tại là . Nói cách bạn sẽ nói nó như thế này (và hãy cố gắng hình dung nó trên hình ảnh với các bộ):P(AB)B

    Ở thế giới mới, tỷ lệ giữa số đo của và số đo của phải giống như tỷ lệ giữa số đo của và số đo củaMột B Ω Một | BBABΩAB

  2. Cuối cùng dịch điều này bằng ngôn ngữ toán học (một tỷ lệ đơn giản):

P(B):P(AB)=P(Ω):P(AB)

và vì nên theo sau:P(Ω)=1

P(AB)=P(AB):P(B)

5

Bạn sẽ thấy trực giác dễ dàng nghĩ về vấn đề sau.

Giả sử, bạn có 10 quả bóng: 6 Đen và 4 đỏ. Trong số các bóng đen 3 là Tuyệt vời và các bóng đỏ chỉ có 1 là Tuyệt vời. Làm thế nào có khả năng đó là một quả bóng đen cũng tuyệt vời?

Câu trả lời rất dễ: đó là 50%, vì chúng tôi có 3 quả bóng Đen tuyệt vời trong tổng số 6 quả bóng Đen.

Đây là cách bạn ánh xạ xác suất cho vấn đề của chúng tôi:

  • 3 quả bóng có màu Đen VÀ Tuyệt vời tương ứng vớiP(AB)
  • 6 quả bóng có màu Đen tương ứng vớiP(B)
  • xác suất rằng một quả bóng là Tuyệt vời khi chúng ta BIẾT rằng đó là Đen:P(AB)

1
Nó sẽ không có ý nghĩa hơn để viết chứ không phải ? n(B)=6P(B)=6
Cá bạc

@Silverfish Sẽ chính xác hơn, nhưng tôi đã theo trực giác trong trường hợp này
Aksakal

4

Đối với một trực giác cơ bản của công thức xác suất có điều kiện, tôi luôn thích sử dụng bảng hai chiều. Giả sử có 150 sinh viên trong một nhóm, trong đó 80 là nữ và 70 nam, mỗi người phải học chính xác một khóa học ngôn ngữ. Bảng hai chiều của sinh viên tham gia các khóa học khác nhau là:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

Cho rằng một sinh viên học khóa tiếng Ý, xác suất họ là nữ là bao nhiêu? Vâng, khóa học tiếng Ý có 60 sinh viên, trong đó 40 người là nữ học tiếng Ý, vì vậy xác suất phải là:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

nơi là cardinality của tập , tức là số lượng các mục nó chứa. Lưu ý rằng chúng ta cần sử dụng trong tử số và không chỉ , bởi vì sau này sẽ bao gồm tất cả 80 nữ, bao gồm 40 nữ khác người không học tiếng Ý.n(A)An(FItalian)n(F)

Nhưng nếu câu hỏi được lật lại, xác suất mà một sinh viên tham gia khóa học tiếng Ý là gì, cho rằng họ là nữ? Sau đó, 40 trong số 80 sinh viên nữ tham gia khóa học tiếng Ý, vì vậy chúng tôi có:

P(Italian|F)=n(ItalianF)n(F)=4080=12

Tôi hy vọng điều này cung cấp trực giác cho lý do tại sao

P(A|B)=n(AB)n(B)

Hiểu lý do tại sao phân số có thể được viết với xác suất thay vì hồng y là vấn đề của các phân số tương đương . Ví dụ, chúng ta hãy quay trở lại xác suất một học sinh là nữ cho rằng họ đang học tiếng Ý. Tổng cộng có 150 sinh viên, vì vậy xác suất sinh viên là nữ và học tiếng Ý là 40/150 (đây là xác suất "chung") và xác suất sinh viên học tiếng Ý là 60/150 (đây là xác suất "cận biên" ). Lưu ý rằng chia xác suất chung cho xác suất cận biên sẽ cho:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(Để thấy rằng các phân số là tương đương, nhân tử số và mẫu số với 150 sẽ loại bỏ "/ 150" trong mỗi phân số.)

Tổng quát hơn, nếu không gian lấy mẫu của bạn có cardinality - trong ví dụ này, số lượng thẻ là 150 - chúng tôi thấy rằngΩn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

Tôi sẽ đảo ngược logic. Xác suất mà cả và là:AB

  1. Xác suất xảy ra, và điều đó cho rằng đã xảy ra.BA
  2. Vai trò tương tự nhưng ngược lại cho vàAB

Điều này sẽ cung cấp cho bạn

p(AB)=p(B)p(AB)

Nếu bạn đang tìm kiếm một tiêu cực cho đề xuất của mình, thì trong khi đó đúng là xác suất cho được chứa trong xác suất của sản phẩm, không gian bạn gieo xúc xắc nhỏ hơn không gian xác suất ban đầu của bạn - bạn biết đấy chắc chắn bạn đang "ở" , do đó bạn chia cho kích thước của không gian mới.ABB


2

Biểu đồ Venn không đại diện cho xác suất, nó biểu thị số đo các tập hợp con của không gian sự kiện. Một xác suất là tỷ lệ giữa hai biện pháp; xác suất của X là kích thước của "mọi thứ cấu thành X" chia kích thước của "tất cả các sự kiện đang được xem xét". Bất cứ khi nào bạn tính toán xác suất, bạn cần cả "không gian thành công" và "không gian dân số". Bạn không thể tính xác suất chỉ dựa trên "không gian" lớn như thế nào. Chẳng hạn, xác suất để lăn bảy với hai con xúc xắc là số cách lăn bảy được chia cho tổng số cách lăn hai con xúc xắc. Chỉ cần biết số cách lăn bảy là không đủ để tính xác suất. P (A | B) là tỷ lệ của số đo "cả A và B xảy ra" không gian và số đo của không gian "B xảy ra". Đó là những gì "|" có nghĩa là: nó có nghĩa là "làm cho những gì đến sau không gian dân số này".


2

Tôi nghĩ cách tốt nhất để nghĩ về điều này là vẽ các đường dẫn từng bước.

Chúng ta hãy mô tả Sự kiện B khi cán trên một cái chết công bằng - điều này có thể dễ dàng được chứng minh là có xác suất . Bây giờ, hãy mô tả Sự kiện A khi vẽ Ace từ bộ bài 52 lá tiêu chuẩn - điều này có thể dễ dàng được chứng minh là có xác suất .416113

Bây giờ chúng ta hãy chạy một thí nghiệm trong đó chúng ta lăn một cái chết và sau đó chọn một thẻ. Vì vậy, sẽ là xác suất để chúng ta vẽ Ace, với điều kiện là chúng ta đã cán được . Nếu bạn nhìn vào hình ảnh, đây sẽ là đường dẫn (đi lên) và sau đó là đường dẫn (đi lên lại).P(A|B)416113

Theo trực giác, tổng không gian xác suất là những gì chúng ta đã được đưa ra: cán . Chúng ta có thể bỏ qua và đường dẫn xuống ban đầu dẫn đến, vì đó là GIVEN mà chúng ta đã cán . Theo luật nhân, tổng không gian của chúng ta sau đó là .411312134(16×113)+(16×1213)

Bây giờ xác suất chúng ta vẽ Ace, GIVEN là gì khi chúng ta cán ? Câu trả lời bằng cách sử dụng đường dẫn là , sau đó chúng ta cần chia cho tổng không gian. Vì vậy, chúng tôi nhận được4(16×113)

P(A|B)=16×113(16×113)+(16×1213).

nhập mô tả hình ảnh ở đây


2
Tôi đã tự hỏi downvote là để làm gì, bởi vì cây xác suất có thể rất hướng dẫn. Có lẽ mối quan tâm là việc sử dụng các sự kiện độc lập cho hình minh họa sẽ bỏ lỡ điểm xác suất có điều kiện, đó là phân phối xác suất có thể thay đổi tùy thuộc vào sự kiện điều hòa. Sử dụng một minh họa ít hời hợt có thể giúp đỡ.
whuber

1

Hãy nghĩ về nó về các tính. Xác suất cận biên là số lần A xảy ra chia cho cỡ mẫu. Xác suất chung của A và B là số lần A xảy ra cùng với B chia cho cỡ mẫu. Xác suất có điều kiện của A đã cho B là số lần A xảy ra cùng với B chia cho số lần B xảy ra, tức là chỉ có A trong "B".

Bạn có thể tìm thấy hình minh họa đẹp mắt trên blog này , cho thấy nó sử dụng các khối Lego.


1

Tại thời điểm viết có khoảng 10 câu trả lời mà dường như tất cả đều bỏ lỡ điểm quan trọng nhất: về cơ bản bạn đã đúng.

Trong trường hợp đó, xác suất của P (A | B) sẽ không bằng với xác suất của giao lộ B, vì đó là cách duy nhất để sự kiện có thể xảy ra?

Điều này chắc chắn là đúng. Điều này giải thích tại sao đại lượng chúng ta xác định thực sự được định cỡ lại .P(A|B)P(AB)

Tôi đang thiếu gì?

Bạn đang thiếu rằng xác suất B hài lòng khi B hài lòng là 1 vì đây là một sự kiện nhất định và không phải có thể nhỏ hơn 1. Chia cho làm cho xác suất có điều kiện của B cho B bằng 1, như mong đợi. Trên thực tế, điều này thậm chí còn tốt hơn và làm cho bản đồ thành xác suất - vì vậy xác suất có điều kiện thực sự là một xác suất.P(BB)=P(B)P(B)AP(A|B)


0

Tôi cảm thấy nó trực quan hơn khi chúng ta có dữ liệu cụ thể để ước tính xác suất.

Hãy sử dụng mtcarsdữ liệu làm ví dụ, dữ liệu trông như thế này (chúng tôi chỉ sử dụng số lượng hình trụ và loại truyền.)

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Chúng ta có thể tính toán phân phối chung trên hai biến bằng cách thực hiện một bảng chéo:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

Xác suất chung có nghĩa là chúng tôi muốn xem xét hai biến cùng một lúc. Ví dụ, chúng tôi sẽ hỏi có bao nhiêu chiếc xe là 4 xi lanh và hộp số tay.

Bây giờ, chúng ta đến với xác suất có điều kiện. Tôi tìm thấy cách trực quan nhất để giải thích xác suất có điều kiện là sử dụng thuật ngữ lọc trên dữ liệu.

Giả sử chúng ta muốn lấy , chúng ta sẽ thực hiện các ước tính sau:P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

Điều này có nghĩa, chúng tôi chỉ quan tâm xe có 4 xi lanh. Vì vậy, chúng tôi lọc dữ liệu về điều đó. Sau khi lọc, chúng tôi kiểm tra có bao nhiêu trong số chúng là truyền tay.

Bạn có thể so sánh điều kiện này với khớp tôi đã đề cập trước đó để cảm nhận sự khác biệt.


0

Nếu Alà một siêu thay đổi của Bxác suất Axảy ra luôn luôn là 1 được đưa Bra, nghĩa là P(A|B) = 1. Tuy nhiên, Bbản thân nó có thể có xác suất nhỏ hơn 1.

Hãy xem xét ví dụ sau:

  • đã cho xlà một số tự nhiên trong 1..100,
  • Alà ' xlà số chẵn'
  • Blà ' xchia hết cho 10'

sau đó chúng ta có:

  • P(A) là 0,5
  • P(B) là 0,1

Nếu chúng ta biết rằng xnó chia hết cho 10 (tức xlà trong B) thì chúng ta biết rằng đó cũng là một số chẵn (tức xlà trong A) như vậy P(A|B) = 1.

Từ quy tắc của Bayes, chúng ta có:

P(A|B)=P(AB)P(B)

lưu ý rằng trong trường hợp (đặc biệt) của chúng tôi , nghĩa là xác suất có cả số chẵn và số chia hết cho 10 bằng với xác suất là số chia hết cho 10. Do đó chúng tôi có và cắm lại quy tắc này của Bayes, chúng tôi nhận được .P(AB)xxP(AB)=P(B)P(A|B)=P(B)/P(B)=1


Đối với một ví dụ không suy biến, hãy xem xét ví dụ: A' xchia hết cho 7' và B' xchia hết cho 3'. Khi đó, P(A|B)tương đương với 'cho rằng chúng ta biết rằng xchia hết cho 3 thì xác suất mà nó (cũng) chia hết cho 7 là bao nhiêu?'. Hoặc tương đương 'Phần nào của các số 3, 6, ..., 99 chia hết cho 7'?


0

Tôi nghĩ rằng tuyên bố ban đầu của bạn có thể là một sự hiểu lầm.

Bạn đã viết:

Công thức xác suất có điều kiện của A xảy ra, một khi B đã xảy ra là:

Từ cụm từ của bạn, có vẻ như có 2 sự kiện "Lần đầu tiên B xảy ra, và sau đó chúng tôi muốn tính xác suất A sẽ xảy ra".

Đây không phải là trường hợp. (Sau đây là hợp lệ cho dù có hiểu lầm hay không).

Chúng tôi chỉ có 1 sự kiện, được mô tả bởi một trong 4 khả năng:

  1. không hay ;AB

  2. chỉ , không phải ;AB

  3. chỉ , không phải ;BA

  4. cả và .AB

Đặt một số số ví dụ trên đó, giả sử

P(A)=0.5,P(B)=0.5,andA and B are independent.

Theo sau

P(A and B)=0.25andP(neither A nor B)=0.25.

Ban đầu (không có kiến ​​thức về sự kiện này), chúng tôi biết .P(AB)=0.25

Nhưng một khi chúng ta biết rằng đã xảy ra, chúng ta ở một không gian khác. là một nửa của nên xác suất của cho , , là . Không phải , biết rằng đã xảy ra.BP(AB)P(B)ABP(A|B)0.50.25B


0

Xác suất điều hòa KHÔNG bằng xác suất giao nhau. Đây là một câu trả lời trực quan:

1) : "Chúng tôi biết rằng đã xảy ra. Xác suất mà sẽ xảy ra là gì?"P(BA)AB

2: : "Chúng tôi không biết nếu hoặc đã xảy ra. Xác suất cả hai sẽ xảy ra là gì?P(AB)AB

Sự khác biệt là trong phần đầu tiên, chúng tôi có thêm thông tin (chúng tôi biết rằng xảy ra trước). Trong cái thứ hai chúng ta không biết gì cả.A

Bắt đầu với xác suất của cái thứ hai, chúng ta có thể suy ra xác suất của cái thứ nhất.

Sự kiện mà cả và sẽ xảy ra có thể xảy ra theo hai cách:AB

1) Xác suất của VÀ xác suất của cho rằng đã xảy ra.ABA

2) Xác suất của VÀ xác suất của cho rằng đã xảy ra.BAB

Nó chỉ ra rằng cả hai tình huống đều giống nhau để xảy ra. (Tôi không thể tự mình tìm ra lý do trực quan). Do đó, chúng ta phải cân cả hai kịch bản với0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

Bây giờ sử dụng và là độc lập và hãy nhớ rằng cả hai kịch bản đều có khả năng xảy ra như nhau.ABA

P(AB)=P(A)P(BA)

Tadaaa ... bây giờ cô lập xác suất của điều hòa!

btw. Tôi rất thích nếu ai đó có thể giải thích tại sao kịch bản 1 và 2 bằng nhau. Chìa khóa nằm ở đó imo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.