Số học để cập nhật khả năng sử dụng định lý Bayes


8

Đây có thể là một câu hỏi cơ bản, đó là lý do tại sao tôi không thể tìm thấy nó trên Stackexchange hoặc Mathoverflow tuy nhiên tôi gặp vấn đề với số học liên quan đến việc cập nhật khả năng sử dụng định lý Bayes cho một vấn đề tôi đang làm việc.

Lý lịch:

Tôi đang cố gắng đưa ra dự báo khả năng cho các sự kiện trong tương lai không có hoặc có ít tiền lệ. Không giống như hầu hết các tài liệu và văn bản về Bayes sử dụng các bản phân phối đã biết trước đây để đưa ra khả năng về các sự kiện trong tương lai với các tham số tương tự - tình huống của tôi chỉ dựa trên ý kiến ​​chuyên gia với một vài hoặc không có phân phối hợp lý để tham khảo.

Thí dụ:

GM tuyên bố họ đang phát triển một chiếc xe mới nhưng không nói khi nào nó sẽ được phát hành. Giám đốc sản xuất của KIA cần biết khi nào họ sẽ sẵn sàng phát hành nó để họ có thể phát hành chiếc xe mới của họ cùng một lúc.

KIA biết rằng chiếc xe mới cần các thành phần sau đây để sẵn sàng giải phóng (1) động cơ, (2) truyền động, (3) thân xe, (4) Bánh xe và hệ thống treo. Các kỹ sư giàu kinh nghiệm của KIA tuyên bố rằng đối với một dự án mới như thế này, họ tin tưởng 90% rằng nó có thể được hoàn thành trong hai năm. KIA cũng phát hiện ra rằng GM đã thử nghiệm với hệ truyền động mới trong một chiếc SUV khác và nó hoạt động như được thiết kế với tỷ lệ thành công 95%. Các kỹ sư tương tự tuyên bố rằng trong bài kiểm tra truyền động này, một chiếc xe có thể được hoàn thành trong khung thời gian đó 70% thời gian.

Theo cách tôi có, tại thời điểm này, KIA có thể bắt đầu tính toán Bayes với mẫu ban đầu như sau:

   A = GM will release the new car in two years
   B1 = GM will successfully test a new transmission
   P(A) = Prior Probability that GM will release the new car in two years
   P(B1) = Probability that GM will successfully test a new transmission
   P(B1|A) = Likelihood that given a successful transmission test, the car will be released within 2 years

Gán các giá trị như sau

   P(A) = .9
   P(B1) = .95
   P(B1|A) = .7

P(Một|B1)= =P(Một)P(B1|Một)P(Một)P(B1|Một)+P(Một¯)P(B1|Một¯)

.9545= =.9*.7(.9*.7)+(.1*.3)

Ngay sau khi bộ phận thống kê KIA đưa ra bản cập nhật này, GM đã thông báo rằng họ đã thử nghiệm động cơ mới của họ và nó có tỷ lệ thành công 98% so với tất cả các thử nghiệm. Các kỹ sư của KIA cho biết, thông thường nếu có một cuộc thử nghiệm động cơ thành công thì có khả năng 80% chiếc xe sẽ được hoàn thành đúng hạn - nhưng họ không biết khả năng về thời gian hoàn thành tổng thể được đưa ra cho cả động cơ và động cơ và kiểm tra truyền đã.

Giá trị bây giờ cho bit bằng chứng thứ hai của chúng tôi, cần lưu ý là độc lập cho trường hợp này - nhưng không phải trong tất cả các trường hợp, ví dụ như cơ thể phải tiếp tục sau khi đình chỉ:

   P(B2) = .98
   P(B2|A) = .8

B1...Bn

Tôi đã thấy mục wikipedia mô tả ba phần mở rộng sự kiện:

P(Một|B1,B2)= =P(B2|Một,B1)P(B1|Một)P(Một)P(B2|B1)P(B1)

tuy nhiên những gì về một phần mở rộng thứ tư và thứ năm?

Hầu hết các cuốn sách và tài nguyên trực tuyến tôi không chỉ ra các bước để cập nhật các linh mục theo bất kỳ cách nào mà tôi có thể phân biệt đối xử. Có thể là tôi đã bị loại bỏ quá xa so với những ngày tính toán đại học của mình để giải thích nó, nhưng nỗi sợ của tôi là tôi cần phải có kinh nghiệm quan trọng trong lý thuyết tập hợp và toán cấp độ sau đại học để làm những gì có vẻ là một phép tính đơn giản. Trao đổi này là gần nhất tôi có thể tìm thấy và thậm chí nó không bước qua nó. Thực tế là tôi đã không sau một tuần tìm kiếm đã tìm thấy một hướng dẫn cơ bản về cơ chế cập nhậtĐịnh lý Bayes (không quan tâm đến bạn về định lý Bayes là gì và cách thức hoạt động - có nhiều hơn thế nữa) ngoài việc thực hiện đầu tiên, khiến tôi nghĩ rằng đó không phải là một phép tính tầm thường. Có một cách đơn giản để thực hiện việc cập nhật này mà không cần toán học trình độ sau đại học?

Lưu ý: Tôi nhận thức được sự trớ trêu liên quan đến khó khăn cố hữu của "vấn đề cập nhật" WRT Bayes khi Yudkowski đã tiếp tục về nó trong một thời gian. Tôi đã giả định, có lẽ không chính xác, rằng những người làm việc trên nó đã tham khảo các lần lặp phức tạp hơn nhiều, tuy nhiên tôi biết rằng đó có thể là trường hợp tôi gặp phải vấn đề đó.

Câu trả lời:


10

Tôi sẽ bắt đầu bằng cách trả lời câu hỏi của bạn về việc cập nhật các sự kiện với "tiện ích mở rộng thứ tư và thứ năm". Như bạn nghi ngờ, số học thực sự khá đơn giản.

Đầu tiên, hãy nhớ lại định lý Bayes bắt nguồn từ định nghĩa xác suất có điều kiện:

nhập mô tả hình ảnh ở đây

Bằng cách điều chỉnh A trong tử số, chúng ta có thể chuyển sang dạng quen thuộc hơn:

nhập mô tả hình ảnh ở đây

Bây giờ hãy xem xét nếu chúng tôi không chỉ có B, mà là 2 hoặc nhiều sự kiện B_1, B_2 ... Vì vậy, chúng tôi có thể rút ra ba phần mở rộng Bayes mà bạn trích dẫn bằng quy tắc xác suất chuỗi , đó là (từ wikipedia):

nhập mô tả hình ảnh ở đây

Đối với B_1 và B_2, chúng tôi bắt đầu với định nghĩa xác suất có điều kiện

nhập mô tả hình ảnh ở đây

Và sử dụng quy tắc chuỗi trên cả tử số và mẫu số:

nhập mô tả hình ảnh ở đây

Và cứ như thế, chúng tôi đã làm lại phương trình mà bạn trích dẫn từ wikipedia. Hãy thử thêm một sự kiện khác:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Thêm một sự kiện thứ năm cũng đơn giản không kém (một bài tập cho người đọc). Nhưng bạn chắc chắn sẽ nhận thấy một mẫu, cụ thể là câu trả lời cho phiên bản ba sự kiện được tổ chức trong câu trả lời cho phiên bản bốn sự kiện, để chúng ta có thể viết lại câu này như sau:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Hay nói chung hơn, quy tắc cập nhật hậu thế sau phần thứ n của bằng chứng:

nhập mô tả hình ảnh ở đây

Phần đó có những gì bạn quan tâm. Bây giờ, điều bạn đang nói là điều này có thể không dễ tính toán - không phải vì bất kỳ khó khăn số học nào, mà vì sự phụ thuộc trong B. Nếu chúng ta nói mỗi B được phân phối độc lập, việc cập nhật trở nên rất đơn giản:

nhập mô tả hình ảnh ở đây

(Trên thực tế, bạn sẽ nhận thấy đó là một ứng dụng đơn giản của định lý Bayes!) Độ phức tạp của phân số đó phụ thuộc vào những bằng chứng trước đây mà bằng chứng mới của bạn phụ thuộc vào. Tầm quan trọng của sự phụ thuộc có điều kiện giữa các biến của bạn và các bằng chứng của bạn chính xác là lý do tại sao các mạng Bayes được phát triển (trên thực tế, mô tả ở trên mô tả các yếu tố của mạng Bayes).

Bây giờ, hãy nói về ví dụ của bạn. Đầu tiên, giải thích của bạn về vấn đề từ ngữ có một vấn đề. Giải thích của bạn lần lượt là 70% và 80%

P(B1|A) = .7
P(B2|A) = .8

Nhưng (theo định nghĩa của bạn) A có nghĩa là chiếc xe sẽ được hoàn thành đúng hạn, B_1 có nghĩa là GM kiểm tra việc truyền tải thành công và B_2 có nghĩa là đã thử nghiệm động cơ thành công, điều đó có nghĩa là bạn nên lùi xe -

P(A|B1) = .7
P(A|B2) = .8

Bây giờ, tuy nhiên, vấn đề từ ngữ không thực sự có ý nghĩa. Dưới đây là ba vấn đề:

1) Họ đang mang đến cho bạn những gì bạn đang tìm kiếm một cách hiệu quả: nói rằng "với thử nghiệm truyền động này, một chiếc xe có thể được hoàn thành trong khung thời gian đó 70% thời gian", và sau đó hỏi "xác suất một chiếc xe sẽ được hoàn thành là bao nhiêu trong luc đo".

2) Bằng chứng đẩy bạn theo hướng ngược lại mà lẽ thường sẽ mong đợi. Xác suất là 90% trước khi bạn biết về việc truyền tải, làm thế nào có thể biết về một thử nghiệm thành công hạ thấp nó xuống 70%?

3) Có sự khác biệt giữa "tỷ lệ thành công 95%" và 95% khả năng thử nghiệm thành công. Tỷ lệ thành công có thể có nghĩa là rất nhiều thứ (ví dụ, tỷ lệ phần nào không phá vỡ), điều này khiến nó trở thành một câu hỏi kỹ thuật về chất lượng của phần đó, chứ không phải là một đánh giá chủ quan về "làm thế nào để thử nghiệm thành công?" Như một ví dụ minh họa, hãy tưởng tượng chúng ta đang nói về một phần quan trọng của một con tàu tên lửa, cần ít nhất 99,999% cơ hội làm việc trong một chuyến bay. Nói "Mảnh vỡ phá vỡ 20% thời gian" không có nghĩa là có 80% khả năng thử nghiệm đã thành công, và do đó, 80% cơ hội bạn có thể phóng tên lửa vào tuần tới. Có lẽ phần này sẽ mất 20 năm để phát triển và sửa chữa - không có cách nào biết được dựa trên thông tin bạn đưa ra.

Vì những lý do này, vấn đề được nói rất kém. Nhưng, như tôi đã chỉ ra ở trên, số học liên quan đến việc cập nhật dựa trên nhiều sự kiện khá đơn giản. Theo nghĩa đó, tôi hy vọng tôi đã trả lời câu hỏi của bạn.

ETA: Dựa trên ý kiến ​​của bạn, tôi muốn nói rằng bạn nên làm lại câu hỏi từ đầu. Bạn chắc chắn nên loại bỏ ý tưởng về "tỷ lệ thành công" 95% / 98%, trong bối cảnh này là một câu hỏi kỹ thuật và không phải là một thống kê Bayes. Thứ hai, các ước tính của "Chúng tôi tự tin 70%, cho rằng phần này hoạt động, rằng chiếc xe sẽ sẵn sàng trong hai năm" là một xác suất sau, không phải là một bằng chứng; bạn không thể sử dụng nó để cập nhật những gì bạn đã có.

Trong tình huống bạn đang mô tả, bạn cần cả bốn phần để làm việc theo thời hạn. Do đó, điều thông minh nhất cần làm chỉ đơn giản là nói "xác suất mỗi phần sẽ hoạt động trong hai năm là bao nhiêu?" Sau đó, bạn lấy sản phẩm của những xác suất đó (giả sử tính độc lập) và bạn có khả năng toàn bộ mọi thứ sẽ hoạt động trong hai năm.

Lùi lại, có vẻ như bạn thực sự đang cố gắng kết hợp nhiều dự đoán chủ quan thành một. Trong trường hợp đó, đề nghị của tôi sẽ là sa thải các kỹ sư của bạn. Tại sao? Bởi vì họ đang nói với bạn rằng họ tự tin 90% rằng nó sẽ sẵn sàng trong hai năm, nhưng sau đó, sau khi biết được một thử nghiệm thành công về truyền dẫn, hạ mức ước tính của họ xuống 70%. Nếu đó là tài năng chúng tôi làm việc cùng, không có thống kê Bayes nào sẽ giúp chúng tôi :-)

Nghiêm trọng hơn - có lẽ nếu bạn cụ thể hơn về loại vấn đề (có lẽ giống như kết hợp P (A | B1) và P (A | B2)), tôi có thể cho bạn thêm một lời khuyên.


Cảm ơn điều này giúp làm rõ mức độ khó tôi đang làm việc. Đối với những gì đáng giá tôi đã thiết kế vấn đề để có thể có một vấn đề cố hữu ở đó. Đối với từ ngữ của vấn đề: Mỗi P (B_n | A) được dự định là độc lập với xác suất trước. Sử dụng ví dụ, nếu GM hoàn thành bất kỳ thành phần cụ thể nào, các kỹ sư có khả năng chiếc xe sẽ được hoàn thành đúng hạn, bất kể các thành phần khác.
Andrew

Tôi không chắc ý của bạn là gì - rắc rối với vấn đề từ bạn đưa ra không phải là mức độ khó, mà là từ ngữ. Đây là một vấn đề ban đầu hay một bài tập?
David Robinson

Hãy tha thứ cho tôi - Tôi đang điều chỉnh để ngắt đoạn shift-enter trong các bình luận. Như tôi đã đề cập trong bản chỉnh sửa, đó là ví dụ của riêng tôi có thể được dùng từ kém như bạn đã đề cập. Các tập hợp tôi làm việc thường không liên quan đến nguồn dữ liệu của chúng, vì vậy tôi phải xác định thường xuyên một phần dữ liệu mới không nhất thiết phải dựa vào dữ liệu khác từ cùng một tập hợp hoặc từ cùng một nhóm ảnh hưởng đến một giả thuyết đó là lý do tại sao Tôi đã viết nó như tôi đã làm. Trong ví dụ trên hãy tưởng tượng rằng các kỹ sư có khả năng hoàn thành tổng thể dựa trên từng thành phần một cách độc lập.
Andrew

Xem các chỉnh sửa. Bạn có chắc chắn họ có ước tính hoàn thành tổng thể dựa trên từng thành phần một cách độc lập không? Hay họ có ước tính về việc hoàn thành thành phần đó để thử nghiệm thành công?
David Robinson

Như bạn đã đề cập, có vẻ như tôi đang cố cập nhật P (A | B1) với P (A | B2), P (A | B3) ... P (A | Bn). Nếu bạn muốn chúng tôi có thể loại bỏ cuộc thảo luận này qua các bình luận qua e-mail. AndrewKemendo@hotmail.com
Andrew

0

P(Một|B,C,D...)= =P(Một,B,C,D...)P(B,C,D,...)
B2C

Một,B,C,D

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.