Kết hợp xác suất / thông tin từ các nguồn khác nhau


26

Hãy nói rằng tôi có ba nguồn độc lập và mỗi nguồn trong số chúng đưa ra dự đoán cho thời tiết ngày mai. Người đầu tiên nói rằng xác suất mưa vào ngày mai là 0, sau đó người thứ hai nói rằng xác suất là 1, và cuối cùng người cuối cùng nói rằng xác suất là 50%. Tôi muốn biết tổng xác suất đưa ra thông tin đó.

Nếu áp dụng định lý nhân cho các sự kiện độc lập tôi nhận được 0, điều này có vẻ không đúng. Tại sao không thể nhân cả ba nếu tất cả các nguồn độc lập? Có một số cách Bayes để cập nhật trước khi tôi nhận được thông tin mới?

Lưu ý: Đây không phải là bài tập về nhà, là điều mà tôi đã suy nghĩ.


1
Bạn có biết các nguồn độc lập đáng tin cậy đến mức nào không
Dilip Sarwate

Không, một tiên nghiệm tôi sẽ cho rằng tất cả các nguồn đều đáng tin cậy như nhau.
Biela Diela

3
Đây là một câu hỏi hay tôi cũng đang suy nghĩ. Tôi sẽ thêm câu hỏi thứ hai: Nếu tất cả các dự đoán là 0,75, xác suất kết hợp sẽ là bao nhiêu? Cao hơn 0,75? Một khung chính thức sẽ là gì để phân tích loại câu hỏi này?
Karsten W.

2
Không có đủ thông tin thực sự; chúng ta cần một số mô hình về cách dự đoán sẽ liên quan đến thực tế.
Glen_b -Reinstate Monica

Tôi không chắc chắn ý nghĩa của "tất cả các nguồn đều đáng tin cậy như nhau" khi các nguồn cung cấp các tuyên bố liên quan đến xác suất hoặc mức độ tin cậy / tin cậy. Nếu chúng ta đang nói về xác suất-đó-một-nhất định-xác suất-có-một-giá trị nhất định dường như đưa ra các vấn đề khái niệm. BTW, nếu các nguồn 1 và 2 có độ tin cậy như nhau, cả hai đều phải đúng với xác suất 0,5 ... (và xác suất mưa là 1/2).
AG

Câu trả lời:


32

Bạn hỏi về ba điều: (a) cách kết hợp một số dự báo để có được dự báo duy nhất, (b) nếu phương pháp Bayes có thể được sử dụng ở đây và (c) làm thế nào để đối phó với xác suất bằng không.

Kết hợp dự báo, là một thực tế phổ biến . Nếu bạn có một vài dự báo so với việc bạn lấy trung bình các dự báo đó thì dự báo kết hợp sẽ tốt hơn về mặt chính xác so với bất kỳ dự báo riêng lẻ nào. Để tính trung bình chúng, bạn có thể sử dụng mức trung bình có trọng số trong đó trọng số dựa trên các lỗi nghịch đảo (nghĩa là độ chính xác) hoặc nội dung thông tin . Nếu bạn có kiến ​​thức về độ tin cậy của từng nguồn, bạn có thể chỉ định các trọng số tỷ lệ thuận với độ tin cậy của từng nguồn, vì vậy các nguồn đáng tin cậy hơn có tác động lớn hơn đến dự báo kết hợp cuối cùng. Trong trường hợp của bạn, bạn không có bất kỳ kiến ​​thức nào về độ tin cậy của chúng, vì vậy mỗi dự báo có cùng trọng số và vì vậy bạn có thể sử dụng trung bình số học đơn giản của ba dự báo

0%×.33+50%×.33+100%×.33=(0%+50%+100%)/3=50%

Như đã được đề xuất trong các bình luận của @AndyW@ArthurB. , các phương pháp khác ngoài giá trị trung bình đơn giản có sẵn. Nhiều phương pháp như vậy được mô tả trong tài liệu về dự báo trung bình của chuyên gia, mà trước đây tôi không quen thuộc, vì vậy cảm ơn các bạn. Trong dự báo chuyên gia trung bình đôi khi chúng tôi muốn sửa vì thực tế là các chuyên gia có xu hướng thoái lui về mức trung bình (Baron et al, 2013), hoặc làm cho dự báo của họ cực đoan hơn (Ariely et al, 2000; Erev et al, 1994). Để đạt được điều này, người ta có thể sử dụng các phép biến đổi của các dự báo riêng lẻ , ví dụ hàm logitpi

(1)logit(pi)=log(pi1pi)

tỷ lệ cược với sức mạnh thứ a

(2)g(ptôi)= =(ptôi1-ptôi)một

trong đó hoặc biến đổi tổng quát hơn của biểu mẫu0<một<1

(3)t(ptôi)= =ptôimộtptôimột+(1-ptôi)một

trong đó nếu không áp dụng biến đổi, nếu a > 1 dự báo riêng lẻ được thực hiện cực đoan hơn, nếu 0 < a < 1 dự báo được thực hiện ít cực đoan hơn, những gì được hiển thị trên hình dưới đây (xem Karmarkar, 1978; Baron et al, 2013 ).một= =1a>10<a<1

nhập mô tả hình ảnh ở đây

Sau khi dự báo chuyển đổi như vậy được tính trung bình (sử dụng trung bình số học, trung bình, trung bình có trọng số hoặc phương pháp khác). Nếu phương trình (1) hoặc (2) được sử dụng, kết quả cần được chuyển đổi ngược lại bằng cách sử dụng logit nghịch đảo cho (1) và tỷ lệ nghịch cho (2). Ngoài ra, thể sử dụng trung bình hình học (xem Genest và Zidek, 1986; xem Dietrich and List, 2014)

(4)p^=i=1Npiwii=1Npiwi+i=1N(1pi)wtôi

hoặc cách tiếp cận được đề xuất bởi Satopää et al (2014)

(5)p^= =[Πtôi= =1N(ptôi1-ptôi)wtôi]một1+[Πtôi= =1N(ptôi1-ptôi)wtôi]một

nơi là trọng lượng. Trong hầu hết các trường hợp, các trọng số bằng nhau w i = 1 / N được sử dụng trừ khi thông tin tiên nghiệm cho thấy sự lựa chọn khác tồn tại. Các phương pháp như vậy được sử dụng trong các dự báo trung bình của chuyên gia để điều chỉnh sự thiếu tự tin hoặc quá mức. Trong các trường hợp khác, bạn nên cân nhắc nếu chuyển đổi dự báo thành nhiều hơn hoặc cực ít hơn là hợp lý vì nó có thể làm cho ước tính tổng hợp kết quả rơi ra khỏi ranh giới được đánh dấu bởi dự báo cá nhân thấp nhất và lớn nhất.wtôiwtôi= =1/N

Nếu bạn có một tiên nghiệm kiến thức về khả năng mưa, bạn có thể áp dụng định lý Bayes để cập nhật các dự báo đưa ra một tiên nghiệm khả năng mưa trong thời trang tương tự như đã mô tả ở đây . Ngoài ra còn có một phương pháp đơn giản mà có thể được áp dụng, tức là tính toán bình quân gia quyền của bạn dự báo (như mô tả ở trên), nơi trước khả π được coi là điểm dữ liệu bổ sung với một số trọng lượng được xác định trước w π như trong này dụ IMDB (xem thêm nguồn , hoặc ở đâyở đây để thảo luận; xem Genest and Schervish, 1985), tức làptôiπwπ

(6)p^= =(Σtôi= =1Nptôiwtôi)+πwπ(Σtôi= =1Nwtôi)+wπ

Từ câu hỏi của bạn tuy nhiên nó không làm theo mà bạn có bất kỳ một tiên nghiệm kiến thức về vấn đề của bạn, do đó bạn có lẽ sẽ sử dụng thống nhất trước đó, tức là giả định một tiên nghiệm khả năng mưa và điều này không thực sự thay đổi nhiều trong trường hợp ví dụ mà bạn cung cấp.50%

Để đối phó với số không, có một số cách tiếp cận khác nhau có thể. Trước tiên, bạn nên chú ý rằng cơ hội mưa không thực sự đáng tin cậy, vì nó nói rằng không thể nào trời sẽ mưa. Các vấn đề tương tự thường xảy ra trong xử lý ngôn ngữ tự nhiên khi trong dữ liệu của bạn, bạn không quan sát thấy một số giá trị có thể xảy ra (ví dụ: bạn đếm tần số của các chữ cái và trong dữ liệu của bạn, một số chữ cái không phổ biến hoàn toàn không xảy ra). Trong trường hợp này, công cụ ước tính cổ điển cho xác suất, nghĩa là0%

pi=niini

Trong đó là một số lần xuất hiện của giá trị thứ i (trong số các loại d ), cung cấp cho bạn p i = 0 nếu n i = 0 . Đây được gọi là vấn đề tần số không . Đối với các giá trị như vậy, bạn biết rằng xác suất của chúng là khác không (chúng tồn tại!), Vì vậy ước tính này rõ ràng là không chính xác. Ngoài ra còn có một mối quan tâm thực tế: nhân và chia cho các số 0 dẫn đến các số không hoặc kết quả không xác định, do đó các số không có vấn đề trong việc xử lý.ntôitôidpi=0ni=0

Việc sửa chữa dễ dàng và thường được áp dụng là, thêm một số hằng số để đếm của bạn, do đóβ

pi=ni+β(ini)+dβ

Sự lựa chọn phổ biến đối với 1 , tức là áp dụng thống nhất trước dựa trên quy tắc Laplace của kế , 1 / 2 cho dự Krichevsky-Trofimov, hoặc 1 / d cho ước lượng Schurmann-Grassberger (1996). Tuy nhiên, lưu ý rằng những gì bạn làm ở đây là bạn áp dụng thông tin ngoài dữ liệu (trước) trong mô hình của mình, do đó, nó mang tính chủ quan, hương vị Bayes. Với việc sử dụng phương pháp này, bạn phải nhớ các giả định bạn đã thực hiện và xem xét chúng. Thực tế là chúng ta có một tiên nghiệm mạnh mẽβ11/21/dkiến thức rằng không nên có bất kỳ xác suất bằng không nào trong dữ liệu của chúng tôi trực tiếp biện minh cho cách tiếp cận Bayes ở đây. Trong trường hợp của bạn, bạn không có tần số nhưng xác suất, vì vậy bạn sẽ thêm một số giá trị rất nhỏ để sửa lỗi cho số không. Tuy nhiên, lưu ý rằng trong một số trường hợp, cách tiếp cận này có thể có hậu quả xấu (ví dụ như khi xử lý nhật ký ) vì vậy nên thận trọng khi sử dụng.


Schurmann, T. và P. Grassberger. (1996). Ước tính Entropy của chuỗi ký hiệu. Hỗn loạn, 6, 41-427.

Ariely, D., Tung Au, W., Bender, RH, Budescu, DV, Dietz, CB, Gu, H., Wallsten, TS và Zauberman, G. (2000). Các tác động của ước tính xác suất chủ quan trung bình giữa và trong các thẩm phán. Tạp chí Tâm lý học Thực nghiệm: Áp dụng, 6 (2), 130.

Nam tước, J., Meller, BA, Tetlock, PE, Stone, E. và Ungar, LH (2014). Hai lý do để làm cho dự báo xác suất tổng hợp cực đoan hơn. Phân tích quyết định, 11 (2), 133-145.

Erev, I., Wallsten, TS và Budescu, DV (1994). Đồng thời quá mức và thiếu tự tin: Vai trò của lỗi trong các quá trình phán đoán. Đánh giá tâm lý, 101 (3), 519.

Karmarkar, Hoa Kỳ (1978). Tiện ích có trọng số chủ quan: Một phần mở rộng mô tả của mô hình tiện ích dự kiến. Hành vi tổ chức và hiệu suất của con người, 21 (1), 61-72.

Turner, BM, Steyvers, M., Merkle, EC, Budescu, DV, và Wallsten, TS (2014). Dự báo tổng hợp thông qua hiệu chuẩn lại. Học máy, 95 (3), 261-289.

Thể loại, C. và Zidek, JV (1986). Kết hợp phân phối xác suất: một bài phê bình và thư mục chú thích. Khoa học thống kê, 1 , 114 Từ135.

Satopää, VA, Baron, J., Foster, DP, Meller, BA, Tetlock, PE, và Ungar, LH (2014). Kết hợp nhiều dự đoán xác suất bằng mô hình logit đơn giản. Tạp chí dự báo quốc tế, 30 (2), 344-356.

Thể loại, C. và Schervish, MJ (1985). Mô hình đánh giá chuyên gia cho Bayesian cập nhật. Biên niên sử Thống kê , 1198-1212.

Dietrich, F. và Danh sách, C. (2014). Ý kiến ​​xác suất tổng hợp. (Chưa được công bố)


2
Tôi muốn thêm vào điều này hơn là bắt đầu một câu trả lời mới. Một phương pháp nổi tiếng khác là kết hợp ba xác suất (hoặc N) bằng cách lấy trung bình hình học của chúng (chứ không phải là trung bình số học của chúng). Hinton chỉ ra rằng điều này mang lại cho một mô hình có xác suất rất cao hoặc thấp, sức mạnh 'phủ quyết' giữa những người khác, thay vì lấy trung bình mọi thứ đôi khi có thể chống lại bạn.
Zhubarb

Vì vậy, nếu ba dự báo là tất cả 75% và không có thông tin nào về độ tin cậy của chúng, dự báo cuối cùng sẽ là 75%?
Karsten W.

@KarstenW. vâng, tại sao bạn mong đợi một cái gì đó khác nhau? Nếu bạn không có thông tin tiên nghiệm, thì đây là thông tin duy nhất mà bạn có, vì vậy bạn không có lý do gì để coi kết quả cuối cùng là khác biệt ...
Tim

1
Không đọc bất kỳ bài báo học thuật nào của Tetlock, nhưng tôi sẽ bắt đầu từ đó. Chẳng hạn như hai lý do để làm cho dự báo xác suất tổng hợp trở nên cực đoan hơn . Tôi sẽ tra từ ngữ chính xác của Phil, tôi có thể đang nhớ sai từ cực đoan .
Andy W

1
Tôi đã gần với cực đoan , nhưng không hoàn toàn. Tôi nên sử dụng cực đoan , xem ở đây . Bên cạnh Nam tước et al. bài viết đã đề cập, tôi thấy Ville Satopää có một số công việc về chủ đề arxiv.org/abs/1506,06405 .
Andy W

6

Có hai cách để nghĩ về vấn đề. Một là nói rằng các nguồn quan sát một phiên bản ồn ào của biến tiềm ẩn "trời sẽ mưa / trời sẽ không mưa".

Betmột(một+b,một)Betmột(một,một+b)

mộtxyz

p= =11+(1x-1)b(1y-1)b(1z-1)b

bb>1b<1b= =1

p1-p= =x1-xy1-yz1-z

10

Mô hình này hoạt động tốt hơn nếu bạn nghĩ đến ba người cho bạn biết hôm qua trời có mưa hay không. Trong thực tế, chúng ta biết rằng có một thành phần ngẫu nhiên không thể khắc phục được trong thời tiết, và do đó, tốt hơn là giả định rằng thiên nhiên trước tiên chọn xác suất mưa, được các nguồn quan sát một cách ồn ào, sau đó lật một đồng xu thiên vị để quyết định xem hoặc không thì trời sẽ mưa.

Trong trường hợp đó, ước tính kết hợp sẽ trông giống như trung bình giữa các ước tính khác nhau.


Điều gì sẽ x, y, z trong mô hình này?
Karsten W.

Nó sẽ là ba dự đoán khác nhau.
Arthur B.

x= =y= =z= =34p= =2728342728

Đi từ 3/4 đến 27/11 là một chút cực đoan, giống như ba người đang nói với bạn rằng bầu trời có màu xanh thẫm và bạn kết luận đó là màu đen ...
Tim

Nó phụ thuộc vào mô hình. Ở đây tôi giả sử mỗi nguồn có một cái nhìn ồn ào về một biến nhị phân tiềm ẩn, mưa hoặc không mưa. Giống như ba người khác nói với bạn rằng trời mưa ngày hôm qua. Bạn cũng có thể mô hình hóa hệ thống khi có xác suất mưa tiềm ẩn và các nguồn dự báo sẽ có phiên bản ồn ào của dự báo đó.
Arthur B.

3

Trong khuôn khổ của Mô hình niềm tin có thể chuyển nhượng (TBM) , có thể kết hợp các dự đoán khác nhau bằng cách sử dụng ví dụ "quy tắc kết hợp". Để áp dụng quy tắc này, bạn cần chuyển đổi xác suất của các dự đoán thành các bài tập niềm tin cơ bản. Điều này có thể đạt được với cái gọi là Nguyên tắc tối thiểu. Trong R:

library(ibelief)
#probabilities
p1 <- c(0.99, 0.01) # bad results for 0 and 1
p2 <- c(0.01, 0.99)
p3 <- c(0.5, 0.5)

# basic belief assignment, 
# each row represents a subset of (rain, not rain)
# each column represents one prediction
Mat <- LCPrincple(rbind(p1,p2,p3))

# combine beliefs
m <- DST(Mat, 1)

# resulting probability distribution (pignistic probability)
mtobetp(m)
# returns 0.5 and 0.5

Đối với ví dụ thứ hai về ba dự đoán độc lập 0,75, phương pháp này trả về giá trị cao hơn:

p4 <- c(0.75, 0.25)
Mat <- LCPrincple(rbind(p4,p4,p4))
m <- DST(Mat, 1)
mtobetp(m)
#returns 0.9375 0.0625

Điều này không quá xa so với cách tiếp cận Bayes thể hiện trong câu trả lời của Arthur B.


2

w1=σ22σ32σ12σ22+σ12σ32+σ22σ32, w2=σ12σ32σ12σ22+σ12σ32+σ22σ32, w3=σ12σ22σ12σ22+σ12σ32+σ22σ32.

13

σiσ12:σ22:σ32=1:2:4,

f=814(0)+414(1)+214(0.5)=0,3571

1

Con số của họ về khả năng mưa chỉ là một nửa câu chuyện, vì chúng ta phải tiết chế dự đoán của họ với xác suất rằng chúng chính xác khi đưa ra dự đoán.

Bởi vì thứ gì đó giống như mưa là loại trừ lẫn nhau (trời mưa hoặc không, trong thiết lập này), tất cả chúng không thể đồng thời đúng với xác suất 75% như Karsten đã đề xuất (tôi nghĩ, thật khó để nói với sự nhầm lẫn mà tôi nghe về ý nghĩa của nó để tìm "xác suất kết hợp").

Cân nhắc khả năng cá nhân của họ để dự đoán thời tiết, chúng ta có thể đâm một cú (a la Thomas Bayes, như trong một cảnh quay mù trong bóng tối) vào cơ hội mưa vào ngày mai.

Trạm 1 đúng trong dự đoán của họ 60% thời gian, 30% thứ hai thời gian và trạm cuối cùng chiếm 10% thời gian.

E [rain] = Px X + Py Y + Pz * Z là hình thức chúng tôi đang xem xét ở đây:

(.6) (0) + (. 3) (1) + (. 1) (. 5) = E [mưa] = 35% khả năng mưa với độ chính xác dự đoán.


1
Thuật toán này có thể tạo ra các giá trị trên 1.
Andy W

1

Có rất nhiều câu trả lời phức tạp được đưa ra cho câu hỏi này, nhưng ý nghĩa của phương sai trọng số nghịch đảo có nghĩa là gì: https://en.wikipedia.org/wiki/Inverse-variance_ weighting

Thay vì n phép đo lặp lại với một dụng cụ, nếu người thí nghiệm thực hiện n cùng số lượng với n dụng cụ khác nhau với chất lượng đo khác nhau ...

Mỗi biến ngẫu nhiên được tính theo tỷ lệ nghịch với phương sai của nó.

Trung bình trọng số phương sai nghịch đảo có vẻ rất đơn giản để tính toán và vì phần thưởng có phương sai ít nhất trong số tất cả các trung bình có trọng số.


-1

Để kết hợp độ tin cậy, công thức chuyển đến của tôi là r1xr2xr3 (r1xr2xr3 + (1-r1) x (1-r2) x (1-r3). Vì vậy, trong 3 nguồn tin cậy, 75% đều nói giống nhau, tôi sẽ có .75 ^ 3 (.75 ​​^ 3 + .25 ^ 3) => 96% độ tin cậy của phản hồi kết hợp


1
Đây dường như không phải là một câu trả lời thích hợp cho câu hỏi.
Michael R. Chernick

Phải thừa nhận rằng đó là một câu trả lời cho các bình luận của KarstenW hơn là một câu trả lời trực tiếp cho câu hỏi.
dùng3902302
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.