Hãy suy nghĩ như một người Bayes, kiểm tra như một người thường xuyên: Điều đó có nghĩa là gì?


35

Tôi đang xem một số slide bài giảng về một khóa học khoa học dữ liệu có thể được tìm thấy ở đây:

https://github.com/cs109/2015/blob/master/Lectures/01-Int sinhtion.pdf

Thật không may, tôi không thể xem video cho bài giảng này và tại một thời điểm trên slide, người trình bày có văn bản sau:

Một số nguyên tắc chính

Hãy suy nghĩ như một người Bayes, kiểm tra như một người thường xuyên (hòa giải)

Có ai biết điều đó thực sự có nghĩa là gì không? Tôi có cảm giác có một cái nhìn sâu sắc về hai trường phái tư tưởng được tập hợp từ đây.


2
Hãy nghĩ rằng nó có thể được thực hiện với việc kiểm tra mô hình: xem Tại sao một người Bayes không được phép nhìn vào phần dư? .
Scortchi - Phục hồi Monica

@Scortchi Từ những gì tôi thu thập được, điều này không liên quan đến việc tách các bộ dữ liệu huấn luyện, xác nhận và kiểm tra theo cách hoặc có thể Bayesian không được phép điều chỉnh các linh mục ngay cả trong giai đoạn đào tạo của mô hình (sử dụng thuật ngữ ML đây). Tuy nhiên, tôi vẫn bối rối không hiểu ý nghĩa của nó bằng cách kiểm tra như một người thường xuyên ...
Luca

1
Một Bayes "đúng đắn" không bao giờ điều chỉnh các linh mục của họ, mà chỉ cập nhật chúng theo thông tin mới sử dụng Định lý Bayes. Nhưng tôi chỉ đoán "nguyên tắc chính" này có thể là về cái gì.
Scortchi - Phục hồi Monica

4
Tôi không thể tải liên kết. Tôi đoán là chúng có nghĩa là ngay cả khi bạn sử dụng các phương pháp Bayes, bạn nên quan tâm đến các đặc điểm hoạt động của Người thường xuyên: nếu bạn tạo ra khoảng thời gian đáng tin cậy 95% cực kỳ chặt chẽ, nhưng trên thực tế, bao gồm thông số thực sự quan tâm 20% thời gian, bạn có nên quan tâm? Một người Bayes quá cứng nhắc có thể nói "không" (nhưng rất ít người Bayes có độ cứng như vậy thực sự tồn tại).
Vách đá AB

3
Nhìn về phía trước trong các slide tương lai, họ đang chứng thực Bayes theo kinh nghiệm. Điều này có thể được nhìn thấy trên các trang trình bày
Cliff AB

Câu trả lời:


32

Sự khác biệt chính giữa các trường thống kê Bayes và thường xuyên phát sinh do sự khác biệt trong giải thích xác suất. Xác suất Bayes là một tuyên bố về niềm tin cá nhân rằng một sự kiện sẽ (hoặc đã) xảy ra. Xác suất thường xuyên là một tuyên bố về tỷ lệ các sự kiện tương tự xảy ra trong giới hạn khi số lượng các sự kiện đó tăng lên.

Đối với tôi, "nghĩ như một người Bayes" có nghĩa là cập nhật niềm tin cá nhân của bạn khi có thông tin mới phát sinh và "kiểm tra [hoặc lo lắng] như một người thường xuyên" có nghĩa là quan tâm đến việc thực hiện các quy trình thống kê được tổng hợp qua các lần sử dụng các quy trình đó, ví dụ: phạm vi bảo hiểm của các khoảng đáng tin cậy là gì, tỷ lệ lỗi Loại I / II, v.v.


1
Cảm ơn bạn vì câu trả lời. Súc tích và hiệu quả ngay cả đối với giáo dân như tôi!
Luca

2
Có phải là không thể kiểm tra hoặc lo lắng như một Bayes bằng cách điều tra ảnh hưởng của các linh mục hoặc sử dụng một thông tin không thông tin? Đây có phải chỉ áp dụng cho các phân tích tuần tự? Đã có rất nhiều công việc về nơi thống kê Bayes và Thường xuyên giao nhau với các phân tích tuần tự, "cập nhật niềm tin" là không cần thiết, và thống kê seqeuential có thể được thực hiện nghiêm ngặt trong môi trường thường xuyên.
AdamO

1
Vâng, có thể lo lắng như một Bayes, ví dụ như điều tra ảnh hưởng của trước đó của bạn. Không, câu trả lời của tôi không chỉ áp dụng cho các phân tích tuần tự, tức là thông tin mới có thể phát sinh cùng một lúc.
jaradniemi

15

Thống kê Bayes tóm tắt niềm tin trong khi thống kê thường xuyên tóm tắt bằng chứng. Người Bayes xem xác suất là một mức độ của niềm tin. Kiểu lý luận bao hàm và khái quát này rất hữu ích cho việc hình thành các giả thuyết. Chẳng hạn, người Bayes có thể tùy ý gán một số xác suất cho khái niệm rằng mặt trăng được làm bằng phô mai xanh, bất kể các phi hành gia có thực sự có thể đi đến đó để xác minh điều này hay không. Giả thuyết này có lẽ được ủng hộ bởi ý tưởng rằng, từ xa, mặt trăng trôngnhư phô mai xanh. Những người thường xuyên không thể hình dung một cách đơn lẻ về một giả thuyết không chỉ là một người rơm, và họ cũng không thể nói bằng chứng ủng hộ giả thuyết này hơn một giả thuyết khác. Thậm chí khả năng tối đa chỉ tạo ra một thống kê "phù hợp nhất với những gì được quan sát". Chính thức, số liệu thống kê Bayes cho phép chúng ta suy nghĩ bên ngoài hộp và đề xuất ý tưởng phòng thủ từ dữ liệu. Nhưng đây là giả thuyết nghiêm ngặt tạo ra trong tự nhiên.

Thống kê thường xuyên được áp dụng tốt nhất để xác nhận các giả thuyết. Khi một thí nghiệm được tiến hành tốt, các số liệu thống kê thường xuyên cung cấp bối cảnh "quan sát độc lập" hoặc "theo kinh nghiệm" cho các phát hiện của các linh mục eschewing. Điều này phù hợp với triết lý khoa học của Karl Popper. Điểm của bằng chứng là không đưa ra một ý tưởng nhất định. Rất nhiều bằng chứng phù hợp với các giả thuyết không chính xác. Bằng chứng chỉ có thể làm sai lệch niềm tin.

Ảnh hưởng của các linh mục thường được coi là một thành kiến ​​trong lý luận thống kê. Như bạn đã biết, chúng ta có thể tạo nên bất kỳ lý do tuyệt vời nào cho lý do tại sao mọi thứ xảy ra. Về mặt tâm lý, nhiều người tin rằng sự thiên vị của người quan sát của chúng ta là kết quả của các linh mục trong não khiến chúng ta không thực sự coi trọng những gì chúng ta thấy. "Hy vọng mây quan sát" như Mẹ Reverend đã nói trong Dune. Popper thực hiện ý tưởng này nghiêm ngặt.

Điều này có tầm quan trọng lịch sử to lớn trong một số thí nghiệm khoa học vĩ đại nhất của thời đại chúng ta. Chẳng hạn, John Snow đã thu thập bằng chứng một cách tỉ mỉ về dịch bệnh Cholera và kết luận một cách sắc sảo rằng Cholera không phải do thiếu đạo đức, và chỉ ra rằng bằng chứng này rất phù hợp với ô nhiễm nước thải: lưu ý rằng ông không kết luậnĐiều này, những phát hiện của Snow có trước sự phát hiện ra vi khuẩn và không có sự hiểu biết cơ học hay nguyên nhân. Một bài diễn văn tương tự được tìm thấy trong Origin of Species. Chúng tôi thực sự không biết liệu mặt trăng được làm bằng phô mai xanh cho đến khi các phi hành gia thực sự đáp xuống bề mặt và thu thập các mẫu. Vào thời điểm đó, hậu thế Bayes đã chỉ định xác suất rất thấp cho bất kỳ khả năng nào khác và những người thường xuyên nhất có thể nói rằng các mẫu rất không phù hợp với bất cứ thứ gì ngoại trừ bụi mặt trăng.

Tóm lại, số liệu thống kê Bayes có thể tuân theo giả thuyết tạo ra và số liệu thống kê thường xuyên có thể tuân theo xác nhận giả thuyết. Đảm bảo rằng dữ liệu được thu thập độc lập trong những nỗ lực này là một trong những thách thức lớn nhất mà các nhà thống kê hiện đại phải đối mặt.


1
Cảm ơn câu trả lời. Bạn ấy có ý gì khi bạn nói Plenty of evidence is consistent with incorrect hypotheses.
Luca

2
@Luca Một ví dụ thống kê phổ biến có thể được tìm thấy trong bối rối. Ví dụ, tôi có thể nói, "Hút thuốc mang lại cho thanh thiếu niên chức năng phổi tốt hơn". Tôi có thể đi xa hơn để hợp lý hóa điều này bằng cách nói rằng hút thuốc là một chất kích thích khuyến khích hoạt động thể chất tốt hơn, thèm ăn lành mạnh hơn và khuyến khích xã hội hóa lành mạnh. Nếu tôi thu thập dữ liệu, họ thực sự sẽ cho thấy thanh thiếu niên hút thuốc có chức năng phổi tốt hơn. Kết luận kết hợp là đúng, nhưng kết quả nhân quả là sai. Mối quan hệ bị giới hạn bởi tuổi tác, vì trẻ lớn hơn có nhiều khả năng hút thuốc.
AdamO

Cảm ơn bạn! Tôi đã học được rất nhiều từ câu trả lời được viết rất tốt này.
Luca

5

Mỗi Cliff AB's bình luận cho OP, có vẻ như họ đang hướng tới một triết lý thực nghiệm Bayesian. Có ba trường phái tư tưởng chính của Bayes và Empirical Bayes ước tính các linh mục từ dữ liệu, thường là bằng các phương pháp thường xuyên. Điều đó không phù hợp chính xác với trích dẫn (ngụ ý Bayes lên phía trước, mối quan tâm giống như thường xuyên sau đó), nhưng chúng ta không nên bỏ qua Cliff ABnhận xét tuyệt vời.

Ngoài ra, đã có, và vẫn có thể, một trường học Bayes nghĩ rằng bạn không phải kiểm tra bất cứ điều gì sau khi làm thủ tục Bayes. Suy nghĩ hiện đại hơn sẽ sử dụng kiểm tra dự đoán sau, và có lẽ cách tiếp cận kiểm tra hai lần của bạn là những gì trích dẫn được đề cập.

Ngoài ra, triết lý thường xuyên quan tâm đến các thủ tục hơn là suy luận từ dữ liệu. Vì vậy, có lẽ đó cũng là một đầu mối cho ý nghĩa của trích dẫn.


Tôi nghĩ rằng bạn đã đề cập đến bình luận đầu tiên của tôi và nhận xét thứ hai của tôi là sau khi kiểm tra kỹ hơn, bạn đã đúng rằng họ rất đặc biệt đề cập đến Empirical Bayes. Tôi thực sự thất vọng vì trích dẫn chỉ đơn giản là một sự chứng thực của Empirical Bayes chứ không phải là một lời kêu gọi chung chung hơn để xem xét những lợi thế của cả hai trường phái tư tưởng. Ồ tốt
Vách đá AB

2

Trong ngữ cảnh của lớp khoa học dữ liệu này, cách giải thích của tôi về "kiểm tra như một người thường xuyên" là bạn đánh giá hiệu suất của chức năng dự đoán hoặc chức năng quyết định của mình đối với dữ liệu xác nhận được tổ chức. Lời khuyên để "suy nghĩ như một người Bayes" bày tỏ quan điểm rằng một chức năng dự đoán xuất phát từ cách tiếp cận Bayes nói chung sẽ cho kết quả tốt.


(chơi người ủng hộ của quỷ :) Tại sao cách tiếp cận Bayes nên cho "kết quả tốt" và người thường xuyên không?
Tim

Phương pháp Bayes là quy định về cách tiếp cận. Số liệu thống kê thường xuyên có thể được coi là một phần của lý thuyết quyết định và nó đưa ra một khung để đánh giá bất kỳ chức năng quyết định nào (cho dù dựa trên nguyên tắc Bayesian hoặc một số nguyên tắc thường xuyên). Một số phương pháp, chẳng hạn như các phương pháp khả năng tối đa, thường được sử dụng trong ngữ cảnh thường xuyên vì chúng có các thuộc tính thường xuyên tốt (ví dụ như không có triệu chứng, chúng thực hiện đúng và chúng đến đó nhanh hơn hầu hết các phương pháp khác). Một phương pháp Bayes chắc chắn có thể được sử dụng bởi một người thường xuyên, nhưng họ sẽ có những lý do khác nhau để sử dụng nó.
DavidR

Phương pháp Bayes cũng có rất nhiều điểm chung với lý thuyết quyết định. Tôi cũng không nghĩ rằng các phương pháp Bayes có thể được sử dụng trong bối cảnh thường xuyên (bạn sẽ tưởng tượng như thế nào khi sử dụng các linh mục trong bối cảnh thường xuyên?) - đó là cách khác: nhiều phương pháp thường xuyên có cách giải thích Bayes. Tôi không nghĩ rằng có điểm nào trong việc thảo luận về điều này, điều tôi đang nói rằng những phát biểu của bạn hơi quá mức cho thấy mọi thứ.
Tim

Người ta có thể chứng minh nhiều đặc tính thường xuyên tốt đẹp về cách tiếp cận Bayes, vì vậy theo nghĩa đó, làm một việc gì đó Bayesian khá an toàn, miễn là bạn có đủ dữ liệu.
DavidR

1
Giả sử tôi muốn ước tính xác suất p của các đầu trong một lần lật đồng xu. Là một người Bayes, tôi bắt đầu với xác suất trước p, tôi sẽ quan sát một số dữ liệu và sau đó tôi sẽ nhận được một hậu thế trên p. Chúng ta cần đưa ra ước tính điểm của p và tôi chọn sử dụng giá trị trung bình của phân phối sau của tôi làm ước tính điểm của mình. Tất cả đã nói, điều này mô tả một phương pháp để đi từ dữ liệu đến ước tính điểm. Phương pháp này có thể được đánh giá theo cách thường xuyên: ví dụ như nó có sai lệch không? thích hợp? hiệu quả không triệu chứng? Thực tế là trước đó có liên quan không nên, liên quan đến người thường xuyên.
DavidR

1

Nghe có vẻ như "nghĩ như một người Bayes, kiểm tra như một người thường xuyên" đề cập đến cách tiếp cận của một người trong thiết kế và phân tích thống kê. Theo tôi hiểu, suy nghĩ của Bayes liên quan đến một số niềm tin về các tình huống trước đó (về mặt thực nghiệm hoặc thống kê), ví dụ như điểm đọc trung bình của học sinh lớp 4 là 80 từ mỗi phút và một số can thiệp có thể tăng lên 90 từ mỗi phút . Đây là những niềm tin dựa trên các nghiên cứu và giả thuyết trước đây. Tư duy thường xuyên ngoại suy các kết quả (của can thiệp) để có được khoảng tin cậy hoặc các số liệu thống kê khác dựa trên tần suất lý thuyết và thực tế hoặc xác suất của các kết quả này xảy ra lần nữa (nghĩa là "thường xuyên"). Ví dụ: điểm đọc sau can thiệp có thể là 91 từ mỗi phút với khoảng tin cậy 95% từ 85 đến 97 từ / phút và giá trị p liên quan (giá trị xác suất) khác với điểm trước can thiệp. Vì vậy, 95% thời gian, điểm đọc mới sẽ nằm trong khoảng từ 85 đến 97 từ mỗi phút sau khi can thiệp. Do đó, "hãy suy nghĩ như một người Bayes" --- tức là đưa ra giả thuyết, đưa ra giả thuyết, xem xét các bằng chứng trước đó và "kiểm tra như một người thường xuyên" --- tức là, những kết quả thử nghiệm này sẽ xảy ra thường xuyên như thế nào và có khả năng là do cơ hội hơn là sự can thiệp. điểm đọc mới sẽ nằm trong khoảng từ 85 đến 97 từ mỗi phút sau khi can thiệp. Do đó, "hãy suy nghĩ như một người Bayes" --- tức là đưa ra giả thuyết, đưa ra giả thuyết, xem xét các bằng chứng trước đó và "kiểm tra như một người thường xuyên" --- tức là, những kết quả thử nghiệm này sẽ xảy ra thường xuyên như thế nào và có khả năng là do cơ hội hơn là sự can thiệp. điểm đọc mới sẽ nằm trong khoảng từ 85 đến 97 từ mỗi phút sau khi can thiệp. Do đó, "hãy suy nghĩ như một người Bayes" --- tức là đưa ra giả thuyết, đưa ra giả thuyết, xem xét các bằng chứng trước đó và "kiểm tra như một người thường xuyên" --- tức là, những kết quả thử nghiệm này sẽ xảy ra thường xuyên như thế nào và khả năng chúng là do cơ hội hơn là sự can thiệp.


2
Câu cuối cùng của mình - "kiểm tra như một frequentist" phần - có thực sự không có gì để làm với khung cảnh frequentist: dự toán Bayes cũng sẽ cho bạn biết "mức độ thường xuyên" chúng tôi mong đợi một cái gì đó xảy ra, hoặc "làm thế nào có khả năng" đó là ...
Tim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.