Làm thế nào khuôn khổ Bayes tốt hơn trong giải thích khi chúng ta thường sử dụng các linh mục không thông tin hoặc chủ quan?


18

Người ta thường lập luận rằng khung bayes có lợi thế lớn trong việc giải thích (so với người thường xuyên), vì nó tính xác suất của một tham số được cung cấp dữ liệu - thay vì như trong khuôn khổ thường xuyên. Càng xa càng tốt.p ( x | q )p(θ|x)p(x|θ)

Nhưng, toàn bộ phương trình nó dựa trên:

p(θ|x)= =p(x|θ).p(θ)p(x)

Có vẻ tôi hơi nghi ngờ vì 2 lý do:

  1. Trong nhiều bài báo, các linh mục không thông thường (phân phối đồng đều) được sử dụng và sau đó chỉ , do đó, Bayesian có được kết quả tương tự như những người thường xuyên nhận được - vì vậy làm thế nào khung Bayes tốt hơn trong giải thích, khi bayesian postior và thường xuyên có khả năng là phân phối giống nhau? Nó chỉ mang lại kết quả tương tự.p(θ|x)= =p(x|θ)

  2. Khi sử dụng các mục sư thông tin, bạn sẽ nhận được các kết quả khác nhau, nhưng bayesian bị ảnh hưởng bởi sự chủ quan trước đó, vì vậy toàn bộ cũng có xu hướng chủ quan.p(θ|x)

Nói cách khác, toàn bộ đối số của được giải thích tốt hơn dựa trên giả định rằng là loại "thực", thông thường không phải vậy, nó thường không chỉ là một điểm khởi đầu bằng cách nào đó chúng tôi chọn để làm cho MCMC chạy, một giả định, nhưng nó không phải là một mô tả về thực tế (tôi nghĩ nó không thể được định nghĩa).p ( x | θ ) p ( θ )p(θ|x)p(x|θ)p(θ)

Vì vậy, làm thế nào chúng ta có thể lập luận rằng bayesian là tốt hơn trong giải thích?


4
(1) có vẻ nghi ngờ vì kết luận của nó là không chính xác: kết quả Bayes với các linh mục không thông tin không nhất thiết giống như kết luận thường xuyên. Trong thực tế, trong nhiều trường hợp dường như không có sự đồng ý nào về việc thậm chí "không chính xác trước" là gì! (2) cũng gây tranh cãi bởi vì nó mặc nhiên cho rằng mọi giả định được đưa ra trong phân tích thường xuyên là không chủ quan - nhưng đó không phải là trường hợp. Cuối cùng, chính xác những gì bạn có nghĩa là "tốt hơn trong giải thích"? Câu hỏi của bạn là mơ hồ mà không có một định nghĩa về điều đó.
whuber

1
Ngoài nhận xét của người viết mà tôi muốn nói, không có lý do chung nào khiến Bayes tốt hơn người thường xuyên, do đó tranh luận. Đôi khi Bayes cho kết quả có ý nghĩa và đôi khi cách thường xuyên là tốt hơn. Tuy nhiên, trong lĩnh vực ứng dụng, không nên có lý do tại sao một người nên nhận được kết quả rất khác nhau. Từ góc độ triết học, Bayes chắc chắn rất mạnh, nhưng như chúng ta đều biết, lý thuyết & thực hành khác nhau, đôi khi quyết liệt. Ngoài ra, tôi có một chút lo ngại về đoạn đầu tiên của bạn. Tôi nhận ra rằng bạn là một Bayesian tận tâm (không có gì sai với nó.).
suncoolsu

Có nên tiêu đề không uninformative or *objective* priors? Các subjectivelinh mục là chính xác thông tin linh mục.
javadba

Câu trả lời:


15

Để đưa ra một phản hồi hẹp hơn so với những phản hồi xuất sắc đã được đăng và tập trung vào lợi thế trong việc giải thích - cách giải thích Bayes của một, ví dụ: "khoảng tin cậy 95%" là xác suất mà giá trị tham số thực nằm trong khoảng bằng 95%. Một trong hai cách giải thích thường gặp phổ biến của a, ví dụ: "khoảng tin cậy 95%", ngay cả khi hai số giống nhau, là về lâu dài, nếu chúng ta thực hiện thủ tục nhiều lần, tần suất mà khoảng sẽ bao gồm giá trị thực sẽ hội tụ đến 95%. Cái trước là trực quan, cái sau thì không. Hãy thử giải thích với người quản lý một lúc nào đó rằng bạn không thể nói "Xác suất các tấm pin mặt trời của chúng ta sẽ xuống cấp dưới 20% sau 25 năm là 95%", nhưng thay vào đó phải nói "

Một cách giải thích thường xuyên thay thế sẽ là "Trước khi dữ liệu được tạo, có 5% khả năng khoảng thời gian tôi sẽ tính toán bằng cách sử dụng quy trình tôi đã giải quyết sẽ hoàn toàn nằm dưới giá trị tham số thực. Tuy nhiên, giờ đây chúng tôi đã thu thập dữ liệu, chúng tôi không thể đưa ra bất kỳ tuyên bố nào như vậy, bởi vì chúng tôi không phải là người chủ quan và xác suất là 0 hoặc 1, tùy thuộc vào việc nó có hay không nằm hoàn toàn dưới giá trị tham số thực. " Điều đó sẽ giúp với các kiểm toán viên và khi tính toán dự phòng bảo hành. (Tôi thực sự thấy định nghĩa này hợp lý, mặc dù thường không hữu ích; cũng không dễ hiểu bằng trực giác và đặc biệt là không nếu bạn không phải là một nhà thống kê.)

Không phải giải thích thường xuyên là trực quan. Phiên bản Bayes là. Do đó, "lợi thế lớn trong giải thích" được tổ chức theo phương pháp Bayes.


Vấn đề của tôi với lập luận chống thường xuyên là nó cố gắng quá nhiều để mô tả thủ tục như một câu trả lời. Hãy thử cùng một thí nghiệm cho chính bạn trong việc giải thích, nhưng xem kết luận nào sẽ rút ra từ kết quả. Chính xác thì bạn sẽ hành động khác nhau như thế nào dựa trên việc nghe kết quả được đưa ra bởi một người thường xuyên và một người Bayes? Trên thực tế, bạn vẫn sẽ hành động giống nhau khi bạn hiểu cả hai. Không cần phải đi đến cấp độ của thủ tục để giải thích rằng "tốt nhất là hành động như vậy và dựa trên độ tin cậy của dữ liệu".
PascalVKooten

Ngoài ra, theo định nghĩa, bạn sẽ phải giải thích nhiều hơn trong trường hợp bayes, vì bạn không chỉ có "những gì dữ liệu cho chúng tôi biết" mà còn cả những thông tin trước đó chứa thông tin gì! Người Bayes có xu hướng đưa ra một lời giải thích thường xuyên lâu dài, nhưng họ không đi vào giải thích những gì họ đã chọn trước, tại sao họ lại chọn một ưu tiên và cụ thể là tại sao trước đó.
PascalVKooten

Chà, tôi sẽ không đồng ý một phần với điểm cuối cùng của bạn. Ví dụ, khi tôi đang thực hiện phân tích độ tin cậy trên các thiết bị rất, rất đắt tiền trong công việc trước đây của mình, chúng tôi đã coi kết quả phân tích độ tin cậy trước đây của chúng tôi như trước cho "thiết bị mẫu tương đương" tính đến sự không ổn định của thế giới thực và những thay đổi nhỏ trong thiết kế, v.v. Và, thực sự, thống kê Bayes là tất cả về việc cập nhật dữ liệu trước đó của bạn; thống kê cổ điển không "cập nhật", vì vậy bạn chỉ nhận được kết quả tương tự nếu trước đó là bằng phẳng, với một số ngoại lệ.
jbowman

Tôi sẽ chỉ hợp nhất các bộ dữ liệu và thực hiện một phân tích khác ... không cần phải đưa ra trước. Không có ưu tiên nào tốt hơn dữ liệu thực tế trước đó: bạn có được một hậu thế dựa trên dữ liệu "thực".
PascalVKooten

Vâng, bạn có thể không muốn chính xác các hậu thế trước cho trước mới của bạn, trong trường hợp của chúng tôi vì những thay đổi thiết kế nhỏ đang diễn ra và kiến ​​thức của chúng tôi rằng mfg. quá trình đang phát triển quá mức khiến cho trước đây chúng tôi không cung cấp thông tin 100% cho dữ liệu trong tương lai. Cũng có thể có những cân nhắc về thời gian chạy. Nhưng quan điểm của bạn nói chung là một điểm tốt, nó có vẻ với tôi.
jbowman

13

p(θ|x)p(x|θ)p(x|θ)p(θ|x)

Lưu ý rằng các linh mục thông tin không nhất thiết là chủ quan, ví dụ tôi sẽ không coi đó là kiến ​​thức chủ quan để khẳng định rằng kiến ​​thức trước đây về một số hệ thống vật lý nên độc lập với các đơn vị đo lường (vì về cơ bản là tùy ý), dẫn đến ý tưởng về các nhóm biến đổi và các linh mục "thông tin tối thiểu".

Mặt trái của việc bỏ qua kiến ​​thức chủ quan là hệ thống của bạn có thể không tối ưu vì bạn đang bỏ qua kiến ​​thức chuyên môn, vì vậy chủ quan không nhất thiết là điều xấu. Ví dụ, trong bài toán "suy ra sự thiên vị của đồng xu" thông thường, thường được sử dụng như một ví dụ tạo động lực, bạn sẽ học tương đối chậm với một bộ đồng phục trước khi dữ liệu xuất hiện. Nhưng liệu tất cả các lượng sai lệch có thể là giả định hợp lý không? Không, thật dễ dàng để tạo ra một đồng xu hơi thiên vị, hoặc một đồng xu hoàn toàn sai lệch (hai đầu hoặc hai tals), vì vậy nếu chúng ta xây dựng sự hấp thụ đó vào phân tích của mình, thông qua một chủ quan trước đó, chúng ta sẽ cần ít dữ liệu hơn để xác định những gì thiên vị thực sự là.

Các phân tích thường xuyên cũng thường chứa các yếu tố chủ quan (ví dụ quyết định bác bỏ giả thuyết khống nếu giá trị p nhỏ hơn 0,05, không có sự bắt buộc logic nào để làm như vậy, đó chỉ là một truyền thống đã được chứng minh là hữu ích). Ưu điểm của phương pháp Bayes là tính chủ quan được thể hiện rõ ràng trong tính toán, thay vì để nó ẩn.

Vào cuối ngày, đó là vấn đề "ngựa cho các khóa học", bạn nên có cả hai bộ công cụ trong hộp công cụ của mình và sẵn sàng sử dụng công cụ tốt nhất cho nhiệm vụ trong tay.

»


6

Khung Bayes có một lợi thế lớn so với người thường xuyên bởi vì nó không phụ thuộc vào việc có một "quả cầu pha lê" về mặt biết các giả định phân phối chính xác để thực hiện. Các phương pháp Bayes phụ thuộc vào việc sử dụng thông tin bạn có và biết cách mã hóa thông tin đó thành phân phối xác suất.

Sử dụng các phương pháp Bayes về cơ bản là sử dụng lý thuyết xác suất trong toàn bộ sức mạnh của nó. Định lý Bayes không là gì ngoài sự phục hồi của quy tắc sản phẩm cổ điển của lý thuyết xác suất:

p(θx|tôi)= =p(θ|tôi)p(x|θtôi)= =p(x|tôi)p(θ|xtôi)

p(x|tôi)0tôi

Bây giờ, nếu bạn nghĩ rằng định lý Bayes là nghi ngờ, thì về mặt logic, bạn cũng phải nghĩ rằng quy tắc sản phẩm cũng bị nghi ngờ. Bạn có thể tìm thấy một đối số suy diễn ở đây , xuất phát từ quy tắc tổng của sản phẩm và tổng, tương tự như định lý của Cox. Một danh sách rõ ràng hơn về các giả định cần thiết có thể được tìm thấy ở đây .

Theo như tôi biết, suy luận thường xuyên không dựa trên một tập hợp các nền tảng trong khuôn khổ logic. Bởi vì nó sử dụng các tiên đề xác suất Kolmogorov, dường như không có bất kỳ mối liên hệ nào giữa lý thuyết xác suất và suy luận thống kê. Không có bất kỳ tiên đề nào cho suy luận thường xuyên dẫn đến một thủ tục phải tuân theo. Có các nguyên tắc và phương pháp (khả năng tối đa, khoảng tin cậy, giá trị p, v.v.) và chúng hoạt động tốt, nhưng chúng có xu hướng bị cô lập và chuyên biệt cho các vấn đề cụ thể. Tôi nghĩ rằng các phương pháp thường xuyên là tốt nhất để lại mơ hồ trong nền tảng của họ, ít nhất là về khuôn khổ logic chặt chẽ.

1θ

2

Sử dụng đồng phục trước thường là một xấp xỉ thuận tiện để thực hiện khi khả năng là sắc nét so với trước. Đôi khi nó không đáng để nỗ lực, để trải qua và thiết lập đúng trước. Tương tự, đừng phạm sai lầm khi nhầm lẫn số liệu thống kê Bayes với MCMC. MCMC chỉ là một thuật toán để tích hợp, giống như tứ giác guassian và trong một lớp tương tự với xấp xỉ Laplace. Nó hữu ích hơn một chút so với quadratre vì bạn có thể sử dụng lại đầu ra của thuật toán để thực hiện tất cả các tích phân của mình (phương tiện và phương sai sau là tích phân) và nói chung hơn một chút rằng Laplace vì bạn không cần một mẫu lớn hoặc đỉnh tròn cũng ở phía sau (Laplace là nhanh hơn).


3

μ= =0) được đặt trên một hệ số hồi quy, mã hóa kiến ​​thức rằng tất cả mọi thứ đều bằng nhau, chúng tôi thích các giải pháp trong đó các hệ số có cường độ thấp hơn. Điều này là để tránh làm quá mức một tập dữ liệu, bằng cách tìm các giải pháp tối đa hóa chức năng mục tiêu nhưng không có ý nghĩa trong bối cảnh cụ thể của vấn đề của chúng tôi. Theo một nghĩa nào đó, họ cung cấp một cách để cung cấp cho mô hình thống kê một số "manh mối" về một miền cụ thể.

Tuy nhiên, đây không phải (theo ý kiến ​​của tôi) khía cạnh quan trọng nhất của phương pháp luận Bayes. Các phương pháp Bayes mang tính khái quát, trong đó chúng cung cấp một "câu chuyện" hoàn chỉnh về cách dữ liệu ra đời. Do đó, họ không chỉ đơn giản là những người tìm mẫu, mà là họ có thể tính đến toàn bộ thực tế của tình huống hiện tại. Ví dụ, hãy xem xét LDA (phân bổ Dirichlet tiềm ẩn), cung cấp một câu chuyện khái quát đầy đủ về cách một tài liệu văn bản xuất hiện, diễn ra như thế này:

  1. Chọn một số kết hợp các chủ đề dựa trên khả năng các chủ đề cụ thể cùng xảy ra; và
  2. Chọn một số từ trong từ vựng, dựa trên các chủ đề đã chọn.

Do đó, mô hình phù hợp dựa trên sự hiểu biết rất cụ thể về các đối tượng trong miền (ở đây, tài liệu văn bản) và cách chúng được tạo; do đó, thông tin chúng tôi nhận được được điều chỉnh trực tiếp cho miền vấn đề của chúng tôi (khả năng từ được đưa ra chủ đề, khả năng chủ đề được đề cập cùng nhau, khả năng tài liệu có chứa chủ đề và ở mức độ nào, v.v.). Thực tế là Định lý Bayes được yêu cầu để làm điều này gần như là thứ yếu, do đó, một câu nói đùa nhỏ, "Bayes sẽ không phải là người Bayes và Chúa Kitô sẽ không phải là Kitô hữu."

Nói tóm lại, các mô hình Bayes đều tập trung vào việc mô hình hóa nghiêm ngặt các đối tượng miền bằng cách sử dụng các phân phối xác suất; do đó, chúng tôi có thể mã hóa kiến ​​thức mà nếu không có sẵn bằng một kỹ thuật phân biệt đối xử đơn giản.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.