Làm thế nào để thống kê Bayes xử lý sự vắng mặt của các linh mục?


16

Câu hỏi này được lấy cảm hứng từ hai tương tác gần đây tôi có, một ở đây trong CV , một ở đây tại economics.se.

Ở đó, tôi đã đăng một câu trả lời để nổi tiếng "Envelope Nghịch lý" (tâm trí bạn, không phải là những "câu trả lời đúng" nhưng là câu trả lời chảy từ các giả định cụ thể về cơ cấu của tình hình). Sau một thời gian, một người dùng đã đăng một bình luận quan trọng và tôi đã tham gia vào cuộc trò chuyện để cố gắng hiểu quan điểm của anh ấy. Rõ ràng là anh ta đang nghĩ theo cách của Bayes, và tiếp tục nói về các linh mục - và rồi nó chợt nhận ra tôi, và tôi tự nhủ: "Đợi một chút, ai nói gì về bất kỳ điều gì trước đây? Theo cách tôi đã hình thành vấn đề, không có linh mục ở đây, họ chỉ không nhập vào hình ảnh, và không cần phải ".

Gần đây, tôi thấy câu trả lời này ở đây trong CV, về ý nghĩa của Độc lập thống kê. Tôi đã bình luận với tác giả rằng câu của anh ấy

"... nếu các sự kiện độc lập thống kê thì (theo định nghĩa) chúng ta không thể tìm hiểu về cái này từ việc quan sát cái kia."

đã sai một cách trắng trợn. Trong một cuộc trao đổi bình luận, anh ấy tiếp tục quay trở lại vấn đề (lời nói của anh ấy)

"Không" học "có nghĩa là thay đổi niềm tin của chúng ta về một thứ dựa trên sự quan sát của người khác? Nếu vậy, không độc lập (theo định nghĩa) có loại trừ điều này không?

Một lần nữa, rõ ràng là anh ta đang nghĩ theo cách của Bayes, và anh ta tự coi mình là hiển nhiên rằng chúng ta bắt đầu bằng một số niềm tin (tức là trước) , và vấn đề là làm thế nào chúng ta có thể thay đổi / cập nhật chúng. Nhưng làm thế nào niềm tin đầu tiên được tạo ra?

Vì khoa học phải phù hợp với thực tế, tôi lưu ý rằng các tình huống tồn tại là con người tham gia không có linh mục (tôi, vì một điều, đi vào tình huống mà không có bất kỳ thời gian nào trước đó - và xin đừng tranh luận rằng tôi có linh mục nhưng tôi chỉ cần không nhận ra điều đó, hãy để bản thân phân tích tâm lý không có thật ở đây).

Vì tôi tình cờ nghe thấy thuật ngữ "linh mục không thông tin", tôi chia câu hỏi của mình thành hai phần và tôi khá chắc chắn rằng những người dùng ở đây hiểu biết về lý thuyết Bayes, biết chính xác những gì tôi sắp hỏi:

Câu 1: Có phải sự vắng mặt của một tương đương trước (theo nghĩa lý thuyết nghiêm ngặt) để có một trước không chính xác?

Nếu câu trả lời cho Q1 là "Có" (với một số chi tiết xin vui lòng), thì điều đó có nghĩa là cách tiếp cận Bayes được áp dụng phổ biến và ngay từ đầu , vì trong mọi trường hợp, con người có liên quan đều tuyên bố "Tôi không có linh mục" chúng ta có thể bổ sung nó đặt một ưu tiên không phù hợp với trường hợp hiện tại.

Nhưng nếu câu trả lời cho Q1 là "Không", thì Q2 xuất hiện:

Câu 2: Nếu câu trả lời cho Q1 là "Không", thì điều này có nghĩa là, trong trường hợp không có linh mục, cách tiếp cận Bayes không được áp dụng ngay từ đầu, và trước tiên chúng ta phải hình thành trước một cách không theo Bayes, để sau đó chúng ta có thể áp dụng phương pháp Bayes?


2
Tôi sẽ lưu ý rằng với tư cách là một nhà khoa học "không có niềm tin trước" là một tuyên bố cực đoan ... giống như chỉ nhìn thấy "tuyết" tĩnh của một chiếc TV analog cũ được điều chỉnh đến một trạm chết và chỉ nghe thấy tiếng ồn trắng. Các nhà khoa học rõ ràng không tin rằng không có gì trên thế giới liên quan hoặc mang thông tin về bất cứ điều gì ... nếu chúng ta tin rằng chúng ta sẽ không phải là nhà khoa học. Tất nhiên, phần phát âm của Bayes về "không thông tin" mang niềm tin rất chung về khả năng và xác suất.
Alexis

2
@Alexis Phụ thuộc vào tình huống. Ví dụ, trong "Nghịch lý phong bì", vấn đề là, sau khi xem số tiền mà một phong bì chứa, tôi tin tưởng trước về việc tôi đang xem là số tiền "lớn" hay số tiền "nhỏ" hay không. Và tôi không thấy bất cứ điều gì cực đoan khi tuyên bố ở đây "Tôi không có niềm tin trước về vấn đề này".
Alecos Papadopoulos

1
Bạn có tin tưởng trước rằng có một số tiền và chúng có một số phân phối giữa các phong bì không? (Ngay cả khi bạn không biết về phân phối cụ thể hoặc tham số hóa của nó?)
Alexis

1
@Alexis Chắc chắn, nhưng nó được xây dựng như kiến ​​thức cấu trúc tồn tại độc lập với thông tin tiếp theo. Đó không phải là một niềm tin cần cập nhật. Và vì công thức này phản ánh nhận thức của ít nhất một thành viên của loài người (bản thân tôi), đó là một tình huống trong thế giới thực, và câu hỏi đặt ra là liệu nó có được xem là có thể chấp nhận phân tích Bayes hay không. Tất nhiên đối với một số người khác tuyên bố "Tôi có niềm tin trước đây về việc phân phối số tiền giữa các phong bì", khả năng áp dụng phương pháp Bayes là rõ ràng.
Alecos Papadopoulos

2
Bạn dường như tin rằng hoặc KHÔNG có trước hoặc có trước. Trong một mô hình Bayes như tôi thấy, phân tích sau là có điều kiện hoặc liên quan đến sự lựa chọn của A trước và tôi không sử dụng điều này trước là tuyệt đối. Ưu tiên của tôi là một cách tự nhiên để giới thiệu một cấu trúc xác suất và đo lường trên không gian tham số.
Tây An

Câu trả lời:


11

Câu 1: Có phải sự vắng mặt của một tương đương trước (theo nghĩa lý thuyết nghiêm ngặt) để có một trước không chính xác?

Không.

Đầu tiên, không có định nghĩa toán học cho một "trước đây không thông tin". Từ này chỉ được sử dụng không chính thức để mô tả một số linh mục.

Ví dụ, ưu tiên của Jeffrey thường được gọi là "không thông tin". Điều này ưu tiên khái quát hóa đồng phục trước cho các vấn đề bất biến dịch. Trước đây, Jeffrey thích nghi với hình học Riemannian (lý thuyết thông tin) của mô hình và do đó không phụ thuộc vào tham số, chỉ phụ thuộc vào hình dạng của đa tạp (trong không gian phân phối) là mô hình. Nó có thể được coi là kinh điển, nhưng đó chỉ là một sự lựa chọn. Nó chỉ là đồng phục trước theo cấu trúc Riemannian. Không có gì vô lý khi định nghĩa "uninformative = thống nhất" là một cách đơn giản hóa của câu hỏi. Điều này áp dụng cho nhiều trường hợp và giúp đặt một câu hỏi rõ ràng và đơn giản.

E(X)XX[0;1]

Cách tiếp cận Bayes và thường xuyên chỉ đơn giản là trả lời các câu hỏi khác nhau. Ví dụ: về các công cụ ước tính có thể là đơn giản nhất:

  • θxθ

  • θθ

Bằng cách nào đó, người thường xuyên nhắm đến việc kiểm soát trường hợp xấu nhất và không cần trước. Bayesian nhằm mục đích kiểm soát trung bình và yêu cầu trước khi nói "trung bình theo nghĩa nào?".

Câu 2: Nếu câu trả lời cho Q1 là "Không", thì điều này có nghĩa là, trong trường hợp không có linh mục, cách tiếp cận Bayes không được áp dụng ngay từ đầu, và trước tiên chúng ta phải hình thành trước một cách không theo Bayes, để sau đó chúng ta có thể áp dụng phương pháp Bayes?

Đúng.

X~N(μ,1)μ

Theo tôi, các vấn đề thực sự với đặc điểm kỹ thuật xảy ra trong các vấn đề phức tạp hơn. Điều quan trọng ở đây là hiểu những gì trước đó nói.


2
(+1) Cảm ơn bạn, đây thực sự là thông tin.
Alecos Papadopoulos

4

Trước hết, phương pháp Bayes thường được sử dụng bạn muốn đưa kiến ​​thức trước vào mô hình của mình để làm phong phú nó. Nếu bạn không có bất kỳ kiến ​​thức nào trước đó, thì bạn sẽ dính vào cái gọi là "linh mục không thông tin" hoặc các linh mục thông tin hàng tuần. Lưu ý rằng định nghĩa đồng phục trước không "không chính xác" theo định nghĩa, vì giả định về tính đồng nhất một giả định. Không có thứ gọi là thực sự không thông tin trước. Có những trường hợp "nó có thể là bất cứ điều gì" là một giả định trước "không hợp lý", nhưng cũng có những trường hợp nói rằng "tất cả các giá trị đều có khả năng như nhau" là một giả định rất mạnh mẽ và không hợp lý. Ví dụ: nếu bạn cho rằng chiều cao của tôi có thể là bất cứ thứ gì trong khoảng từ 0 cm đến 3 mét, với tất cả các giá trị đều có khả năng như nhau, thì đây sẽ không phải là một giả định hợp lý và nó sẽ quá nặng đối với các giá trị cực đoan, vì vậy nó có thể làm biến dạng hậu thế của bạn

Mặt khác, Bayesian sẽ lập luận rằng thực sự không có tình huống nào mà bạn không có kiến ​​thức hay niềm tin nào trước đó. Bạn luôn có thể giả định một cái gì đó và là một con người, bạn đang làm điều đó mọi lúc (các nhà tâm lý học và kinh tế học hành vi đã thực hiện hàng tấn nghiên cứu về chủ đề này). Toàn bộ sự ồn ào của Bayes với các linh mục là về việc định lượng những định kiến ​​đó và nêu rõ chúng trong mô hình của bạn, vì suy luận Bayes là về việc cập nhật niềm tin của bạn .

Thật dễ dàng để đưa ra các lập luận "không có giả định trước", hoặc các linh mục thống nhất, cho các vấn đề trừu tượng, nhưng đối với các vấn đề thực tế mà bạn có kiến ​​thức trước. Nếu bạn cần đặt cược về số tiền trong một phong bì, bạn sẽ biết rằng số tiền đó không phải là âm và hữu hạn. Bạn cũng có thể đưa ra dự đoán có giáo dục về giới hạn trên đối với số tiền có thể có được do kiến ​​thức của bạn về các quy tắc của cuộc thi, quỹ dành cho đối thủ của bạn, kiến ​​thức về kích thước vật lý của phong bì và số tiền có thể phù hợp với thể chất trong đó, v.v. Bạn cũng có thể đoán một số tiền về số tiền mà đối thủ của bạn có thể sẵn sàng bỏ vào phong bì và có thể bị mất. Có rất nhiều điều mà bạn sẽ biết như là một cơ sở cho trước của bạn.


2
@AlecosPapadopoulos xin lỗi vì đã không nói những gì bạn muốn nghe, nhưng tôi tin rằng đây là một phần của câu trả lời cho câu hỏi của bạn. Về Q1, rõ ràng giả định đồng phục trước không giống như không giả định trước, vì bạn đã đưa ra một giả định. Nếu bạn không muốn sử dụng linh mục, hãy sử dụng phương pháp Bayes theo kinh nghiệm hoặc khả năng tối đa.
Tim

2
Những gì tôi "muốn nghe"? Theo tôi hiểu, khi một người đặt câu hỏi ở đây, người ta kỳ vọng rằng câu trả lời sẽ là về câu hỏi. Không có gì đặc biệt tôi "muốn nghe" (không có linh mục nào ở đây cả), tôi chỉ tìm kiếm câu trả lời cho các câu hỏi cụ thể, và nhận xét của tôi là về việc không thấy câu trả lời của bạn giải quyết câu hỏi của tôi như thế nào. Nhưng trong nhận xét của bạn tôi nghĩ có một cái gì đó thực sự có liên quan: "Cách tiếp cận thực nghiệm Bayes"? Bạn có thể đề cập / chỉ đến một số tài liệu?
Alecos Papadopoulos

3
@AlecosPapadopoulos Bayes theo kinh nghiệm đang chọn các linh mục của bạn dựa trên dữ liệu (tức là gian lận). Bạn có thể bắt đầu với Wikipedia hoặc các bài báo của Efron (có thể dễ dàng googlable trên học giả Google).
Tim

2
Giả sử, bạn đã bắt đầu một vấn đề vào thứ Hai, và có trước, nói tiêu chuẩn bình thường. Vì vậy, bạn cắm nó vào dữ liệu của bạn, chạy phân tích, tìm hiểu một cái gì đó. Vào thứ ba, bạn không thể sử dụng trước đó nữa, vì bạn đã học được điều gì đó. Vì vậy, bạn phải cắm một khác trước, thực sự. Vì vậy, trong Bayesian nghiêm ngặt, các linh mục chỉ sử dụng một lần. Bạn thực sự có thể chạy chúng thông qua phần mềm chỉ ONCE. Thời điểm bạn nhận được kết quả, ưu tiên đã hết hạn, trừ khi bạn không học BẤT CỨ điều gì. Vì vậy, trong ý nghĩa thực tế, cách tiếp cận Bayes không thể sử dụng được ở dạng thuần túy, tất cả người Bayes liên tục tự lừa dối mình
Aksakal

3
@Aksakal Nhưng tại sao không hợp lệ để sử dụng, vào thứ ba, như trước mới của tôi, sau tôi nhận được vào thứ hai? Theo cách tôi nói, đó là một thủ tục tuần tự hoàn toàn hợp lệ. Vì vậy, tôi không hiểu tại sao bạn viết "Bayesian liên tục tự lừa dối mình".
Alecos Papadopoulos

3

Câu hỏi 1 Tôi nghĩ rằng câu trả lời có lẽ là không. Lý do của tôi là chúng tôi không thực sự có một định nghĩa cho "không chính xác" ngoại trừ bằng cách nào đó đo lường câu trả lời cuối cùng là bao xa từ một số mô hình / khả năng thông tin tùy tiện. Nhiều linh mục không thông tin được xác nhận chống lại các ví dụ "trực quan" trong đó chúng ta đã có "mô hình / khả năng" và "câu trả lời" trong tâm trí. Sau đó, chúng tôi yêu cầu không thông tin trước để cho chúng tôi câu trả lời chúng tôi muốn.

Vấn đề của tôi với điều này là tôi đấu tranh với việc tin rằng ai đó có thể có một mô hình hoặc cấu trúc mô hình thực sự tốt, được thông tin tốt cho dân số của họ và đồng thời "không có thông tin" về các giá trị tham số có khả năng và không có khả năng cho mô hình đó. Ví dụ: bằng cách sử dụng hồi quy logistic, hãy xem "PHÂN PHỐI TRƯỚC KHAI THÁC THÔNG TIN TUYỆT VỜI. CHO CÁC MÔ HÌNH ĐĂNG KÝ VÀ ĐĂNG KÝ KHÁC"

Tôi nghĩ rằng đồng phục rời rạc trước là thứ duy nhất chúng ta có thể nói một cách hợp lý là "trước hết" trước. Nhưng bạn gặp phải vấn đề khi sử dụng nó, nghĩ rằng mình "không có thông tin", nhưng sau đó đột nhiên có phản ứng với câu trả lời "không trực quan" (gợi ý: nếu bạn không thích câu trả lời bay bổng - bạn có thể đã bỏ thông tin trước hoặc khả năng!). Một vấn đề khác mà bạn gặp phải là nhận được sự phân biệt đối xử cho vấn đề của bạn. Và thậm chí nghĩ về điều này, bạn cần biết số lượng giá trị rời rạc để áp dụng đồng phục riêng biệt trước đó.

Một tài sản khác cần xem xét trước là "hành vi đuôi" liên quan đến khả năng bạn đang sử dụng.

vào câu hỏi 2

Về mặt khái niệm, tôi không thấy có gì sai khi chỉ định phân phối mà không sử dụng ưu tiên hoặc khả năng. Bạn có thể bắt đầu một vấn đề bằng cách nói "pdf của tôi là ... và tôi muốn tính ... viết pdf này". Sau đó, bạn đang tạo ra một ràng buộc cho trước, dự đoán trước và khả năng. Phương pháp bayes dành cho khi bạn có trước và có khả năng, và bạn muốn kết hợp chúng thành phân phối sau.

Đây có thể là một vấn đề rõ ràng về xác suất của bạn là gì. Sau đó, đối số chuyển sang "pdf / pmf này có đại diện cho những gì tôi nói nó đại diện không?" - đó là không gian bạn muốn ở trong tôi nghĩ. Từ ví dụ của bạn, bạn đang nói rằng phân phối duy nhất phản ánh tất cả các thông tin có sẵn - không có "trước" bởi vì nó đã được chứa (ngầm) trong phân phối bạn đang sử dụng.

Bạn(0,1)BTôin(n,p)Betmột(0,0)21

về cái gọi là bình luận sai lầm trắng trợn

Thành thật mà nói, tôi sẽ rất thích thú khi thấy bất kỳ sự tê liệt nào của quan sát có thể được sử dụng để dự đoán một quan sát "độc lập thống kê". Ví dụ, nếu tôi nói với bạn tôi sẽ tạo ra 100 biến thông thường tiêu chuẩn. Tôi đưa cho bạn 99 và để bạn đưa cho tôi dự đoán tốt nhất của bạn cho lần thứ 100. Tôi nói rằng bạn không thể đưa ra dự đoán tốt hơn cho lần thứ 100 hơn 0. Nhưng đây là điều tương tự bạn sẽ dự đoán cho lần thứ 100 nếu tôi không cung cấp cho bạn dữ liệu. Do đó bạn không học được gì từ 99 điểm dữ liệu.

Tuy nhiên, nếu tôi nói với bạn rằng đó là "một số phân phối bình thường", bạn có thể sử dụng 99 điểm dữ liệu để ước tính các tham số. Sau đó, dữ liệu bây giờ không còn "độc lập thống kê", bởi vì chúng tôi tìm hiểu thêm về cấu trúc phổ biến khi chúng tôi quan sát nhiều dữ liệu hơn. Dự đoán tốt nhất của bạn hiện sử dụng tất cả 99 điểm dữ liệu


1
(+1) Cảm ơn bạn đã trả lời chu đáo. Một sự làm rõ liên quan đến khẳng định "sai lầm trắng trợn": nó được thực hiện bởi vì "học" (và tôi đang nói về nghĩa chung của từ này) là một khái niệm rộng hơn nhiều so với "dự đoán". Nếu hai sự kiện giống nhau về mặt cấu trúc, chúng ta có thể học những thứ liên quan đến cái kia bằng cách nghiên cứu cái kia, mặc dù chúng có thể độc lập thống kê. Bạn cũng nói về "cấu trúc chung" trong câu trả lời của mình, đó là tất cả những gì có trong đó.
Alecos Papadopoulos

@Alecos Papadopoulos - vấn đề là bạn không thể học mà không khiến mọi thứ phụ thuộc vào thống kê. Lấy ví dụ của tôi, những gì có thể học được trong kịch bản 1? Ngoài ra, cấu trúc chung cần phải được biết, không chỉ hiện diện.
xác suất

1
Nhận xét về câu cuối cùng của bài đăng của bạn, thực tế là chúng ta có thể tìm hiểu điều gì đó về cấu trúc phổ biến như bạn chỉ ra, không làm cho các biến ngẫu nhiên liên quan đến "phụ thuộc thống kê". Họ vẫn "độc lập trong xác suất", đó là một cách khác để nói "độc lập thống kê", một khái niệm có ý nghĩa rất chính xác về mặt toán học. Rằng họ chia sẻ các đặc điểm chung (ở đây, phạm vi của họ được đặc trưng bởi cùng phân phối xác suất), không làm cho họ phụ thuộc thống kê.
Alecos Papadopoulos

Phrasing của bạn "độc lập trong xác suất" không rõ ràng đối với tôi và tôi nghi ngờ đây là lý do tại sao tôi không đồng ý với những gì bạn đang nói. Nếu điều này được thay thế bằng "độc lập có điều kiện" hoặc "có thể trao đổi" thì những gì bạn nói có ý nghĩa. Tôi cũng vẫn đang chờ đợi một cái gì đó có thể học được từ 99 rvs tiêu chuẩn thông thường giúp thứ 100 (không cần phải dự đoán).
xác suất

1
@probabilisticlogic "Độc lập trong xác suất" là một biểu thức có thể được tìm thấy thường thấy trong các tác phẩm cũ và có nghĩa là độc lập thống kê có nghĩa là gì được thể hiện thông qua các hàm phân phối. 99 rv sẽ cho phép tôi tìm hiểu tất cả các loại tính chất, đặc điểm, vv của thứ 100, khoảnh khắc, lượng tử, bạn đặt tên cho nó.
Alecos Papadopoulos

3

Đây chỉ là một nhận xét ngắn khi thêm vào các câu trả lời xuất sắc khác. Thông thường, hoặc ít nhất là đôi khi, có phần tùy ý (hoặc thông thường) phần nào của thông tin nhập vào phân tích thống kê được gọi là dữ liệu và phần nào được gọi là trước . Hay nói chung hơn, chúng ta có thể nói rằng thông tin trong phân tích thống kê đến từ ba nguồn: mô hình , dữ liệutrước đó . Trong một số trường hợp, chẳng hạn như mô hình tuyến tính hoặc glm's, sự phân tách khá rõ ràng, ít nhất là theo quy ước.

Tôi sẽ sử dụng lại một ví dụ từ Ước tính khả năng tối đa (MLE) theo thuật ngữ cư sĩ để minh họa quan điểm của tôi. Nói rằng một bệnh nhân vào văn phòng của bác sĩ, với một số vấn đề y tế hóa ra rất khó chẩn đoán. Bác sĩ này đã không nhìn thấy một cái gì đó khá giống nhau trước đây. Sau đó, nói chuyện với bệnh nhân, nó xuất hiện một số thông tin mới: bệnh nhân này đã đến thăm châu Phi nhiệt đới khá gần đây. Sau đó, bác sĩ cho biết đây có thể là sốt rét hoặc một số bệnh nhiệt đới khác. Nhưng lưu ý rằng thông tin này rõ ràng là dữ liệu cho chúng tôi, nhưng ít nhất trong nhiều mô hình thống kê có thể được sử dụng, nó sẽ đưa vào phân tích dưới dạng phân phối trước, phân phối trước cho xác suất cao hơn đối với một số bệnh nhiệt đới. Nhưng chúng ta có thể, có thể, tạo ra một số mô hình (lớn hơn), đầy đủ hơn, nơi thông tin này được nhập dưới dạng dữ liệu. Vì vậy, ít nhất là một phần, dữ liệu phân biệt / trước là thông thường.

Chúng tôi đã quen và chấp nhận quy ước này vì chúng tôi nhấn mạnh vào một số loại mô hình thông thường. Nhưng, trong sơ đồ lớn hơn, bên ngoài thế giới của các mô hình thống kê cách điệu, tình hình ít rõ ràng hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.