Giới thiệu về thống kê thường xuyên cho người Bayes [đóng]


8

Tôi là một người Bayes có đầu óc đơn giản, người cảm thấy thoải mái trong thế giới ấm cúng của Bayes.

Tuy nhiên, do các lực lượng xấu xa ngoài tầm kiểm soát của tôi, bây giờ tôi phải thực hiện các khóa học tốt nghiệp giới thiệu về thế giới kỳ lạ và kỳ lạ của thống kê thường xuyên. Một số khái niệm này có vẻ rất kỳ lạ đối với tôi và các giáo viên của tôi không thành thạo Bayes, vì vậy tôi nghĩ rằng tôi đã nhận được sự giúp đỡ trên internet từ những người hiểu cả hai.

Làm thế nào bạn sẽ giải thích các khái niệm khác nhau trong thống kê thường xuyên cho một người Bayes tìm thấy chủ nghĩa thường xuyên kỳ lạ và không thoải mái ?

Ví dụ, một số điều tôi đã hiểu:

  • Khả năng tối đa ước lượng argmaxθp(D|θ) bằng với công cụ ước tính sau tối đa, nếubằng phẳng.p ( θ )argmaxθp(θ|D)p(θ)
  • (không hoàn toàn chắc chắn về điều này). Nếu một công cụ ước tính nhất định là một thống kê đủ cho một tham số và là phẳng, thì , tức là phân phối lấy mẫu bằng với hàm khả năng và do đó bằng với giá trị sau của tham số được cung cấp trước đó. θp(θ)p( θ |θ)=c1p(D|θ)=c1c2p(θ|D)θ^θp(θ)p(θ^|θ)= =c1p(D|θ)= =c1c2p(θ|D)

Đó là những ví dụ về việc giải thích các khái niệm thường xuyên cho một người hiểu những người Bayes.

Làm thế nào bạn có thể giải thích tương tự các khái niệm trung tâm khác của thống kê thường xuyên theo thuật ngữ một Bayes có thể hiểu?

Cụ thể, tôi quan tâm đến các câu hỏi sau:

  • Vai trò của lỗi bình phương trung bình là gì? Làm thế nào nó liên quan đến chức năng mất Bayes?
  • Làm thế nào để tiêu chí "không thiên vị" liên quan đến tiêu chí Bayes? Tôi biết rằng một người Bayes sẽ không yêu cầu những người ước tính của mình không thiên vị, nhưng đồng thời, một người Bayes có thể sẽ đồng ý rằng một người ước lượng thường xuyên không thiên vị thường mong muốn hơn một người thường xuyên thiên vị (mặc dù anh ta sẽ coi cả hai đều kém hơn công cụ ước tính Bayes). Vậy làm thế nào để một Bayes hiểu không thiên vị?
  • Nếu chúng ta có các linh mục phẳng, các khoảng tin cậy thường xuyên có bằng cách nào đó trùng với các Bayes không?
  • Điều gì trong tên của Laplace đang diễn ra với các bài kiểm tra đặc điểm kỹ thuật như bài kiểm tra ? Đây có phải là một số trường hợp đặc biệt suy biến của một bản cập nhật Bayes về phân phối trên không gian mô hình?F

Tổng quát hơn:

Có một số tài nguyên giải thích chủ nghĩa thường xuyên cho Bayes? Hầu hết các cuốn sách chạy theo cách khác: họ giải thích chủ nghĩa Bayes cho những người có kinh nghiệm trong thống kê thường xuyên.


ps. Tôi đã xem xét, và trong khi có rất nhiều câu hỏi về sự khác biệt giữa Bayes và Chủ nghĩa thường xuyên, không ai giải thích rõ ràng Chủ nghĩa Thường xuyên theo quan điểm của Bayes.

Câu hỏi này có liên quan, nhưng không cụ thể về việc giải thích các khái niệm Thường xuyên cho một người Bayes (nói thêm về việc biện minh cho suy nghĩ thường xuyên nói chung).

Ngoài ra, quan điểm của tôi là không bash thường xuyên. Tôi thực sự muốn hiểu nó tốt hơn


2
Đây có thể là một câu hỏi hợp lệ nhưng nó có vẻ quá rộng ở dạng này, vì dường như bạn yêu cầu chúng tôi dịch bất kỳ phương pháp thường xuyên nào có thể sang dạng Bayes - người ta có thể viết một cuốn sách về chủ đề này! Hầu hết các cẩm nang Bayes giới thiệu (ví dụ Kruschke) thảo luận về các chủ đề đó vì chúng nhằm vào những người thường xuyên. Hơn nữa, có lẽ bạn đã sử dụng rất nhiều công cụ thường xuyên (ví dụ để chẩn đoán chuỗi MCMC của bạn). Một số chủ đề bạn đề cập không hoàn toàn là Bayes (chức năng mất). Bạn có thể thử chỉnh sửa câu hỏi của bạn để làm cho nó cụ thể hơn?
Tim

2
Tôi thông cảm và đánh giá cao câu hỏi. Ngoài văn học, nếu bạn quan tâm đến những hiểu biết từ cộng đồng về những câu hỏi cụ thể tôi khuyên bạn nên cố gắng chia tách. Nhiều người trong số họ nghe rất thú vị. Tôi phải thừa nhận tôi đã tự hỏi mình một vài trong số những câu hỏi này với thành công hỗn hợp.
Benoit Sanchez

6
Câu hỏi này khiến tôi co rúm người lại và nghĩ rằng giáo dục Thống kê bị phá vỡ. Làm thế nào một người nào đó có thể vượt qua Thống kê cơ bản mà không có khái niệm thiên vị là trở ngại. Tương tự như vậy, việc một học sinh thấy các nhà giáo dục của mình không " thông thạo Bayes " nên họ không thể giải thích "Thống kê thường xuyên" cho một "Bayes" là tôi không biết ... lúng túng ? (Tôi không đánh giá thấp hoặc bất cứ điều gì, tôi nghĩ thật tốt khi OP hỏi và câu trả lời của TIm dưới đây rất hợp lý (+1) nhưng thực sự ... câu hỏi khiến tôi không yên tâm về điều gì đó sai về cơ bản trong bối cảnh này.)
usεr11852

4
Bạn sẽ không thực sự hiểu leo ​​núi nếu bạn buộc mình phải xem nó như bơi dọc.
David Ernst

1
Thực hiện một bài kiểm tra t đơn giản sau đó, nó không tính toán sau bởi vì nó rõ ràng không muốn chọn trước. Làm thế nào bạn sẽ tìm thấy một Bayesian tương đương để tránh Bayes? Với MLE, bạn đã tìm thấy một kỹ thuật mà bạn sẽ dễ dàng xác định một tương đương Bayes vì ​​về cơ bản đây đã là một kỹ thuật Bayesian trừ tên.
David Ernst

Câu trả lời:


14

t

Hơn nữa, một số khái niệm được đề cập bởi bạn không thực sự là Bayes. Ví dụ, hàm mất mát là một khái niệm chung và chỉ khi bạn kết hợp nó với phân phối trước, bạn mới có rủi ro Bayes.

Một điều đáng nói nữa là ngay cả khi bạn tự khai báo Bayes, thì có lẽ bạn đã sử dụng rất nhiều phương pháp thường xuyên. Ví dụ: nếu bạn sử dụng MCMC để ước tính và sau đó tính giá trị trung bình của chuỗi MCMC làm ước tính điểm của bạn, thì bạn đang sử dụng công cụ ước tính thường xuyên, vì bạn không sử dụng bất kỳ mô hình Bayes và nhà tiên tri nào để lấy ước tính trung bình của MCMC chuỗi.

Cuối cùng, một số khái niệm và công cụ thường xuyên không dễ dịch sang cài đặt Bayes, hoặc "tương đương" được đề xuất là bằng chứng của khái niệm, sau đó là thứ bạn sử dụng trong cuộc sống thực. Trong nhiều trường hợp, các cách tiếp cận đơn giản là khác nhau và tìm kiếm sự tương đồng là một sự lãng phí thời gian.


2
(+1): điểm rất tốt!
Tây An

Bạn có thể thấy blog này thú vị: errorstatistic.com
kjetil b halvorsen

3

θ^̂θp(θ)p(θ^̂|θ)= =p(D|θ)= =cp(θ|D)

Điều này là không chính xác:

  1. p(D|θ)= =p(θ^̂|θ)×p(D|θ^)θ^
  2. p(D|θ)= =cp(θ|D)Dθ
  3. θ^D

Hơn nữa, sự đầy đủ không liên quan gì đến chủ nghĩa thường xuyên so với chủ nghĩa Bayes, mặc dù có tồn tại những quan niệm cụ thể về Bayes về sự đầy đủ. Ví dụ như trong so sánh mô hình .

một người Bayes có thể đồng ý rằng một người ước lượng thường xuyên không thiên vị nói chung là mong muốn hơn so với một người thường xuyên thiên vị

Vấn đề với phần này của câu hỏi là các công cụ ước tính Bayes là công cụ ước tính thường xuyên cũng như ở chỗ chúng thỏa mãn các tính chất thường xuyên như sự chấp nhận hoặc đôi khi là tối thiểu. Như đã thảo luận trong một mục CV gần đây , Bayes ước tính theo mất bình phương lỗi có thể không thiên vị . Và không có lý do nào ngoài việc sử dụng chức năng mất đặc biệt để ủng hộ tính không thiên vị: giảm thiểu tổn thất sau là bao gồm tất cả và nếu áp đặt không thiên vị dẫn đến tổn thất cao hơn thì không nên xem xét. (Một điểm cuối cùng là có rất ít chức năng của tham số cho phép các công cụ ước tính không thiên vị.)


Chỉ cần làm rõ, điểm đó không phải là một nỗ lực để kết nối khái niệm về sự đầy đủ với chủ nghĩa Bayes, mà là để kết nối khái niệm phân phối lấy mẫu với các phân phối sau. Các khái niệm về sự đầy đủ trong chủ nghĩa thường xuyên và chủ nghĩa bay là tương đương, có thể được nhìn thấy bằng cách áp dụng quy tắc của vịnh. Nhưng tôi sẽ nghiên cứu bài viết của bạn và cố gắng hiểu điều này tốt hơn.
dùng56834

2

Nó xuất hiện với tôi như thể bạn đang xem xét một thế giới của những người thường xuyên và Bayes. Đó không phải là nhiều sắc thái. Giống như nếu bạn phải là người này hay người kia, hoặc như thể các phương pháp được áp dụng được xác định bởi một số niềm tin cá nhân (chứ không phải là sự thuận tiện và vấn đề và thông tin cụ thể trong tay). Tôi tin rằng đây là một quan niệm sai lầm dựa trên các xu hướng hiện tại trong việc tự gọi mình là người thường xuyên hoặc Bayes, và cũng có rất nhiều ngôn ngữ thống kê có thể gây nhầm lẫn. Chỉ cần cố gắng để có một nhóm các nhà thống kê giải thích giá trị p hoặc khoảng tin cậy.

Một số tác phẩm cổ điển có thể giúp bạn hiểu suy luận thường xuyên. Các tác phẩm cổ điển chứa đựng các nguyên tắc cơ bản, gần với sức nóng của cuộc thảo luận giữa những người đề xướng và cung cấp một nền tảng của động lực (thực tế) và sự phù hợp tại thời điểm đó.

Ngoài ra, những tác phẩm cổ điển này dựa trên các phương pháp thường xuyên, được viết vào thời điểm mọi người chủ yếu làm việc với các nguyên tắc Bayes và tính toán xác suất (lưu ý rằng số liệu thống kê không phải lúc nào cũng như khi bạn đang làm việc với một vấn đề toán học điển hình với xác suất, xác suất có thể là rất không xác định).

Xác suất thường xuyên không phải là xác suất nghịch đảo

'Xác suất nghịch đảo' Fisher 1930

Bạn đưa ra một khái niệm về khả năng là một biểu thức Bayes với một căn hộ trước

Tuy nhiên,

  1. trong khi toán học trùng khớp (khi giải thích sai, vì bạn có thể nhận được P (x | a) = P (a | x), đến một hằng số, nhưng chúng không giống nhau), cách xây dựng và ý nghĩa là khác nhau.

  2. Khả năng không có nghĩa là một 'xác suất Bayes dựa trên các linh mục phẳng, hoặc mặc đồng phục'. Khả năng thậm chí không phải là xác suất và không tuân theo quy tắc phân phối xác suất (ví dụ: bạn không thể thêm khả năng cho các sự kiện khác nhau và tích phân không bằng một), chỉ khi bạn nhân nó với một căn hộ trước, rằng nó trở thành một xác suất, nhưng sau đó ý nghĩa cũng đã thay đổi.

Một số trích dẫn thú vị từ 'xác suất nghịch đảo' 1930 Fisher.

Phương pháp Bayes và thường xuyên là các công cụ khác nhau :

... Có hai biện pháp khác nhau về niềm tin hợp lý phù hợp với các trường hợp khác nhau. Biết dân số chúng ta có thể thể hiện kiến ​​thức không đầy đủ của chúng tôi về, hoặc kỳ vọng về mẫu về mặt xác suất; biết mẫu chúng ta có thể thể hiện kiến ​​thức không đầy đủ của chúng ta về dân số theo khả năng. Chúng ta có thể nêu khả năng tương đối rằng một mối tương quan chưa biết là + 0,6, nhưng không có khả năng nó nằm trong phạm vi .595-.605.

Lưu ý rằng có một tuyên bố xác suất nhất định, đó là một phương pháp frequentist cung cấp.

θθθ

  • một phương pháp thường xuyên đưa ra tuyên bố về xác suất một thí nghiệm (với khoảng ngẫu nhiên) sẽ có giá trị thực của tham số (có thể ngẫu nhiên) bên trong khoảng được đưa ra bởi một thống kê.
  • Đây không phải là nhầm lẫn với xác suất rằng một thử nghiệm cụ thể (với khoảng thời gian cố định) sẽ có giá trị thực của tham số (cố định) bên trong khoảng được đưa ra bởi thống kê.

Xem thêm 'Về "Lỗi có thể xảy ra" của Hệ số tương quan được giảm từ một mẫu nhỏ.' Fisher 1921 trong đó Fisher chứng minh sự khác biệt của phương pháp của ông không phải là xác suất nghịch đảo của Bayes.

Trong bài báo trước đây, người ta đã tìm thấy, bằng cách áp dụng một phương pháp đã được phát triển trước đó, rằng giá trị << rất có thể >> của mối tương quan của dân số, nhỏ hơn một chút so với mẫu. Kết luận này đã bị chỉ trích bất lợi trong Biometrica , rõ ràng dựa trên giả định không chính xác mà tôi đã suy luận từ định lý Bayes . Trong bài báo này sẽ chỉ ra rằng khi các đường cong lấy mẫu được hiển thị gần như bình thường, hiệu chỉnh mà tôi đã đề xuất bằng khoảng cách giữa giá trị dân số và điểm giữa của đường cong lấy mẫu và theo đó không nhiều hơn hiệu chỉnh của sai lệch không đổi được giới thiệu bằng phương pháp tính toán. Không có giả định như một xác suất tiên nghiệm có liên quan.

... hai khái niệm hoàn toàn khác biệt đã bị nhầm lẫn dưới tên << xác suất >> ...

đó là xác suất và khả năng Xem thêm ghi chú về phần cuối của bài viết của Fishers từ năm 1921, trong đó ông nói nhiều hơn về sự nhầm lẫn.

Một lần nữa lưu ý rằng khả năng là một hàm của một tập các tham số, nhưng không phải là hàm mật độ xác suất của tập các tham số đó.

Xác suất được sử dụng cho một cái gì đó bạn có thể quan sát. Ví dụ: xác suất mà một con xúc xắc lăn sáu. Khả năng được sử dụng cho một cái gì đó mà bạn không thể quan sát được, ví dụ như giả thuyết rằng một con xúc xắc lăn sáu 1/6 thời gian.

Ngoài ra, bạn có thể thích công việc của Fisher trong đó anh ấy nhẹ hơn nhiều theo quan điểm của anh ấy về định lý Bayes (vẫn mô tả sự khác biệt). 'Trên nền tảng toán học của thống kê lý thuyết' Fisher 1922 (đặc biệt là phần 6 'giải pháp chính thức cho vấn đề ước tính')

Hơn

Nếu bạn có thể hiểu và đánh giá cao các ý kiến ​​từ Fisher về sự khác biệt giữa xác suất nghịch đảo và nguyên tắc khả năng bạn có thể muốn đọc thêm về sự khác biệt trong các phương pháp thường xuyên.

'Phác thảo một lý thuyết về ước tính thống kê dựa trên lý thuyết cổ điển về xác suất' Neyman 1937

Đó là một tác phẩm 50 trang và khó tóm tắt. Nhưng nó liên quan đến các câu hỏi của bạn về độ lệch không thiên vị , giải thích phương pháp bình phương tối thiểu (và khác biệt với phương pháp khả năng tối đa), và đặc biệt cung cấp cách xử lý các khoảng tin cậy (khoảng cách thường xuyên không giống nhau, duy nhất giống như khoảng thời gian Bayes cho các linh mục phẳng).

Liên quan đến bài kiểm tra F không rõ ràng, những gì trong tên của Laplace bạn nghĩ là sai. Nếu bạn thích sử dụng sớm, bạn có thể xem trong 'Các nghiên cứu về biến đổi cây trồng. II. Phản ứng manurial của các giống khoai tây khác nhau 1923 Fisher và Mackenzie

Bài viết này có biểu hiện của anova trong một mô hình tuyến tính dễ nhận biết, chia các tổng bình phương thành giữa và trong các nhóm.

12d1+12d2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.