Suy luận tiên đoán phi Bayes (ngoài trường hợp máy ảnh DSLR) là một lĩnh vực tương đối gần đây. Dưới tiêu đề "phi Bayes", chúng ta có thể chia nhỏ các phương pháp tiếp cận thành những phương pháp thường xuyên "cổ điển" so với những phương pháp dựa trên "khả năng".
Dự đoán thường xuyên cổ điển
αβ
Bây giờ, tôi thường có vấn đề với cách các PI cổ điển được trình bày và giảng dạy trong hầu hết các khóa học thống kê, bởi vì xu hướng áp đảo là diễn giải những điều này như các khoảng dự đoán sau của Bayes, mà chúng không được quyết định. Về cơ bản nhất, họ đang nói về xác suất khác nhau! Bayesian không đưa ra yêu cầu nào về hiệu suất lấy mẫu lặp lại về số lượng của họ (nếu không, họ sẽ là người thường xuyên). Thứ hai, một Bayesian PI thực sự đang hoàn thành một thứ gì đó tương tự về mặt tinh thần với Khoảng thời gian dung sai cổ điển hơn là Khoảng dự đoán cổ điển.
Để tham khảo: Khoảng dung sai cần được chỉ định bởi hai xác suất: Độ tin cậy và phạm vi bảo hiểm. Độ tin cậy cho chúng tôi biết mức độ thường xuyên trong các mẫu lặp lại. Phạm vi bảo hiểm cho chúng tôi biết số đo xác suất tối thiểu của khoảng theo phân phối thực (trái ngược với PI, đưa ra số đo xác suất dự kiến ... một lần nữa trong lấy mẫu lặp lại). Về cơ bản, đây là những gì Bayesian PI đang cố gắng thực hiện, nhưng không có bất kỳ tuyên bố lấy mẫu lặp lại nào.
Vì vậy, logic cơ bản của Hồi quy tuyến tính đơn giản thống kê 101 là lấy được các thuộc tính lấy mẫu lặp lại của PI theo giả định về tính quy tắc. Đó là cách tiếp cận thường xuyên + Gaussian thường được coi là "cổ điển" và được dạy trong các lớp thống kê giới thiệu. Điều này dựa trên sự đơn giản của các tính toán kết quả (xem Wikipedia để có cái nhìn tổng quan đẹp).
Các phân phối xác suất không phải là gaussian thường có vấn đề vì chúng có thể thiếu các đại lượng quan trọng có thể được đảo ngược gọn gàng để có được một khoảng. Do đó, không có phương pháp "chính xác" cho các phân phối này, thường là do các thuộc tính của khoảng phụ thuộc vào các tham số cơ bản thực sự.
Thừa nhận sự bất lực này, một lớp dự đoán khác đã nảy sinh (và suy luận và ước lượng) với cách tiếp cận khả năng.
Suy luận dựa trên khả năng
Phương pháp tiếp cận dựa trên khả năng, giống như nhiều khái niệm thống kê hiện đại, có thể được truy nguyên từ Ronald Fisher. Ý tưởng cơ bản của trường này là, ngoại trừ các trường hợp đặc biệt, các kết luận thống kê của chúng tôi ở mức yếu hơn về mặt logic so với khi chúng tôi xử lý các suy luận từ một phân phối bình thường (có ước tính tham số là trực giao ), nơi chúng tôi có thể đưa ra các tuyên bố xác suất chính xác. Theo quan điểm suy luận này, người ta thực sự nên tránh các tuyên bố về xác suất ngoại trừ trong trường hợp chính xác, nếu không, người ta nên đưa ra tuyên bố về khả năng và thừa nhận rằng người ta không biết xác suất chính xác của lỗi (theo nghĩa thông thường).
Do đó, chúng ta có thể thấy khả năng giống như xác suất Bayes, nhưng không có các yêu cầu tích hợp hoặc nhầm lẫn có thể xảy ra với xác suất thường xuyên. Giải thích của nó là hoàn toàn chủ quan ... mặc dù tỷ lệ khả năng là 0,15 thường được khuyến nghị cho suy luận tham số duy nhất.
Tuy nhiên, người ta không thường thấy các bài báo đưa ra "khoảng thời gian thích hợp". Tại sao? Có vẻ như đây phần lớn là một vấn đề của xã hội học, vì tất cả chúng ta đã quen với các tuyên bố niềm tin dựa trên xác suất. Thay vào đó, những gì bạn thường thấy là một tác giả đề cập đến khoảng tin cậy "gần đúng" hoặc "tiệm cận" như vậy và như vậy. Các khoảng này phần lớn có nguồn gốc từ các phương pháp khả năng, trong đó chúng tôi đang dựa vào phân phối Chi bình phương tiệm cận của tỷ lệ khả năng theo cách tương tự như chúng tôi dựa vào tính chuẩn hóa tiệm cận của mẫu có nghĩa.
Với "cách khắc phục" này, giờ đây chúng ta có thể xây dựng "Vùng tin cậy" gần đúng 95% với độ nhất quán logic gần như bằng Bayes.
Từ CI đến PI trong Khung khả năng
Sự thành công và dễ dàng của phương pháp khả năng trên đã dẫn đến những ý tưởng về cách mở rộng nó để dự đoán. Một bài viết khảo sát rất hay về điều này được đưa ra ở đây (tôi sẽ không tái tạo phạm vi bảo hiểm tuyệt vời của nó). Nó có thể được truy trở lại David Hinkley vào cuối những năm 1970 (xem JSTOR ), người đặt ra thuật ngữ này. Ông đã áp dụng nó cho " Vấn đề dự đoán nhị thức của Pearson ". Tôi sẽ tóm tắt logic cơ bản.
yyy
Các quy tắc cơ bản để loại bỏ các tham số "phiền toái" để có được khả năng dự đoán như sau:
- μ , σ
- Nếu một tham số là ngẫu nhiên (ví dụ: dữ liệu không quan sát khác hoặc "hiệu ứng ngẫu nhiên"), thì bạn tích hợp chúng ra (giống như trong phương pháp Bayes).
Sự khác biệt giữa một tham số cố định và ngẫu nhiên là duy nhất cho khả năng suy luận, nhưng có các kết nối với các mô hình hiệu ứng hỗn hợp, trong đó dường như các khung Bayesian, người thường xuyên và khung khả năng va chạm.
Hy vọng rằng điều này đã trả lời câu hỏi của bạn về phạm vi rộng của dự đoán "không phải Bayes" (và suy luận về vấn đề đó). Vì các siêu liên kết có thể thay đổi, tôi cũng sẽ tạo ra một cuốn sách cho cuốn sách "Trong tất cả khả năng: Mô hình thống kê và suy luận sử dụng khả năng thích ứng", thảo luận về khung khả năng hiện đại ở độ sâu, bao gồm một số lượng khá lớn các vấn đề nhận thức luận về khả năng so với Bayesian so với thường xuyên suy luận và dự đoán.
Tài liệu tham khảo
- Khoảng dự đoán: Phương pháp không tham số . Wikipedia. Truy cập ngày 13/9/2015.
- Bjornstad, Jan F. Khả năng dự đoán: Đánh giá. Thống kê. Khoa học 5 (1990), không. 2, 242--254. doi: 10.1214 / ss / 1177012175.
http://projecteuclid.org/euclid.ss/1177012175 .
- David Hinkley. Khả năng dự đoán . Biên niên sử Thống kê Vol. 7, Số 4 (Jul., 1979), trang 718-728 Xuất bản bởi: Viện thống kê toán học URL ổn định: http://www.jstor.org/ sóng / 2858920
- Yudi Pawitan. Trong tất cả khả năng: Mô hình thống kê và suy luận sử dụng khả năng thích ứng. Nhà xuất bản Đại học Oxford; 1 phiên bản (ngày 30 tháng 8 năm 2001). ISBN-10: 0198507658, ISBN-13: 980-0198507659. Đặc biệt là các chương 5.5-5.9, 10 và 16.