Ví dụ về cách Thống kê Bayes có thể ước tính các tham số rất khó ước tính thông qua các phương pháp thường xuyên


9

Các nhà thống kê Bayes duy trì rằng "Thống kê Bayes có thể ước tính các tham số rất khó khăn để ước tính thông qua các phương pháp thường xuyên". Liệu trích dẫn sau đây được lấy từ tài liệu này của SAS nói điều tương tự?

Nó cung cấp các suy luận có điều kiện về dữ liệu và chính xác, không phụ thuộc vào xấp xỉ tiệm cận. Suy luận mẫu nhỏ tiến hành theo cách tương tự như khi người ta có một mẫu lớn. Phân tích Bayes cũng có thể ước tính bất kỳ chức năng nào của các tham số trực tiếp mà không cần sử dụng phương thức "trình cắm thêm" (một cách để ước tính các chức năng bằng cách cắm các tham số ước tính trong các chức năng).

Tôi thấy một tuyên bố tương tự trong một số sách giáo khoa nhưng không nhớ là ở đâu. Bất cứ ai có thể vui lòng giải thích điều này với tôi với một ví dụ?


Xác suất mà mặt trời sẽ mọc vào ngày mai là gì? vi.wikipedia.org/wiki/Sunawn_probols Ví dụ này có thể tầm thường hơn bạn mong đợi
Hugh

Bạn có thể đặt trích dẫn trực tiếp vào câu hỏi của bạn? Tiêu đề dường như không liên quan đến điểm đạn thứ hai.
Hugh

1
Tuyên bố trong trích dẫn đó không tuyệt vời ở chỗ (a) "chính xác" không có nghĩa gì ở đó và (b) chỉ trích bổ trợ chỉ áp dụng khi người ta xem xét toàn bộ hậu quả chứ không phải ước tính khác, cộng với tùy thuộc vào chức năng mất được chọn để ước tính. Xem câu hỏi khác cho một số câu trả lời .
Tây An

Câu trả lời:


8

Tôi phản đối với trích dẫn đó:

  1. "Chủ nghĩa thường xuyên" là một cách tiếp cận suy luận dựa trên các thuộc tính tần số của các công cụ ước tính được chọn. Đây là một khái niệm mơ hồ ở chỗ nó thậm chí không nói rằng các công cụ ước tính phải hội tụ và nếu chúng làm theo cách chúng phải hội tụ. Chẳng hạn, tính không thiên vị là một khái niệm thường xuyên nhưng nó không thể giữ cho bất kỳ và mọi chức năng [của tham số ] vì việc thu thập các biến đổi của cho phép một công cụ ước lượng không thiên vị bị hạn chế. Hơn nữa, một công cụ ước tính thường xuyên không được tạo ra bởi mô hình mà trước tiên phải được chọn trước khi được đánh giá. Theo nghĩa đó, một công cụ ước tính Bayes là một công cụ ước tính thường xuyên nếu nó đáp ứng một số tài sản thường xuyên.θθ
  2. Suy luận được tạo ra bởi một cách tiếp cận Bayes dựa trên phân phối sau, được biểu thị bằng mật độ của nó . Tôi không hiểu làm thế nào thuật ngữ "chính xác" có thể được gắn vào . Nó được liên kết duy nhất với phân phối trước và nó được dẫn xuất chính xác bởi định lý Bayes. Nhưng nó không trả về suy luận chính xác ở chỗ ước tính điểm không phải là giá trị thực của tham số và nó tạo ra các báo cáo xác suất chính xác chỉ trong khung được cung cấp bởi khả năng của cặp trước xπ(θ|D)π(θ|D)π(θ)θ. Thay đổi một thuật ngữ trong cặp sẽ sửa đổi hậu thế và suy luận, trong khi không có đối số chung để bảo vệ một ưu tiên hoặc khả năng duy nhất .
  3. Tương tự, các báo cáo xác suất khác như khác, tham số thực có xác suất 0,95 giảm trong khoảng tin cậy 95% được tìm thấy trong cùng một trang của tài liệu SAS này có ý nghĩa liên quan đến khung phân phối sau nhưng không có giá trị tuyệt đối.
  4. Từ góc độ tính toán, đúng là cách tiếp cận Bayes thường có thể trả về câu trả lời chính xác hoặc gần đúng trong trường hợp khi cách tiếp cận cổ điển tiêu chuẩn thất bại. Ví dụ, đây là trường hợp cho các mô hình biến [hoặc thiếu] tiềm ẩn trong đó là mật độ chung của cặp và trong đó không được quan sát, Sản xuất ước tính của và sau của nó bằng cách mô phỏng cặp có thể chứng minh dễ dàng hơn nhiều so với xuất phát một ước tính tối đa [thường xuyên?]. Một ví dụ thực tế của bối cảnh này là mô hình hợp nhất của Kingman trong di truyền dân số
    f(x|θ)=g(x,z|θ)dz
    g(x,z|θ)(X,Z)Zθ(θ,Z), nơi sự tiến hóa của quần thể từ một tổ tiên chung liên quan đến các sự kiện tiềm ẩn trên cây nhị phân. Mô hình này có thể được xử lý bằng [gần đúng] suy luận Bayes thông qua một thuật toán gọi là ABC, mặc dù cũng tồn tại các độ phân giải phần mềm không thuộc Bayes .
  5. Tuy nhiên, ngay cả trong những trường hợp như vậy, tôi không nghĩ rằng suy luận Bayes là giải pháp duy nhất có thể. Các kỹ thuật học máy như lưới thần kinh, rừng ngẫu nhiên, học sâu, có thể được phân loại là phương pháp thường xuyên vì chúng huấn luyện trên một mẫu bằng cách xác nhận chéo, giảm thiểu một lỗi hoặc tiêu chí khoảng cách có thể được xem là một kỳ vọng [theo mô hình thực] xấp xỉ bởi một trung bình mẫu. Ví dụ, mô hình hợp nhất của Kingman cũng có thể được xử lý bằng các độ phân giải phần mềm không thuộc Bayes .
  6. Điểm cuối cùng là, để ước tính điểm, cách tiếp cận Bayes có thể tạo ra các ước tính bổ trợ. Đối với một số hàm mất mà tôi gọi là tổn thất nội tại , công cụ ước tính Bayes của biến đổi là biến đổi của công cụ ước tính Bayes của .h(θ)h(θ^)θ

Câu trả lời là tốt như nó đi. Tôi phản đối điểm 5, vì nó gán cho các phương thức ML một hiệu suất vượt trội mà chưa được chứng minh bằng lý thuyết. Ngoài ra, "... mô hình thực sự ..." thậm chí có nghĩa là gì? Không còn nghi ngờ gì nữa, những phương pháp này rất phổ biến, nhưng sự phổ biến đó thường được chứng minh bằng khả năng "mở rộng quy mô" của chúng. Thật không may, nhiều trong số các hiểu biết chẩn đoán được cung cấp bởi các phương pháp không phải ML Bayes và thường xuyên bị mất khi sử dụng các phương pháp như vậy. Cụ thể, xác thực chéo có thể mang lại tỷ lệ lỗi cao hơn các kỹ thuật khác Xem Efron, 1983, 1986, JASA.
Jan Galkowski

Cảm ơn. Trên thực tế, tôi không ủng hộ các phương thức ML với sức mạnh "vượt trội", chỉ cần đề cập rằng một số câu trả lời ML có thể được đề xuất cho các mô hình phức tạp. Và theo "mô hình thực", ý tôi là đánh giá hiệu suất của một phương pháp giả định (sai) rằng dữ liệu được tạo ra bởi mô hình nói trên. Đó là một khiếm khuyết của hầu hết các phân tích thống kê imo.
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.