Tại sao nên sử dụng bayesglm?


8

Câu hỏi tổng thể của tôi là: tại sao sử dụng bayesglmthay vì các phương pháp phân loại khác?

Ghi chú:

  1. Tôi chỉ quan tâm đến dự đoán.
  2. Tôi có một lượng dữ liệu kha khá (~ 100.000 obs).

Tôi cảm thấy như cỡ mẫu đủ lớn, các tham số của hồi quy logistic thông thường sẽ được phân phối bình thường (CLT). Tôi sẽ đạt được gì khi chỉ định các linh mục? Linh cảm của tôi là nó sẽ chỉ quan trọng đối với một tập dữ liệu nhỏ, nhưng tôi không có bất kỳ bằng chứng lý thuyết hoặc ứng dụng nào.


4
Trực giác của bạn về mối quan hệ giữa kích thước mẫu và linh mục là chính xác. Mặt khác, hồi quy logistic Bayes có thể giải quyết vấn đề ước tính tham số vô hạn do sự phân tách hoàn hảo.
Sycorax nói Phục hồi lại

1
Hồi quy logistic không phải là một thuật toán phân loại. Nó là một thuật toán dự đoán xác suất.
Cân bằng Brash

1
Những gì Sycorax đề cập là một trong những lý do quan trọng nhất mà bạn muốn sử dụng mô hình Bayes trong một thiết lập mẫu lớn. Nếu hồi quy logistic của bạn có rất nhiều yếu tố dự đoán, đặc biệt là các yếu tố dự đoán có phương sai thấp, hãy cân nhắc việc có các linh mục vượt qua các hệ số hồi quy.
Cân bằng Brash

Câu trả lời:


8

Trong kỹ thuật, cũng như quản lý rủi ro chuỗi cung ứng, "kiến thức kỹ thuật" - theo dự đoán của một người có học - có thể là dữ liệu tốt nhất bạn có. Ví dụ, khả năng xảy ra sóng thần và làm gián đoạn chuỗi cung ứng, mà không có dữ liệu bổ sung, có thể được ước tính bởi một chuyên gia trong chủ đề (có các phương pháp tốt hơn để xây dựng các linh mục). Khi thời gian trôi qua, sóng thần xảy ra và do đó, chúng tôi có được nhiều dữ liệu hơn và có thể cập nhật các linh mục của chúng tôi (kiến thức kỹ thuật) với các hậu thế (các linh mục được điều chỉnh cho dữ liệu mới). Tại một số điểm, sẽ có rất nhiều dữ liệu mà trước đó ban đầu là không liên quan và bất kể ai đưa ra dự đoán, bạn sẽ có những dự đoán tương đương về khả năng.

Tôi tin rằng nếu bạn có nhiều dữ liệu đó, cách tiếp cận thường xuyên "truyền thống" là (thường) thích hợp hơn với phương pháp Bayes (tất nhiên những người khác sẽ không đồng ý, đặc biệt là lựa chọn giữa các triết lý thống kê thay vì bám vào một phương pháp và chọn một phương pháp thích hợp ). Lưu ý rằng điều hoàn toàn có thể (và xảy ra thường xuyên) là cách tiếp cận Thường xuyên mang lại kết quả tương tự / giống hệt với Bayes.

Điều đó nói rằng, khi sự khác biệt trong các phương thức là một dòng mã, tại sao không thực hiện nhiều phương thức và tự so sánh kết quả?


Cảm ơn! Giải thích tốt về một số khía cạnh của suy nghĩ Bayes - không phải là điều tôi rất quen thuộc.
wcampbell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.