Rất đơn giản: Có bất kỳ sự khác biệt nào trong cách tiếp cận Bayes và Thường xuyên đối với Phân tích dữ liệu thăm dò không?
Tôi biết không có sự thiên vị cố hữu trong các phương pháp EDA vì biểu đồ là biểu đồ, biểu đồ phân tán là biểu đồ phân tán, v.v., tôi cũng không tìm thấy các ví dụ về sự khác biệt trong cách dạy hoặc trình bày EDA (bỏ qua một bài báo lý thuyết đặc biệt của A. Gelman) . Cuối cùng, tôi đã xem CRAN, trọng tài của tất cả những điều được áp dụng: Tôi chưa tìm thấy các gói phù hợp với cách tiếp cận Bayes. Tuy nhiên, tôi nghĩ CV có thể có một vài người có thể làm sáng tỏ điều này.
Tại sao nên có sự khác biệt?
Cho người mới bắt đầu:
- Khi xác định phân phối trước phù hợp, không nên điều tra trực quan này?
- Khi tóm tắt dữ liệu và đề xuất nên sử dụng mô hình thường xuyên hay mô hình Bayes, EDA không nên đề xuất hướng đi nào?
- Hai cách tiếp cận có sự khác biệt rất rõ ràng về cách xử lý các mô hình hỗn hợp. Xác định rằng một mẫu có khả năng đến từ hỗn hợp các quần thể là một thách thức và liên quan trực tiếp đến phương pháp được sử dụng để ước tính các tham số hỗn hợp.
- Cả hai phương pháp đều kết hợp các mô hình ngẫu nhiên và việc lựa chọn mô hình được thúc đẩy bằng cách hiểu dữ liệu. Dữ liệu phức tạp hơn hoặc các mô hình phức tạp hơn đòi hỏi nhiều thời gian hơn trong EDA. Với sự khác biệt như vậy giữa các mô hình ngẫu nhiên hoặc các quy trình tạo, có sự khác biệt trong các hoạt động EDA, vì vậy không nên có sự khác biệt phát sinh từ các phương pháp ngẫu nhiên khác nhau?
Lưu ý 1: Tôi không quan tâm đến các triết lý của "trại" - Tôi chỉ muốn giải quyết bất kỳ khoảng trống nào trong bộ công cụ và phương pháp EDA của mình.