Có sự khác biệt trong cách tiếp cận Bayes và thường xuyên đối với EDA không?


14

Rất đơn giản: Có bất kỳ sự khác biệt nào trong cách tiếp cận Bayes và Thường xuyên đối với Phân tích dữ liệu thăm dò không?

Tôi biết không có sự thiên vị cố hữu trong các phương pháp EDA vì biểu đồ là biểu đồ, biểu đồ phân tán là biểu đồ phân tán, v.v., tôi cũng không tìm thấy các ví dụ về sự khác biệt trong cách dạy hoặc trình bày EDA (bỏ qua một bài báo lý thuyết đặc biệt của A. Gelman) . Cuối cùng, tôi đã xem CRAN, trọng tài của tất cả những điều được áp dụng: Tôi chưa tìm thấy các gói phù hợp với cách tiếp cận Bayes. Tuy nhiên, tôi nghĩ CV có thể có một vài người có thể làm sáng tỏ điều này.

Tại sao nên có sự khác biệt?

Cho người mới bắt đầu:

  1. Khi xác định phân phối trước phù hợp, không nên điều tra trực quan này?
  2. Khi tóm tắt dữ liệu và đề xuất nên sử dụng mô hình thường xuyên hay mô hình Bayes, EDA không nên đề xuất hướng đi nào?
  3. Hai cách tiếp cận có sự khác biệt rất rõ ràng về cách xử lý các mô hình hỗn hợp. Xác định rằng một mẫu có khả năng đến từ hỗn hợp các quần thể là một thách thức và liên quan trực tiếp đến phương pháp được sử dụng để ước tính các tham số hỗn hợp.
  4. Cả hai phương pháp đều kết hợp các mô hình ngẫu nhiên và việc lựa chọn mô hình được thúc đẩy bằng cách hiểu dữ liệu. Dữ liệu phức tạp hơn hoặc các mô hình phức tạp hơn đòi hỏi nhiều thời gian hơn trong EDA. Với sự khác biệt như vậy giữa các mô hình ngẫu nhiên hoặc các quy trình tạo, có sự khác biệt trong các hoạt động EDA, vì vậy không nên có sự khác biệt phát sinh từ các phương pháp ngẫu nhiên khác nhau?

Lưu ý 1: Tôi không quan tâm đến các triết lý của "trại" - Tôi chỉ muốn giải quyết bất kỳ khoảng trống nào trong bộ công cụ và phương pháp EDA của mình.

Câu trả lời:


17

Trong tâm trí của tôi, Bayes vs thường xuyên là về suy luận chính thức, và phân tích dữ liệu khám phá là không.

Chắc chắn, khi nói đến đánh giá mô hình / mức độ phù hợp và phân tích độ nhạy, trong đó tôi phân loại điểm của bạn (1), (3) và (4), sẽ có những khác biệt trong cách tiến hành, nhưng đó là vì bản chất của sự khác biệt giữa các phương pháp phân tích và tính toán hơn là về triết học.

Về (2) của bạn, tôi thường không thấy kết quả của EDA khi chỉ cho bạn hướng tới phương pháp tiếp cận Bayes hoặc frquentist, nhưng tôi nghĩ đó là mục tiêu của nghiên cứu quan trọng nhất.

Đối với cá nhân tôi, EDA (cộng với nội tâm sâu sắc) sẽ hướng tôi đến một mô hình, và nếu tôi có thể tìm thấy một cách tiếp cận thường xuyên tự nhiên trả lời tốt câu hỏi khoa học, tôi sẽ làm theo, nhưng nếu theo bản chất của tình huống , không có phương pháp thường xuyên nào hoạt động tốt và nếu có một phương pháp hợp lý trước đó, tôi sẽ sử dụng Bayes.


(+1) Nói rất hay - đặc biệt, "EDA (cộng với nội tâm sâu sắc) sẽ hướng tôi đến một người mẫu"
suncoolsu

+1 cũng vậy. EDA thực sự không phải là về việc chọn một viễn cảnh, mà là về việc hiểu dữ liệu của bạn để đưa ra quyết định sáng suốt hơn.
Fomite

+1 Cho câu trả lời hay. Thật không may, tôi nghĩ rằng câu hỏi ban đầu đã bị hiểu lầm. Tôi đã không hỏi về việc sử dụng EDA để quyết định giữa các mô hình Bayesian hoặc người thường xuyên. Tôi sẽ cần xem lại cách tôi nói nó nếu có vẻ như nhiều người có cùng hiểu lầm.
Lặp lại

@Iterator Tôi hiểu câu hỏi chính của bạn là: có sự khác biệt nào giữa cách tiếp cận của người Bayes và người thường xuyên đối với EDA không? Câu trả lời của tôi cho điều đó là: không; EDA không thường xuyên cũng không Bayes.
Karl

3
Tôi nghĩ định nghĩa của tôi về "phân tích dữ liệu khám phá" hẹp hơn so với của bạn. Theo quan điểm của tôi, tất cả các phân tích dữ liệu tốt liên quan đến thăm dò. Điều khác biệt giữa "phân tích dữ liệu thăm dò" là thiếu một mô hình hoặc bất kỳ nỗ lực nào đối với suy luận chính thức.
Karl

0

Tôi nghĩ rằng, EDA giúp bạn xây dựng một mô hình, đưa ra một số giả định và (nếu cần) cập nhật mô hình và các giả định của nó. Tôi chọn một cách tiếp cận thực dụng để sử dụng cho phù hợp và đánh giá mô hình.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.