Tại sao Bayesian Statistics trở thành một chủ đề nghiên cứu ngày càng phổ biến? [đóng cửa]


10

Lướt qua khu vực nghiên cứu của 100 chương trình thống kê hàng đầu của US News, hầu hết tất cả chúng đều nặng về thống kê Bayes. Tuy nhiên, nếu tôi đi học ở tầng dưới, hầu hết trong số họ vẫn đang làm nghiên cứu thống kê cổ điển / thường xuyên. Ví dụ, trường hiện tại của tôi (được xếp hạng từ 150 đến 200 trên bảng xếp hạng QS thế giới về chỉ số nên không được coi là trường hàng đầu) chỉ có một giáo sư tập trung vào các số liệu thống kê của Bayes và gần như phẫn nộ với các số liệu thống kê của Bayes. Một số học sinh tốt nghiệp mà tôi đã nói chuyện thậm chí nói rằng các nhà thống kê Bayes đang làm các số liệu thống kê Bayes vì ​​lợi ích của nó mà tất nhiên tôi không đồng ý mạnh mẽ.

Tuy nhiên, tôi tự hỏi tại sao đây là trường hợp. Tôi có một số phỏng đoán có giáo dục:

(a) không còn đủ chỗ cho những tiến bộ trong phương pháp thống kê cổ điển / tần suất và nghiên cứu khả thi duy nhất trong nghiên cứu thống kê cổ điển / thường xuyên là về các ứng dụng sẽ là trọng tâm chính của trường cấp dưới vì trường học cấp cao nhất nên nhiều hơn nghiêng về nghiên cứu lý thuyết và phương pháp luận.

(b) Nó phụ thuộc nhiều vào lĩnh vực. Một số nhánh thống kê đơn giản là phù hợp hơn với các số liệu thống kê Bayes như nhiều ứng dụng khoa học của phương pháp thống kê trong khi nhánh khác phù hợp hơn với các số liệu thống kê cổ điển như khu vực tài chính. (sửa tôi nếu tôi sai) Với điều này, đối với tôi, dường như các trường hàng đầu có rất nhiều khoa thống kê làm ứng dụng trong lĩnh vực khoa học trong khi bộ phận thống kê của các trường cấp dưới chủ yếu tập trung vào các ứng dụng trong lĩnh vực tài chính vì điều đó giúp họ tạo thu nhập và tài trợ.

(c) Có những vấn đề lớn với phương pháp thường xuyên không thể giải quyết được, ví dụ như dễ bị quá tải MLE, v.v. Và Bayesian dường như cung cấp một giải pháp tuyệt vời.

(d) Sức mạnh tính toán ở đây do đó tính toán Bayes không còn là nút cổ chai như 30 năm trước.

(e) Đây có thể là phỏng đoán được quan tâm nhất mà tôi có. Có một sự phản kháng từ Nhà thống kê cổ điển / thường xuyên chỉ không thích một làn sóng phương pháp mới có khả năng vượt qua vai trò của các số liệu thống kê cổ điển. Nhưng như Larry Wasserman đã nói, nó phụ thuộc vào những gì chúng tôi đang cố gắng làm và mọi người nên giữ một tâm trí cởi mở, đặc biệt là một nhà nghiên cứu.


1
Mặc dù ý kiến ​​của người từ chối CV sẽ khác nhau, và ý kiến ​​đó được coi là lạc đề, điều đáng nói là chính xác câu hỏi này được trả lời trong các chương giới thiệu của các văn bản hiện đại về phân tích Bayes. Cụ thể, Chương 1 của Gelman, et al Bayesian Phân tích dữ liệu lần thứ 3 Ed. Nó hiểu rõ về a) "lẽ thường" và b) khoảng tin cậy thường xuyên có vấn đề cao mà 99% chúng ta không thể giúp đỡ nhưng giải thích sai. Các cách chúng ta hiểu sai về bản chất nó là Bayesian, vì vậy chúng tôi cũng có thể làm phân tích Bayesian từ get-go.
Peter Leopold

3
@Peter Leopold Một nửa nghiêm túc: 99%? và "chúng ta" là ai? Nhiều người sử dụng thống kê ngây thơ thực sự có những quan niệm sai lầm nghiêm trọng về các TCTD, nhưng nếu bạn giải quyết được cộng đồng CV, tôi hy vọng rằng 99% thực sự không phù hợp. Những người thống kê có thể tệ như bất kỳ ai khác khi tạo nên những con số trong trường hợp không có dữ liệu cứng!
Nick Cox

102

Câu trả lời:


8

Cá nhân, tôi sẽ mạo hiểm một vài dự đoán:

(1) Thống kê Bayes đã chứng kiến ​​sự gia tăng lớn về mức độ phổ biến trong vài thập kỷ qua. Một phần của điều này là do những tiến bộ trong MCMC và cải thiện tài nguyên tính toán. Thống kê Bayes đã đi từ lý thuyết thực sự tốt đẹp nhưng chỉ áp dụng cho các vấn đề đồ chơi cho một cách tiếp cận có thể được áp dụng phổ biến hơn. Điều này có nghĩa là vài năm trước, nói rằng bạn làm việc trên thống kê Bayes có thể đã khiến bạn trở thành một người thuê rất cạnh tranh.

Bây giờ, tôi sẽ nói rằng số liệu thống kê Bayes vẫn là một điểm cộng, nhưng vì vậy, đang giải quyết các vấn đề thú vị mà không sử dụng các phương pháp Bayes. Việc thiếu nền tảng về thống kê Bayes chắc chắn sẽ là một điểm trừ đối với hầu hết các ủy ban tuyển dụng, nhưng việc lấy bằng tiến sĩ về thống kê mà không được đào tạo đầy đủ về phương pháp Bayes sẽ là điều đáng ngạc nhiên.

(2) Các nhà thống kê Bayes sẽ đề cập đến "Bayesian" trong CV của họ. Những người thường xuyên sẽ không đưa "Người thường xuyên" vào CV của họ, mà điển hình hơn là lĩnh vực họ làm việc (ví dụ: phân tích sinh tồn, mô hình dự báo, dự báo, v.v.). Ví dụ, rất nhiều công việc của tôi là viết các thuật toán tối ưu hóa, điều mà tôi đoán ngụ ý bạn sẽ nói có nghĩa là tôi làm công việc Thường xuyên. Tôi cũng đã viết một đoạn lớn các thuật toán Bayes, nhưng nó chắc chắn nằm trong nhóm thiểu số công việc của tôi. Số liệu thống kê Bayes có trong CV của tôi, số liệu thống kê thường xuyên thì không.

(3) Ở một mức độ nào đó, những gì bạn đã nói trong câu hỏi của bạn cũng có sự thật. Tính toán Bayes nói chung hiệu quả có nhiều vấn đề mở hơn trong đó so với vương quốc Thường xuyên. Ví dụ, Hamiltonian Monte Carlo gần đây đã trở thành một thuật toán rất thú vị để lấy mẫu tổng quát từ các mô hình Bayes. Không có nhiều chỗ để cải thiện chung chungtối ưu hóa những ngày này; Các thuật toán Newton Raphson, L-BFGS và EM bao gồm rất nhiều cơ sở. Nếu bạn muốn cải thiện các phương pháp này, bạn thường phải chuyên môn hóa rất nhiều cho vấn đề. Như vậy, bạn muốn nói "Tôi làm việc tối ưu hóa các mô hình không gian địa lý" hơn là "Tôi làm việc trên Ước tính khả năng tối đa chiều cao". Thế giới máy học là một ngoại lệ, vì có rất nhiều hứng thú trong việc tìm ra các phương pháp tối ưu hóa ngẫu nhiên mới (ví dụ, SGD, Adam, v.v.), nhưng vì một vài lý do.

Tương tự như vậy, có nhiều việc phải làm để đến với những linh mục tốt cho người mẫu. Phương pháp frequentist làm có một tương đương với này (đến với hình phạt tốt, tức là, Lasso, glmnet) nhưng có lẽ mặt đất màu mỡ hơn cho priors trên chấm phạt đền.

(4) Cuối cùng, và đây chắc chắn là ý kiến ​​cá nhân nhiều hơn, rất nhiều người liên kết Thường xuyên với giá trị p. Do sự lạm dụng chung của các giá trị p được quan sát trong các lĩnh vực khác, rất nhiều nhà thống kê sẽ thích cách xa nhau nhất có thể khỏi việc lạm dụng các giá trị p hiện tại.


3
Vì vậy, câu trả lời tại sao nó trở nên phổ biến hơn bao gồm (1) nó trở nên phổ biến hơn. Bối rối vì điều đó, nhưng tôi tưởng tượng đó chỉ là vấn đề cần viết lại.
Nick Cox

@NickCox: quan điểm của tôi là nó phổ biến hơn, mà còn đó là sự nổi tiếng có thể được phóng đại một chút. Đó là, OP thấy rằng Bayesian Statistics có trong CV của hầu hết mọi giáo sư tại một mẫu của các trường đại học hàng đầu. Nhưng điều đó không có nghĩa là mỗi một giáo sư chỉ thống kê Bayes. Một điểm khác trên (1) là tôi nghĩ đã có lúc thực hiện thống kê Bayes vì ​​khu vực nghiên cứu của bạn rất quan trọng để có được vị trí hàng đầu. Tôi không chắc nó là một yêu cầu khắt khe nữa, nhưng nhiều giáo sư mà bạn thấy bây giờ đã được thuê trong thời gian đó.
Vách đá AB

Ồ, tôi thấy quan điểm của bạn. Tôi đang tập trung thảo luận về "Có phải vì không có đủ chỗ cho sự tiến bộ trong thống kê cổ điển / thường xuyên?" và không quá nhiều về "tại sao điều này xảy ra?"
Vách đá AB
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.