Chủ quan trong thống kê thường xuyên


14

Tôi thường nghe tuyên bố rằng số liệu thống kê Bayes có thể rất chủ quan. Đối số chính là suy luận phụ thuộc vào sự lựa chọn của một ưu tiên (mặc dù người ta có thể sử dụng nguyên tắc thờ ơ o entropy tối đa để chọn một ưu tiên). Trong so sánh, yêu cầu đi, thống kê thường xuyên nói chung là khách quan hơn. Có bao nhiêu sự thật trong tuyên bố này?

Ngoài ra, điều này làm cho tôi tự hỏi:

  1. Các yếu tố cụ thể của thống kê thường xuyên (nếu có) có thể đặc biệt chủ quan và không có mặt hoặc ít quan trọng hơn trong thống kê Bayes là gì?
  2. Là chủ quan phổ biến ở Bayes hơn so với thống kê thường xuyên?

5
Chắc chắn các phương pháp thường xuyên chủ quan hơn nhiều so với quảng cáo, nhưng tôi cho rằng các phương pháp Bayes vẫn chủ quan hơn. Và xin đừng thuyết phục bản thân rằng sự bất biến của bạn trước một nhóm hoặc đặc điểm kỹ thuật của MaxEnt trước đó là "khách quan" - cả hai loại trước đều có khả năng thể hiện niềm tin mà tôi xem là thông tin, và ở mọi mức độ, không chiến lược nào được áp dụng trong tổng quát (ví dụ: tôi không nghĩ rằng có các linh mục bất biến hoặc MaxEnt trên không gian của CDF và bất kỳ ưu tiên nào trên không gian này đều gán xác suất 1 cho một tập hợp ít nhất về mặt tôpô).
anh chàng

2
Bayes bắt đầu trên mặt đất chủ quan, sau đó dữ liệu (hy vọng) kéo họ trở lại thực tế khách quan. Những người thường xuyên bắt đầu (hoặc ít nhất là nghĩ rằng họ làm) từ các vị trí khách quan, nhưng sau đó họ kết thúc việc làm mờ phân tích với các giả định chủ quan của họ.
Aksakal

2
Bayesian đều biết và đang lên phía trước với các giả định của họ. Những người thường xuyên nói chung là không.
Alexis

Câu trả lời:


15

Tôi thường nghe tuyên bố rằng số liệu thống kê Bayes có thể rất chủ quan.

Tôi cũng vậy, nhưng lưu ý rằng có một sự mơ hồ lớn trong việc gọi một cái gì đó chủ quan.

Chủ quan (cả hai giác quan)

Chủ quan có thể có nghĩa (ít nhất) một trong những

  1. phụ thuộc vào sự bình dị của nhà nghiên cứu
  2. quan tâm rõ ràng với trạng thái kiến ​​thức của một cá nhân

Chủ nghĩa Bayes là chủ quan theo nghĩa thứ hai bởi vì nó luôn đưa ra một cách để cập nhật niềm tin được thể hiện bằng phân phối xác suất bằng cách điều chỉnh thông tin. (Lưu ý rằng liệu những niềm tin đó có phải là niềm tin mà một số chủ đề thực sự có hoặc chỉ là niềm tin mà một chủ đề có thể có không liên quan đến việc quyết định liệu đó có phải là 'chủ quan' hay không.)

Đối số chính là suy luận phụ thuộc vào sự lựa chọn của trước

Trên thực tế, nếu một ưu tiên đại diện cho niềm tin cá nhân của bạn về một cái gì đó thì bạn gần như chắc chắn đã không chọn nó nhiều hơn bất kỳ niềm tin nào của bạn. Và nếu nó đại diện cho niềm tin của ai đó thì đó có thể là một đại diện ít nhiều chính xác cho những niềm tin đó, thật trớ trêu thay, sẽ có một thực tế khá 'khách quan' về việc nó thể hiện chúng tốt như thế nào.

(mặc dù người ta có thể sử dụng nguyên tắc thờ ơ o entropy tối đa để chọn trước).

Người ta có thể, mặc dù điều này không có xu hướng khái quát hóa rất trơn tru cho các miền liên tục. Ngoài ra, có thể cho rằng không thể bằng phẳng hoặc 'thờ ơ' trong tất cả các tham số cùng một lúc (mặc dù tôi chưa bao giờ chắc chắn lý do tại sao bạn muốn trở thành).

Trong so sánh, yêu cầu đi, thống kê thường xuyên nói chung là khách quan hơn. Có bao nhiêu sự thật trong tuyên bố này?

Vậy làm thế nào chúng ta có thể đánh giá tuyên bố này?

Tôi đề nghị rằng trong ý thức thứ hai của chủ quan: chủ yếu là chính xác. Và theo nghĩa chủ quan đầu tiên: nó có thể sai.

Chủ nghĩa thường xuyên là chủ quan (giác quan thứ hai)

Một số chi tiết lịch sử là hữu ích để lập bản đồ các vấn đề

Đối với Neyman và Pearson, chỉ có hành vi quy nạp chứ không phải suy luận quy nạp và tất cả các đánh giá thống kê đều hoạt động với các thuộc tính lấy mẫu dài hạn của các công cụ ước tính. (Do đó phân tích alpha và công suất, nhưng không phải giá trị p). Điều đó khá không thuyết phục theo cả hai nghĩa.

Quả thực là có thể, và tôi nghĩ khá hợp lý, khi lập luận theo những dòng này rằng Chủ nghĩa thường xuyên thực sự không phải là một khung suy luận mà là một tập hợp các tiêu chí đánh giá cho tất cả các quy trình suy luận có thể nhấn mạnh hành vi của họ trong ứng dụng lặp đi lặp lại. Các ví dụ đơn giản sẽ là tính nhất quán, không thiên vị, v.v ... Điều này rõ ràng không có ý nghĩa trong ý nghĩa 2. Tuy nhiên, nó cũng có nguy cơ bị chủ quan theo nghĩa 1 khi chúng ta phải quyết định làm gì khi những điều đó không được áp dụng (ví dụ khi không có một công cụ ước tính không thiên vị sẽ có) hoặc khi chúng áp dụng nhưng mâu thuẫn.

Fisher đưa ra một Chủ nghĩa thường xuyên ít mang tính chất không thú vị, rất thú vị. Đối với Fisher, có một thứ như suy luận quy nạp, theo nghĩa là một chủ đề, nhà khoa học, đưa ra những suy luận trên cơ sở phân tích dữ liệu, được thực hiện bởi nhà thống kê. (Do đó giá trị p nhưng không phân tích alpha và công suất). Tuy nhiên, các quyết định về cách ứng xử, có nên tiếp tục nghiên cứu, v.v. được đưa ra bởi nhà khoa học trên cơ sở hiểu biết của cô về lý thuyết miền, chứ không phải bởi nhà thống kê áp dụng mô hình suy luận. Do sự phân công lao động của ngư dân này, cả chủ thể (giác quan 2) và chủ thể cá nhân (giác quan 1) đều ngồi về phía khoa học chứ không phải phía thống kê.

Nói một cách hợp pháp, Chủ nghĩa thường xuyên của Fisher chủ nghĩa chủ quan. Chỉ là đối tượng chủ quan không phải là thống kê.

Có nhiều tổng hợp khác nhau có sẵn, cả hai sự pha trộn gần như kết hợp của hai thứ này bạn tìm thấy trong sách giáo khoa thống kê được áp dụng và các phiên bản nhiều sắc thái hơn, ví dụ như 'Thống kê lỗi' được đẩy bởi Deborah Mayo. Cái sau này khá không phù hợp với ý nghĩa 2, nhưng chủ quan cao trong ý nghĩa 1, bởi vì nhà nghiên cứu phải sử dụng phán đoán khoa học - phong cách Fisher - để tìm ra xác suất lỗi nào quan trọng và shoudl sẽ được kiểm tra.

Chủ nghĩa thường xuyên là chủ quan (ý nghĩa đầu tiên)

Vì vậy, chủ nghĩa thường xuyên ít chủ quan trong ý nghĩa đầu tiên? Nó phụ thuộc. Bất kỳ thủ tục suy luận có thể được đánh đố với idiosyncracies như thực sự áp dụng. Vì vậy, có lẽ sẽ hữu ích hơn khi hỏi liệu Chủ nghĩa thường xuyên có khuyến khích không cách tiếp cận ít chủ quan (ý nghĩa đầu tiên) không? Tôi nghi ngờ điều đó - tôi nghĩ rằng việc áp dụng tự ý thức của các phương pháp chủ quan (giác quan thứ hai) dẫn đến kết quả ít chủ quan (ý nghĩa thứ nhất), nhưng nó có thể được tranh luận theo một trong hai cách.

Giả sử trong một khoảnh khắc rằng tính chủ quan (ý nghĩa đầu tiên) lẻn vào một phân tích thông qua 'sự lựa chọn'. Bayes dường như liên quan đến nhiều 'sự lựa chọn' hơn. Trong trường hợp đơn giản nhất, các lựa chọn được kiểm đếm là: một tập hợp các giả định có khả năng bình dị cho Người thường xuyên (hàm Likabilities hoặc tương đương) và hai bộ cho Bayesian (Khả năng thích ứng và trước là ẩn số).

Tuy nhiên, người Bayes biết rằng họ đang chủ quan (theo nghĩa thứ hai) về tất cả những lựa chọn này nên họ có khả năng tự ý thức hơn về những hàm ý sẽ dẫn đến ít chủ quan hơn (theo nghĩa thứ nhất).

Ngược lại, nếu một người tìm kiếm một bài kiểm tra trong một cuốn sách kiểm tra lớn, thì người ta có thể cảm thấy rằng kết quả đó ít chủ quan hơn (ý nghĩa đầu tiên), nhưng có thể cho rằng đó là kết quả của việc thay thế sự hiểu biết của một đối tượng khác về vấn đề của chính mình . Không rõ ràng rằng người ta đã bớt chủ quan theo cách này, nhưng nó có thể cảm thấy như vậy. Tôi nghĩ rằng hầu hết sẽ đồng ý rằng điều đó là vô ích.


4
Một định nghĩa từ điển của 'chủ quan' (trực tiếp từ Google) nói: dựa trên hoặc bị ảnh hưởng bởi cảm xúc, thị hiếu hoặc ý kiến ​​cá nhân. ví dụ: "quan điểm của anh ấy rất chủ quan" đồng nghĩa: cá nhân, cá nhân, cá nhân, nội bộ, cảm xúc, bản năng, trực giác, ấn tượng . Lưu ý rằng điều này phản ánh một lý thuyết dân gian rằng một "quan điểm" (nghĩa là một niềm tin) là chủ quan (ý nghĩa 1: ấn tượng, trực quan, kỳ lạ, v.v.) bởi vì nó liên quan đến trạng thái bên trong của một chủ đề cụ thể (ý nghĩa 2: cá nhân hóa, cá nhân, v.v. .) chứ không phải là công khai tức là không cá nhân .
liên hợp chiến

2
Có thể hữu ích khi nghĩ về tâm lý học nhận thức là một ví dụ. Lĩnh vực này hoàn toàn chủ quan (theo nghĩa thứ hai, bởi vì đó là tất cả về trạng thái bên trong của con người và ảnh hưởng của họ đối với hành vi của những người đó) nhưng nó không chủ quan theo nghĩa thứ nhất, bởi vì các nhà tâm lý học thực sự không thể ngồi xung quanh và giải quyết cơ sở của nhà nước nội bộ của họ.
liên hợp chiến

2
Cực đoan ngược lại, nơi một cái gì đó hoàn toàn bình dị và chủ quan (ý nghĩa 1) nhưng không thực sự về các chủ đề là khó tìm hơn. Có lẽ Lucretius giải thích các nguyên tử và khoảng trống trong de Rerum Naturae là một ví dụ.
liên hợp chiến

1
Chính xác. Tiếng Anh khá không hữu ích về điều này ...
liên hợp chiến

1
và tôi đã chấp thuận (và điều chỉnh một chút) sự thay đổi được đề xuất
liên hợp

6

Sự chủ quan trong cách tiếp cận thường xuyên đang lan tràn trong việc áp dụng suy luận. Khi bạn kiểm tra một giả thuyết bạn đặt mức độ tin cậy, hãy nói 95% hoặc 99%. Trường hợp nào này đến từ đâu? Nó không đến từ bất cứ nơi nào ngoài sở thích của bạn hoặc thực tiễn phổ biến trong lĩnh vực của bạn.

Vấn đề trước Bayes rất ít trên các bộ dữ liệu lớn, bởi vì khi bạn cập nhật dữ liệu, phân phối sau sẽ trôi ra khỏi trước của bạn vì ngày càng có nhiều dữ liệu được xử lý.

Đã nói rằng Bayes bắt đầu từ định nghĩa chủ quan về xác suất, niềm tin, vv Điều này làm cho họ khác với những người thường xuyên, những người nghĩ về xác suất khách quan. Trong các tập dữ liệu nhỏ, điều này tạo ra sự khác biệt

CẬP NHẬT: Tôi hy vọng bạn ghét triết học nhiều như tôi, nhưng họ có một số suy nghĩ thú vị theo thời gian, xem xét chủ nghĩa chủ quan . Làm thế nào để tôi biết rằng tôi thực sự trên SE? Nếu đó là giấc mơ của tôi thì sao? Vân vân. :)


1
Ngoài việc lựa chọn mức độ tin cậy trong kiểm tra giả thuyết (vì điều tương tự có thể được tranh luận trong thống kê Bayes, ví dụ, khi chọn tiêu chí so sánh HDP / HDI với ROPE để từ chối hoặc chấp nhận giả thuyết ), tính chủ quan có vai trò trong có được một ước tính điểm hoặc có được khoảng tin cậy, có lẽ trong sự lựa chọn của người ước tính?
Amelio Vazquez-Reina

1
Ngoài ra, sự hiểu biết của tôi là các mức ý nghĩa được đặt trong các số liệu thống kê thường xuyên trong bối cảnh ra quyết định (nghĩa là chúng ta có nên từ chối giả thuyết không?), Không phải trong xác suất tính toán. Trong lý thuyết quyết định Bayes, điều tương tự có thể được tranh luận về việc lựa chọn hàm Mất, có thể ảnh hưởng đến quyết định tối ưu (được chọn). Ngoài ra, các giá trị mức độ tin cậy thường được chọn từ tỷ lệ lỗi loại I chấp nhận được (ví dụ 95% trong NHST được thiết lập trực tiếp từ tỷ lệ dương tính giả "không cao hơn 5%")
Amelio Vazquez-Reina

4
Chắc chắn các vấn đề trước khá nhiều khi phân tích các bộ dữ liệu lớn, cho hầu hết các vấn đề hiện đại thú vị. Đúng, chúng tôi có kết quả tiệm cận khinp«n, nhưng thông thường, những người có bộ dữ liệu lớn đặt câu hỏi lớn để theo một nghĩa nào đó p ở mức tương đương với n, và ở đây một ưu tiên thích hợp sẽ hoạt động như một người thường xuyên và sẽ có vấn đề lớn.
anh chàng

5
Có thể đáng lưu ý rằng các chức năng mất có thể không chủ quan (nghĩa là hoàn toàn được xác định bởi bối cảnh), trong trường hợp đó, các quyết định tối ưu của Bayes có tiềm năng hoàn toàn khách quan so với trước.

1
@Matthew Có, mặc dù điều đó cũng đúng với sự lựa chọn của αtrong NHST từ tỷ lệ dương tính giả có thể chịu được tối đa, như tôi đã đề cập ở trên.
Amelio Vazquez-Reina
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.