Ngư dân cho người giả?


11

Phiên bản ngắn: có giới thiệu về các tác phẩm (giấy tờ và sách) của Ronald Fisher về các số liệu thống kê nhắm vào những người có ít hoặc không có nền tảng về thống kê? Tôi đang nghĩ về một cái gì đó giống như một "độc giả câu chú thích" nhắm vào những người không thống kê.

Tôi đánh vần động lực cho câu hỏi này bên dưới, nhưng được cảnh báo rằng nó dài dòng (tôi không biết làm thế nào để giải thích nó ngắn gọn hơn), và hơn nữa, nó gần như chắc chắn gây tranh cãi, có thể gây khó chịu, thậm chí có thể gây phẫn nộ. Vì vậy, xin vui lòng, bỏ qua phần còn lại của bài đăng này trừ khi bạn thực sự nghĩ rằng câu hỏi (như đã nêu ở trên) quá ngắn gọn để được trả lời mà không cần làm rõ thêm.


Tôi đã tự dạy mình những điều cơ bản của nhiều lĩnh vực mà nhiều người cho là khó khăn (ví dụ đại số tuyến tính, đại số trừu tượng, phân tích thực và phức tạp, cấu trúc liên kết chung, lý thuyết đo lường, v.v.) Nhưng tất cả những nỗ lực của tôi trong việc dạy bản thân thống kê đã thất bại .

Lý do cho điều này không phải là tôi thấy việc thống kê khó khăn về mặt kỹ thuật (hoặc hơn thế nữa so với các lĩnh vực khác mà tôi đã tìm cách vượt qua), mà là tôi thấy số liệu thống kê liên tục xa lạ , nếu không hoàn toàn kỳ lạ , hơn rất nhiều so với bất kỳ khu vực khác tôi đã tự dạy mình.

Dần dần, tôi bắt đầu nghi ngờ rằng gốc rễ của sự kỳ lạ này chủ yếu là lịch sử, và rằng, như một người đang học lĩnh vực này từ sách chứ không phải từ một cộng đồng các học viên (như trường hợp tôi đã được đào tạo chính thức về thống kê ), Tôi sẽ không bao giờ vượt qua cảm giác xa lánh này cho đến khi tôi biết thêm về lịch sử thống kê.

Vì vậy, tôi đã đọc một vài cuốn sách về lịch sử thống kê và trên thực tế, việc này đã đi một cách lỏng lẻo trong việc giải thích những gì tôi cho là kỳ lạ của lĩnh vực này. Nhưng tôi vẫn có một số cách để đi theo hướng này.

Một trong những điều mà tôi đã học được từ các bài đọc của mình trong lịch sử thống kê là nguồn gốc của phần lớn những gì tôi cho là kỳ quái trong thống kê là một người đàn ông, Ronald Fisher.

Trên thực tế, câu trích dẫn 1 (mà tôi chỉ tìm thấy gần đây) rất phù hợp với cả nhận thức của tôi rằng chỉ bằng cách đi sâu vào lịch sử, tôi mới bắt đầu hiểu về lĩnh vực này, cũng như việc tôi không tham gia vào Fisher như của tôi điểm mốc:

Hầu hết các khái niệm và lý thuyết thống kê có thể được mô tả tách biệt với nguồn gốc lịch sử của chúng. Điều này là không khả thi, nếu không có sự bí ẩn không cần thiết, đối với trường hợp "xác suất fiducial".

Thật vậy, tôi nghĩ rằng linh cảm của tôi ở đây, mặc dù chủ quan (tất nhiên), không hoàn toàn không có cơ sở. Fisher không chỉ đóng góp một số ý tưởng quan trọng nhất trong thống kê, ông còn khét tiếng vì sự coi thường công việc trước đây và vì sự phụ thuộc vào trực giác (cung cấp bằng chứng mà hầu như không ai có thể hiểu được, hoặc bỏ qua chúng hoàn toàn). Hơn nữa, ông có mối thù truyền kiếp với nhiều nhà thống kê quan trọng khác của nửa đầu thế kỷ 20, những mối thù dường như đã gieo rắc nhiều nhầm lẫn và hiểu lầm trong lĩnh vực này.

Kết luận của tôi từ tất cả những điều này là, vâng, những đóng góp của Fisher cho các số liệu thống kê hiện đại thực sự rất sâu rộng, mặc dù không phải tất cả chúng đều tích cực.

Tôi cũng đã kết luận rằng để thực sự hiểu được ý nghĩa của sự xa lánh với các số liệu thống kê, tôi sẽ phải đọc ít nhất một số tác phẩm của Fisher, ở dạng ban đầu.

Nhưng tôi đã thấy rằng văn bản của Fisher sống với danh tiếng của nó là không thể xuyên thủng. Tôi đã cố gắng tìm hướng dẫn cho tài liệu này, nhưng thật không may, tất cả mọi thứ tôi tìm thấy đều dành cho những người được đào tạo về thống kê, vì vậy thật khó để tôi hiểu được những gì nó làm sáng tỏ.

Do đó câu hỏi ở đầu bài này.


1 Stone, Mervyn (1983), "Xác suất tin tưởng", Từ điển bách khoa khoa học thống kê 3 81-86. Wiley, New York.


2
Đối với các số liệu thống kê về lễ hội, tôi nghĩ rằng một số đặc điểm của các lập luận của Fisher có thể đúng và áp dụng gần như nhiều cho một số công việc khác của ông, nhưng chắc chắn nó không đúng với tất cả các công việc thống kê của ông. Một số lập luận hình học của ông liên quan đến và bình phương là song song của sự rõ ràng và sâu sắc. t
Glen_b -Reinstate Monica

@Glen_b: Tôi dùng từ ngữ của bạn cho nó, nhưng, ít nhất là liên quan đến t , K. Pearson từ chối cho giấy ban đầu công bố Fisher trên t vì ông không thể làm theo bằng chứng của Fisher, và nói càng nhiều rất rõ ràng trong thư của ông với Gosset. Cả Gosset cũng không thể làm theo bằng chứng của Fisher.
kjo

1
Vâng, nó hoàn toàn đúng. Tuy nhiên, bản thân tôi đã đọc một số bài báo của Fisher từ những năm 20, hoặc những bài báo sau này của anh ấy rõ ràng hơn những bài trước đó (có vẻ như có thể), hoặc, có lẽ, hiệu suất của Pearson có thể đã bị ảnh hưởng bởi lịch sử và hậu quả tiềm tàng của các tương tác của anh ấy với Fisher.
Glen_b -Reinstate Monica

Câu trả lời:


8

Một chú thích Fisher sẽ là một nguồn tài nguyên tuyệt vời!

Tôi không nghĩ rằng bạn sẽ có thể hiểu được Fisher mà không cần đồng thời cố gắng hiểu các phần chính khác của sự phát triển thống kê và tương tác của Fisher với những người đóng góp quan trọng khác. Tôi thấy Thống kê trong Tâm lý học: Một quan điểm lịch sử của Michael Cowles là rất hữu ích. (Đừng để chút tâm lý của tiêu đề khiến bạn thất vọng: cuốn sách khá chung chung và dường như là một tài khoản rất thuận tay.)

Về chủ đề chú thích của Fisher, gần đây tôi đã chú thích một trong những đoạn của anh ấy khi tôi được yêu cầu biện minh cho một khẳng định rằng Fisher đề xuất các giá trị P là chỉ số bằng chứng chống lại giả thuyết khống. Đây là cách tôi trả lời:

Tôi đã xem xét xung quanh một chút mà không tìm thấy một đặc điểm kỹ thuật chính xác bởi vì, như thường lệ, văn bản của Fisher rất khó xử và đòi hỏi một số giải thích nỗ lực về phía người đọc. Ông nói trên p. 46 phương pháp thống kê và suy luận khoa học (Tôi có phiên bản cuối cùng):

"Mặc dù có thể nhận ra là một điều kiện tâm lý của sự miễn cưỡng, hoặc chống lại sự chấp nhận một đề xuất, cảm giác gây ra bởi một bài kiểm tra có ý nghĩa có một cơ sở khách quan trong đó tuyên bố xác suất mà nó dựa trên là một thực tế có thể truyền đạt được và có thể kiểm chứng được Mức độ quan trọng trong các trường hợp như vậy đáp ứng các điều kiện của thước đo căn cứ hợp lý cho sự hoài nghi mà nó gây ra. Nó nguyên thủy hơn, hoặc nguyên tố hơn, và không biện minh cho bất kỳ tuyên bố xác suất chính xác nào về mệnh đề. "

Đây là một lần nữa, với các tuyên bố chỉnh sửa và diễn giải của tôi:

có sự hiểu lầm hoặc áp dụng sai các nguyên tắc kiểm tra ý nghĩa bị chỉ trích bởi Fisher trong đoạn trước của mình.]. Mức ý nghĩa trong các trường hợp như vậy [giá trị P] đáp ứng các điều kiện của thước đo căn cứ hợp lý cho sự hoài nghi mà nó gây ra [nghĩa là bằng chứng]. Nó nguyên thủy hơn, hoặc nguyên tố hơn, và không biện minh cho bất kỳ tuyên bố xác suất chính xác nào về mệnh đề [và do đó có thể là một chỉ số, nhưng không phải là thước đo xác suất.]. "


2
Nhận xét mở đầu cho câu trả lời của bạn đã cho tôi ý tưởng bắt đầu một wiki "Chú thích được chú thích" ... Một suy nghĩ nhàn rỗi, thực sự, vì tôi chưa bao giờ làm bất cứ điều gì từ xa như nó. Cụ thể, tôi không có ý tưởng gì về việc thiết lập và quản lý wiki, và tôi thậm chí còn ít hiểu hơn về các vấn đề pháp lý / bản quyền cần phải xử lý để đưa dự án đó ra khỏi mặt đất. Tôi đồng ý, mặc dù: nó sẽ là một nguồn tài nguyên thực sự vô giá.
kjo

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.