Những đóng góp thống kê chính của Ronald Fisher là gì?


13

Richard Dawkins đã mô tả Ronald Fisher là "cha đẻ của thống kê hiện đại và thiết kế thử nghiệm", một dòng được trích dẫn trong tiểu sử Wikipedia của Fisher . Và cũng là tác giả Anders Hald gọi ông là "một thiên tài gần như một tay tạo ra nền tảng cho khoa học thống kê hiện đại" trong cuốn sách Lịch sử thống kê toán học .

Tôi chỉ tự hỏi chính xác những gì anh ấy đã làm để mọi người đánh giá cao như vậy?


10
Đây sẽ là một bài viết tuyệt vời cho HSM .
Antoni Parellada

6
@Antoni Tôi nghĩ rằng tại một thời điểm nào đó trong tương lai, khi HSM tiếp tục phát triển và phát triển, HSM có thể trở thành một ngôi nhà tốt hơn cho các câu hỏi lịch sử thống kê. Nhưng có một nền tảng chuyên môn vững chắc về CV, với nhiều người dùng thực sự quan tâm đến các khía cạnh lịch sử, CV được cho là nơi tốt hơn bây giờ. (Tôi nghĩ về lâu dài, CV có thể sẽ tiếp tục là nơi tốt hơn cho các câu hỏi lịch sử "mang tính khái niệm" hơn.)
Silverfish

3
Tôi không nghĩ rằng bản chất 'dựa trên ý kiến' của câu hỏi này là vấn đề. Tôi đồng ý với @AntoniParellada: Nếu câu hỏi này không thuộc về trang Lịch sử Khoa học và Toán học SE, thì không rõ điều gì sẽ xảy ra. Chúng tôi nợ các đồng nghiệp SE của chúng tôi để di chuyển nó đến đó. Các khung ban đầu là hoàn toàn tốt đẹp.
gung - Phục hồi Monica

3
Tôi đồng ý, "câu hỏi hay", nhưng có lẽ không phải ở đây. Các tác phẩm của Fisher đã được thu thập thành một số lượng lớn Đóng góp cho Thống kê toán học có thể dễ dàng thu được từ bất kỳ cửa hàng sách cũ nào. Đối với một see sách xem xét lại: jstor.org/stable/2332332 Tôi cá nhân không có khả năng để thêm lời tốt hơn và chỉ có thể tham khảo Efron jstor.org/stable/2676745 gì thực sự sẽ rất thú vị và bổ sung thêm thông tin là một cái nhìn từ các nhà sử học. (hoặc các nhà triết học từ quan điểm thống kê khác nhau là một câu hỏi và mặc dù tôi thực sự không thực sự có được nó, tức là tôi sử dụng tất cả trong số họ.)
Sextus Empiricus

7
@MatthewDrury Chúng tôi có thẻ [history] tương đối phổ biến. Câu hỏi lịch sử là chủ đề trên trang web của chúng tôi. Nếu có gì đó thuộc chủ đề ở đây, chúng ta không nên di chuyển nó đi ngay cả khi nó cũng thuộc chủ đề khác.
amip nói phục hồi Monica

Câu trả lời:


19

Rất khó để viết câu trả lời cho câu hỏi

Những đóng góp thống kê chính của Ronald Fisher là gì?

vì đã có rất nhiều tác phẩm xuất sắc về chủ đề này, được tạo ra bởi các nhà văn xuất sắc, bao gồm các nhà thống kê vĩ đại, ví dụ:

Những tác phẩm này rất khó để so khớp trong một vài dòng đơn giản trên bảng hỏi đáp trên internet. Trên hết, không dễ để nắm bắt toàn bộ ý tưởng từ Fisher, như Efron đã viết trong tác phẩm của mình trên Fisher:

Một khó khăn trong việc đánh giá tầm quan trọng của thống kê Ngư dân là khó có thể nói nó là gì. Fisher có một số lượng đáng kinh ngạc các ý tưởng quan trọng và một số trong số chúng, như suy luận ngẫu nhiên và điều kiện, là mâu thuẫn. Đó là một chút như thể trong kinh tế học Marx, Adam Smith và Keynes hóa ra là cùng một người.


Fisher là người tiên phong

Đã là một nguồn đơn giản, nhưng rất tốt, đóng góp của Fisher là Wikipedia. Chỉ cần đọc bài viết về lịch sử thống kê (hoặc bạn có thể sử dụng bất kỳ văn bản nào khác) sẽ cho bạn cái nhìn sâu sắc về số lượng và tầm quan trọng của những đóng góp của Fisher.

Bạn cũng sẽ thấy rằng đó là một phần thời gian, địa điểm và may mắn đã làm cho Fisher trở thành một người đóng góp tuyệt vời. Fisher là một nhà thống kê quan trọng và có ảnh hưởng trong đầu thế kỷ 20 khi nền tảng cơ bản của thống kê ứng dụng được tạo ra và lĩnh vực này tương đối nhỏ (tương đương với thời kỳ của thế kỷ 18 và 19 trong toán học).

Tạp chí thống kê đầu tiên và khoa thống kê đầu tiên tại một trường đại học vừa được bắt đầu khi Fisher bước vào giai đoạn. Trước đầu thế kỷ 20, hầu hết có các phương pháp để thực hiện hồi quy và một số ý tưởng về phân phối các thuật ngữ và sai sót còn lại, được sử dụng trong các lĩnh vực như thiên văn học.

Khái niệm về lỗi đo lường và xác suất kết quả. Loại toán học và logic này (gần với toán học thuần túy hơn, và ... được coi là cao quý hơn, và ít bị các nhà toán học nghiêm túc thời đó lên án), đã được áp dụng rộng rãi hơn cho các lĩnh vực lựa chọn của Fisher: di truyền, tiến hóa, sinh học, nông nghiệp . Vì Fisher, một nhà toán học xuất sắc, đã đóng góp lớn cho những phát triển ban đầu này (hoặc thậm chí có thể được coi là động lực chính cho những phát triển này), công việc của ông đã được đặt ở một vị trí quan trọng trong lịch sử thống kê.

Các khái niệm và công cụ cơ bản

Nếu bạn xem các chủ đề trong một cuốn sách giới thiệu về thống kê (cụ thể là các khái niệm toán học hoặc suy luận), bạn có thể coi Fisher là người đóng góp thống trị. Đó cũng là Fisher, người đã viết phần giới thiệu đầu tiên và có ảnh hưởng nhất đến sách thống kê :

  • Phương pháp thống kê cho công nhân nghiên cứu (1925)
  • Thiết kế thí nghiệm (1935) (sử dụng thí nghiệm tách trà để giải thích cho những người khác, ngẫu nhiên, sử dụng hình vuông Latin, giả thuyết null, ý nghĩa, độ nhạy / sức mạnh và về cơ bản là tất cả mọi thứ; Yates cung cấp một nền tảng lịch sử cho công việc này)

Lưu ý rằng các phiên bản trực tuyến của những cuốn sách này tồn tại SMRWmột phần DE (xem bài đọc ngày 29 tháng 10 b) .

Từ 1912 đến 1925, Fisher:

  • đã giúp cải thiện bài kiểm tra chi bình phương (trong đó Pearson và những người khác đã sai về số bậc tự do trong nhiều năm),
  • đã cung cấp một thử nghiệm chính xác để tính giá trị p cho mức độ phù hợp với số lượng quan sát thấp (được đặt theo tên của anh ta là thử nghiệm chính xác của Fisher ),
  • N-1N
  • đã phát triển phân tích phương saiphân phối F (cũng được đặt theo tên ông), và
  • (một điều "nhỏ" khác mà anh ấy đã làm khi còn là sinh viên) đang phát triển những điều cơ bản và khái niệm để có khả năng tối đa ( Aldrich's RA Fisher và việc tạo ra khả năng tối đa ).

Vì vậy, đại khái điều này bao gồm hầu hết các công cụ suy luận cơ bản mà các văn bản giới thiệu hiện tại sử dụng. Trong khi thực hiện công việc này trên các số liệu thống kê, Fisher đã giải quyết các vấn đề lớn về di truyền khiến những người như Richard Dawkins ngưỡng mộ ông rất nhiều.

Thuật ngữ

L2L1L2L1"Phương sai" (trong bài viết năm 1920 của ông Một quan sát toán học về các phương pháp xác định độ chính xác của quan sát bằng sai số trung bình và sai số trung bình bình phương ).

Nền móng

Trong bài báo năm 1922 Trên nền tảng toán học của thống kê lý thuyết, Fisher cung cấp một cái nhìn tổng quan ngắn gọn và đơn giản về các khái niệm chính, chỉ để đặt tên cho danh sách các định nghĩa: 'trung tâm của vị trí', 'tính nhất quán', 'phân phối', 'hiệu quả', ' ước tính ',' độ chính xác nội tại ',' các khu vực điều khiển ',' khả năng ',' vị trí ',' tối ưu ',' tỷ lệ ',' đặc tả ',' đủ điều kiện ',' hiệu lực ' . Nó đòi hỏi một nhà sử học để xem những gì Fisher đóng góp ở đây theo nghĩa là người khởi tạo các khái niệm, và điều này cũng liên quan đến tuyên bố của Efron. Thật khó để nắm bắt chính xác những gì được đóng góp bởi ai.

Trong bài viết đó, Fisher bắt đầu đề cập đến vấn đề áp dụng các thuật ngữ như 'trung bình' và 'phương sai' cho cả giá trị phân phối thực cũng như giá trị ước tính.

(Tôi sẽ cố gắng tránh đưa Fisher vào một nơi nào đó trong 'trường học' như người thường xuyên hoặc Bayesian. Tôi nói rằng anh ta chỉ 'đủ' thực tế cho bất kỳ câu hỏi nào trong tầm tay).

Khái niệm nâng cao

Trong công việc tiếp theo, Fisher đã phát triển các khái niệm ban đầu về phân tích phân biệt tuyến tính :

X= =λ1x1+λ2x2+λ3x3+λ4x4

Việc sử dụng nhiều phép đo trong các vấn đề phân loại, 1936

và khái niệm ước tính theo khả năng mà Fisher khám phá thêm, và có hai khái niệm được đặt theo tên ông, thông tin của Fisher và điểm số của Fisher . Xem Lý thuyết ước lượng thống kê, 1925 , Hai tính chất mới của khả năng toán học, 1934Logic của suy luận quy nạp, 1935 .

Thêm liên kết:

  • Hướng dẫn RA Fisher , bởi John Aldrich. Một nguồn khổng lồ, nếu không phải là lớn nhất, với thông tin về Fisher, với nhiều tài liệu tham khảo thêm.
  • Câu trả lời của Michael Hardy trên Mathoverflow về câu hỏi về các nhà toán học vĩ đại nhất: /mathpro//a/173374

Viết bởi StackExchangeStrike


Cảm ơn bạn @Martijn! Tôi đã xem qua câu trả lời của bạn và thực hiện các chỉnh sửa nhỏ ở đây và đó, chủ yếu là để làm cho định dạng rõ ràng hơn và để sửa một số lỗi chính tả. Tôi hy vọng bạn sẽ không phiền. Tôi rất vui khi được thưởng tiền thưởng của mình cho câu trả lời này; đóng góp rất tốt. Thật tuyệt vời khi có tất cả các tài liệu tham khảo này.
amip nói rằng Phục hồi lại

Hoàn toàn không phải là những chỉnh sửa tuyệt vời, đó là lý do tại sao tôi tạo ra cộng đồng wiki. Đây là một câu hỏi lớn để trả lời. Mặc dù tôi là một fan hâm mộ lớn của Fisher và đã xem qua một số bài viết của anh ấy, tôi cảm thấy như mình không nên trả lời câu hỏi (đã tải) này.
Sextus Empiricus

Tôi đã quảng cáo câu trả lời của bạn trong cuộc trò chuyện của chúng tôi và bây giờ tôi thấy rằng nó đã trở thành câu trả lời được đánh giá cao nhất trong chủ đề này. Tôi nghĩ rằng nó cũng xứng đáng.
amip nói rằng Phục hồi lại

8

Một số khái niệm ông đã phát minh ra: Tính hiệu quả, hiệu quả, ANOVA, tính phụ trợ, giá trị p và có thể là một loạt các thứ khác (quan trọng nhất là thiết kế các thí nghiệm).

Hàm khả năng và mle's có tiền thân, nhưng đã được anh ta phổ biến.


9
+1 Trong khi Fisher chắc chắn sẽ nhận được tín dụng liên quan đến nó, khái niệm giá trị p dường như đã tồn tại, ít nhất là không chính thức, trước khi làm việc của FIsher. Pearson đang tính toán rõ ràng các giá trị p trong bài báo năm 1900 về mức độ phù hợp chi bình phương của kiểm tra mức độ phù hợp và xử lý những gì anh ta tính toán (nếu chỉ được mô tả trong việc thông qua), như thể đó là điều hiển nhiên, được chấp nhận. Người ta có ấn tượng rằng nó không được xem là một khái niệm mới được giới thiệu trong bài báo đó. Tất nhiên những điều tương tự có thể được nói về nhiều khái niệm ... chúng thường "ở quanh" một thời gian trước khi ai đó chính thức hóa nó.
Glen_b -Reinstate Monica

8

Ngài Ronald Aylmer Fisher được ghi nhận cho nhiều khía cạnh của thiết kế thí nghiệm và lý thuyết và thực hành thống kê hiện đại. Một số đóng góp quan trọng nhất của ông bao gồm thử nghiệm ý nghĩa (Bandyopadhyay và Cherry 2011), ước tính khả năng tối đa (MLE), phân phối hoán vị (lấy mẫu lại), tính đầy đủ, lý thuyết tối ưu tiệm cận (Efron 1998), và các thành phần thiết kế thử nghiệm bao gồm ngẫu nhiên, sao chép, chặn, gây nhiễu và phân tích phương sai (ANOVA). Cũng cần lưu ý là sự tranh giành của ông về thí nghiệm Pea Plant của Mendel. Ông tuyên bố nó là "quá tốt là đúng."

Hãy xem xét việc đọc bài báo của Efron (1998), "RA Fisher trong thế kỷ 21". Hãy để tôi trích dẫn tóm tắt:

Fisher là nhân vật quan trọng nhất trong thống kê thế kỷ 20. Bài nói chuyện này xem xét ảnh hưởng của ông đối với tư duy thống kê hiện đại, cố gắng dự đoán Ngư dân chúng ta có thể mong đợi thế kỷ 21 sẽ như thế nào. Triết lý của Fisher được đặc trưng bởi một loạt các thỏa hiệp sắc sảo giữa quan điểm của người Bayes và người thường xuyên, được tăng cường bởi một số đặc điểm độc đáo đặc biệt hữu ích trong các vấn đề được áp dụng. Một số chủ đề nghiên cứu hiện tại được kiểm tra với tầm nhìn về ảnh hưởng của Ngư dân, hoặc thiếu nó, và điều này báo hiệu cho sự phát triển thống kê trong tương lai. Dựa trên bài giảng Fisher năm 1996, bài viết theo sát văn bản của bài nói chuyện đó.

Người giới thiệu

  • Bandyopadhyay, Prasanta S. và Steve Cherry. "Xác suất và thống kê cơ bản: Một mồi." Triết lý thống kê 7 (2011): 53.

  • Efron, Bradley. " RA Fisher trong thế kỷ 21. " Khoa học thống kê (1998): 95-114.


1
Phiên bản thử nghiệm quan trọng của ông là suy luận nhiệt tình đã gây tranh cãi và không được chấp nhận theo cách mà lý thuyết Neyman-Pearson đã có. Những đóng góp khác là hoành tráng và là một phần của nền tảng của thống kê.
Michael R. Chernick

3
Vâng, suy luận fiducial dường như đang tìm thấy một số người hâm mộ bây giờ. Tôi lưu ý rằng không ai đã đề cập đến Thông tin của Fisher, tuy nhiên, cũng như các hướng dẫn hữu ích như "Bạn phân tích là ngẫu nhiên của bạn."
Bjorn

Bjorn - vâng, chắc chắn đã bỏ lỡ phần Thông tin của Fisher. Có lẽ bởi vì tôi đã sao chép văn bản này từ một bài báo mà tôi đang viết lại: thông tin về cá. Hà!
Jessica Burnett
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.