Tôi có ba liên kết / đối số hỗ trợ hỗ trợ ngày ~ 1600-1650 cho các thống kê được phát triển chính thức và sớm hơn nhiều cho việc sử dụng xác suất.
Nếu bạn chấp nhận kiểm tra giả thuyết làm cơ sở, dự đoán xác suất, thì Từ điển Từ nguyên Trực tuyến cung cấp điều này:
" Giả thuyết (n.)
1590s, "một tuyên bố cụ thể;" Những năm 1650, "một đề xuất, được thừa nhận và được chấp nhận, được sử dụng làm tiền đề", từ giả thuyết Trung Pháp và trực tiếp từ giả thuyết Latinh muộn, từ giả thuyết Hy Lạp "cơ sở, nền tảng, nền tảng", do đó được sử dụng mở rộng "cơ sở của một lập luận, giả sử, "nghĩa đen là" đặt dưới ", từ hypo-" dưới "(xem hypo-) + luận án" đặt, mệnh đề "(từ dạng lặp lại của gốc PIE * dhe-" để đặt, đặt "). Một thuật ngữ trong logic; ý nghĩa khoa học hẹp hơn là từ những năm 1640. ".
Wiktionary cung cấp:
"Được ghi nhận từ năm 1596, từ giả thuyết Trung Pháp, từ giả thuyết Latinh muộn, từ Hy Lạp cổ đại ὑὑόθεσς, (hupóthesis, cơ sở của cơ sở của một cuộc tranh luận, giả sử,) trước đó, đề nghị một), từ ὑπό (hupó, hạ bên dưới) + τίθημι (títhēmi, Hồi tôi đặt, đặt ra).
Giả thuyết danh từ (giả thuyết số nhiều)
(khoa học) Được sử dụng một cách lỏng lẻo, một phỏng đoán dự kiến giải thích một quan sát, hiện tượng hoặc vấn đề khoa học có thể được kiểm tra bằng cách quan sát, điều tra và / hoặc thử nghiệm thêm. Là một thuật ngữ khoa học của nghệ thuật, xem trích dẫn đính kèm. So sánh với lý thuyết, và trích dẫn được đưa ra ở đó. trích dẫn
2005, Ronald H. Pine, http://www.csicop.org/specialarticles/show/intellect_design_or_no_model_creationism , 15 tháng 10 năm 2005:
Có quá nhiều người trong chúng ta đã được dạy ở trường rằng một nhà khoa học, trong quá trình cố gắng tìm ra điều gì đó, trước tiên sẽ đưa ra một "giả thuyết" (một phỏng đoán hoặc phỏng đoán không nhất thiết là một phỏng đoán "có giáo dục"). ... [Nhưng t] ông từ "giả thuyết" nên được sử dụng, trong khoa học, dành riêng cho một lời giải thích hợp lý, hợp lý, hiểu biết về lý do tại sao một số hiện tượng tồn tại hoặc xảy ra. Một giả thuyết có thể chưa được kiểm chứng; có thể đã được thử nghiệm; có thể đã bị làm sai lệch; có thể chưa bị làm sai lệch, mặc dù đã được thử nghiệm; hoặc có thể đã được thử nghiệm trong vô số cách mà không bị làm sai lệch; và nó có thể được chấp nhận rộng rãi bởi cộng đồng khoa học. Một sự hiểu biết về từ "giả thuyết", như được sử dụng trong khoa học, đòi hỏi phải nắm bắt các nguyên tắc cơ bản của Occam ' s Suy nghĩ của dao cạo và Karl Popper liên quan đến "giả mạo" - bao gồm cả quan niệm rằng bất kỳ giả thuyết khoa học đáng kính nào, về nguyên tắc, phải "có khả năng" được chứng minh là sai (trên thực tế, nếu nó chỉ xảy ra là sai), nhưng không ai có thể được chứng minh là đúng Một khía cạnh của một sự hiểu biết đúng đắn về từ "giả thuyết", như được sử dụng trong khoa học, là chỉ một tỷ lệ nhỏ các giả thuyết có thể trở thành một lý thuyết.
Về xác suất và thống kê Wikipedia cung cấp:
" Thu thập dữ liệu
Lấy mẫu
Khi dữ liệu điều tra dân số đầy đủ không thể được thu thập, các nhà thống kê thu thập dữ liệu mẫu bằng cách phát triển các thiết kế thí nghiệm cụ thể và mẫu khảo sát. Thống kê cũng cung cấp các công cụ để dự đoán và dự báo thông qua các mô hình thống kê. Ý tưởng thực hiện các suy luận dựa trên dữ liệu được lấy mẫu bắt đầu vào khoảng giữa những năm 1600 liên quan đến việc ước tính dân số và phát triển tiền thân của bảo hiểm nhân thọ . (Tham khảo: Wolfram, Stephen (2002). Một loại khoa học mới. Wolfram Media, Inc. trang 1082. ISBN 1-57955-008-8).
Để sử dụng một mẫu làm hướng dẫn cho toàn bộ dân số, điều quan trọng là nó thực sự đại diện cho toàn bộ dân số. Lấy mẫu đại diện đảm bảo rằng các kết luận và kết luận có thể mở rộng một cách an toàn từ toàn bộ mẫu đến toàn bộ dân số. Một vấn đề lớn nằm ở việc xác định mức độ mà mẫu được chọn thực sự là đại diện. Thống kê cung cấp các phương pháp để ước tính và sửa chữa cho bất kỳ sai lệch nào trong quy trình thu thập dữ liệu và mẫu. Ngoài ra còn có các phương pháp thiết kế thử nghiệm cho các thí nghiệm có thể làm giảm các vấn đề này ngay từ đầu của một nghiên cứu, tăng cường khả năng của nó để phân biệt sự thật về dân số.
Lý thuyết lấy mẫu là một phần của môn học toán học của lý thuyết xác suất. Xác suất được sử dụng trong thống kê toán học để nghiên cứu phân phối mẫu của thống kê mẫu và, nói chung, các tính chất của quy trình thống kê. Việc sử dụng bất kỳ phương pháp thống kê nào là hợp lệ khi hệ thống hoặc dân số được xem xét thỏa mãn các giả định của phương pháp. Sự khác biệt về quan điểm giữa lý thuyết xác suất cổ điển và lý thuyết lấy mẫu là, gần như, lý thuyết xác suất đó bắt đầu từ các tham số đã cho của tổng dân số để suy ra xác suất liên quan đến các mẫu. Tuy nhiên, suy luận thống kê di chuyển theo hướng ngược lại - suy diễn theo quy nạp từ các mẫu đến các tham số của dân số lớn hơn hoặc tổng .
Từ "Wolfram, Stephen (2002). Một loại khoa học mới. Wolfram Media, Inc. trang 1082.":
" Phân tích thống kê
• Lịch sử. Một số tính toán tỷ lệ cược cho các trò chơi may rủi đã được thực hiện trong thời cổ đại. Bắt đầu từ khoảng những năm 1200, các kết quả ngày càng phức tạp dựa trên bảng liệt kê xác suất kết hợp đã thu được bởi các nhà thần bí học và toán học, với các phương pháp đúng đắn được phát triển vào giữa những năm 1600 và đầu những năm 1700. Ý tưởng tạo ra các kết luận từ dữ liệu được lấy mẫu xuất hiện vào giữa những năm 1600 liên quan đến việc ước tính dân số và phát triển tiền thân của bảo hiểm nhân thọ. Phương pháp lấy trung bình để sửa cho những gì được cho là lỗi quan sát ngẫu nhiên bắt đầu được sử dụng, chủ yếu trong thiên văn học, vào giữa những năm 1700, trong khi các hình vuông nhỏ nhất phù hợp và khái niệm phân phối xác suất được thiết lập vào khoảng năm 1800. Các mô hình xác suất dựa trên các biến thể ngẫu nhiên giữa các cá nhân bắt đầu được sử dụng trong sinh học vào giữa những năm 1800, và nhiều phương pháp cổ điển hiện được sử dụng để phân tích thống kê đã được phát triển vào cuối những năm 1800 và đầu những năm 1900 trong bối cảnh nghiên cứu nông nghiệp. Trong vật lý, các mô hình xác suất cơ bản là trọng tâm của sự ra đời của cơ học thống kê vào cuối những năm 1800 và cơ học lượng tử vào đầu những năm 1900.
Những nguồn khác:
"Báo cáo này, chủ yếu là các thuật ngữ phi toán học, xác định giá trị p, tóm tắt nguồn gốc lịch sử của phương pháp giá trị p để kiểm tra giả thuyết, mô tả các ứng dụng khác nhau của p≤0,05 trong bối cảnh nghiên cứu lâm sàng và thảo luận về sự xuất hiện của p≤ 5 × 10−8 và các giá trị khác làm ngưỡng cho các phân tích thống kê bộ gen. "
Phần "Nguồn gốc lịch sử" nêu rõ:
[1]
[1]. Arbuthnott J. Một cuộc tranh luận về Providence thần thánh, được lấy từ sự đều đặn quan sát thường xuyên trong sự ra đời của cả hai giới. Phil Trans 1710; 27: 186 Từ90. doi: 10.1098 / rstl.1710.0011 xuất bản ngày 1 tháng 1 năm 1710
1–45–78910,11
Tôi sẽ chỉ cung cấp bảo vệ giới hạn giá trị P. ... ".
Tài liệu tham khảo
1 Hald A. A history of probability and statistics and their appli- cations before 1750. New York: Wiley, 1990.
2 Shoesmith E, Arbuthnot, J. In: Johnson, NL, Kotz, S, editors. Leading personalities in statistical sciences. New York: Wiley, 1997:7–10.
3 Bernoulli, D. Sur le probleme propose pour la seconde fois par l’Acadamie Royale des Sciences de Paris. In: Speiser D,
editor. Die Werke von Daniel Bernoulli, Band 3, Basle:
Birkhauser Verlag, 1987:303–26.
4 Arbuthnot J. An argument for divine providence taken from
the constant regularity observ’d in the births of both sexes. Phil Trans R Soc 1710;27:186–90.
5 Freeman P. The role of P-values in analysing trial results. Statist Med 1993;12:1443 –52.
6 Anscombe FJ. The summarizing of clinical experiments by
significance levels. Statist Med 1990;9:703 –8.
7 Royall R. The effect of sample size on the meaning of signifi- cance tests. Am Stat 1986;40:313 –5.
8 Senn SJ. Discussion of Freeman’s paper. Statist Med
1993;12:1453 –8.
9 Gardner M, Altman D. Statistics with confidence. Br Med J
1989.
10 Matthews R. The great health hoax. Sunday Telegraph 13
September, 1998.
11 Matthews R. Flukes and flaws. Prospect 20–24, November 1998.
@Martijn Weterings : "Pearson năm 1900 đã hồi sinh hay đã làm khái niệm (thường xuyên) này xuất hiện trước đó? có nhiều nguồn hơn)?
Hiệp hội Thống kê Hoa Kỳ có một trang web về Lịch sử Thống kê , cùng với thông tin này, có một poster (được sao chép ở phần bên dưới) có tiêu đề "Dòng thời gian thống kê".
QUẢNG CÁO 2: Bằng chứng về một cuộc điều tra dân số đã hoàn thành trong thời kỳ nhà Hán còn tồn tại.
1500s: Girolamo Cardano tính toán xác suất của các cuộn súc sắc khác nhau.
1600s: Edmund Halley liên quan đến tỷ lệ tử vong theo tuổi và phát triển các bảng tỷ lệ tử vong.
Những năm 1700: Thomas Jefferson chỉ đạo Tổng điều tra dân số Hoa Kỳ đầu tiên.
1839: Hiệp hội thống kê Hoa Kỳ được thành lập.
1894: Thuật ngữ độ lệch chuẩn tiêu chuẩn, được giới thiệu bởi Karl Pearson.
1935: RA Fisher xuất bản Thiết kế thí nghiệm.
Trong phần "Lịch sử" trên trang web " Luật số lượng lớn " của Wikipedia, nó giải thích:
"Nhà toán học người Ý Gerolamo Cardano (1501 Từ1576)tuyên bố mà không có bằng chứng rằng tính chính xác của thống kê thực nghiệm có xu hướng cải thiện với số lượng thử nghiệm. Điều này sau đó đã được chính thức hóa như là một luật của số lượng lớn. Một dạng đặc biệt của LLN (đối với biến ngẫu nhiên nhị phân) lần đầu tiên được chứng minh bởi Jacob Bernoulli. Ông đã mất hơn 20 năm để phát triển một bằng chứng toán học đủ nghiêm ngặt được xuất bản trong Ars Conjectandi (Nghệ thuật phỏng đoán) vào năm 1713. Ông đặt tên cho nó là "Định lý vàng" nhưng nó thường được gọi là "Định lý Bernoulli". Điều này không nên nhầm lẫn với nguyên tắc của Bernoulli, được đặt theo tên của cháu trai Jacob Bernoulli, Daniel Bernoulli. Năm 1837, SD Poisson đã mô tả thêm về nó dưới cái tên "la loi des grands nombres" ("Định luật về số lượng lớn"). Sau đó, nó được biết đến dưới cả hai tên, nhưng "
Sau khi Bernoulli và Poisson công bố những nỗ lực của họ, các nhà toán học khác cũng góp phần hoàn thiện luật, bao gồm Ch Quashev, Markov, Borel, Cantelli và Kolmogorov và Khinchin. ".
Câu hỏi: "Pearson có phải là người đầu tiên quan niệm về giá trị p không?"
Không, có lẽ là không.
Trong " Tuyên bố của ASA về giá trị p: Bối cảnh, quy trình và mục đích " (09 tháng 6 năm 2016) của Wasserstein và Lazar, doi: 10.1080 / 00031305.2016.1154108 có một tuyên bố chính thức về định nghĩa của giá trị p (không có nghi ngờ không được đồng ý bởi tất cả các nguyên tắc sử dụng hoặc từ chối, giá trị p) có nội dung:
" . Giá trị p là gì?
Một cách không chính thức, giá trị p là xác suất theo mô hình thống kê được chỉ định rằng tóm tắt thống kê của dữ liệu (ví dụ: chênh lệch trung bình mẫu giữa hai nhóm được so sánh) sẽ bằng hoặc cực hơn giá trị quan sát được.
3. Nguyên tắc
...
6. Chính nó, một giá trị p không cung cấp một thước đo tốt về bằng chứng liên quan đến một mô hình hoặc giả thuyết.
Các nhà nghiên cứu nên nhận ra rằng giá trị p không có ngữ cảnh hoặc bằng chứng khác cung cấp thông tin hạn chế. Ví dụ, giá trị p gần 0,05 được lấy bởi chính nó chỉ cung cấp bằng chứng yếu chống lại giả thuyết null. Tương tự, giá trị p tương đối lớn không bao hàm bằng chứng ủng hộ giả thuyết null; nhiều giả thuyết khác có thể đồng nhất hoặc phù hợp hơn với dữ liệu được quan sát. Vì những lý do này, phân tích dữ liệu không nên kết thúc bằng việc tính toán giá trị p khi các phương pháp khác phù hợp và khả thi. ".
Từ chối giả thuyết khống có khả năng xảy ra từ lâu trước Pearson.
Trang Wikipedia về các ví dụ ban đầu về các trạng thái thử nghiệm giả thuyết null :
Lựa chọn sớm của giả thuyết null
Paul Meehl đã lập luận rằng tầm quan trọng nhận thức luận của việc lựa chọn giả thuyết null đã không được kiểm chứng. Khi giả thuyết null được dự đoán bởi lý thuyết, một thí nghiệm chính xác hơn sẽ là một thử nghiệm nghiêm trọng hơn về lý thuyết cơ bản. Khi giả thuyết null mặc định là "không có sự khác biệt" hoặc "không có hiệu lực", một thí nghiệm chính xác hơn là một thử nghiệm ít nghiêm trọng hơn về lý thuyết thúc đẩy thực hiện thí nghiệm. Do đó, việc kiểm tra nguồn gốc của thực hành sau có thể hữu ích:
1778: Pierre Laplace so sánh tỷ lệ sinh của bé trai và bé gái ở nhiều thành phố châu Âu. Ông nói: "thật tự nhiên khi kết luận rằng những khả năng này rất gần với cùng một tỷ lệ". Do đó, giả thuyết khống của Laplace rằng sự ra đời của bé trai và bé gái nên được coi là "sự khôn ngoan thông thường".
1900: Karl Pearson phát triển thử nghiệm chi bình phương để xác định "liệu một dạng đường cong tần số nhất định sẽ mô tả hiệu quả các mẫu được rút ra từ một dân số nhất định hay không." Do đó, giả thuyết khống là một dân số được mô tả bởi một số phân phối được dự đoán bởi lý thuyết. Ông sử dụng như một ví dụ về số lượng năm và sáu trong dữ liệu ném xúc xắc Weldon.
1904: Karl Pearson phát triển khái niệm "dự phòng" để xác định xem kết quả có độc lập với một yếu tố phân loại nhất định hay không. Ở đây, giả thuyết null được mặc định là hai thứ không liên quan (ví dụ hình thành sẹo và tỷ lệ tử vong do bệnh đậu mùa). Giả thuyết khống trong trường hợp này không còn được dự đoán bởi lý thuyết hay trí tuệ thông thường, mà thay vào đó là nguyên tắc thờ ơ khiến Fisher và những người khác bác bỏ việc sử dụng "xác suất nghịch đảo".
Mặc dù bất kỳ một người nào được tín nhiệm vì bác bỏ giả thuyết khống, tôi không nghĩ sẽ hợp lý khi gán cho họ " khám phá về sự hoài nghi dựa trên lập trường toán học yếu".