Nguồn gốc của ngưỡng 5 ngưỡng để chấp nhận bằng chứng trong vật lý hạt?


33

Các báo cáo tin tức nói rằng Cern sẽ thông báo vào ngày mai rằng boson Higgs đã được phát hiện bằng thực nghiệm với 5 bằng chứng . Theo bài báo đó:σ

5 tương đương với 99.99994% cơ hội dữ liệu mà các máy dò CMS và ATLAS đang nhìn thấy không chỉ là tiếng ồn ngẫu nhiên - và khả năng là 0,00006% mà chúng bị che khuất; 5 là sự chắc chắn cần thiết để một cái gì đó được chính thức gắn nhãn là một khám phá khoa học.σσ

Điều này không quá nghiêm ngặt, nhưng dường như các nhà vật lý sử dụng phương pháp thống kê "kiểm định giả thuyết" tiêu chuẩn, đặt thành , tương ứng với (hai đuôi)? Hoặc có một số ý nghĩa khác?0.0000006 z = 5α0.0000006z=5

Trong phần lớn khoa học, tất nhiên, việc đặt alpha thành 0,05 được thực hiện thường xuyên. Đây sẽ là tương đương với "hai " bằng chứng, mặc dù tôi chưa bao giờ nghe nói về nó được gọi đó. Có các lĩnh vực khác (ngoài vật lý hạt) trong đó một định nghĩa chặt chẽ hơn nhiều về alpha là tiêu chuẩn? Bất cứ ai biết một tài liệu tham khảo cho cách five- σ quy tắc đã được chấp nhận bởi vật lý hạt?σσ

Cập nhật: Tôi đang hỏi câu hỏi này vì một lý do đơn giản. Cuốn sách của tôi Trực quan sinh học (giống như hầu hết các sách thống kê) có một phần giải thích quy tắc "P <0,05" thông thường như thế nào. Tôi muốn thêm ví dụ này của một lĩnh vực khoa học, nơi một nhiều (nhiều!) Giá trị nhỏ hơn của được coi là cần thiết. Nhưng nếu ví dụ thực sự phức tạp hơn, với việc sử dụng các phương pháp Bayes (như một số ý kiến ​​dưới đây cho thấy), thì nó sẽ không hoàn toàn thích hợp hoặc sẽ cần nhiều lời giải thích hơn.α


2
Bạn đã từng nghe về "Six Sigma" chưa?
Daniel R Hicks

Trong kiểm soát chất lượng, sáu sigma được coi là Daniel gợi ý với câu hỏi / nhận xét của mình. Tất cả các xác suất loại bỏ này đều giả định lấy mẫu từ một phân phối bình thường và xác suất đuôi có thể lớn hơn đối với các phân phối khác. Sử dụng các thái cực như 5 hoặc 6 sigma chỉ có thể hữu ích trong các trường hợp đặc biệt. Trong thực tế, cỡ mẫu và độ biến thiên của dữ liệu làm cho suy luận vượt quá 2 hoặc 3 sigma không khả thi.
Michael R. Chernick

1
Về cơ bản, hầu hết các nhà vật lý hạt thoải mái hơn với các ý tưởng bayes khi tính toán các tham số, vì vậy họ thực sự " chắc chắn , đưa ra dữ liệu và các linh mục, rằng tín hiệu của hạt Higgs không bằng 0", điều này chắc chắn khác với việc nói rằng có chỉ là "0,01 phần trăm khả năng tín hiệu là nhiễu ngẫu nhiên" (cũng có những dao động không ngẫu nhiên phát sinh từ hệ thống!). [1]: Phys.stackexchange.com/questions/8752/ từX%
Néstor

3
@ Néstor: Tôi đang xem chương trình phát sóng trực tiếp của cuộc họp báo Higgs và không ai nhắc đến những diễn giải của Bayes. "Giá trị p" và "mức ý nghĩa" được sử dụng, nhưng chỉ có thông tin sai lệch khủng khiếp Bayesian sẽ hiểu những điều đó là xác suất mà tín hiệu là nhiễu ngẫu nhiên. Tôi nghĩ rằng văn bản trong trích dẫn trong câu hỏi của OP chỉ đơn giản là giải thích sai về giá trị p thực sự là gì.
MånsT

1
BTW Tôi đã làm một bài đăng trên blog của mình về vấn đề này: Randomastronomy.wordpress.com .
Néstor

Câu trả lời:


13

Trong hầu hết các ứng dụng thống kê đều có hạt dẻ cũ về 'tất cả các mô hình đều sai, một số là hữu ích'. Đây là trường hợp, chúng tôi chỉ mong đợi một mô hình sẽ thực hiện ở một mức nhất định vì chúng tôi đang mô tả một quá trình cực kỳ phức tạp bằng cách sử dụng một số mô hình đơn giản.

Vật lý rất khác nhau, do đó trực giác được phát triển từ các mô hình thống kê không phù hợp lắm. Trong Vật lý, đặc biệt là vật lý hạt liên quan trực tiếp đến các định luật vật lý cơ bản, mô hình thực sự được coi là một mô tả chính xác của thực tế. Bất kỳ sự khởi đầu nào từ những gì mô hình dự đoán phải được giải thích hoàn toàn bằng tiếng ồn thử nghiệm, không phải là giới hạn của mô hình. Điều này có nghĩa là nếu mô hình tốt và chính xác và bộ máy thử nghiệm hiểu được ý nghĩa thống kê sẽ rất cao, do đó thanh cao được đặt.

Lý do khác là lịch sử, cộng đồng vật lý hạt đã bị đốt cháy trong quá khứ bởi 'những khám phá' ở mức độ quan trọng thấp hơn sau đó được rút lại, do đó chúng thường thận trọng hơn bây giờ.


1
Bạn có đồng ý rằng vật lý sử dụng thử nghiệm giả thuyết thống kê tiêu chuẩn với chỉ số alpha rất thấp (trong trường hợp này, dù sao đi nữa). Hay họ sử dụng một số cách tiếp cận Bayes như Nestor đã nói trong một bình luận ở trên?
Harvey Motulsky

2
Sự hiểu biết của tôi từ việc nói chuyện với một số người mà tôi biết, những người làm việc trên ATLAS là phân tích tất cả đều rất Bayes. Tuy nhiên, họ là những người cấp thấp hơn (tức là những người thực sự làm việc). Tôi sẽ không ngạc nhiên nếu một số người nói chuyện cao hơn trong chuỗi có khả năng giải thích kém hơn. Điều đó đang được nói, việc trình bày kết quả LHC là khá kém, và không thực sự đi qua rất Bayes, như những người khác đã lưu ý.
Bogdanovist

2
Tôi đã luôn nghĩ rằng vật lý hạt nói riêng cũng xử lý hàng tỷ sự kiện, vì vậy bạn phải đặt thanh rất cao.
Wayne

11

Lịch sử và nguồn gốc

Theo Robert D Cousins 1 và Tommaso Dorigo 2 , nguồn gốc của 5 σ dối ngưỡng gốc trong công tác vật lý hạt đầu của thập niên 60 khi nhiều biểu đồ thí nghiệm tán xạ đã được nghiên cứu và tìm kiếm đỉnh / va chạm có thể cho biết một số hạt mới được phát hiện . Ngưỡng là một quy tắc thô để tính đến nhiều so sánh đang được thực hiện.125σ

Cả hai tác giả đều đề cập đến một bài báo năm 1968 từ Rosenfeld 3 , trong đó đề cập đến câu hỏi liệu có hay không có meson và baryon, trong đó có khoảng 4 σ hiệu ứng được đo. Bài báo đã trả lời câu hỏi tiêu cực bằng cách lập luận rằng số lượng khiếu nại được công bố tương ứng với số lượng biến động dự kiến ​​thống kê. Cùng với một số tính toán hỗ trợ lập luận này bài viết khuyến khích việc sử dụng các 5 σ mức:34σ5σ

Rosenfeld: "Trước khi chúng tôi tiếp tục khảo sát xa-out phổ thứ cấp, nơi va chạm mạnh đã được báo cáo trong (Kππ)3/2,(πρ) chúng ta nên đầu tiên quyết định những gì ngưỡng có ý nghĩa với nhu cầu vào năm 1968. Tôi muốn để cho bạn thấy rằng mặc dù các nhà thực nghiệm có lẽ nên lưu ý 3σ -effects, lý thuyết và hiện tượng học sẽ làm tốt hơn để chờ đợi cho đến khi đạt hiệu quả >4σ ."

và sau này trong bài báo (nhấn mạnh là của tôi)

4σ3σ5σ

Tommaso dường như cẩn thận khi nói rằng nó bắt đầu với bài báo Rosenfeld

Tommaso: "Tuy nhiên, chúng tôi cần lưu ý rằng bài báo được viết vào năm 1968, nhưng tiêu chí nghiêm ngặt về năm độ lệch chuẩn cho tuyên bố khám phá đã không được áp dụng vào những năm bảy mươi và tám mươi. Ví dụ, không có tiêu chí nào như tiêu chí năm sigma được sử dụng cho việc phát hiện ra các boson W và Z, đã mang lại cho Rubbia và Van der Meer giải thưởng Nobel về vật lý năm 1984. "

5σ4

Schneider: "Thông thường, 'mức độ tin cậy' 95% hoặc 99% được trích dẫn cho dữ liệu khác biệt rõ ràng, nhưng điều này chỉ có hai hoặc ba sigmas thống kê. Tôi được dạy không nên tin bất cứ điều gì dưới năm sigma , nếu bạn nghĩ về nó là một yêu cầu nghiêm ngặt vô lý --- một cái gì đó giống như mức độ tin cậy 99,9999%. Nhưng tất nhiên, giới hạn như vậy được sử dụng vì kích thước thực tế của sigma gần như không bao giờ được biết. Có quá nhiều biến số miễn phí trong thiên văn học mà chúng ta có thể Không kiểm soát hay không biết về. "

4σ5σ5

Franklin: Đến năm 2003, tiêu chí 5 độ lệch chuẩn cho "quan sát" dường như đã có hiệu lực

...

Một thành viên của cộng tác BaBar nhớ lại rằng vào thời điểm này, tiêu chí 5 sigma đã được ban hành như một hướng dẫn của các biên tập viên của Thư đánh giá vật lý


Sử dụng hiện đại

5σ67

Z=55σ2.87×107

5σ

  • 5σ3σ4σ

  • 5σ

  • σσσ6σ

  • 5σ

5σ8,912


Các lĩnh vực khác

Thật thú vị khi lưu ý rằng nhiều lĩnh vực khoa học khác không có ngưỡng tương tự hoặc bằng cách nào đó, không giải quyết vấn đề này. Tôi tưởng tượng điều này có ý nghĩa một chút trong trường hợp thí nghiệm với con người, nơi rất tốn kém (hoặc không thể) để mở rộng một thử nghiệm có ý nghĩa 0,05 hoặc 0,01.

1011


  1. Anh em họ, RD (2017). Nghịch lý Jeffreys của Lindre và tiêu chí khám phá trong vật lý năng lượng cao. Synthese, 194 (2), 395-432. liên kết arxiv

  2. Dorigo, T. (2013) làm sáng tỏ Tiêu chí Năm Sigma, từ khoa học20.com 2019-03-07

  3. Rosenfeld, AH (1968). Có bất kỳ meson hoặc baryon xa? nguồn web: học bổng

  4. Burbidge, G., Roberts, M., Schneider, S., Sharp, N., & Tifft, W. (1990, tháng 11). Thảo luận nhóm: Redshift vấn đề liên quan. Trong ấn phẩm hội nghị của NASA (Tập 3098, trang 462). liên kết đến bản sao trên harvard.edu

  5. Franklin, A. (2013). Các tiêu chuẩn thay đổi: Các thí nghiệm trong vật lý hạt trong thế kỷ XX. Nhà xuất bản Đại học Pittsburgh.

  6. 5 sigma có nghĩa là gì? từ vật lý.org 2019-03-07

  7. Beringer, J., Arguin, JF, Barnett, RM, Copic, K., Dahl, O., Groom, DE, ... & Yao, WM (2012). Ôn tập vật lý hạt. Đánh giá vật lý D-Hạt, Lĩnh vực, Trọng lực và Vũ trụ học, 86 (1), 010001. (phần 36.2.2. Các xét nghiệm quan trọng, trang 394, liên kết aps.org )

  8. Lyons, L. (2013). Khám phá ý nghĩa của 5 sigma. bản in sẵn arXiv arXiv: 1310.1284. liên kết arxiv

  9. Lyons, L. (2014). Các vấn đề thống kê trong tìm kiếm vật lý mới. arXiv in sẵn liên kết arxiv

  10. Baker, M. (2015). Hơn một nửa các nghiên cứu tâm lý thất bại kiểm tra khả năng sinh sản. Tin tức thiên nhiên. từ thiên nhiên.com 2019-03-07

  11. Horton, R. (2015). Ngoại tuyến: 5 sigma của thuốc là gì ?. The Lancet, 385 (9976), 1380. từ thelancet.com 2019-03-07


4

Vì một lý do hoàn toàn khác với vật lý, có những lĩnh vực khác với bảng chữ cái nghiêm ngặt hơn nhiều khi chúng tham gia vào thử nghiệm giả thuyết. Dịch tễ di truyền là một trong số đó, đặc biệt là khi họ sử dụng "GWAS" (Nghiên cứu của Hiệp hội toàn bộ bộ gen) để xem xét các dấu hiệu di truyền khác nhau cho bệnh.

Bởi vì một nghiên cứu GWAS là một đồ sộ tập thể dục trong nhiều thử nghiệm giả thuyết, nhà nước-of-the-art kỹ thuật phân tích đều xây dựng xung quanh nhiều nghiêm ngặt hơn bản alpha hơn 0,05. Các kỹ thuật nghiên cứu "sàng lọc ứng cử viên" khác theo sau các nghiên cứu về bộ gen có thể sẽ làm điều tương tự.


2
α

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.