Bối cảnh
(Trong phần này tôi sẽ giải thích về kiểm tra giả thuyết, gõ một và hai lỗi, v.v., theo phong cách của riêng tôi. Nếu bạn cảm thấy thoải mái với tài liệu này, hãy chuyển sang phần tiếp theo)
Bổ đề Neyman-Pearson xuất hiện trong vấn đề kiểm tra giả thuyết đơn giản . Chúng tôi có hai phân bố xác suất khác nhau trên một không gian chung : và , được gọi là null và giả thuyết thay thế. Dựa trên một quan sát duy nhất , chúng tôi phải đưa ra dự đoán về phân phối xác suất nào trong hai phân phối xác suất có hiệu lực. Một thử nghiệm do đó là một chức năng để mỗi chuyển nhượng đoán của một trong hai "null giả thuyết" hoặc "giả thuyết thay thế". Một thử nghiệm rõ ràng có thể được xác định với khu vực mà nó trả về "thay thế", vì vậy chúng tôi chỉ tìm kiếm các tập hợp con (sự kiện) của không gian xác suất.ΩP0P1w ∈ Ohmwω
Thông thường trong các ứng dụng, giả thuyết null tương ứng với một số loại hiện trạng, trong khi giả thuyết thay thế là một hiện tượng mới mà bạn đang cố chứng minh hoặc bác bỏ là có thật. Ví dụ, bạn có thể đang thử nghiệm ai đó cho sức mạnh tâm linh. Bạn chạy thử nghiệm tiêu chuẩn với các thẻ có dòng nguệch ngoạc hoặc không, và làm cho chúng đoán một số lần nhất định. Giả thuyết khống là họ sẽ nhận được không quá một trong năm quyền (vì có năm thẻ), giả thuyết thay thế là họ là người tâm lý và có thể có nhiều quyền hơn.
Những gì chúng tôi muốn làm là giảm thiểu khả năng mắc lỗi. Thật không may, đó là một khái niệm vô nghĩa. Có hai cách bạn có thể phạm sai lầm. Giả thuyết null là đúng và bạn lấy mẫu trong khu vực "thay thế" của bài kiểm tra của bạn hoặc giả thuyết thay thế là đúng và bạn lấy mẫu khu vực "null". Bây giờ, nếu bạn sửa một vùng của không gian xác suất (một bài kiểm tra), thì các số vàωMộtP0( A )P1( Mộtc), xác suất tạo ra hai loại lỗi đó, hoàn toàn được xác định rõ ràng, nhưng vì bạn không có khái niệm trước về "xác suất giả thuyết không / thay thế là đúng", nên bạn không thể có được xác suất "có ý nghĩa" sai lầm". Vì vậy, đây là một tình huống khá điển hình trong toán học, nơi chúng ta muốn "tốt nhất" của một số loại đối tượng, nhưng khi bạn nhìn kỹ, không có "tốt nhất". Trên thực tế, những gì chúng tôi đang cố gắng làm là giảm thiểu trong khi tối đa hóa , những mục tiêu rõ ràng đối lập nhau.P0( A )P1( A )
Hãy ghi nhớ ví dụ về bài kiểm tra khả năng ngoại cảm, tôi muốn đề cập đến loại sai lầm trong đó null là đúng nhưng bạn kết luận phương án thay thế là đúng là " ảo tưởng " (bạn tin rằng nhà ngoại cảm của anh chàng nhưng anh ta thì không), và loại sai lầm khác là "sự lãng quên ".
Bổ đề
Cách tiếp cận của bổ đề Neyman-Pearson là như sau: chúng ta hãy chọn một số xác suất ảo tưởng tối đa mà chúng ta sẵn sàng chịu đựng, và sau đó tìm thử nghiệm có xác suất tối thiểu của sự lãng quên trong khi thỏa mãn giới hạn trên. Kết quả là các xét nghiệm như vậy luôn có dạng thử nghiệm tỷ lệ khả năng:α
Đề xuất (bổ đề Neyman-Pearson)
Nếu là các hàm khả năng (PDF) của các giả thuyết không và thay thế, và , thì vùng tối đa hóa trong khi duy trì là hình thứcL0, L1α > 0Một ⊆ OhmP1( A )P0( Một ) ≤ alpha
Một = { w ∈ Ohm | L1( ω )L0( ω )≥ K}
với một số hằng số . Ngược lại, đối với mọi , thử nghiệm trên có cho bất kỳ nào sao cho .K> 0 KP1( Một ) ≥ P1( B )BP0( B ) ≤ P0( A )
Do đó, tất cả những gì chúng ta phải làm là tìm hằng số sao cho .KP0( A ) = α
Bằng chứng trên Wikipedia tại thời điểm viết là một bằng chứng toán học khá điển hình, chỉ bao gồm việc phỏng đoán dạng đó và sau đó xác minh rằng nó thực sự tối ưu. Tất nhiên những bí ẩn thực sự là nơi đã làm ý tưởng này lấy một tỷ lệ của các khả năng thậm chí đến từ đâu, và câu trả lời là: tỷ lệ khả năng chỉ đơn giản là mật độ của đối với .P1P0
Nếu bạn đã học được xác suất thông qua cách tiếp cận hiện đại với tích phân Lebesgue và không, thì bạn biết rằng trong các điều kiện khá hạn chế , bạn luôn có thể biểu thị một thước đo xác suất được đưa ra bởi hàm mật độ đối với hàm khác. Trong các điều kiện của Neyman-Pearson lemma, chúng ta có hai biện pháp khả , mà cả hai đều có mật độ tôn trọng đối với một số biện pháp cơ bản, thường là biện pháp đếm trên một không gian rời rạc, hoặc các biện pháp Lebesgue trên với . Hóa ra vì số lượng mà chúng tôi quan tâm kiểm soát là , chúng tôi nên lấy làm thước đo cơ bản và xemP0P1RnP0( A )P0P1về cách nó liên quan đến , do đó, chúng ta xem xét được đưa ra bởi một hàm mật độ đối với với .P0P1P0
Mua đất
Do đó, trái tim của bổ đề là như sau:
Đặt là thước đo trên một số không gian và để là một hàm tích cực, có thể tích hợp trên . Đặt . Sau đó, tập hợp với sẽ tối đa hóa có dạng
cho một số hằng số và ngược lại, bất kỳ tập hợp nào như vậy sẽ tối đa hóa trên tất cả các tập hợp nhỏ hơn chính nó.μΩfΩα > 0Mộtμ ( A ) ≤ α∫Mộtfdμ{ W ∈ Ohm | f( Ω ) ≥ K}
K> 0∫fB
Giả sử bạn đang mua đất. Bạn chỉ có thể đủ khả năng mẫu Anh, nhưng có một chức năng tiện ích trên đất liền, định lượng, chẳng hạn, tiềm năng cho cây trồng phát triển, và do đó bạn muốn có một khu vực tối đa hóa . Sau đó, đề xuất trên nói rằng đặt cược tốt nhất của bạn là về cơ bản đặt mua đất từ hữu ích nhất đến ít hữu ích nhất và mua nó theo thứ tự tốt nhất đến tồi tệ nhất cho đến khi bạn đạt được diện tích tối đa . Trong thử nghiệm giả thuyết, là , và là mật độ của đối với (trong đó, như đã nói, là ).αf∫fαμP0fP1P0L1/ L0
Dưới đây là một bằng chứng dựa trên kinh nghiệm nhanh chóng: ra khỏi một khu vực nhất định của đất , hãy xem xét một số một mét nhỏ bằng gạch vuông một mét, . Nếu bạn có thể tìm thấy một ô có cùng diện tích ở đâu đó bên ngoài , nhưng sao cho tiện ích của lớn hơn , thì rõ ràng không tối ưu, vì nó có thể được cải thiện bằng cách hoán đổi cho . Do đó, một vùng tối ưu phải được "đóng lên trên", nghĩa là nếu và , thì phải ở , nếu không chúng ta có thể làm tốt hơn bằng cách hoán đổiMộtBB'MộtB'BMộtBB'x ∈ Af( y) > f( x )yMộtxvà . Đây là tương đương với nói rằng chỉ đơn giản là đối với một số .yMộtf- 1( [ K, + ∞ ) )K