Có thể là tốt để đọc Điều gì sau đây nếu chúng ta không từ chối giả thuyết null? trước lời giải thích dưới đây.
Thuộc tính mong muốn: sức mạnh
Trong thử nghiệm giả thuyết, mục tiêu là tìm ra 'bằng chứng thống kê' cho . Do đó, chúng tôi có thể mắc lỗi loại I, tức là chúng tôi từ chối (và quyết định rằng có bằng chứng ủng hộ ) trong khi là đúng (tức là là sai). Vì vậy, lỗi loại I là 'tìm bằng chứng sai' cho .H 0 H 1 H 0 H 1 H 1H1H0H1H0H1H1
Một lỗi loại II được tạo ra khi không thể bị từ chối trong khi đó là sai trong thực tế, tức là chúng tôi '' chấp nhận '' và chúng tôi 'bỏ lỡ' bằng chứng cho .H 0 H 1H0H0H1
Xác suất của lỗi loại I được biểu thị bằng , mức ý nghĩa được chọn. Xác suất của lỗi loại II được ký hiệu là và được gọi là sức mạnh của thử nghiệm, đó là xác suất tìm thấy bằng chứng có lợi cho khi là đúng.β 1 - β H 1 H 1αβ1−βH1H1
Trong thử nghiệm giả thuyết thống kê, nhà khoa học sửa ngưỡng trên cho xác suất xảy ra lỗi loại I và dưới sự ràng buộc đó cố gắng tìm một thử nghiệm có công suất tối đa, được đưa ra .α
Các tính chất mong muốn của các thử nghiệm tỷ lệ khả năng phải làm với sức mạnh
Trong thử nghiệm giả thuyết so với giả thuyết null và giả thuyết thay thế được gọi là '' đơn giản '', tức là tham số được cố định theo một giá trị, cũng như dưới như dưới (chính xác hơn; các bản phân phối được xác định đầy đủ). H 1 : θ = θ 1 H 0 H 1H0:θ=θ0H1:θ=θ1H0H1
Các Neyman-Pearson Bổ đề khẳng định rằng, đối với các bài kiểm tra giả thuyết với hypothesises đơn giản, và cho được lỗi khả năng loại I, một bài kiểm tra tỷ lệ khả năng có quyền lực cao nhất. Rõ ràng, công suất cao được cung cấp là một đặc tính mong muốn: sức mạnh là thước đo 'việc tìm kiếm bằng chứng cho dễ dàng như thế nào '.H 1αH1
Khi giả thuyết là hợp chất; ví dụ: so với thì không thể áp dụng bổ đề Neyman-Pearson vì có 'nhiều giá trị trong '. Nếu người ta có thể tìm thấy một thử nghiệm sao cho mạnh mẽ nhất cho mọi giá trị 'theo ' thì thử nghiệm đó được gọi là 'mạnh mẽ nhất' (UMP) (nghĩa là mạnh mẽ nhất cho mọi giá trị trong ).H 1 : θ > θ 1 H 1 H 1 H 1H0:θ=θ1H1:θ>θ1H1H1H1
Có một định lý của Karlin và Rubin đưa ra các điều kiện cần thiết để kiểm tra tỷ lệ khả năng là hoàn toàn mạnh mẽ nhất. Những điều kiện này được điền đầy đủ cho nhiều thử nghiệm một phía (đơn biến).
Vì vậy, tính chất mong muốn của kiểm tra tỷ lệ khả năng nằm ở thực tế là trong một số trường hợp, nó có sức mạnh cao nhất (mặc dù không phải trong tất cả các trường hợp).
Trong hầu hết các trường hợp, không thể hiển thị sự tồn tại của thử nghiệm UMP và trong nhiều trường hợp (đặc biệt là đa biến), có thể chứng minh rằng thử nghiệm UMP không tồn tại. Tuy nhiên, trong một số trường hợp, các thử nghiệm tỷ lệ khả năng được áp dụng do các đặc tính mong muốn của chúng (trong bối cảnh trên), vì chúng tương đối dễ áp dụng, và đôi khi vì không thể xác định các thử nghiệm khác.
Ví dụ, thử nghiệm một phía dựa trên phân phối chuẩn thông thường là UMP.
Trực giác đằng sau bài kiểm tra tỷ lệ khả năng:
Nếu tôi muốn kiểm tra so với thì chúng tôi cần một quan sát xuất phát từ một mẫu. Lưu ý rằng đây là một giá trị duy nhất. H 1 : θ = θ 1 oH0:θ=θ0H1:θ=θ1o
Chúng tôi biết rằng là đúng hoặc là đúng, vì vậy người ta có thể tính xác suất của khi là đúng (hãy gọi nó là ) và xác suất quan sát khi là đúng (gọi là ).H 1 o H 0 L 0 o H 1 L 1H0H1oH0L0oH1L1
Nếu thì chúng tôi có xu hướng tin rằng '' có lẽ là đúng ''. Vì vậy, nếu khẩu phần chúng ta có lý do để tin rằng thực tế hơn . H 1 L 1L1>L0H1H1H0L1L0>1H1H0
Nếu sẽ giống như thì chúng tôi có thể kết luận rằng đó có thể là do tình cờ, vì vậy, để quyết định chúng tôi cần thử nghiệm và do đó, việc phân phối là .. tỷ lệ của hai khả năng. 1.001L1L1L01.001L1L0
Tôi tìm thấy pdf này trên internet.