Hai định nghĩa về giá trị p: làm thế nào để chứng minh tính tương đương của chúng?


11

Tôi đang đọc qua cuốn sách Tất cả các số liệu thống kê của Larry Wasserman và hiện tại về giá trị p (trang 187). Trước tiên tôi xin giới thiệu một số định nghĩa (tôi trích dẫn):

Định nghĩa 1 Hàm công suất của thử nghiệm với vùng loại bỏ được xác định bởi Kích thước của thử nghiệm được xác định là Một bài kiểm tra được cho là có mức \ alpha nếu kích thước của nó nhỏ hơn hoặc bằng \ alpha .R

β(θ)=Pθ(XR)
α=supθΘ0β(θ)
alphaαα

Về cơ bản điều này nói rằng α , kích thước là xác suất "lớn nhất" của lỗi loại I. Giá trị p sau đó được xác định thông qua (tôi trích dẫn)

Định nghĩa 2 Giả sử rằng với mọi α(0,1) chúng ta có một phép thử kích thước α với vùng loại bỏ Rα . Sau đó,

p-value=inf{α:T(Xn)Rα}
trong đó Xn=(X1,,Xn) .

Đối với tôi điều này có nghĩa là: được cung cấp một \ alpha cụ thể, αcó một vùng thử nghiệm và loại bỏ Rα sao cho α=supθΘ0(α)Pθ(T(Xn)Rα) . Đối với giá trị p tôi chỉ cần lấy giá trị nhỏ nhất trong số tất cả các α .

Câu hỏi 1 Nếu đây là trường hợp, thì rõ ràng tôi có thể chọn α=ϵ cho tùy ý nhỏ ϵ . Giải thích sai của tôi về định nghĩa 2, nghĩa là nó chính xác nghĩa là gì?

Bây giờ Wasserman liên tục và nêu một định lý để có định nghĩa "tương đương" về giá trị p mà tôi quen thuộc (tôi trích dẫn):

Định lý Giả sử kích thước test có dạng Sau đó, trong đó là giá trị quan sát của .chối  H 0α p -value = sup θ Θ 0 P θ ( T ( X n ) T ( x n ) ) x n X n

reject H0T(Xn)cα
p-value=supθΘ0Pθ(T(Xn)T(xn))
xnXn

Vì vậy, đây là câu hỏi thứ hai của tôi:

Câu hỏi 2 Làm thế nào tôi thực sự có thể chứng minh định lý này? Có thể đó là do sự hiểu lầm của tôi về định nghĩa của giá trị , nhưng tôi không thể tìm ra nó.p


4
Thật kỳ lạ khi Wasserman sẽ định nghĩa sức mạnh là " ", vì ký hiệu gần như được sử dụng phổ biến cho tỷ lệ lỗi loại II (nghĩa là power = 1- đối với hầu hết mọi tác giả khác đang thảo luận về sức mạnh). Tôi cảm thấy khó có thể tưởng tượng một sự lựa chọn ký hiệu có thể gây ra sự nhầm lẫn tồi tệ hơn ngoại trừ việc cố tình đặt ra để gây ra nó. beta betaβββ
Glen_b -Reinstate Monica

1
Tôi đồng ý rằng điều đó thật kỳ lạ, Glen - tuy nhiên, Casella và Berger cũng làm điều tương tự và theo tôi, tiêu chuẩn vàng cho lý thuyết thống kê.
Matt Brems

Câu trả lời:


6

Chúng tôi có một số dữ liệu đa biến , được rút ra từ một bản phân phối với một số tham số chưa biết . Lưu ý rằng là kết quả mẫu.D θ xxDθx

Chúng tôi muốn kiểm tra một số giả thuyết về một tham số chưa biết , các giá trị của theo giả thuyết null nằm trong tập .q q 0θθθ0

Trong không gian của , chúng ta có thể xác định vùng loại bỏ và sức mạnh của vùng này sau đó được xác định là . Vì vậy, công suất được tính cho một giá trị cụ thể của là xác suất để kết quả mẫu nằm trong vùng loại bỏ khi giá trị của . Rõ ràng sức mạnh phụ thuộc vào vùng và vào .R R P R ˉ q = P ˉ q ( x R ) ˉ q q x R q ˉ q R ˉ qXRRPθ¯R=Pθ¯(xR)θ¯θxR θθ¯Rθ¯

Định nghĩa 1 định nghĩa kích thước của vùngR là tối cao của tất cả các giá trị của cho trong , do đó, chỉ dành cho các giá trị của dưới . Rõ ràng điều này phụ thuộc vào khu vực, vì vậy .Pθ¯Rθ¯θ0θ¯H0αR=supθ¯θ0Pθ¯R

Vì phụ thuộc vào chúng ta có một giá trị khác khi vùng thay đổi và đây là cơ sở để xác định giá trị p: thay đổi vùng, nhưng theo cách mà giá trị quan sát mẫu vẫn thuộc về vùng, cho từng khu vực như vậy, tính toán như định nghĩa ở trên và lấy infimum: . Vì vậy, giá trị p là kích thước nhỏ nhất trong tất cả các vùng có chứa .αRRαRpv(x)=infR|xRαRx

Định lý sau đó chỉ là một "bản dịch" của nó, cụ thể là trường hợp các vùng được xác định bằng cách sử dụng thống kê và với giá trị bạn xác định vùng là . Nếu bạn sử dụng loại vùng trong lý luận trên, thì định lý sau.RTcRR={x|T(x)c}R

EDIT vì ý kiến:

@ user8: cho định lý; nếu bạn định nghĩa các vùng loại bỏ như trong định lý, thì vùng loại bỏ kích thước là một tập hợp trông giống như cho một số .αRα={X|T(X)cα}cα

Để tìm giá trị p của giá trị quan sát , tức là bạn phải tìm vùng nhỏ nhất , tức là giá trị lớn nhất của sao cho vẫn chứa , cái sau (vùng chứa ) tương đương (vì cách xác định vùng) để nói rằng , vì vậy bạn phải tìm lớn nhất sao choxpv(x)Rc{X|T(X)c} xxcT(x)c{X|T(X)c&cT(x)}

Rõ ràng, lớn nhất sao cho phải là và sau đó supra đã đặt trở thànhccT(x)c=T(x){X|T(X)c=T(x)}={X|T(X)T(x)}


Rất cám ơn câu trả lời của bạn. Đối với câu hỏi về việc xác thực định lý: Không có cách nào đó thiếu over ? infα
toán

@ user8: Tôi đã thêm một đoạn ở cuối câu trả lời của tôi, bạn thấy điểm nào với điểm tối thiểu bây giờ chưa?

7

Trong Định nghĩa 2, giá trị của thống kê kiểm tra là giới hạn dưới lớn nhất của tất cả sao cho giả thuyết bị từ chối để kiểm tra kích thước . Nhớ lại rằng nhỏ hơn chúng ta thực hiện , càng ít khoan dung đối với loại I lỗi chúng tôi đang cho phép, do đó từ chối khu vực cũng sẽ giảm. Vì vậy, (rất) nói không chính thức, các -giá trị là nhỏ nhất chúng ta có thể chọn mà vẫn cho phép chúng ta từ chối cho các dữ liệu mà chúng tôi quan sát. Chúng ta không thể tùy ý chọn một nhỏ hơn bởi vì tại một số điểm,pαααRαpαH0αRα sẽ nhỏ đến mức nó sẽ loại trừ (nghĩa là không chứa) sự kiện chúng ta quan sát được.

Bây giờ, dưới ánh sáng của những điều trên, tôi mời bạn xem xét lại định lý.


Tôi vẫn còn một chút bối rối. Vậy trước tiên, trong định nghĩa là thống kê cố định cho tất cả ? Tôi không đồng ý với tuyên bố của bạn: "... tại một số điểm, sẽ nhỏ đến mức sẽ loại trừ (nghĩa là không thể chứa) sự kiện chúng tôi quan sát được." Hoàn toàn ổn, nếu nhỏ đến mức không chứa mẫu được quan sát, chúng tôi không từ chối . Vấn đề với điều này là gì? cảm ơn sự giúp đỡ / kiên nhẫn của bạn2TαRαRαH0
toán

Đúng. Thống kê kiểm tra là một hàm cố định được xác định trước của mẫu, trong đó "cố định" theo nghĩa này có nghĩa là dạng của hàm không thay đổi đối với bất kỳ . Giá trị cần có có thể (và nên) phụ thuộc vào mẫu. Tuyên bố của bạn "chúng tôi không từ chối " cho thấy lý do tại sao sự không đồng ý của bạn là không chính xác: theo định nghĩa , bao gồm tập hợp tất cả các giá trị mà thống kê kiểm tra dẫn đến từ chối null . Đó là lý do tại sao nó được dán nhãn "R" tống ra. Tôi sẽ đăng một bản cập nhật cho câu trả lời của tôi để giải thích chi tiết hơn. α H 0 R α RTαH0RαR
heropup

Rất cám ơn câu trả lời nhanh chóng của bạn và trước cho phiên bản cập nhật của bạn. Ý tôi là như sau: Chúng tôi từ chối nếu , trong đó là mẫu được quan sát. Giả sử tôi rất cực đoan và chọn rất nhỏ, sao cho mẫu đã cho có nghĩa là chúng tôi KHÔNG từ chối . Vì vậy, một nhỏ không phải là apriori là một điều xấu. Rõ ràng, tại một thời điểm nó rất nhỏ, rất khó có thể quan sát một mẫu thuộc về . Một lần nữa, cảm ơn sự kiên nhẫn / giúp đỡ của bạn. rất cảm kích! T ( x n ) R α x n R α T ( x n ) R α H 0 R α R αH0T(xn)RαxnRαT(xn)RαH0RαRα
toán

2
Định nghĩa đã cho của giá trị p rõ ràng đòi hỏi thống kê kiểm tra cho mẫu nằm trong vùng loại bỏ . Bạn không được tự do thay đổi phần định nghĩa của giá trị p.
Glen_b -Reinstate Monica

@Glen_b Cảm ơn bạn đã bình luận. Thật vậy, bình luận trước đây của tôi không vi phạm định nghĩa. Cảm ơn đã chỉ ra điều đó.
toán
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.