p-value Sublety: lớn hơn bằng so với lớn hơn

11

Khi tôi đang đọc cuốn sách Tất cả các số liệu thống kê của Wassermann, tôi nhận thấy một sự tinh tế trong định nghĩa về giá trị p, mà tôi không thể hiểu được. Không chính thức, Wassermann định nghĩa giá trị p là

[..] xác suất (dưới $H_0$ ) của việc quan sát giá trị của thống kê kiểm tra giống hoặc cực hơn so với những gì thực tế được quan sát.

Nhấn mạnh thêm. Tương tự chính thức hơn (Định lý 10.12):

Giả sử rằng phép thử kích thước $\alpha$ có dạng

từ chối $H_0$ khi và chỉ khi $T(X^n) \ge c_\alpha$ .

Sau đó,

$p -value = sup_{θ \in Θ_{0}} P_{θ_{0}} [T (X^{n}) \geq T (x^{n})]$ $\text{$p$-value} = \sup_{\theta\in\Theta_0} P_{\theta_0}[T(X^n) \ge T (x^n)]$
Trong đó là giá trị quan sát của . Nếu thì $x^n$ $X^n$ $\Theta_0=\{\theta_0\}$
$p -value = P_{θ_{0}} [T (X^{n}) \geq T (x^{n})]$ $\text{$p$-value} = P_{\theta_0}[T(X^n) \ge T (x^n)]$

Hơn nữa, Wassermann định nghĩa giá trị p của thử nghiệm của Pearson $\chi^2$ (và các thử nghiệm khác tương tự) là:

p -value = P [χ_{k - 1}^{2} > T] .

$\text{$p$-value} = P[\chi^2_{k-1} > T].$

Phần tôi muốn yêu cầu làm rõ là dấu bằng ( ) lớn hơn trong dấu đầu tiên và dấu lớn hơn ( ) trong định nghĩa thứ hai. Tại sao chúng ta không viết , sẽ khớp với trích dẫn đầu tiên của " giống như hoặc cực đoan hơn?" $\ge$ $>$ $\ge T$

Đây có phải là sự tiện lợi tuyệt đối để chúng tôi tính giá trị p là không? Tôi nhận thấy rằng R cũng sử dụng định nghĩa với dấu , ví dụ, trong . $1-F(T)$ $>$ chisq.test

hypothesis-testing chi-squared p-value

— mavam
nguồn

5

Bạn có biết rằng giá trị p là giống nhau cho cả hai định nghĩa nếu thống kê kiểm tra là liên tục?

— đánh dấu999

3

Việc phân phối liên tục không thành vấn đề, nhưng thực tế này không nên cám dỗ bạn quên đi sự khác biệt giữa và vì về mặt toán học nó quan trọng. Nó cũng quan trọng trong các ứng dụng vì "tính riêng biệt của cuộc sống thực", trên thực tế chúng ta có thể gặp các giá trị p của chính xác .

\leq

$\leq$

<

$<$

α

$\alpha$

— Horst Grünbusch

11

"Như hoặc cực đoan hơn" là chính xác.

Chính thức, sau đó, nếu phân phối sao cho xác suất nhận được thống kê kiểm tra là dương, thì xác suất đó (và bất cứ điều gì cực kỳ tương tự, chẳng hạn như giá trị tương ứng ở đuôi khác) nên được đưa vào giá trị p.

Tất nhiên, với một thống kê liên tục, xác suất đó của đẳng thức chính xác là 0. Sẽ không có gì khác biệt nếu chúng ta nói hoặc . $>$ $\geq$

— Glen_b -Reinstate Monica
nguồn

4

Điểm đầu tiên của là không gian giả thuyết được đóng theo cấu trúc liên kết trong toàn bộ không gian tham số. Nếu không xem xét tính ngẫu nhiên, đây có thể là một quy ước hữu ích nếu bạn có một số khẳng định về một chuỗi các tham số hội tụ thuộc giả thuyết bởi vì sau đó bạn sẽ biết rằng giới hạn không đột nhiên thuộc về phương án. $\geq$

Bây giờ xem xét phân phối xác suất, chúng (thường) phải liên tục. Điều đó có nghĩa là ánh xạ của không gian giả thuyết đóng vào khoảng được đóng lại. Đó là lý do tại sao khoảng tin cậy cũng bị đóng theo quy ước. $[0,1]$

Điều này tăng cường toán học. Hãy tưởng tượng, bạn sẽ xây dựng một khoảng tin cậy cho tham số vị trí của phân phối xác suất không đối xứng. Ở đó, bạn sẽ phải đổi chiều dài cho đuôi trên để lấy chiều dài cho đuôi dưới. Xác suất ở cả hai đuôi sẽ tổng hợp lên tới . Để có CI càng nhiều thông tin càng tốt, bạn sẽ phải rút ngắn độ dài của CI sao cho xác suất bảo hiểm của nó vẫn là . Đây là một bộ kín. Bạn có thể tìm thấy một giải pháp tối ưu ở đó bằng một số thuật toán lặp, ví dụ định lý điểm cố định của Banach. Nếu đó là một bộ mở, bạn không thể làm điều này. $\alpha$ $\geq 1-\alpha$

— Horst Grünbusch
nguồn