Khi tôi đang đọc cuốn sách Tất cả các số liệu thống kê của Wassermann, tôi nhận thấy một sự tinh tế trong định nghĩa về giá trị p, mà tôi không thể hiểu được. Không chính thức, Wassermann định nghĩa giá trị p là
[..] xác suất (dưới ) của việc quan sát giá trị của thống kê kiểm tra giống hoặc cực hơn so với những gì thực tế được quan sát.
Nhấn mạnh thêm. Tương tự chính thức hơn (Định lý 10.12):
Giả sử rằng phép thử kích thước có dạng
từ chối khi và chỉ khi .
Sau đó,
Trong đó là giá trị quan sát của . Nếu thì \ text {$ p $ -value} = P _ {\ theta_0} [T (X ^ n) \ ge T (x ^ n)]X n Θ 0 = { θ 0 } p -giá trị = P θ 0 [ T ( X n ) ≥ T ( x n ) ]
Hơn nữa, Wassermann định nghĩa giá trị p của thử nghiệm \ chi ^ 2 của Pearson (và các thử nghiệm khác tương tự) là:
Phần tôi muốn yêu cầu làm rõ là dấu bằng ( ) lớn hơn trong dấu đầu tiên và dấu lớn hơn ( ) trong định nghĩa thứ hai. Tại sao chúng ta không viết , sẽ khớp với trích dẫn đầu tiên của " giống như hoặc cực đoan hơn?"> ≥ T
Đây có phải là sự tiện lợi tuyệt đối để chúng tôi tính giá trị p là không? Tôi nhận thấy rằng R cũng sử dụng định nghĩa với dấu , ví dụ, trong .>chisq.test