Vì người ta có thể tính khoảng tin cậy cho giá trị p và vì ngược lại với ước lượng khoảng là ước tính điểm: Giá trị p có phải là ước tính điểm không?
Vì người ta có thể tính khoảng tin cậy cho giá trị p và vì ngược lại với ước lượng khoảng là ước tính điểm: Giá trị p có phải là ước tính điểm không?
Câu trả lời:
Ước tính điểm và khoảng tin cậy là cho các tham số mô tả phân phối, ví dụ độ lệch trung bình hoặc độ lệch chuẩn.
Nhưng không giống như các thống kê mẫu khác như trung bình mẫu và độ lệch chuẩn mẫu, giá trị p không phải là một công cụ ước tính hữu ích của một tham số phân phối thú vị. Nhìn vào câu trả lời của @whuber để biết chi tiết kỹ thuật.
Giá trị p cho thống kê kiểm tra đưa ra xác suất quan sát độ lệch so với giá trị dự kiến của thống kê kiểm tra ít nhất lớn như quan sát trong mẫu, được tính theo giả định rằng giả thuyết null là đúng. Nếu bạn có toàn bộ phân phối thì nó phù hợp với giả thuyết null hoặc không. Điều này có thể được mô tả bằng biến chỉ báo (một lần nữa, xem câu trả lời của @whuber).
Nhưng giá trị p không thể được sử dụng như một công cụ ước tính hữu ích của biến chỉ báo vì nó không nhất quán vì giá trị p không hội tụ khi kích thước mẫu tăng nếu giả thuyết null là đúng. Đây là một cách thay thế khá phức tạp để nói rằng một bài kiểm tra thống kê có thể từ chối hoặc không từ chối null, nhưng không bao giờ xác nhận nó.
Có, có thể (và đã) lập luận rằng giá trị p là ước tính điểm.
Để xác định bất kỳ thuộc tính nào của phân phối mà giá trị p có thể ước tính, chúng tôi sẽ phải giả định rằng đó là không thiên vị không thiên vị. Nhưng, không có triệu chứng, giá trị p trung bình của giả thuyết null là (lý tưởng; đối với một số thử nghiệm, nó có thể là một số khác không) và đối với bất kỳ giả thuyết nào khác, nó là . Do đó, giá trị p có thể được coi là một công cụ ước tính của một nửa hàm chỉ thị cho giả thuyết null.0
Phải thừa nhận rằng cần có một số sáng tạo để xem giá trị p theo cách này. Chúng ta có thể làm tốt hơn một chút bằng cách xem công cụ ước tính được đề cập như quyết định mà chúng ta đưa ra bằng giá trị p: phân phối cơ bản là thành viên của giả thuyết null hay của giả thuyết thay thế? Hãy gọi bộ này có thể quyết định . Jack Kiefer viết
Chúng tôi cho rằng có một thí nghiệm mà kết quả mà nhà thống kê có thể quan sát được. Kết quả này được mô tả bởi một biến ngẫu nhiên hoặc vectơ ngẫu nhiên .... Định luật xác suất của chưa được biết đến bởi nhà thống kê, nhưng người ta biết rằng hàm phân phối của là thành viên của một lớp xác định của các hàm phân phối. ...X F X Ω
Một vấn đề thống kê được cho là một vấn đề về ước tính điểm nếu là tập hợp các giá trị có thể có của một số thuộc tính có giá trị thực hoặc vectơ của phụ thuộc vào một cách hợp lý trơn tru.F F
Trong trường hợp này, vì rời rạc, "hợp lý trơn tru" hoàn toàn không phải là một hạn chế. Thuật ngữ của Kiefer phản ánh điều này bằng cách tham khảo các quy trình thống kê với các không gian quyết định riêng biệt là "kiểm tra" thay vì "ước tính điểm".
Mặc dù thật thú vị khi khám phá các giới hạn (và giới hạn) của các định nghĩa như vậy, vì câu hỏi này mời chúng ta làm, có lẽ chúng ta không nên quá khăng khăng rằng giá trị p là một công cụ ước tính điểm, bởi vì sự khác biệt giữa các công cụ ước tính và kiểm tra là cả hữu ích và thông thường.
Trong một bình luận cho câu hỏi này, Christian Robert đã chú ý đến một bài báo năm 1992 trong đó ông và các đồng tác giả đã đưa ra chính xác quan điểm này và phân tích sự chấp nhận của giá trị p như một công cụ ước tính của hàm chỉ thị . Xem liên kết trong các tài liệu tham khảo dưới đây. Bài báo bắt đầu,
Phương pháp tiếp cận kiểm tra giả thuyết thường coi vấn đề kiểm tra là một trong những quyết định thay vì ước tính. Chính xác hơn, một bài kiểm tra giả thuyết chính thức sẽ đưa ra kết luận về việc liệu một giả thuyết có đúng hay không và không đưa ra thước đo bằng chứng nào liên quan đến kết luận đó. Trong bài báo này, chúng tôi coi thử nghiệm giả thuyết là một vấn đề ước tính trong khuôn khổ lý thuyết quyết định ....
[Nhấn mạnh thêm.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells và Roger H. Farrell, Ước tính chính xác trong thử nghiệm . Ann. Thống kê. Tập 20, Số 1 (1992), 490-509. Mở truy cập .
Jack Carl Kiefer, Giới thiệu về suy luận thống kê . Springer-Verlag, 1987.
-values không sử dụng để ước lượng bất kỳ thông số quan tâm, nhưng để thử nghiệm giả thuyết. Ví dụ, bạn có thể quan tâm đến việc ước tính dân số dựa trên mẫu mà bạn có, hoặc bạn có thể quan tâm đến việc ước tính khoảng thời gian đó, nhưng trong kịch bản thử nghiệm giả thuyết bạn thà so sánh mẫu giá trị trung bình với dân số trung bình để xem nếu chúng khác nhau. Trong thực tế trong kịch bản thử nghiệm giả thuyết, bạn không quan tâm đến các giá trị cụ thể của chúng, mà là nếu chúng ở dưới ngưỡng nào đó (ví dụ ). Với μ ¯ x μ p < 0,05 p p-giá trị bạn không quan tâm nhiều đến giá trị điểm của họ, nhưng bạn muốn biết liệu dữ liệu của bạn có cung cấp đủ bằng chứng chống lại giả thuyết không. Trong kịch bản kiểm tra giả thuyết, bạn sẽ không so sánh các giá trị khác nhau với nhau, mà sử dụng từng giá trị để đưa ra quyết định riêng về các giả thuyết của bạn. Bạn không thực sự muốn biết bất cứ điều gì về giả thuyết thân tàu, theo như bạn biết nếu bạn có thể từ chối nó hay không. Điều này làm cho các giá trị của chúng không thể tách rời khỏi bối cảnh quyết định và do đó chúng khác với ước tính điểm, bởi vì với ước tính điểm, chúng tôi quan tâm đến giá trị của chúng.