Giá trị p có phải là ước tính điểm không?


32

Vì người ta có thể tính khoảng tin cậy cho giá trị p và vì ngược lại với ước lượng khoảng là ước tính điểm: Giá trị p có phải là ước tính điểm không?


6
Tôi không tin người ta có thể tính khoảng tin cậy cho giá trị p; đó là một thống kê được tính toán từ dữ liệu, không phải là tham số mô tả quá trình tạo dữ liệu. Tất nhiên bạn vẫn có thể hỏi những gì một ước tính thống kê.
Scortchi - Phục hồi Monica

1
@Scortchi: nhưng nếu tôi áp dụng, ví dụ bootstrapping để tính toán phân phối giá trị p và sau đó xây dựng khoảng 95% phần trăm của phân phối bootstraoped này, thì nếu đó không phải là khoảng tin cậy cho giá trị p - thì đó là gì nó không
amip nói rằng phục hồi Monica

2
@amoeba: khoảng tin cậy là về một tham số không xác định, trong khi khoảng thời gian bootstrap của bạn là xấp xỉ 95% cho một thống kê.
Tây An

@Scorthci: Tôi đã thấy phần mềm in CI cho giá trị p. Trong trường hợp này, các giá trị p gần đúng được tính bằng các phép thử hoán vị, do đó, nếu CI quá rộng (nghĩa là p-value và p-value ), bạn sẽ sử dụng hoán vị nhiều hơn trước khi suy luận. [0,0.05][0.05,1]
Vách đá AB

4
@Cliff Đó không phải là một khoảng tin cậy cho các giá trị p qua tài sản của một phân phối: đó là một khoảng tin cậy cho một ước lượng ngẫu nhiên của p-giá trị của một thử nghiệm cho một mẫu cụ thể. Mặc dù chúng có vẻ giống nhau và cả hai đều là những khoảng thời gian, chúng là những thứ hoàn toàn khác nhau.
whuber

Câu trả lời:


23

Ước tính điểm và khoảng tin cậy là cho các tham số mô tả phân phối, ví dụ độ lệch trung bình hoặc độ lệch chuẩn.

Nhưng không giống như các thống kê mẫu khác như trung bình mẫu và độ lệch chuẩn mẫu, giá trị p không phải là một công cụ ước tính hữu ích của một tham số phân phối thú vị. Nhìn vào câu trả lời của @whuber để biết chi tiết kỹ thuật.

Giá trị p cho thống kê kiểm tra đưa ra xác suất quan sát độ lệch so với giá trị dự kiến ​​của thống kê kiểm tra ít nhất lớn như quan sát trong mẫu, được tính theo giả định rằng giả thuyết null là đúng. Nếu bạn có toàn bộ phân phối thì nó phù hợp với giả thuyết null hoặc không. Điều này có thể được mô tả bằng biến chỉ báo (một lần nữa, xem câu trả lời của @whuber).

Nhưng giá trị p không thể được sử dụng như một công cụ ước tính hữu ích của biến chỉ báo vì nó không nhất quán vì giá trị p không hội tụ khi kích thước mẫu tăng nếu giả thuyết null là đúng. Đây là một cách thay thế khá phức tạp để nói rằng một bài kiểm tra thống kê có thể từ chối hoặc không từ chối null, nhưng không bao giờ xác nhận nó.


3
Hầu hết các tài khoản kiểm tra thống kê tốt hơn (Lehman, Kiefer, v.v.) hoàn toàn không đề cập đến "dân số", mà thay vào đó, đóng khung tình huống về mặt ước tính các tham số phân phối. Điều này không đòi hỏi tính ngẫu nhiên chỉ do lấy mẫu và do đó cho phép lý thuyết được áp dụng rộng rãi hơn cho các tình huống trong đó tính ngẫu nhiên là một phần của mô hình .
whuber

2
Nhưng bạn đã mâu thuẫn rõ ràng rằng với tuyên bố "không có xác suất nào liên quan đến dân số cả". Cũng xin lưu ý rằng tất cả các công cụ ước tính đều "được xác định rõ ràng ở cấp độ mẫu". Do đó, rất khó để xác định sự khác biệt mà bạn đang cố gắng thực hiện trong bài viết này.
whuber

2
Tất nhiên! Nhưng một phân phối không phải là một dân số.
whuber

4
(-1) Tôi đồng ý với cả câu trả lời nhạy cảm chung của @ Tim & câu trả lời được yêu cầu của người yêu thích, nhưng đang đấu tranh để có bất kỳ ý nghĩa nào của câu hỏi này. (1) "Nhưng giá trị p không phải là tham số dân số vì nó được xác định rõ ràng ở cấp độ mẫu": đây là giá trị không thể nghi ngờ, nhưng "nhưng" có vẻ như bạn đang nói rằng giá trị p có thể 'không phải là ước tính của bất cứ điều gì vì đó là thống kê mẫu, vì nếu mẫu có nghĩa là không thể ước tính bất cứ điều gì vì đó là thống kê mẫu. ...
Scortchi - Phục hồi Monica

2
(2) "Điều này là do không có xác suất nào liên quan đến dân số, nó được coi là cố định nhưng không xác định": (a) Giá trị p không được tính từ mẫu "không có xác suất [.. .] "; (b) như @ whuber đã chỉ ra, lấy mẫu từ dân số hữu hạn là trường hợp đặc biệt; (c) trong mọi trường hợp, nó chỉ không tuân theo những gì bạn đã nói rằng giá trị p không ước tính bất cứ điều gì về dân số.
Scortchi - Phục hồi Monica

21

Có, có thể (và đã) lập luận rằng giá trị p là ước tính điểm.

Để xác định bất kỳ thuộc tính nào của phân phối mà giá trị p có thể ước tính, chúng tôi sẽ phải giả định rằng đó là không thiên vị không thiên vị. Nhưng, không có triệu chứng, giá trị p trung bình của giả thuyết null là (lý tưởng; đối với một số thử nghiệm, nó có thể là một số khác không) và đối với bất kỳ giả thuyết nào khác, nó là . Do đó, giá trị p có thể được coi là một công cụ ước tính của một nửa hàm chỉ thị cho giả thuyết null.01/20


Phải thừa nhận rằng cần có một số sáng tạo để xem giá trị p theo cách này. Chúng ta có thể làm tốt hơn một chút bằng cách xem công cụ ước tính được đề cập như quyết định mà chúng ta đưa ra bằng giá trị p: phân phối cơ bản là thành viên của giả thuyết null hay của giả thuyết thay thế? Hãy gọi bộ này có thể quyết định . Jack Kiefer viếtD

Chúng tôi cho rằng có một thí nghiệm mà kết quả mà nhà thống kê có thể quan sát được. Kết quả này được mô tả bởi một biến ngẫu nhiên hoặc vectơ ngẫu nhiên .... Định luật xác suất của chưa được biết đến bởi nhà thống kê, nhưng người ta biết rằng hàm phân phối của là thành viên của một lớp xác định của các hàm phân phối. ...X F X ΩXXFXΩ

Một vấn đề thống kê được cho là một vấn đề về ước tính điểm nếu là tập hợp các giá trị có thể có của một số thuộc tính có giá trị thực hoặc vectơ của phụ thuộc vào một cách hợp lý trơn tru.F FDFF

Trong trường hợp này, vì rời rạc, "hợp lý trơn tru" hoàn toàn không phải là một hạn chế. Thuật ngữ của Kiefer phản ánh điều này bằng cách tham khảo các quy trình thống kê với các không gian quyết định riêng biệt là "kiểm tra" thay vì "ước tính điểm".D

Mặc dù thật thú vị khi khám phá các giới hạn (và giới hạn) của các định nghĩa như vậy, vì câu hỏi này mời chúng ta làm, có lẽ chúng ta không nên quá khăng khăng rằng giá trị p là một công cụ ước tính điểm, bởi vì sự khác biệt giữa các công cụ ước tính và kiểm tra là cả hữu ích và thông thường.


Trong một bình luận cho câu hỏi này, Christian Robert đã chú ý đến một bài báo năm 1992 trong đó ông và các đồng tác giả đã đưa ra chính xác quan điểm này và phân tích sự chấp nhận của giá trị p như một công cụ ước tính của hàm chỉ thị . Xem liên kết trong các tài liệu tham khảo dưới đây. Bài báo bắt đầu,

Phương pháp tiếp cận kiểm tra giả thuyết thường coi vấn đề kiểm tra là một trong những quyết định thay vì ước tính. Chính xác hơn, một bài kiểm tra giả thuyết chính thức sẽ đưa ra kết luận về việc liệu một giả thuyết có đúng hay không và không đưa ra thước đo bằng chứng nào liên quan đến kết luận đó. Trong bài báo này, chúng tôi coi thử nghiệm giả thuyết là một vấn đề ước tính trong khuôn khổ lý thuyết quyết định ....

[Nhấn mạnh thêm.]


Tài liệu tham khảo

Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells và Roger H. Farrell, Ước tính chính xác trong thử nghiệm . Ann. Thống kê. Tập 20, Số 1 (1992), 490-509. Mở truy cập .

Jack Carl Kiefer, Giới thiệu về suy luận thống kê . Springer-Verlag, 1987.


2
Hừm. Tôi không chắc chắn nếu quan điểm này là hữu ích. Đối với một ý nghĩa này, giá trị p không phải là một công cụ ước tính tốt, vì nó không nhất quán nếu giả thuyết null là đúng. Và trong một số trường hợp (bạn đề cập đến điều đó), nó cũng có độ lệch phụ thuộc cỡ mẫu. Nó có thể đúng về mặt kỹ thuật, nhưng bất kỳ số ngẫu nhiên nào cũng có thể là công cụ ước tính (khủng khiếp) cho bất kỳ tham số nào.
Erik

10
Câu hỏi không hỏi liệu giá trị p có phải là một công cụ ước tính tốt không , @Erik. Là một người ước tính, nó có thiếu sót rõ ràng. Ví dụ, phương sai tiệm cận của nó đối với giả thuyết null là khác không. Xin lưu ý rằng độ lệch của hầu hết mọi ước lượng không thiên vị phụ thuộc vào kích thước mẫu. Mặc dù bạn đúng rằng một số ngẫu nhiên độc lập có thể được xem như một công cụ ước tính, nó sẽ là một công cụ ước tính của một cái gì đó khác: nó sẽ ước tính giá trị trung bình của chính nó (theo định nghĩa). Do đó, sự phản đối của bạn dường như không liên quan đến câu hỏi.
whuber

7
Tôi không nghĩ chúng tôi khác nhau về bất kỳ điểm nào trong số đó, @Erik, ngoại trừ phần "không có ích". Như Nick Cox đã chỉ ra trong một nhận xét ở đâu đó trong chủ đề này, tuy nhiên thật thú vị khi chiêm ngưỡng ý nghĩa trong đó một giá trị p có thể được coi là một công cụ ước tính và chính xác, nó có thể ước tính được. Điều đó có thể giúp chúng ta hiểu rõ hơn một chút về giá trị p là gì (và không phải). Nhiều người sẽ xem đó là một bài tập hữu ích .
whuber

7
Trong một bài báo năm 1992 , chúng tôi nghiên cứu giá trị như một công cụ ước tính của hàm chỉ số và chứng minh rằng nó có thể là một công cụ ước tính có thể chấp nhận được cho giả thuyết một phía và không thể chấp nhận được cho các giả thuyết hai mặt. I Θ 0 ( θ )pIΘ0(θ)
Tây An

1
@ Xi'an Tôi thấy chúng tôi chỉ sau bạn 23 năm .... Cảm ơn bạn đã tham khảo!
whuber

11

p -values không sử dụng để ước lượng bất kỳ thông số quan tâm, nhưng để thử nghiệm giả thuyết. Ví dụ, bạn có thể quan tâm đến việc ước tính dân số dựa trên mẫu mà bạn có, hoặc bạn có thể quan tâm đến việc ước tính khoảng thời gian đó, nhưng trong kịch bản thử nghiệm giả thuyết bạn thà so sánh mẫu giá trị trung bình với dân số trung bình để xem nếu chúng khác nhau. Trong thực tế trong kịch bản thử nghiệm giả thuyết, bạn không quan tâm đến các giá trị cụ thể của chúng, mà là nếu chúng ở dưới ngưỡng nào đó (ví dụ ). Với μ ¯ x μ p < 0,05 p pμx¯μp<0.05p-giá trị bạn không quan tâm nhiều đến giá trị điểm của họ, nhưng bạn muốn biết liệu dữ liệu của bạn có cung cấp đủ bằng chứng chống lại giả thuyết không. Trong kịch bản kiểm tra giả thuyết, bạn sẽ không so sánh các giá trị khác nhau với nhau, mà sử dụng từng giá trị để đưa ra quyết định riêng về các giả thuyết của bạn. Bạn không thực sự muốn biết bất cứ điều gì về giả thuyết thân tàu, theo như bạn biết nếu bạn có thể từ chối nó hay không. Điều này làm cho các giá trị của chúng không thể tách rời khỏi bối cảnh quyết định và do đó chúng khác với ước tính điểm, bởi vì với ước tính điểm, chúng tôi quan tâm đến giá trị của chúng.p


5
Tuyên bố ban đầu của bạn lặp lại chính xác cách mọi thứ thường được giải thích, nhưng tuy nhiên nó không đủ sâu. Một thực tế cơ bản ở đây là biến thể lấy mẫu, sự biến đổi từ mẫu này sang mẫu khác. Lấy một mẫu khác và giá trị P của bạn sẽ khác. Cần một chút khéo léo để xem chính xác những gì nó đang ước tính, và nó không (theo như tôi biết) thông thường để giải thích nó như là ước tính một tham số, nhưng quan điểm đó có ý nghĩa hoàn hảo. Xem câu trả lời thú vị của @ whuber. (Toàn bộ lãnh thổ tràn ngập các paraph cụm lầy lội dựa trên nhu cầu đơn giản hóa cho việc giảng dạy.)
Nick Cox

1
Làm thế nào các thuật ngữ được sử dụng là thú vị và quan trọng (nhân tiện, và một mối bận tâm cá nhân). Câu hỏi vẫn là giá trị P là gì . Điều này cũng được chỉ ra [chơi chữ không thể tránh khỏi ở đây] ở nơi khác trong chủ đề này. Đó là một quy ước hữu ích để coi các tham số là những ẩn số xuất hiện trong một đặc tả mô hình, nhưng cũng có những ẩn số khác.
Nick Cox

3
@Tim, tôi nghĩ rằng tuyên bố này (từ nhận xét cuối cùng của bạn) hầu như không luôn đúng, ít nhất là trong sinh học. Mọi người rất quan tâm đến giá trị của giá trị p, đánh dấu , , với một, hai hoặc ba ngôi sao trên các hình, viết về một cái gì đó "rất có ý nghĩa", v.v. khuyến nghị cũng là báo cáo giá trị p chính xác, ví dụ và không . Chỉ rất hiếm khi mọi người tuân thủ khuôn khổ Neyman-Pearson nghiêm ngặt, chọn trước và báo cáo tất cả các giá trị là . p < 0,01 p < 0,001 p = 0,003 p < 0,05 α p < αp<0.05p<0.01p<0.001p=0.003p<0.05αp<α
amip nói rằng phục hồi Monica

5
Câu hỏi này giao nhau với nhiều người khác, hầu hết trong số đó là rất gây tranh cãi. Một là lý tưởng hóa rằng mục đích của một bài kiểm tra là đưa ra quyết định có hay không, không phù hợp với tất cả các vấn đề. Một thực tế quan trọng khác là việc sử dụng các ngưỡng ngưỡng trong nhiều thập kỷ là vấn đề mà mọi người sử dụng các bảng được công bố từ các bảng in và giá trị P chính xác nằm ngoài tầm với trong khi mọi người không sử dụng máy tính.
Nick Cox

4
@ 00schneider: Nếu bạn từng thấy một khoảng được đưa ra cho các giá trị p, thì rất có thể đó là khoảng tin cậy cho tham số dân số được xác định bởi whuber. Quan điểm của Tim là không cần phải coi họ là ước tính gì cả, thật thú vị mặc dù có thể phải làm như vậy.
Scortchi - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.