Thử nghiệm giả thuyết. Tại sao trung tâm phân phối lấy mẫu trên H0?


9

Giá trị p là xác suất để có được một thống kê ít nhất là cực trị như giá trị quan sát được trong dữ liệu mẫu khi giả sử rằng giả thuyết null ( H0 ) là đúng.

Về mặt đồ họa, điều này tương ứng với khu vực được xác định bởi thống kê mẫu trong phân phối mẫu mà người ta sẽ có được khi giả sử H0 :

trung tâm h0

Tuy nhiên, vì hình dạng của phân phối giả định này thực sự dựa trên dữ liệu mẫu, việc căn giữa nó vào có vẻ như là một lựa chọn kỳ lạ đối với tôi. Thay vào đó, nếu người ta sử dụng phân phối mẫu của thống kê, nghĩa là phân phối trung tâm trên thống kê mẫu, thì kiểm tra giả thuyết sẽ tương ứng với việc ước tính xác suất μ 0 cho các mẫu.μ0
μ0

trung tâm h1

Trong trường hợp đó, giá trị p là xác suất để có được một thống kê ít nhất là cực như cho các dữ liệu thay vì định nghĩa ở trên.μ0

Ngoài ra, một giải thích như vậy có lợi thế là có liên quan tốt với các khái niệm về khoảng tin cậy:
Một thử nghiệm giả thuyết với mức ý nghĩa sẽ tương đương với kiểm tra xem μ 0 nằm trong ( 1 - α ) Khoảng tin cậy của sự phân bố lấy mẫu.αμ0(1α)

CI2 95

Do đó, tôi cảm thấy rằng việc tập trung vào phân phối trên có thể là một biến chứng không cần thiết. Có bất kỳ biện minh quan trọng nào cho bước này mà tôi không xem xét?μ0


2
Vui lòng cho chúng tôi biết phân phối lấy mẫu sẽ là gì nếu bạn không giả sử . (Trả lời: bạn không thể, ngoại trừ trong các ví dụ trong sách giáo khoa trong đó giả thuyết thay thế chỉ định phân phối duy nhất.)H0
whuber

Tôi không chắc chắn nếu tôi hiểu chính xác yêu cầu nhưng trong ví dụ trên, đó sẽ là phân phối mẫu của giá trị trung bình. Bây giờ tôi đã thêm một con số cho câu hỏi cho thấy phân phối này cùng với khoảng tin cậy / vùng 95% cũng sẽ giúp minh họa mối quan hệ với các khoảng tin cậy.
matti

2
Bạn không có cách nào để biết phân phối mẫu của giá trị trung bình. Để biết điều đó, bạn cần biết ý nghĩa thực sự: nhưng đó chính xác là số lượng bạn đang cố gắng kiểm tra! Logic của bạn là hoàn toàn tròn.
whuber

1
Tôi hiểu đó là ý nghĩa của bạn. Nói chung, cho đến khi bạn biết - hoặc giả sử - các tham số thực của phân phối, bạn không thể biết phân phối của bất kỳ thuộc tính nào của mẫu. (Trên thực tế, nếu bạn có thể suy ra sự phân phối của bất kỳ thuộc tính mẫu nào mà không cần biết kiến ​​thức về các tham số, đó sẽ là bằng chứng cho thấy nó không cung cấp cho bạn thông tin nào về các tham số!)
whuber

1
Tôi không thể, vì có vẻ như bạn không sử dụng các thuật ngữ như "trung bình", "ước tính" hay thậm chí là "H0" trong các giác quan thống kê thông thường của họ. Tôi hoàn toàn không thể hiểu được câu hỏi của bạn là gì. Điều duy nhất rõ ràng là nó được chứng minh dựa trên sự hiểu lầm về kiểm tra giả thuyết null, nhưng phản hồi của bạn đối với các bình luận của tôi không cung cấp bất kỳ dấu hiệu hữu ích nào về sự hiểu lầm đó có thể là gì.
whuber

Câu trả lời:


5

Giả sử là một mẫu được rút ra từ một phân phối bình thường với nghĩa không xác định và phương sai đã biết . Do đó, trung bình mẫu là bình thường với trung bình và phương sai . Về điều này, tôi nghĩ không thể có sự bất đồng nào.X=(X1,X2,,Xn)μσ2X¯μσ2/n

Bây giờ, bạn đề xuất rằng thống kê kiểm tra của chúng tôi là Đúng? NHƯNG NÀY KHÔNG PHẢI LÀ THỐNG KÊ . Tại sao? Bởi vì là một tham số không xác định . Thống kê là một chức năng của mẫu không phụ thuộc vào bất kỳ tham số chưa biết nào. Do đó, một giả định phải được đưa ra về để trở thành một thống kê. Một giả định như vậy là viết trong đó mà một thống kê.

Z=X¯μσ/nNormal(0,1).
μμZZ H 0 = ˉ X - μ 0
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

Ngược lại, bạn có đề xuất sử dụng chính nó. Trong trường hợp đó, giống hệt nhau và nó thậm chí không phải là một biến ngẫu nhiên, hãy để một mình phân phối bình thường. Không có gì để kiểm tra. Z = 0μ=X¯Z=0


1
Cảm ơn bạn. Điều này rất đơn giản và bây giờ tôi thực sự tự hỏi làm thế nào tôi có thể bỏ lỡ điều đó trước đây. Tất cả những gì sẽ còn lại như một cái cớ cho trường hợp được trình bày thứ hai là dựa vào tính toán khoảng tin cậy. Tuy nhiên, do có sai số được cộng / trừ một cách rõ ràng từ ước tính trung bình hoặc điểm, nên việc sử dụng ước tính đó trở thành một bước cần phải được chứng minh.
matti

12

Tuy nhiên, vì hình dạng của phân phối giả định này thực sự dựa trên dữ liệu mẫu, nên việc định tâm nó trên H0 có vẻ như là một lựa chọn kỳ lạ đối với tôi.

Điều này thực sự là không đúng sự thật. Hình dạng của phân phối giả định này xuất phát từ việc chấp nhận là đúng.H0Mẫu không liên quan trực tiếp đến điều đó, ngoài một số giả định.Sử dụng mẫu trực tiếp, là không đủ. Bạn cũng cần giả thuyết null để giữ.

Thay vào đó, nếu người ta sử dụng phân phối lấy mẫu của thống kê, tức là tập trung vào phân phối trên thống kê mẫu, thì kiểm tra giả thuyết sẽ tương ứng với việc ước tính xác suất của H0 cho các mẫu.

Câu hỏi là: làm thế nào để bạn ước tính xác suất của một cái gì đó mà bạn cho là đúng. Trong trường hợp của chúng tôi nếu bạn cho rằng là đúng, sẽ vô ích khi cố gắng ước tính xác suất là đúng.H 0H0H0

Do đó, tôi cảm thấy rằng việc tập trung vào phân phối trên H0 là một biến chứng không cần thiết.

Bạn không có hai bản phân phối ở đó, chỉ có một bản phân phối duy nhất là sự thật cơ bản của bạn, hay còn gọi là bản phân phối đi kèm với . Tuy nhiên, có một phân phối lấy mẫu có nguồn gốc từ mẫu, nhưng điều này không liên quan đến các giả thuyết bạn sử dụng.H0

Tôi tập thể dục tốt sẽ là cố gắng tái tạo cùng một logic với phân phối bất đối xứng. Thực hiện phân phối chi-vuông như trong kiểm tra độc lập chi vuông. Bạn có thể tái tạo nó? Tôi nghĩ rằng câu trả lời là không.


" Điều này thực sự không đúng. Hình dạng của phân phối giả định này xuất phát từ việc chấp nhận H0 là đúng. Mẫu không liên quan trực tiếp đến điều đó, ngoại trừ một số giả định. " Nhưng trong trường hợp của một thử nghiệm t mẫu được trình bày ở trên, thống kê kiểm tra bao gồm SEM và giá trị trung bình mẫu và do đó phụ thuộc vào dữ liệu mẫu. Ngoài ra, mức độ tự do xác định chiều cao của đuôi phụ thuộc vào kích thước mẫu.
t=x¯μ0sn
matti

1
Công thức của tôi là sai lệch. Tôi đã cố gắng nói rằng bạn có thể sử dụng bất kỳ thông tin nào bạn có, cũng như bản thân mẫu, nhưng nó không đủ. Để đánh giá giá trị p và để có phân phối, bạn cũng cần giả sử giả thuyết null. Tôi cũng cải cách trong bài.
rapaio

1
... Lấy ví dụ công thức của bạn cho , nó sử dụng mà tôi cho rằng đó là giá trị từ giả thuyết nullμ 0 H 0 : μ = μ 0tμ0H0:μ=μ0
rapaio

2

H0H1

H0H0H1

H0H0:μ=0H1:μ0μH0

H0

H1H0H1

H0H1H1H1


H0

Và nói chung, H1 khá mơ hồ (mu! = 0), làm cho khả năng tính toán có vấn đề. Mặc dù tôi cho rằng đó thường là một động lực tốt cho mọi người đi Bayesian. :)
Hao Ye
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.