Trong một thử nghiệm t mẫu, điều gì xảy ra nếu trong công cụ ước tính phương sai, giá trị trung bình mẫu được thay thế bằng ?


10

Giả sử thử nghiệm t một mẫu, trong đó giả thuyết null là . Thống kê sau đó là bằng cách sử dụng độ lệch chuẩn . Khi ước tính , người ta so sánh các quan sát với giá trị trung bình mẫu :μ=μ0t=x¯μ0s/nssx¯

s=1n1i=1n(xix¯)2 .

Tuy nhiên, nếu chúng tôi giả sử cho là đúng, người ta cũng có thể ước tính độ lệch chuẩn bằng cách sử dụng thay vì trung bình mẫu :μ0sμ0x¯

s=1n1i=1n(xiμ0)2 .

Đối với tôi, cách tiếp cận này trông tự nhiên hơn vì chúng tôi cũng sử dụng giả thuyết null để ước tính SD. Có ai biết liệu thống kê kết quả được sử dụng trong một bài kiểm tra hoặc biết, tại sao không?


Tôi theo dõi câu hỏi này vì tôi sắp đăng nó và SE đã cảnh báo tôi. Tôi đã tự hỏi nếu có tài liệu tham khảo về câu hỏi này. Theo trực giác, chắc chắn sẽ là ước tính tốt hơn về và phân phối của có thể được bắt nguồn (không phải là Sinh viên, có lẽ). Bất kỳ tài liệu tham khảo sẽ được đánh giá cao! s2=1n(xiμ0)2σ2x¯μ0s/n
AG

Câu trả lời:


6

Có một vấn đề với mô phỏng ban đầu trong bài viết này, hy vọng bây giờ đã được sửa.

Mặc dù ước tính độ lệch chuẩn mẫu có xu hướng tăng cùng với tử số vì giá trị trung bình lệch so với , nhưng điều này hóa ra không có ảnh hưởng lớn đến năng lượng ở mức ý nghĩa "điển hình", bởi vì trong các mẫu trung bình đến lớn, vẫn có xu hướng đủ lớn để từ chối. Tuy nhiên, trong các mẫu nhỏ hơn, nó có thể có một số ảnh hưởng và ở mức ý nghĩa rất nhỏ, điều này có thể trở nên rất quan trọng, bởi vì nó sẽ đặt giới hạn trên của công suất sẽ nhỏ hơn 1.μ0s/n

Vấn đề thứ hai, có thể quan trọng hơn ở các mức ý nghĩa 'phổ biến', dường như là tử số và mẫu số của thống kê kiểm tra không còn độc lập ở giá trị null (bình phương của có tương quan với ước lượng phương sai) .x¯μ

Điều này có nghĩa là thử nghiệm không còn có phân phối t dưới null. Đó không phải là một lỗ hổng chết người, nhưng điều đó có nghĩa là bạn không thể chỉ sử dụng các bảng và đạt được mức ý nghĩa mà bạn muốn (như chúng ta sẽ thấy trong một phút). Đó là, thử nghiệm trở nên bảo thủ và điều này tác động đến sức mạnh.

Khi n trở nên lớn, sự phụ thuộc này trở thành ít vấn đề hơn (ít nhất là vì bạn có thể gọi CLT cho tử số và sử dụng định lý Slutsky để nói hơn là có phân phối chuẩn bất đối xứng cho thống kê đã sửa đổi).

Đây là đường cong công suất cho hai mẫu t thông thường (đường cong màu tím, thử nghiệm hai đuôi) và cho thử nghiệm sử dụng giá trị null của trong phép tính (các chấm màu xanh, thu được thông qua mô phỏng và sử dụng bảng t) dân số có nghĩa là di chuyển ra khỏi giá trị giả thuyết, với :μ0sn=10

n = 10

nhập mô tả hình ảnh ở đây

Bạn có thể thấy đường cong công suất thấp hơn (nó trở nên tồi tệ hơn nhiều ở các cỡ mẫu thấp hơn), nhưng phần lớn điều đó dường như là do sự phụ thuộc giữa tử số và mẫu số đã hạ thấp mức ý nghĩa. Nếu bạn điều chỉnh các giá trị tới hạn một cách thích hợp, sẽ có rất ít giữa chúng ngay cả ở mức n = 10.

Và đây là đường cong sức mạnh một lần nữa, nhưng bây giờ vớin=30

n = 30

nhập mô tả hình ảnh ở đây

Điều này cho thấy rằng ở các cỡ mẫu không nhỏ giữa chúng không có nhiều, miễn là bạn không cần sử dụng các mức ý nghĩa rất nhỏ.


9

Khi giả thuyết null là đúng, thống kê của bạn sẽ giống với thống kê kiểm tra t thông thường (mặc dù trong tính toán độ lệch chuẩn, bạn có thể nên chia cho thay vì vì bạn không dành một mức độ tự do để ước tính giá trị trung bình ). Tôi hy vọng nó có các thuộc tính tương tự (kích thước phù hợp, sức mạnh tương tự) khi giả thuyết null là đúng (trung bình dân số là .nn1μ0

Nhưng bây giờ hãy xem xét những gì xảy ra khi giả thuyết null không đúng. Điều này có nghĩa là khi tính toán sai số chuẩn, bạn đang trừ đi một giá trị không phải là giá trị trung bình thực hoặc ước tính của giá trị trung bình thực, thực tế bạn có thể trừ đi một giá trị thậm chí không nằm trong phạm vi của các giá trị x. Điều này sẽ làm cho độ lệch chuẩn của bạn lớn hơn ( được đảm bảo để giảm thiểu độ lệch chuẩn) khi di chuyển ra khỏi giá trị trung bình thực. Vì vậy, khi null là sai, bạn sẽ tăng cả tử số và mẫu số trong thống kê, điều này sẽ làm giảm cơ hội bác bỏ giả thuyết null (và nó sẽ không được phân phối dưới dạng phân phối t).x¯μ0

Vì vậy, khi null là đúng, một trong hai cách có thể sẽ hoạt động, nhưng khi null là sai, sử dụng sẽ cho sức mạnh tốt hơn (và có lẽ các thuộc tính khác cũng vậy), vì vậy nó được ưu tiên. x¯

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.