Câu hỏi về giả định tính chuẩn của bài kiểm tra t


9

Đối với các bài kiểm tra t, theo hầu hết các văn bản, có một giả định rằng dữ liệu dân số thường được phân phối. Tôi không thấy lý do tại sao. Không phải thử nghiệm t chỉ yêu cầu phân phối lấy mẫu của phương tiện mẫu thường được phân phối chứ không phải dân số?

Nếu đó là trường hợp kiểm tra t cuối cùng chỉ yêu cầu sự bình thường trong phân phối lấy mẫu, thì dân số có thể trông giống như bất kỳ phân phối nào, phải không? Miễn là có cỡ mẫu hợp lý. Đó không phải là những gì định lý giới hạn trung tâm?

(Tôi đang đề cập ở đây để kiểm tra mẫu một mẫu hoặc mẫu độc lập)


1
Chà, mẫu có nghĩa là một biến ngẫu nhiên chỉ có thể là bình thường nếu các phần đơn lẻ cũng bình thường. Nhưng bạn đã đúng: phép thử t là không đối xứng (không phân phối bình thường), nhưng vẫn là phương sai trong nhóm (trong tình huống hai mẫu) nên giống nhau và tồn tại.
Michael M

Bởi các phương sai trong nhóm là tương tự nhau, bạn có đề cập đến giả định về tính đồng nhất của phương sai không? Nếu vậy, bài kiểm tra t của thợ hàn đúng cho việc này, đúng không?
Peter Nash

Đúng chính xác. Nếu mức độ tự do được sửa chữa của người Wales trở nên vô cùng, thì thủ tục của anh ta sẽ không được phân phối (tuy nhiên cần dẫn nguồn ...).
Michael M

Câu trả lời:


9

Đối với các bài kiểm tra t, theo hầu hết các văn bản, có một giả định rằng dữ liệu dân số thường được phân phối. Tôi không thấy lý do tại sao. Không phải thử nghiệm t chỉ yêu cầu phân phối lấy mẫu của phương tiện mẫu thường được phân phối chứ không phải dân số?

Thống kê t bao gồm tỷ lệ của hai đại lượng, cả hai biến ngẫu nhiên. Nó không chỉ bao gồm một tử số.

Để thống kê t có phân phối t, bạn không chỉ cần có nghĩa là mẫu có phân phối bình thường. Bạn cũng cần:

  • rằng trong mẫu số phải sao cho *s 2 / σ 2 ~ χ 2 dss2/σ2χd2

  • tử số và mẫu số là độc lập.

* (giá trị của phụ thuộc vào kiểm tra - trong một mẫu chúng ta có )t d = n - 1dtd=n1

Để ba điều đó thực sự đúng, bạn cần dữ liệu gốc được phân phối bình thường.

Nếu đó là trường hợp kiểm tra t cuối cùng chỉ yêu cầu sự bình thường trong phân phối lấy mẫu, thì dân số có thể trông giống như bất kỳ phân phối nào, phải không?

Hãy để iid như được đưa ra trong một khoảnh khắc. Để CLT giữ được dân số phải phù hợp với điều kiện ... - dân số phải có phân phối mà CLT áp dụng. Vì vậy, không, vì có phân phối dân số mà CLT không áp dụng.

Miễn là có cỡ mẫu hợp lý. Đó không phải là những gì định lý giới hạn trung tâm?

Không, CLT thực sự không nói một từ nào về "cỡ mẫu hợp lý".

Nó thực sự không nói gì về những gì xảy ra ở bất kỳ cỡ mẫu hữu hạn nào.

Tôi đang nghĩ về một phân phối cụ thể ngay bây giờ. Đó là một trong những điều mà CLT chắc chắn áp dụng. Nhưng tại , phân phối trung bình mẫu hoàn toàn không bình thường. Tuy nhiên, tôi nghi ngờ rằng bất kỳ mẫu nào trong lịch sử nhân loại đã từng có nhiều giá trị trong đó. Vậy - bên ngoài tautology - 'hợp lý ' nghĩa là gì?n=1015n


Vì vậy, bạn có vấn đề sinh đôi:

A. Hiệu ứng mà mọi người thường gán cho CLT - cách tiếp cận ngày càng gần với tính quy luật của phân phối mẫu có nghĩa là ở cỡ mẫu nhỏ / vừa - không thực sự được nêu trong CLT **.

B. "Một cái gì đó không quá xa so với bình thường trong tử số" không đủ để thống kê có phân phối t

** (Một cái gì đó giống như định lý Berry-Esseen giúp bạn giống với những gì mọi người đang thấy khi họ nhìn vào ảnh hưởng của việc tăng kích thước mẫu trong phân phối phương tiện mẫu.)


Định lý CLT và Slutsky cùng cung cấp cho bạn (miễn là tất cả các giả định của họ nắm giữ) rằng từ , việc phân phối các phương pháp thống kê t chuẩn là bình thường. Nó không nói liệu bất kỳ hữu hạn nhất định có thể là đủ cho một số mục đích.nnn


1
Đối với ba điều [bình thường của trung bình mẫu, độ chính xác của phương sai mẫu và tính độc lập của hai] là thực sự đúng, bạn cần dữ liệu gốc được phân phối bình thường. Bạn đang nói rằng chỉ có bình thường có ba thuộc tính? Tôi không cho rằng tuyên bố là sai, chỉ tò mò nếu đó là những gì bạn đang nói.
Andrew M

2
@AndrewM Chắc chắn chỉ có bình thường có cả ba cùng nhau. Ngoài ra, chỉ một hoặc ba là đủ để ám chỉ bình thường - thứ ba đặc trưng cho bình thường ( Lukacs, 1942 ) và đối với số lượng hữu hạn của các biến ngẫu nhiên độc lập, chỉ có bình thường mới có đầu tiên ( định lý phân rã của Cramér ). Có thể hình dung rằng có một số cách khác để có được thứ hai, nhưng tôi không biết về một cách.
Glen_b -Reinstate Monica

@AndrewM đối với phần hai, công việc của Ahsanullah (1987,1989) có thể có liên quan.
Glen_b -Reinstate Monica

1
Cảm ơn những tham khảo @Glen_b! Tôi không nhận thức được kết quả của Lukacs và định lý phân rã của Cramer như đã nêu là mạnh hơn phiên bản tôi có trên đỉnh đầu ( Bình thường iff Bình thường, cho tất cả các ma trận ). A X AXAXA
Andrew M

@AndrewM Sự khác biệt là kết quả mà bạn trích dẫn ở đó không phụ thuộc vào sự độc lập, trong khi kết quả của Cramer thì có. Cả hai đều hữu ích ở vị trí của họ.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.