Làm thế nào để kiểm tra sự khác biệt giữa hai nhóm có nghĩa là khi dữ liệu không được phân phối bình thường?

19

Tôi sẽ loại bỏ tất cả các chi tiết sinh học và thí nghiệm và chỉ trích dẫn vấn đề trong tay và những gì tôi đã làm được theo thống kê. Tôi muốn biết nếu nó đúng, và nếu không, làm thế nào để tiến hành. Nếu dữ liệu (hoặc giải thích của tôi) không đủ rõ ràng, tôi sẽ cố gắng giải thích rõ hơn bằng cách chỉnh sửa.

Giả sử tôi có hai nhóm / quan sát, X và Y, với kích thước và . Tôi muốn biết nếu phương tiện của hai quan sát này là bằng nhau. Câu hỏi đầu tiên của tôi là: $N_x=215$ $N_y=40$

Nếu các giả định được thỏa mãn, có liên quan để sử dụng thử nghiệm t hai mẫu tham số ở đây không? Tôi hỏi điều này bởi vì theo hiểu biết của tôi, nó thường được áp dụng khi kích thước nhỏ?
Tôi đã vẽ sơ đồ biểu đồ của cả X và Y và chúng không được phân phối bình thường, một trong những giả định của thử nghiệm t hai mẫu. Sự nhầm lẫn của tôi là, tôi coi chúng là hai quần thể và đó là lý do tại sao tôi kiểm tra phân phối bình thường. Nhưng sau đó tôi chuẩn bị thực hiện bài kiểm tra hai MẪU ... Điều này có đúng không?
Từ định lý giới hạn trung tâm, tôi hiểu rằng nếu bạn thực hiện lấy mẫu (có / không lặp lại tùy thuộc vào kích thước dân số của bạn) nhiều lần và tính trung bình của các mẫu mỗi lần, thì nó sẽ được phân phối bình thường. Và, giá trị trung bình của các biến ngẫu nhiên này sẽ là một ước tính tốt về trung bình dân số. Vì vậy, tôi đã quyết định làm điều này trên cả X và Y, 1000 lần và thu được các mẫu và tôi đã chỉ định một biến ngẫu nhiên cho giá trị trung bình của từng mẫu. Cốt truyện được phân phối rất bình thường. Giá trị trung bình của X và Y là 4.2 và 15.8 (tương đương với dân số + - 0,15) và phương sai là 0,95 và 12,11.
Tôi đã thực hiện một bài kiểm tra t trên hai quan sát này (mỗi điểm 1000 dữ liệu) với phương sai không bằng nhau, vì chúng rất khác nhau (0,95 và 12,11). Và giả thuyết khống đã bị bác bỏ.
Điều này có ý nghĩa gì không? Đây là cách tiếp cận đúng / có ý nghĩa hay một bài kiểm tra z hai mẫu là đủ hay nó hoàn toàn sai?
Tôi cũng đã thực hiện một thử nghiệm Wilcoxon không tham số để chắc chắn (trên X và Y gốc) và giả thuyết khống cũng bị từ chối một cách thuyết phục. Trong trường hợp phương pháp trước đây của tôi hoàn toàn sai, tôi cho rằng làm một bài kiểm tra không tham số là tốt, ngoại trừ khả năng thống kê có thể?

Trong cả hai trường hợp, các phương tiện đều khác nhau đáng kể. Tuy nhiên, tôi muốn biết liệu một trong hai hoặc cả hai cách tiếp cận đều bị lỗi / hoàn toàn sai và nếu vậy, phương án thay thế là gì?

— Arun
nguồn

21

Ý tưởng rằng thử nghiệm t chỉ dành cho các mẫu nhỏ là một sự nắm giữ lịch sử. Vâng, ban đầu nó được phát triển cho các mẫu nhỏ, nhưng không có gì trong lý thuyết phân biệt nhỏ với lớn. Vào thời trước khi máy tính phổ biến để thực hiện thống kê, các bảng t thường chỉ tăng lên khoảng 30 độ tự do và thông thường được sử dụng ngoài mức gần đúng của phân bố t. Điều này là để thuận tiện để giữ cho kích thước của bàn t hợp lý. Bây giờ với máy tính, chúng tôi có thể thực hiện kiểm tra t cho bất kỳ kích thước mẫu nào (mặc dù đối với các mẫu rất lớn, sự khác biệt giữa kết quả của kiểm tra z và kiểm tra t là rất nhỏ). Ý tưởng chính là sử dụng phép thử t khi sử dụng mẫu để ước tính độ lệch chuẩn và phép thử z nếu độ lệch chuẩn dân số được biết (rất hiếm).

Định lý giới hạn trung tâm cho phép chúng ta sử dụng suy luận lý thuyết bình thường (kiểm tra t trong trường hợp này) ngay cả khi dân số không được phân phối bình thường miễn là kích thước mẫu đủ lớn. Điều này không có nghĩa là bài kiểm tra của bạn là gần đúng (nhưng với kích thước mẫu của bạn, sự chấp nhận sẽ rất tốt).

Thử nghiệm Wilcoxon không phải là thử nghiệm về phương tiện (trừ khi bạn biết rằng quần thể đó hoàn toàn đối xứng và các giả định không thể khác giữ được). Nếu phương tiện là điểm quan tâm chính thì bài kiểm tra t có lẽ là cách tốt nhất để trích dẫn.

Cho rằng độ lệch chuẩn của bạn rất khác nhau và hình dạng không bình thường và có thể khác biệt với nhau, sự khác biệt về phương tiện có thể không phải là điều thú vị nhất đang diễn ra ở đây. Hãy suy nghĩ về khoa học và những gì bạn muốn làm với kết quả của bạn. Là quyết định được đưa ra ở cấp độ dân số hoặc cấp độ cá nhân? Hãy nghĩ về ví dụ này: bạn đang so sánh 2 loại thuốc cho một căn bệnh nhất định, về loại thuốc Một nửa mẫu đã chết ngay lập tức nửa còn lại hồi phục sau khoảng một tuần; trên thuốc B tất cả đều sống sót và hồi phục, nhưng thời gian phục hồi lâu hơn một tuần. Trong trường hợp này, bạn có thực sự quan tâm đến thời gian phục hồi ngắn hơn không? Hoặc thay thế một nửa chết trong A bằng chỉ mất một thời gian rất dài để hồi phục (lâu hơn bất kỳ ai trong nhóm B).

— Greg tuyết
nguồn

Cảm ơn bạn Greg. Tôi cho rằng không có gì sai với thủ tục per-se? Tôi hiểu rằng tôi có thể không hỏi đúng câu hỏi, nhưng mối quan tâm của tôi là bằng nhau về kiểm tra / thủ tục thống kê và hiểu chính nó được đưa ra hai mẫu. Tôi sẽ kiểm tra nếu tôi hỏi đúng câu hỏi và quay lại với câu hỏi, nếu có. Có lẽ nếu tôi giải thích vấn đề sinh học, nó sẽ giúp với nhiều gợi ý hơn. Cảm ơn một lần nữa.

— Arun

5

Một bổ sung cho câu trả lời đã rất toàn diện của Greg.

Nếu tôi hiểu bạn đúng cách, điểm 3 của bạn nêu quy trình sau:

$n$ $X$
$m$ $n$
Lặp lại 1000 lần này, lưu phương tiện tương ứng
$X$

Bây giờ giả định của bạn là, với điều này có nghĩa là định lý giới hạn trung tâm giữ và biến ngẫu nhiên tương ứng sẽ được phân phối bình thường.

Có lẽ chúng ta hãy xem toán học đằng sau tính toán của bạn để xác định lỗi:

$X$ $X_1,\ldots,X_n$ $X_1,\ldots, X_n\sim X$ $m$ $k$

Y_{k} = = \frac{1}{m} Σ_{tôi = = 1}^{m} X_{μ_{tôi}^{k}}

$Y_k=\frac{1}{m}\sum_{i=1}^m X_{\mu^k_{i}}$

$\mu^k_i$ $n$ $i$

\frac{1}{1000} Σ_{k = = 1}^{1000} \frac{1}{m} Σ_{tôi = = 1}^{m} X_{μ_{tôi}^{k}}

$\frac{1}{1000}\sum_{k=1}^{1000} \frac{1}{m}\sum_{i=1}^m X_{\mu^k_{i}}$

$X_i$ $1000m$ $1000m$ $X_i$

Tuy nhiên, bây giờ, Định lý giới hạn trung tâm nói rằng tổng của rất nhiều biến ngẫu nhiên độc lập là xấp xỉ bình thường. (Kết quả cũng là trung bình xấp xỉ bình thường).

Tổng của bạn ở trên không tạo ra các mẫu độc lập. Bạn có thể có trọng lượng ngẫu nhiên, nhưng điều đó không làm cho mẫu của bạn độc lập chút nào. Vì vậy, thủ tục viết bằng 3 là không hợp pháp.

$t$

— Thilo
nguồn

Cảm ơn bạn. Có vẻ như kiểm tra t đã xử lý vấn đề bằng cách sử dụng CLT (từ câu trả lời của greg mà tôi đã bỏ qua). Cảm ơn đã chỉ ra rằng và giải thích rõ ràng về 3) đó là những gì tôi thực sự muốn biết. Tôi sẽ phải đầu tư nhiều thời gian hơn để nắm bắt những khái niệm này.

— Arun

2

Hãy nhớ rằng CLT hoạt động tốt khác nhau tùy thuộc vào phân phối trong tay (hoặc thậm chí tệ hơn, giá trị kỳ vọng hoặc phương sai của phân phối không tồn tại - thì CLT thậm chí không hợp lệ). Nếu nghi ngờ, luôn luôn là một ý tưởng tốt để tạo phân phối trông giống với phân phối bạn quan sát và sau đó mô phỏng thử nghiệm của bạn bằng phân phối này vài trăm lần. Bạn sẽ có cảm giác về chất lượng của các nguồn cung cấp CLT gần đúng.

— Thilo