Làm cách nào để kiểm tra nếu hai bản phân phối (không bình thường) khác nhau?


13

Tôi đã đọc về bài kiểm tra t của Sinh viên nhưng có vẻ như nó hoạt động khi chúng ta có thể cho rằng các bản phân phối gốc được phân phối bình thường. Trong trường hợp của tôi, họ chắc chắn là không.

Ngoài ra, nếu tôi có 13 bản phân phối, tôi có cần làm 13^2các bài kiểm tra không?

Đây là một mẫu của hai phân biệt.  Có 13 bản phân phối.


@Glen_b Dữ liệu không rời rạc. Giá trị nằm trong khoảng từ -2 đến 2.
Martin Velez

Câu trả lời:


19

Có một số giác quan trong đó "nó phụ thuộc".

(Một mối quan tâm tiềm năng là có vẻ như dữ liệu gốc có thể rời rạc; điều đó cần được làm rõ.)

  1. tùy thuộc vào cỡ mẫu, tính phi chuẩn có thể không phải là vấn đề lớn như tất cả đối với phép thử t. Đối với các mẫu lớn ít nhất thường có độ bền tốt - Tỷ lệ lỗi loại I không nên bị ảnh hưởng quá nặng nếu nó không thực sự xa so với bình thường. Sức mạnh có thể là một vấn đề với đuôi nặng.

  2. Nếu bạn đang tìm kiếm bất kỳ loại khác biệt nào trong phân phối, thì mức độ phù hợp của hai mẫu thử nghiệm, chẳng hạn như thử nghiệm Kolmogorov - Smirnov hai mẫu có thể phù hợp (mặc dù các thử nghiệm khác có thể được thực hiện).

  3. Nếu bạn đang tìm kiếm sự khác biệt về loại vị trí trong một gia đình vị trí hoặc sự khác biệt về quy mô trong một gia đình tỷ lệ hoặc thậm chí chỉ là mối quan hệ loại P (X> Y)> P (Y> X), thì Wilcoxon-Mann-Whitney hai bài kiểm tra mẫu có thể phù hợp.

  4. Bạn có thể xem xét các thử nghiệm lấy mẫu lại như thử nghiệm hoán vị hoặc bootstrap, nếu bạn có thể tìm thấy một thống kê phù hợp cho (các) loại khác biệt mà bạn muốn có độ nhạy.

Ngoài ra, nếu tôi có 13 bản phân phối, tôi có cần thực hiện 13 ^ 2 bài kiểm tra không?

À, không .

MộtB BMột

AMột

Hai điều đó đã cắt giảm các so sánh theo cặp từ 169 xuống 78.

Thứ ba, sẽ là bình thường hơn nhiều (nhưng không bắt buộc) để kiểm tra tập thể cho bất kỳ sự khác biệt nào , và sau đó, có lẽ để xem xét sự khác biệt theo cặp trong các bài kiểm tra cặp sau-hoc nếu null đầu tiên bị từ chối.

Ví dụ, thay cho Wilcoxon-Mann-Whitney như trong mục 3. ở trên, người ta có thể thực hiện thử nghiệm Kruskal-Wallis, rất nhạy cảm với bất kỳ sự khác biệt nào về vị trí giữa các nhóm.

Ngoài ra còn có các phiên bản mẫu k của thử nghiệm Kolmogorov - Smirnov và các thử nghiệm tương tự đối với một số thử nghiệm độ phù hợp hai mẫu khác của các thử nghiệm phù hợp có thể tồn tại hoặc được xây dựng.

Ngoài ra còn có các phiên bản mẫu k của các thử nghiệm lấy mẫu lại và thử nghiệm t (ví dụ ANOVA, có thể ổn nếu kích thước mẫu lớn một cách hợp lý).


Sẽ thật tuyệt khi có thêm thông tin về những gì chúng ta đang giải quyết và loại khác biệt nào bạn quan tâm nhất; hoặc không thành công, để xem các lô QQ của một số mẫu.


(+1) Cũng giống như thêm rằng thử nghiệm WMW mang một cách hiểu như một thử nghiệm cho sự thống trị ngẫu nhiên nếu bạn chuẩn bị cho rằng các CDF dân số không giao nhau. Người IMO thường muốn điều đó hơn nếu họ biết về nó.
Scortchi - Phục hồi Monica

1
P(X<Y)12

@Glen_b Dữ liệu không rời rạc. Giá trị nằm trong khoảng từ -2 đến 2.
Martin Velez

Wow - thông tin quan trọng! Có phải chúng bị giới hạn trong phạm vi đó (2.1 là không thể) hoặc đã xảy ra rằng các giá trị nằm trong phạm vi đó?
Glen_b -Reinstate Monica

Họ bị giới hạn trong phạm vi đó.
Martin Velez

5

Có, tôi nghĩ bạn không thể làm tốt hơn việc kiểm tra từng bản phân phối so với các bản phân phối khác ...

Nếu nghĩ rằng câu hỏi của bạn có liên quan đến câu hỏi này: So sánh 2 bản phân phối

Bạn khuyên bạn nên sử dụng xét nghiệm Kolmogorov-Sminorv hoặc thử nghiệm Cramér-Von Mises. Cả hai đều là bài kiểm tra đầy đủ rất cổ điển.

Trong R, chức năng ks.testtrong gói thống kê thực hiện cái đầu tiên. Cái thứ hai có thể được tìm thấy trong các gói như cramer.

Để tìm hiểu về hai bài kiểm tra này: http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion


2

Bạn có thể thử phân tích phương sai một chiều của Kruskal, Wallis

"Nó được sử dụng để so sánh nhiều hơn hai mẫu độc lập hoặc không liên quan"

Vi phạm quy tắc trong ANOVA đã được thảo luận tại
Rutherford Giới thiệu Anova và Ancova: Cách tiếp cận GLM 9.1.2 Vi phạm quy tắc

Dòng đầu tiên có "Mặc dù hầu hết các nguồn báo cáo ANOVA ... là mạnh mẽ đối với các vi phạm giả định về tính quy tắc ..."


Cảm ơn! Có vẻ như người ta nên chạy thử nghiệm này trước khi thực hiện so sánh cặp.
Martin Velez
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.