Tại sao các mối quan hệ rất khó khăn trong thống kê phi tham số?


14

Văn bản không tham số của tôi, Số liệu thống kê phi thực tế , thường đưa ra các công thức rõ ràng cho các kỳ vọng, phương sai, thống kê kiểm tra và tương tự, nhưng bao gồm cảnh báo rằng điều này chỉ hoạt động nếu chúng ta bỏ qua các mối quan hệ. Khi tính toán Thống kê Mann-Whitney U, bạn nên loại bỏ các cặp bị trói khi so sánh cái nào lớn hơn.

Tôi hiểu rằng các mối quan hệ không thực sự cho chúng ta biết nhiều về dân số nào lớn hơn (nếu đó là điều chúng ta quan tâm) vì không nhóm nào lớn hơn nhóm kia, nhưng dường như điều đó sẽ không quan trọng khi phát triển các phân phối tiệm cận.

Tại sao sau đó nó là một vấn đề khó khăn như vậy đối phó với các mối quan hệ trong một số thủ tục không theo quy chuẩn? Có cách nào để trích xuất bất kỳ thông tin hữu ích nào từ các mối quan hệ, thay vì chỉ đơn giản là vứt chúng đi?

EDIT: Liên quan đến nhận xét của @ whuber, tôi đã kiểm tra lại các nguồn của mình và một số quy trình sử dụng trung bình các cấp bậc thay vì bỏ hoàn toàn các giá trị bị ràng buộc. Mặc dù điều này có vẻ hợp lý hơn trong việc giữ lại thông tin, nhưng đối với tôi, nó cũng thiếu sự nghiêm ngặt. Tinh thần của câu hỏi vẫn đứng, tuy nhiên.


Bạn đang nói rằng Số liệu thống kê phi thực tế thực tế bảo bạn " vứt bỏ " dữ liệu khi chúng bị ràng buộc? Có lẽ bạn có thể hiểu sai lời khuyên của nó? Bạn có thể trích dẫn chính xác?
whuber

Vâng, có thể là tôi đang hiểu sai lời khuyên. Từ cùng một tác giả: jstor.org/ sóng/2284536 "Wilcoxon đề nghị bỏ các số không từ dữ liệu ban đầu và thực hiện kiểm tra trên tập dữ liệu giảm. Nếu không có liên kết khác thì quy trình này dẫn đến một điều kiện (đưa ra số Vì lý do này, hầu hết các cuốn sách về thống kê phi tham số đều kết hợp phương pháp của Wilcoxon vào mô tả thử nghiệm của họ "
Christopher Aden

Cấp, điều này có liên quan đến bài kiểm tra Wilcoxon Signed Rank, nhưng tôi đã nghe lời khuyên tương tự được sử dụng trong các thủ tục NP khác. Liên quan đến ví dụ Mann-Whitney, tôi đã quay lại và kiểm tra trong cuốn sách, và bạn nói đúng rằng tôi đã nhầm. Với Mann-Whitney, cuốn sách khuyên bạn nên tính trung bình các cấp bậc của các giá trị được gắn, tức là: nếu thứ hạng 6 và 7 được gắn, hãy cho mỗi thứ một giá trị là 6,5.
Christopher Aden

2
Cảm ơn bạn. Có những cách nghiêm ngặt để giải thích cho các nhóm bị ràng buộc. Chúng rất quan trọng khi làm việc với dữ liệu bị kiểm duyệt (nhưng liên tục), bởi vì thường các giá trị bị kiểm duyệt tạo thành một nhóm lớn bị ràng buộc. Đối với các thử nghiệm Xếp hạng Kruskal-Wallis và Wilcoxon, xem chương 18 của RO Gilbert, * Phương pháp thống kê để theo dõi ô nhiễm môi trường. "Các công thức liên quan đến dữ liệu bị ràng buộc có thể trở nên phức tạp, nhưng trong một số trường hợp (như thử nghiệm KW), tất cả những gì bạn cần làm được tính một bảng ANOVA cho các cấp bậc.
whuber

Câu trả lời:


14

Hầu hết các công việc về phi tham số ban đầu được thực hiện với giả định rằng có một phân phối liên tục cơ bản trong đó các mối quan hệ là không thể (nếu được đo chính xác đủ). Lý thuyết sau đó có thể dựa trên sự phân phối của thống kê đơn hàng (đơn giản hơn rất nhiều mà không cần ràng buộc) hoặc các công thức khác. Trong một số trường hợp, số liệu thống kê hoạt động gần như bình thường khiến mọi thứ thực sự dễ dàng. Khi các mối quan hệ được đưa ra do dữ liệu được làm tròn hoặc rời rạc một cách tự nhiên, thì các giả định tiêu chuẩn không được giữ. Giá trị gần đúng có thể vẫn đủ tốt trong một số trường hợp, nhưng không phải trong các trường hợp khác, vì vậy, điều dễ nhất để làm là chỉ đưa ra một cảnh báo rằng các công thức này không hoạt động với mối quan hệ.

Có các công cụ cho một số thử nghiệm phi tham số tiêu chuẩn đã thực hiện phân phối chính xác khi có quan hệ. Gói chính xácRankTests cho R là một ví dụ.

Một cách đơn giản để xử lý các mối quan hệ là sử dụng các thử nghiệm ngẫu nhiên như thử nghiệm hoán vị hoặc bootstrapping. Những người này không lo lắng về phân phối tiệm cận, nhưng sử dụng dữ liệu như nó là, mối quan hệ và tất cả (lưu ý rằng với rất nhiều mối quan hệ, ngay cả những kỹ thuật này có thể có sức mạnh thấp).

Có một bài báo vài năm trước (tôi nghĩ trong Thống kê Hoa Kỳ, nhưng tôi không tìm thấy nó) đã thảo luận về ý tưởng của mối quan hệ và một số điều bạn có thể làm với họ. Một điểm là nó phụ thuộc vào câu hỏi bạn đang hỏi, phải làm gì với các mối quan hệ có thể rất khác nhau trong một bài kiểm tra ưu việt so với một bài kiểm tra không thua kém.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.