Sự khác biệt giữa Kiểm tra tổng xếp hạng Wilcoxon và Kiểm tra xếp hạng Wilcoxon đã ký


22

Tôi đã tự hỏi sự khác biệt về lý thuyết là gì giữa Wilcoxon Rank-Sum Test và Wilcoxon Signed-Rank Test sử dụng các quan sát ghép nối. Tôi biết rằng Thử nghiệm tổng xếp hạng Wilcoxon cho phép số lượng quan sát khác nhau trong hai mẫu khác nhau, trong khi thử nghiệm có chữ ký cho các mẫu được ghép đôi không cho phép điều đó, tuy nhiên cả hai đều có vẻ kiểm tra giống nhau theo quan điểm của tôi. Ai đó có thể cung cấp cho tôi thêm một số thông tin lý thuyết / lý thuyết khi một người nên sử dụng Bài kiểm tra tổng xếp hạng Wilcoxon và khi nào nên sử dụng Bài kiểm tra xếp hạng Wilcoxon bằng cách sử dụng các quan sát được ghép nối?

Câu trả lời:


25

Bạn nên sử dụng bài kiểm tra xếp hạng đã ký khi dữ liệu được ghép nối .

Bạn sẽ tìm thấy nhiều định nghĩa về ghép nối, nhưng cốt lõi, tiêu chí là thứ khiến cho các cặp giá trị ít nhất phụ thuộc tích cực, trong khi các giá trị không ghép đôi không phụ thuộc. Thông thường, việc ghép cặp phụ thuộc xảy ra do chúng quan sát trên cùng một đơn vị (các biện pháp lặp đi lặp lại), nhưng nó không phải ở cùng một đơn vị, theo một cách nào đó có xu hướng được liên kết (trong khi đo lường cùng một loại) , được coi là "ghép đôi".

Bạn nên sử dụng kiểm tra tổng xếp hạng khi dữ liệu không được ghép nối.

Về cơ bản đó là tất cả.

nn

Hiệu quả của việc sử dụng thử nghiệm được ghép nối khi dữ liệu được ghép nối là nó thường mang lại nhiều sức mạnh hơn để phát hiện những thay đổi mà bạn quan tâm. Nếu sự liên kết dẫn đến sự phụ thuộc mạnh mẽ *, thì khả năng tăng sức mạnh có thể là đáng kể.

* cụ thể, nhưng nói hơi lỏng lẻo, nếu kích thước hiệu ứng lớn so với kích thước điển hình của sự khác biệt cặp, nhưng nhỏ so với kích thước điển hình của sự khác biệt không ghép đôi, bạn có thể nhận được sự khác biệt với thử nghiệm được ghép đôi tại cỡ mẫu khá nhỏ nhưng với phép thử không ghép đôi chỉ ở cỡ mẫu lớn hơn nhiều.

Tuy nhiên, khi dữ liệu không được ghép nối, có thể (ít nhất là một chút) sẽ phản tác dụng để coi dữ liệu là được ghép nối. Điều đó nói rằng, chi phí - khi mất điện - trong nhiều trường hợp có thể khá nhỏ - một nghiên cứu về sức mạnh mà tôi đã thực hiện khi trả lời câu hỏi này dường như cho thấy rằng trung bình tổn thất điện năng trong các tình huống mẫu nhỏ điển hình (nói về n của đơn đặt hàng từ 10 đến 30 trong mỗi mẫu, sau khi điều chỉnh sự khác biệt về mức ý nghĩa) có thể nhỏ đáng ngạc nhiên.

[Nếu bạn thực sự không chắc chắn liệu dữ liệu có được ghép nối hay không, thì việc mất dữ liệu trong việc xử lý dữ liệu chưa ghép nối là tương đối nhỏ, trong khi mức tăng có thể là đáng kể nếu chúng được ghép nối. Điều này cho thấy nếu bạn thực sự không biết và có cách tìm ra cái gì được ghép với cái giả định mà chúng được ghép - chẳng hạn như các giá trị nằm trong cùng một hàng trong một bảng, thực tế có thể có ý nghĩa để hành động như thể dữ liệu được ghép nối để an toàn - mặc dù một số người có thể có xu hướng tập thể dục khá nhiều so với bạn làm điều đó.]


7

Tôi không phải là một nhà nghiên cứu, mặc dù tôi là một chuyên gia thống kê. Trước tiên tôi sẽ bố trí các yêu cầu cho Bài kiểm tra tổng xếp hạng Wilcoxon đã ký (WSRST).

  • WSRST yêu cầu các quần thể được ghép nối, ví dụ, cùng một nhóm người được kiểm tra vào hai dịp hoặc sự việc khác nhau và ĐO LƯỜNG về tác động của từng trường hợp và sau đó chúng ta so sánh hai điều hoặc dịp.
  • WSRST yêu cầu dữ liệu phải được định lượng. Dữ liệu định lượng là dữ liệu được đo dọc theo thang đo, đó là lý do tại sao tôi nhấn mạnh thế giới được đo ở điểm đầu tiên. Nếu những người tham gia được yêu cầu xếp hạng các câu trả lời của họ, thì bạn sẽ xử lý dữ liệu định tính, khi đó bạn sẽ phải sử dụng bài kiểm tra dấu hiệu để kiểm tra giả thuyết của mình.

[Có các yêu cầu khác đối với WSRST nhưng những yêu cầu tôi đã liệt kê là đủ để phân biệt hai thử nghiệm]

Bây giờ bài kiểm tra tổng xếp hạng Wilcoxon (WRST)

  • Yêu cầu chính là các mẫu được rút ra từ các quần thể độc lập. Ví dụ, bạn có thể muốn kiểm tra xem bài thi 1 có khó hơn bài thi 2 không, và để làm điều này, bạn sẽ có hai nhóm học sinh và các nhóm không cần phải có cùng kích cỡ. Từ ví dụ, hai nhóm là độc lập, nếu bạn đã yêu cầu cùng một nhóm viết cùng một bài hai lần, thì bạn sẽ sử dụng WSRST để kiểm tra giả thuyết của mình.
  • Yêu cầu khác là dữ liệu không cần phải định lượng, tức là bạn cũng có thể thực hiện kiểm tra trên dữ liệu định tính.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.