Bạn nên sử dụng bài kiểm tra xếp hạng đã ký khi dữ liệu được ghép nối .
Bạn sẽ tìm thấy nhiều định nghĩa về ghép nối, nhưng cốt lõi, tiêu chí là thứ khiến cho các cặp giá trị ít nhất phụ thuộc tích cực, trong khi các giá trị không ghép đôi không phụ thuộc. Thông thường, việc ghép cặp phụ thuộc xảy ra do chúng quan sát trên cùng một đơn vị (các biện pháp lặp đi lặp lại), nhưng nó không phải ở cùng một đơn vị, theo một cách nào đó có xu hướng được liên kết (trong khi đo lường cùng một loại) , được coi là "ghép đôi".
Bạn nên sử dụng kiểm tra tổng xếp hạng khi dữ liệu không được ghép nối.
Về cơ bản đó là tất cả.
nn
Hiệu quả của việc sử dụng thử nghiệm được ghép nối khi dữ liệu được ghép nối là nó thường mang lại nhiều sức mạnh hơn để phát hiện những thay đổi mà bạn quan tâm. Nếu sự liên kết dẫn đến sự phụ thuộc mạnh mẽ *, thì khả năng tăng sức mạnh có thể là đáng kể.
* cụ thể, nhưng nói hơi lỏng lẻo, nếu kích thước hiệu ứng lớn so với kích thước điển hình của sự khác biệt cặp, nhưng nhỏ so với kích thước điển hình của sự khác biệt không ghép đôi, bạn có thể nhận được sự khác biệt với thử nghiệm được ghép đôi tại cỡ mẫu khá nhỏ nhưng với phép thử không ghép đôi chỉ ở cỡ mẫu lớn hơn nhiều.
Tuy nhiên, khi dữ liệu không được ghép nối, có thể (ít nhất là một chút) sẽ phản tác dụng để coi dữ liệu là được ghép nối. Điều đó nói rằng, chi phí - khi mất điện - trong nhiều trường hợp có thể khá nhỏ - một nghiên cứu về sức mạnh mà tôi đã thực hiện khi trả lời câu hỏi này dường như cho thấy rằng trung bình tổn thất điện năng trong các tình huống mẫu nhỏ điển hình (nói về n của đơn đặt hàng từ 10 đến 30 trong mỗi mẫu, sau khi điều chỉnh sự khác biệt về mức ý nghĩa) có thể nhỏ đáng ngạc nhiên.
[Nếu bạn thực sự không chắc chắn liệu dữ liệu có được ghép nối hay không, thì việc mất dữ liệu trong việc xử lý dữ liệu chưa ghép nối là tương đối nhỏ, trong khi mức tăng có thể là đáng kể nếu chúng được ghép nối. Điều này cho thấy nếu bạn thực sự không biết và có cách tìm ra cái gì được ghép với cái giả định mà chúng được ghép - chẳng hạn như các giá trị nằm trong cùng một hàng trong một bảng, thực tế có thể có ý nghĩa để hành động như thể dữ liệu được ghép nối để an toàn - mặc dù một số người có thể có xu hướng tập thể dục khá nhiều so với bạn làm điều đó.]