Tôi đã thực hiện một thử nghiệm trong đó tôi đã thu thập các phép đo từ một số người tham gia. Mỗi điểm dữ liệu có liên quan có hai biến, cả hai đều phân loại: trên thực tế, mỗi biến có hai giá trị có thể (câu trả lời cho hai câu hỏi có / không). Tôi muốn một thử nghiệm giả thuyết thống kê để kiểm tra xem có vẻ như có mối tương quan giữa hai biến này không.
Nếu tôi có một điểm dữ liệu cho mỗi người tham gia, tôi có thể sử dụng thử nghiệm chính xác Fisher về kết quả bảng ngẫu nhiên. Tuy nhiên, tôi có nhiều điểm dữ liệu cho mỗi người tham gia. Do đó, thử nghiệm chính xác của Fisher dường như không thể áp dụng được, bởi vì các điểm dữ liệu từ một người tham gia không độc lập. Chẳng hạn, nếu tôi có 10 điểm dữ liệu từ Alice, những điểm đó có thể không độc lập, bởi vì tất cả chúng đều đến từ cùng một người. Thử nghiệm chính xác của Fisher giả định rằng tất cả các điểm dữ liệu được lấy mẫu độc lập, do đó, các giả định về thử nghiệm chính xác của Fisher không được thỏa mãn và sẽ không phù hợp để sử dụng trong cài đặt này (nó có thể đưa ra các báo cáo không chính đáng về ý nghĩa thống kê).
Có kỹ thuật để xử lý tình huống này?
Phương pháp tiếp cận tôi đã xem xét:
Một thay thế hợp lý là tổng hợp tất cả dữ liệu từ mỗi người tham gia thành một số duy nhất, sau đó sử dụng một số thử nghiệm độc lập khác. Chẳng hạn, với mỗi người tham gia, tôi có thể đếm tỷ lệ câu trả lời Có cho câu hỏi đầu tiên và tỷ lệ câu trả lời Có cho câu hỏi thứ hai, cho tôi hai số thực cho mỗi người tham gia, sau đó sử dụng bài kiểm tra thời điểm sản phẩm của Pearson để kiểm tra tương quan giữa hai số này. Tuy nhiên, tôi không chắc liệu đây có phải là một cách tiếp cận tốt hay không. (Ví dụ: tôi lo lắng rằng tính trung bình / đếm đang làm mất dữ liệu và điều này có thể bị mất sức mạnh, do sự tổng hợp; hoặc các dấu hiệu phụ thuộc có thể biến mất sau khi tổng hợp.)
Tôi đã đọc về các mô hình đa cấp, có vẻ như chúng được dự định xử lý tình huống này khi các biến cơ bản liên tục (ví dụ: số thực) và khi mô hình tuyến tính phù hợp. Tuy nhiên, ở đây tôi có hai biến phân loại (câu trả lời cho Có / Không có câu hỏi), vì vậy chúng dường như không áp dụng ở đây. Có một số kỹ thuật tương đương có thể áp dụng cho dữ liệu phân loại?
Tôi cũng đã đọc một chút về thiết kế các biện pháp lặp đi lặp lại trên Wikipedia, nhưng bài viết trên Wikipedia tập trung vào các nghiên cứu theo chiều dọc. Điều đó dường như không thể áp dụng ở đây: nếu tôi hiểu chính xác, các biện pháp lặp đi lặp lại dường như tập trung vào các hiệu ứng do thời gian trôi qua (trong đó sự tiến triển của thời gian ảnh hưởng đến các biến). Tuy nhiên, trong trường hợp của tôi, thời gian trôi qua không nên có bất kỳ ảnh hưởng nào. Đừng nói với tôi nếu tôi hiểu lầm.
Về sự phản ánh hơn nữa, một cách tiếp cận khác xảy ra với tôi là sử dụng một bài kiểm tra hoán vị. Đối với mỗi người tham gia, chúng tôi có thể hoán vị ngẫu nhiên câu trả lời của họ cho câu hỏi 1 và (độc lập) hoán vị ngẫu nhiên câu trả lời của họ cho câu hỏi 2, sử dụng một hoán vị khác nhau cho mỗi người tham gia. Tuy nhiên, đối với tôi không rõ thống kê kiểm tra nào sẽ phù hợp ở đây, để đo lường kết quả nào "ít nhất là cực đoan" như kết quả quan sát được.
Liên quan: Làm thế nào để xử lý chính xác nhiều điểm dữ liệu cho mỗi đối tượng (nhưng cũng tập trung vào các mô hình tuyến tính cho các biến liên tục, không phải dữ liệu phân loại), Các phép đo được thực hiện trên cùng một bệnh nhân? (tương tự)