Giả sử tôi có một mẫu từ phân phối chung của X và Y . Làm thế nào để kiểm tra giả thuyết rằng X và Y là độc lập ?
Không có giả định nào được đưa ra dựa trên luật phân phối chung hoặc biên của và Y (ít nhất là tất cả các quy tắc chung, vì trong trường hợp đó tính độc lập giống hệt với tương quan là 0 ).
Không có giả định nào được thực hiện dựa trên bản chất của mối quan hệ có thể có giữa và Y ; nó có thể không tuyến tính, vì vậy các biến không tương quan ( r = 0 ) nhưng phụ thuộc rất cao ( I = H ).
Tôi có thể thấy hai cách tiếp cận:
Bin cả hai biến và sử dụng thử nghiệm chính xác của Fisher hoặc G-test .
- Pro: sử dụng các bài kiểm tra thống kê được thiết lập tốt
- Con: phụ thuộc vào binning
Ước tính sự phụ thuộc của và Y : I ( X ; Y ) (đây làđối vớiXvàYđộc lậpvà1khi chúng hoàn toàn xác định lẫn nhau).
- Pro: tạo ra một số có ý nghĩa lý thuyết rõ ràng
- Con: phụ thuộc vào tính toán entropy gần đúng (nghĩa là đóng gói lại)
Những cách tiếp cận này có ý nghĩa?
Những phương pháp khác mọi người sử dụng?