Giả sử chúng ta đang xử lý tập dữ liệu này trong đó là biến liên tục (ví dụ Exponential) và là phân phối rời rạc (ví dụ Poisson) cho . Hãy nói rằng là mối tương quan giữa và . Làm thế nào ai đó có thể định nghĩa ?
Giả sử chúng ta đang xử lý tập dữ liệu này trong đó là biến liên tục (ví dụ Exponential) và là phân phối rời rạc (ví dụ Poisson) cho . Hãy nói rằng là mối tương quan giữa và . Làm thế nào ai đó có thể định nghĩa ?
Câu trả lời:
Tôi muốn nói có ít nhất 3 lựa chọn hợp lý sẽ có ý nghĩa với bạn:
Để trả lời câu hỏi của bạn trực tiếp hơn, tính toán như bình thường (giả sử bạn có nghĩa là hệ số tương quan thời điểm sản phẩm theo đó) có thể có các thuộc tính bạn mong đợi, hoặc ít nhất nó sẽ lớn hơn khi sự phụ thuộc tuyến tính giữa các biến tăng lên . Tuy nhiên, một thử nghiệm thống kê về tầm quan trọng của mối tương quan sẽ không có giá trị vì một trong những giả định cần thiết cho thử nghiệm như vậy là tính quy tắc hai biến và điều đó rõ ràng là không đúng nếu một trong các biến là rời rạc.
Mặc dù vậy, việc kiểm tra tầm quan trọng với hệ số tương quan không tham số (ví dụ Spearman) sẽ có thể thực hiện được và có thể dễ dàng tìm thấy các triển khai được ghi chép rõ ràng bằng ngôn ngữ đó.