Lấy từ số liệu thống kê thực tế cho nghiên cứu y học nơi Douglas Altman viết ở trang 285:
... Với hai đại lượng bất kỳ X và Y, X sẽ tương quan với XY. Thật vậy, ngay cả khi X và Y là mẫu của các số ngẫu nhiên, chúng ta sẽ mong đợi mối tương quan của X và XY là 0,7
Tôi đã thử điều này trong R và có vẻ như là trường hợp:
x <- rnorm(1000000, 10, 2)
y <- rnorm(1000000, 10, 2)
cor(x, x-y)
xu <- sample(1:100, size = 1000000, replace = T)
yu <- sample(1:100, size = 1000000, replace = T)
cor(xu, xu-yu)
Tại sao vậy? Lý thuyết đằng sau điều này là gì?