Tại sao độc lập ngụ ý không tương quan?


16

Trước hết, tôi không hỏi điều này:

Tại sao không tương quan không ngụ ý độc lập?

Điều này được giải quyết (khá độc đáo) tại đây: /math/444408/why-does-zero-correlation-not-imply-independence

Điều tôi đang hỏi ngược lại ... nói rằng hai biến hoàn toàn độc lập với nhau.

Họ không thể có một chút tương quan ngẫu nhiên?

Không phải là ... sự độc lập ngụ ý tương quan RẤT LỚN sao?


5
Ngay cả các biến độc lập hầu như sẽ luôn có mối tương quan SAMPLE khác không, mặc dù nó có thể vẫn gần bằng không.
22h55

10
Như @jsk đã chỉ ra, bạn có thể nhầm lẫn mối tương quan mẫu với tương quan dự kiến
David

1
@David bạn có thể giải thích? Tôi vẫn còn rất nhiều người mới bắt đầu thống kê.
Joshua Ronis

3
@JoshuaRonis Tương quan mẫu là mối tương quan bạn quan sát được khi làm việc với một loạt dữ liệu. Bạn sử dụng điều đó để có được một ý tưởng về mối tương quan "thực sự" giữa hai biến là gì. Mẫu càng lớn, ước tính bạn nhận được càng tốt. Ví dụ, mối tương quan giữa kết quả của hai con xúc xắc là độc lập, do đó không tương quan, mặc dù nếu bạn cuộn chúng lại với nhau mười lần, bạn có thể nhận được mối tương quan (do cơ hội ngẫu nhiên) Nhưng xin vui lòng nhận ra rằng không có sự ưu tiên nào cho tương quan dương hay âm (tức là bạn có cơ hội như nhau)
David

1
Không phải là một bản dupe nhưng thảo luận liên quan: Liệu mối tương quan khác không có nghĩa là sự phụ thuộc?
SecretAgentMan

Câu trả lời:


36

Theo định nghĩa của hệ số tương quan, nếu hai biến độc lập thì tương quan của chúng bằng không. Vì vậy, nó không thể có bất kỳ mối tương quan nào một cách tình cờ!

ρX,Y=E[XY]E[X]E[Y]E[X2][E[X]]2 E[Y2][E[Y]]2

Nếu và độc lập, có nghĩa là . Do đó, tử số của bằng không trong trường hợp này.XYE[XY]=E[X]E[Y]ρX,Y

Vì vậy, nếu bạn không thay đổi ý nghĩa của mối tương quan, như đã đề cập ở đây, điều đó là không thể. Trừ khi, làm rõ định nghĩa của bạn từ những gì tương quan là.


2
Tuy nhiên, chúng ta có các biểu đồ cho thấy rõ mối tương quan (nghịch đảo) giữa số lượng cướp biển và nhiệt độ trung bình toàn cầu. Như các ý kiến ​​khác chỉ ra, người ta phải cẩn thận về kích thước mẫu, không kể đến 'sự xuất hiện tình cờ'
Carl Witthoft

@OmG "nếu bạn không thay đổi ý nghĩa của mối tương quan, như được đề cập ở đây" Khi tôi đọc câu hỏi OP, tôi có một ý nghĩa rất khác về "tương quan". Đối với tôi: "Không phải họ có một chút tương quan một cách tình cờ sao?" rất mạnh mẽ ngụ ý 'đo" tương quan, và khi bạn đo lường sự tương quan trong thực tế, bạn sẽ rất thường xuyên tìm thấy 'một chút tương quan một cách tình cờ'.
industry7

1
@ ngành7 tôi thấy. Nhưng nó nên được xác định trong một phương pháp chính thức. Nó là định tính và chúng ta không thể nói về nó ở đây.
OmG

@CarlWitthoft Số lượng cướp biển và nhiệt độ trung bình toàn cầu không độc lập. Họ có một nguyên nhân chung (tức là thời gian, sự phát triển, hiện đại hóa, v.v.) tạo ra sự phụ thuộc giữa họ. "Độc lập" không có nghĩa là "không gây ra"; nó có nghĩa là "không liên kết", và rõ ràng những biểu đồ thể hiện sự liên kết.

@ Không, tôi sợ một WHOOSH đã xảy ra. venganza.org
Carl Witthoft

19

Nhận xét về tương quan mẫu . Khi so sánh hai mẫu độc lập nhỏ có cùng kích thước, tương quan mẫu thường là đáng chú ý khác với r= =0. [Không có gì ở đây mâu thuẫn với @ trả lời OMG của (1) trên dân số tương quan ρ.]

Xem xét mối tương quan giữa một triệu cặp mẫu độc lập có kích thước n= =5 từ phân bố mũ với tỷ lệ 1.

set.seed(616)
r = replicate( 10^6, cor(rexp(5), rexp(5))  )
mean(abs(r) > .5)
[1] 0.386212
mean(r)
[1] -0.0005904455

hist(r, prob=T, br=40, col="skyblue2")
  abline(v=c(-.5,.5), col="red", lwd=2)

nhập mô tả hình ảnh ở đây

Ví dụ, đây là biểu đồ phân tán đầu tiên trong số hàng triệu cặp mẫu có kích thước 5, với r= =-0,5716.

nhập mô tả hình ảnh ở đây

Không có gì đặc biệt về phân phối theo cấp số nhân trong vấn đề này. Thay đổi phân phối cha mẹ thành tiêu chuẩn bình thường cho kết quả như sau.

set.seed(2019)
...
mean(abs(r) > .5)
[1] 0.391061
mean(r)
[1] 1.43269e-05

nhập mô tả hình ảnh ở đây

n= =20.

nhập mô tả hình ảnh ở đây

r


6
Đối với kích thước mẫu nhỏ, bạn có thể tìm thấy các mối tương quan mẫu "đáng chú ý" khác với 0, nhưng bạn không có khả năng tìm thấy các mối tương quan khác biệt đáng kể so với không. Mặc dù ước tính điểm của bạn khác xa 0, nhưng bạn có quá ít dữ liệu để tự tin tuyên bố rằng bạn đang thấy mối tương quan khác không do bất cứ điều gì ngoài cơ hội. Chỉ với 5 cặp, các hệ số tương quan thậm chí lớn hơn 0,8 có thể không khác biệt đáng kể so với 0.
Hạt nhân Wang

11

Câu trả lời đơn giản: nếu 2 biến độc lập, thì tương quan dân số bằng 0, trong khi tương quan mẫu thường sẽ nhỏ, nhưng khác không.

Đó là bởi vì mẫu không phải là một đại diện hoàn hảo của dân số.

Mẫu càng lớn, đại diện cho dân số càng tốt, do đó, mối tương quan bạn sẽ có càng nhỏ. Đối với một mẫu vô hạn , mối tương quan sẽ bằng không.


1
pεnnεp

Vâng, hoàn toàn chính xác! Tôi đã cố gắng để giữ cho câu trả lời của tôi đơn giản và khái niệm nhất có thể.
Dave

1

Có lẽ điều này hữu ích cho một số người chia sẻ sự hiểu biết trực quan tương tự. Chúng ta đều đã thấy một cái gì đó như thế này:

nhập mô tả hình ảnh ở đây

r= =0,66

Như những người khác đã chỉ ra, các giá trị mẫu có tương quan, nhưng điều đó không có nghĩa là dân số có tương quan khác không.

Tất nhiên, hai phim này phải là một nhóm độc lập được đưa ra bởi Nicolas Cage đã xuất hiện trong 10 bộ phim kỷ lục trong năm nay, chúng ta không nên đóng cửa bể bơi địa phương cho mùa hè vì mục đích an toàn.

Nhưng khi chúng tôi kiểm tra có bao nhiêu người bị chết đuối trong năm nay, có một khả năng nhỏ là kỷ lục 1000 người bị chết đuối trong năm nay.

Có được mối tương quan như vậy là không thể. Có lẽ một trong một ngàn. Nhưng điều đó là có thể, mặc dù cả hai đều độc lập. Nhưng đây chỉ là một trường hợp. Hãy xem xét rằng có hàng triệu sự kiện có thể đo lường được ở đó, và bạn có thể thấy khả năng tỷ lệ của một số hai xảy ra để đưa ra một mối tương quan cao là khá cao (do đó sự tồn tại của các biểu đồ như trên).

Một cách khác để xem xét nó là việc đảm bảo rằng hai sự kiện độc lập sẽ luôn đưa ra các giá trị không tương quan là hạn chế. Cho hai con xúc xắc độc lập và kết quả của con xúc xắc thứ nhất, có một tập hợp kết quả (khá lớn) nhất định cho con xúc xắc thứ hai sẽ đưa ra một số tương quan khác không. Để hạn chế kết quả của xúc xắc thứ hai không tương quan với lần đầu tiên là vi phạm độc lập rõ ràng, vì các cuộn xúc xắc đầu tiên hiện đang ảnh hưởng đến việc phân phối kết quả.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.