Các ví dụ thực tế về sự khác biệt giữa độc lập và tương quan


9

Người ta biết rằng sự độc lập của các biến ngẫu nhiên hàm ý tương quan bằng 0 nhưng tương quan bằng 0 không cần hàm ý độc lập.

Tôi đã bắt gặp rất nhiều ví dụ toán học chứng minh sự phụ thuộc mặc dù không có tương quan. Có bất kỳ ví dụ thực tế để hỗ trợ thực tế này?


2
Hãy cẩn thận, chỉ có tương quan bằng không và các biến thông thường cùng ngụ ý độc lập.
Francis

2
@Siddesh "Nhưng vì âm lượng không phải là hàm tuyến tính của độ dài nên chúng không tương quan với nhau." Vâng, không hoàn toàn tương quan. Nhưng họ sẽ có mối tương quan tích cực.
Cá bạc

1
@Siddhesh: sẽ chỉ hoạt động nếu ...E[tôiength4]-E[tôiength]E[tôiength3]= =0
Francis

1
Vui lòng đưa nhận xét về phân phối bình thường trở lại nếu bạn không đồng ý với chỉnh sửa của tôi. Nhưng tôi nghĩ rằng nó sẽ được loại bỏ tốt hơn vì (1) nó là một vấn đề phụ gây mất tập trung cho câu hỏi chính của bạn, (2) nó đã được hỏi trên CV trước đây vì vậy sẽ là một bản sao của tài liệu hiện có ở đây, ( 3) Tôi không muốn nó gây nhầm lẫn cho những độc giả tương lai. Tôi đã cố gắng chỉnh sửa câu hỏi theo cách tăng khả năng mở lại: Tôi nghĩ câu hỏi này khá khác biệt so với câu hỏi "thống kê toán học" trong cùng một chủ đề.
Cá bạc

2
Tôi vẫn nghĩ rằng câu hỏi này thực sự hay và có thể thu hút một số câu trả lời thú vị hơn nếu nó có thể được mở lại (có thể liên quan đến một số chỉnh sửa để phân biệt rõ ràng với chủ đề mà nó hiện được coi là trùng lặp). Tôi đã đưa ra một chủ đề trên Meta về những gì sẽ cần để mở lại câu hỏi này. Tất cả các ý kiến ​​hoan nghênh.
Cá bạc

Câu trả lời:


6

Lợi nhuận chứng khoán là một ví dụ thực tế về những gì bạn đang yêu cầu. Có rất gần với mối tương quan bằng không giữa lợi nhuận S & P 500 của ngày hôm nay và ngày hôm qua. Tuy nhiên, có sự phụ thuộc rõ ràng: lợi nhuận bình phương được tích cực tự động; thời kỳ biến động cao được nhóm lại trong thời gian.

Mã R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

Thời gian trả về nhật ký trên S & P 500:

đăng nhập thời gian trả lại

Nếu lợi nhuận là độc lập theo thời gian (và văn phòng phẩm), thì rất khó có thể thấy các mô hình biến động theo cụm đó và bạn sẽ không thấy tự động tương quan trong trả về nhật ký bình phương.


3

Một ví dụ khác là mối quan hệ giữa căng thẳng và điểm số trong một kỳ thi. Mối quan hệ là một hình chữ U ngược và mối tương quan là rất thấp mặc dù quan hệ nhân quả có vẻ khá rõ ràng.


2
Đó là một ví dụ gọn gàng. Bạn có dữ liệu hay điều này chỉ dựa trên kinh nghiệm hướng nội / giảng dạy?
Adrian

1
Tôi đã thấy một nghiên cứu về điều này, nhưng tôi đã thấy nó từ nhiều năm trước vì vậy tôi không có trích dẫn hoặc dữ liệu thực tế.
Peter Flom
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.