Làm thế nào để công thức tạo các biến ngẫu nhiên tương quan hoạt động?


19

Nếu chúng ta có 2 biến ngẫu nhiên bình thường, không tương quan X1,X2 thì chúng ta có thể tạo 2 biến ngẫu nhiên tương quan với công thức

Y=ρX1+1ρ2X2

và sau đó Y sẽ có một tương quan ρ với X1 .

Ai đó có thể giải thích công thức này đến từ đâu?


1
Một cuộc thảo luận rộng rãi về vấn đề này và các vấn đề liên quan xuất hiện trong câu trả lời của tôi tại stats.stackexchange.com/a/71303 . Trong số những điều khác, điều rõ ràng là (1) giả định Normality là không liên quan và (2) bạn cần đưa ra các giả định bổ sung: phương sai của X1X2 phải bằng nhau để tương quan của Y với X1ρ .
whuber

Liên kết rất thú vị. Tôi không chắc tôi hiểu ý của bạn là gì bởi tính bình thường không liên quan. Nếu X1 hoặc X2 không bình thường và việc kiểm soát mật độ của trở nên khó khăn hơn Ythông qua thuật toán Kaiser-Dickman. Đây là toàn bộ lý do để các thuật toán chuyên dụng tạo dữ liệu tương quan không bình thường (ví dụ: Headrick, 2002; Ruscio & Kaczetow, 2008; Vale & Maurelli, 1983) Ví dụ, hãy tưởng tượng mục tiêu của bạn là tạo ra đồng phục X ~ bình thường, Y ~ , với ρ = 0,5. Sử dụng X2 ~ kết quả đồng nhất trong một Y không đồng nhất ( Y kết thúc là sự kết hợp tuyến tính của bình thường và đồng nhất).
Anthony

@Anthony Câu hỏi chỉ hỏi về tương quan , đó hoàn toàn là chức năng của khoảnh khắc thứ nhất và thứ hai. Câu trả lời không phụ thuộc vào bất kỳ thuộc tính nào khác của bản phân phối. Những gì bạn đang thảo luận là một chủ đề khác nhau hoàn toàn.
whuber

Câu trả lời:


17

Giả sử bạn muốn tìm kết hợp tuyến tính của X 2 sao choX1X2

corr(αX1+βX2,X1)=ρ

Lưu ý rằng nếu bạn nhân cả hai giá trị β với cùng một hằng số (khác không), mối tương quan sẽ không thay đổi. Do đó, chúng ta sẽ thêm một điều kiện để bảo toàn phương sai: var ( α X 1 + β X 2 ) = var ( X 1 )αβvar(αX1+βX2)=var(X1)

Điều này tương đương với

ρ=cov(αX1+βX2,X1)var(αX1+βX2)var(X1)=αcov(X1,X1)=var(X1)+βcov(X2,X1)=0var(αX1+βX2)var(X1)=αvar(X1)α2var(X1)+β2var(X2)

Giả sử cả hai biến ngẫu nhiên có cùng phương sai (đây là một giả định quan trọng!) ( ), chúng ta nhận đượcvar(X1)=var(X2)

ρα2+β2=α

Có nhiều giải pháp cho phương trình này, vì vậy đã đến lúc nhớ lại điều kiện bảo toàn phương sai:

var(X1)=var(αX1+βX2)=α2var(X1)+β2var(X2)α2+β2=1

Và điều này dẫn chúng ta đến

α=ρβ=±1ρ2

CẬP NHẬT . Về câu hỏi thứ hai: có, điều này được gọi là làm trắng .


9

Phương trình là một dạng bivariate đơn giản của phân rã Cholesky . Phương trình đơn giản này đôi khi được gọi là thuật toán Kaiser - Dickman (Kaiser & Dickman, 1962).

Lưu ý rằng X 2 phải có cùng phương sai để thuật toán này hoạt động chính xác. Ngoài ra, thuật toán thường được sử dụng với các biến thông thường. Nếu X 1 hoặc X 2 không bình thường, Y có thể không có dạng phân phối giống như X 2 .X1X2X1X2YX2

Tài liệu tham khảo:

Kaiser, HF, & Dickman, K. (1962). Ma trận điểm mẫu và dân số và ma trận tương quan mẫu từ một ma trận tương quan dân số tùy ý. Tâm lý học, 27 (2), 179-182.


2
Tôi cho rằng bạn không cần các biến thông thường được tiêu chuẩn hóa, chỉ cần có cùng một phương sai là đủ.
Artem Sobolev

2
Không, sự phân bố của không một hỗn hợp phân phối như bạn yêu cầu. Y
Dilip Sarwate

Điểm lấy, @Dilip Sarwate. Nếu hoặc X 2 là không bình thường, thì Y trở thành tổ hợp tuyến tính của hai biến có thể không dẫn đến phân phối mong muốn. Đây là lý do cho các thuật toán chuyên dụng (thay vì Kaiser-Dickman) cho dữ liệu tương quan không bình thường được tạo ra. X1X2Y
Anthony

3

cosnthnthcosθsinθX1,X2
ρ=cosθ1ρ2=±sinθ

X1,X2


2
TEX
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.