Một số kỹ thuật để lấy mẫu hai biến ngẫu nhiên tương quan là gì?


15

Một số kỹ thuật để lấy mẫu hai biến ngẫu nhiên tương quan là gì:

  • nếu phân phối xác suất của chúng được tham số hóa (ví dụ: log-normal)

  • nếu họ có phân phối không tham số.

Dữ liệu là hai chuỗi thời gian mà chúng ta có thể tính các hệ số tương quan khác không. Chúng tôi muốn mô phỏng những dữ liệu này trong tương lai, giả sử CDF tương quan lịch sử và chuỗi thời gian là không đổi.

Đối với trường hợp (2), tương tự 1-D sẽ là xây dựng CDF và lấy mẫu từ nó. Vì vậy, tôi đoán, tôi có thể xây dựng CDF 2 chiều và làm điều tương tự. Tuy nhiên, tôi tự hỏi liệu có cách nào để đến gần bằng cách sử dụng các CDF 1-D riêng lẻ và bằng cách nào đó liên kết các lựa chọn.

Cảm ơn!


3
Liên kết các CDF 1-D làm tôi nghĩ đến copula s. Không chắc chắn nếu họ sẽ sử dụng cho bạn.
onestop

Câu trả lời:


22

Tôi nghĩ những gì bạn đang tìm kiếm là một copula. Bạn đã có hai phân phối biên (được chỉ định bởi các cdf tham số hoặc theo kinh nghiệm) và bây giờ bạn muốn chỉ định sự phụ thuộc giữa hai. Đối với trường hợp bivariate có tất cả các loại lựa chọn, nhưng công thức cơ bản là như nhau. Tôi sẽ sử dụng một copula Gaussian để dễ giải thích.

Để rút ra từ copula Gaussian với ma trận tương quan C

  1. Vẽ (Z=(Z1,Z2)N(0,C)

  2. Set cho i = 1 , 2 (với Φ các lũy bình thường tiêu chuẩn). Bây giờ U 1 , U 2 ~ U [ 0 , 1 ] , nhưng chúng phụ thuộc.Ui=Φ(Zi)i=1,2ΦU1,U2U[0,1]

  3. Đặt trong đó F - 1 i là nghịch đảo (giả) của cdf biên cho biến i . Điều này ngụ ý rằng Y i tuân theo phân phối mong muốn (bước này chỉ là lấy mẫu biến đổi nghịch đảo).Yi=Fi1(Ui)Fi1iYi

Voila! Hãy thử nó cho một số trường hợp đơn giản, và nhìn vào biểu đồ biên và biểu đồ phân tán, thật thú vị.

Không đảm bảo rằng điều này phù hợp với ứng dụng cụ thể của bạn (đặc biệt, bạn có thể cần phải thay thế copula Gaussian bằng copula) nhưng điều này sẽ giúp bạn bắt đầu. Một tài liệu tham khảo tốt về mô hình copula là Nelsen (1999), Giới thiệu về Công thức , nhưng cũng có một số giới thiệu khá hay trên mạng.


2
+1 Nelsen khá dễ đọc. Tôi đã mua một bản sao vài năm trước ngay cả sau khi trải qua rất nhiều tài liệu trực tuyến.
whuber

1
Tôi tìm thấy một bài hướng dẫn tuyệt vời và bảng tính đi kèm: Behan.ws/copula.pdfsoa.org/files/xls/rsrch-copula-ex.xls
Pete SupportMonica

1
@Pete, giấy thật sự rất hay. Mặt khác, liên kết bảng tính đã chết
Boris Gorelik

Có vẻ như các phiên bản gần đây của Mathematica và Matlab đã tích hợp sẵn các chức năng xử lý vấn đề như vậy?
LCFactorization

Phải làm gì nếu tôi muốn giống với copula plackett? Có một mối quan hệ giữa bình thường và plackett copula?
fedvasu

2

Một phương pháp phổ biến là "giảm trivariate" mà mẫu X 2 ~ W + Z để các mối tương quan được gây ra bởi các variate ngẫu nhiên Z . Lưu ý rằng điều này cũng có thể khái quát hóa hơn 2 chiều - nhưng phức tạp hơn trường hợp 2 chiều. Bạn có thể nghĩ rằng bạn chỉ có thể có được mối tương quan tích cực nhưng thực tế bạn cũng có thể có được mối tương quan tiêu cực bằng cách sử dụng U( 1 - U ) khi tạo ra các biến thiên ngẫu nhiên, điều này sẽ tạo ra một mối tương quan tiêu cực trên các bản phân phối.X1Y+ZX2W+ZZU(1U)

Một phương pháp phổ biến thứ ba là (NORTA) BÌNH THƯỜNG cho bất cứ điều gì ; tạo ra các biến thiên bình thường tương quan, biến chúng thành các biến thể ngẫu nhiên thống nhất thông qua việc đánh giá các cdf tương ứng của chúng, sau đó sử dụng các biến thể ngẫu nhiên đồng nhất "mới" này như một nguồn ngẫu nhiên trong việc tạo ra các bản vẽ từ phân phối mới.

Bên cạnh cách tiếp cận copula (cả lớp phương pháp) được đề cập trong bài đăng khác, bạn cũng có thể lấy mẫu từ phân phối khớp nối tối đa tương tự như phương pháp copula. Bạn chỉ định phân phối biên và mẫu từ khớp nối tối đa. Điều này được thực hiện bằng 2 bước từ chối chấp nhận như được mô tả bởi Pierre Jacob tại đây . Có lẽ phương pháp này có thể được mở rộng đến kích thước cao hơn 2 nhưng có thể phức tạp hơn để đạt được. Lưu ý rằng khớp nối tối đa sẽ tạo ra một mối tương quan phụ thuộc vào các giá trị của các tham số của lề xem bài đăng này cho một ví dụ hay về điều này trong câu trả lời của Xi'an cho câu hỏi của tôi.

Nếu bạn sẵn sàng chấp nhận các mẫu gần đúng (trong hầu hết các trường hợp) thì các kỹ thuật MCMC cũng là một tùy chọn để lấy mẫu từ các phân phối đa chiều.

Ngoài ra, bạn có thể sử dụng các phương pháp chấp nhận từ chối nhưng thường khó tìm được mật độ thống trị để lấy mẫu và đánh giá tỷ lệ của mật độ đó với mật độ mong muốn.

Đây là tất cả các phương pháp bổ sung tôi có thể nghĩ ra nhưng có lẽ có một vài điều tôi đã bỏ lỡ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.