Sự khác biệt giữa phân phối chuẩn chuẩn đa biến và copula Gaussian


17

Tôi tự hỏi sự khác biệt giữa phân phối chuẩn chuẩn đa biến và copula Gauss là gì khi tôi nhìn vào hàm mật độ chúng có vẻ giống nhau đối với tôi.

Vấn đề của tôi là tại sao copula Gaussian được giới thiệu hoặc những gì có lợi cho copula Gaussian tạo ra hoặc ưu điểm của nó là gì khi copula Gaussian không là gì ngoài chính chức năng thông thường tiêu chuẩn đa biến.

Ngoài ra khái niệm đằng sau biến đổi tích phân xác suất trong copula là gì? Ý tôi là chúng ta biết rằng copula là một hàm có biến đồng nhất. Tại sao nó phải được thống nhất? Tại sao không sử dụng dữ liệu thực tế như phân phối chuẩn nhiều biến số và tìm ma trận tương quan? (Thông thường chúng tôi vẽ biểu đồ hai tài sản trả về để xem xét mối quan hệ của chúng nhưng khi đó là copula, chúng tôi sẽ vẽ biểu đồ cho chúng tôi là xác suất thay thế.)

Câu hỏi khác. Tôi cũng nghi ngờ liệu ma trận tương quan từ MVN có thể là không tham số hay bán tham số như của copula (đối với tham số copula có thể là tau của kendall, v.v.)

Tôi sẽ rất biết ơn sự giúp đỡ của bạn vì tôi là người mới trong lĩnh vực này. (nhưng tôi đã đọc rất nhiều bài báo và đây là những điều duy nhất tôi không hiểu)


Làm thế nào bạn "nhìn vào chức năng mật độ"? Bạn có thể không sử dụng một phương pháp đủ nhạy cảm. Ví dụ, mật độ được đảm bảo không đa biến bình thường khi biên không bình thường! Hãy thử điều này bằng cách sử dụng copula Gaussian với phân phối đa phương thức , chẳng hạn như Beta : điều đó phải có vẻ không bình thường! (1/2,1/2)
whuber

phương trình (6) là bivariate copula Gaussian CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/, trong khi phương trình đầu tiên của phần mô tả là bivariate tiêu chuẩn CDF roguewave.com/portals/0/products/ imsl-Numical-library / tầm nhìn và khi chúng ta so sánh chúng với nhau, dạng chức năng rất giống nhau. họ cũng giống hệt tôi
dùng26979

Bạn nói đúng: đó là lý do tại sao bạn không nên dựa vào các tài liệu tham khảo ngẫu nhiên trên Internet, đặc biệt là các tài liệu có thuật ngữ được xác định kém và sắp chữ khủng khiếp. Tham khảo ý kiến ​​của Nelson (một trong những nguồn cho liên kết đầu tiên của bạn và có thể đọc được).
whuber

1
Vì vậy, nếu không đề cập đến các địa điểm trên, sự khác biệt trong quan điểm của bạn là gì?
dùng26979

Câu trả lời:


20

Một quy tắc chung về các bài viết kỹ thuật - đặc biệt là các bài viết được tìm thấy trên Web - là độ tin cậy của bất kỳ định nghĩa thống kê hoặc toán học nào được cung cấp trong chúng thay đổi ngược với số lượng các chủ đề không thống kê không liên quan được đề cập trong tiêu đề của bài báo. Tiêu đề trang trong tài liệu tham khảo đầu tiên được cung cấp (trong một bình luận cho câu hỏi) là "Từ Tài chính đến Vũ trụ học: Bản sao của cấu trúc quy mô lớn". Với cả "tài chính" và "vũ trụ học" xuất hiện nổi bật, chúng ta có thể khá chắc chắn rằng đây không phải là một nguồn thông tin tốt về các công thức!

Thay vào đó, hãy chuyển sang một cuốn sách giáo khoa tiêu chuẩn và rất dễ tiếp cận, Giới thiệu về các công thức của Roger Nelsen (Ấn bản thứ hai, 2006), cho các định nghĩa chính.

... Mỗi copula là một hàm phân phối chung có lề đồng nhất trên [khoảng thời gian đơn vị đóng .[0,1]]

[Tại p. 23, dưới cùng.]

Để hiểu rõ hơn về copulae, hãy chuyển sang định lý đầu tiên trong cuốn sách, Định lý của Sklar :

Hãy là hàm phân phối doanh với lợi nhuận và . Sau đó, tồn tại một copula sao cho tất cả trong [các số thực mở rộng],F G C x , y H ( x , y ) = C ( F ( x ) , G ( y ) ) .HFGCx,y

H(x,y)=C(F(x),G(y)).

[Nói trên trang 18 và 21.]

Mặc dù Nelsen không gọi nó là như vậy, nhưng anh ta định nghĩa copula Gaussian trong một ví dụ:

... nếu biểu thị hàm phân phối chuẩn (đơn biến) tiêu chuẩn và biểu thị hàm phân phối chuẩn bivariate tiêu chuẩn (với hệ số tương quan thời điểm sản phẩm của Pearson ), thì ...N ρ ρ C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

[tại p. 23, phương trình 2.3.6]. Từ ký hiệu, ngay lập tức này thực sự là phân phối chung cho khi là hai biến Bình thường. Bây giờ chúng ta có thể quay lại và xây dựng một phân phối hai biến mới có bất kỳ mong muốn (liên tục) phân bố biên và mà này là copula, chỉ bằng cách thay thế những lần xuất hiện của bởi và : lấy này đặc biệt trong đặc tính các công thức trên.( u , v ) ( ΦC(u,v)(Φ1(u),Φ1(v))FGCΦFGC

Vì vậy, có, điều này trông giống như các công thức cho phân phối chuẩn bivariate, bởi vì nó bivariate bình thường cho các biến được chuyển đổi . Bởi vì các phép biến đổi này sẽ là phi tuyến bất cứ khi nào và chưa có (các biến thể) CDF bình thường, nên phân phối kết quả không phải là (trong các trường hợp này) là biến đổi bình thường.(Φ1(F(x)),Φ1(G(y)))FG


Thí dụ

Hãy để là hàm phân bố cho một Beta biến và chức năng phân phối cho một Gamma biến . Bằng việc sử dụng xây dựng trước chúng ta có thể hình thành sự phân bố doanh với một copula Gaussian và marginals và . Để mô tả phân phối này, đây là một phần của mật độ bivariate của nó trên các trục và :F(4,2)XG(2)YHFGxy

Âm mưu

Các khu vực tối có mật độ xác suất thấp; các vùng ánh sáng có mật độ cao nhất. Tất cả xác suất đã được đưa vào khu vực có (hỗ trợ phân phối Beta) và (hỗ trợ phân phối Gamma).0x10y

Sự thiếu đối xứng làm cho nó rõ ràng là không bình thường (và không có lề bình thường), tuy nhiên nó vẫn có một copula Gaussian bằng cách xây dựng. FWIW nó có một công thức và nó xấu, rõ ràng là không có giá trị bình thường:

132(20(1x)x3)(eyy)exp(w(x,y))

trong đó được cho bởiw(x,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

( là một hàm Gamma được chuẩn hóa và là một hàm Beta được chuẩn hóa .)tôi xQIx


Cảm ơn bạn đã chỉnh sửa, @Cardinal: Tôi cảm thấy xấu hổ về việc viết sai tên của Nelsen, đặc biệt là khi tôi đang nhìn thẳng vào mặt trước của cuốn sách! (Trong phòng của tôi, tôi đã lần đầu tiên nhận thấy nó trong thư mục giấy tham chiếu của OP, nơi mà nó cũng bị sai chính tả: đó là phải có gặp khó khăn với tôi :-).
whuber

Đó là một điều nhỏ nhặt, tôi nghĩ rằng tôi chỉ cần tiếp tục và thực hiện các chỉnh sửa. Chính tả là không bình thường (ít nhất là bằng tiếng Anh!), Đặc biệt là so với các biến thể phổ biến hơn. :-)
Đức hồng y
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.