Có thể có một cặp biến ngẫu nhiên Gaussian mà phân phối chung không phải là Gaussian?


91

Ai đó đã hỏi tôi câu hỏi này trong một cuộc phỏng vấn xin việc và tôi đã trả lời rằng phân phối chung của họ luôn là Gaussian. Tôi nghĩ rằng tôi luôn có thể viết một Gaussian bivariate với phương tiện và phương sai và hiệp phương sai của chúng. Tôi tự hỏi nếu có thể có một trường hợp mà xác suất chung của hai Gaussian không phải là Gaussian?


4
Một ví dụ khác từ Wikipedia . Tất nhiên, nếu các biến là Gaussian độc lập và cận biên, thì chúng là Gaussian chung.

Câu trả lời:


138

Phân phối chuẩn bivariate là ngoại lệ , không phải là quy tắc!

Điều quan trọng là phải nhận ra rằng "hầu hết tất cả" các phân phối chung có biên bình thường không phải là phân phối chuẩn bivariate. Đó là, quan điểm phổ biến rằng các phân phối chung với các lề bình thường không phải là bivariate bình thường bằng cách nào đó là "bệnh lý", là một chút sai lầm.

Chắc chắn, thông thường đa biến là cực kỳ quan trọng do tính ổn định của nó dưới các phép biến đổi tuyến tính, và do đó nhận được phần lớn sự chú ý trong các ứng dụng.

Ví dụ

Nó rất hữu ích để bắt đầu với một số ví dụ. Hình dưới đây chứa các bản đồ nhiệt của sáu bản phân phối bivariate, tất cả đều có lề bình thường tiêu chuẩn. Các bên trái và giữa ở hàng trên cùng là quy tắc bivariate, những cái còn lại là không (như nên rõ ràng). Chúng được mô tả thêm dưới đây.

Ví dụ về phân phối bivariate với lề bình thường tiêu chuẩn.

Xương cốt của công thức

Các thuộc tính của sự phụ thuộc thường được phân tích hiệu quả bằng cách sử dụng các công thức . Một copula bivariate chỉ là một cái tên ưa thích cho phân phối xác suất trên bình phương đơn vị với các lề đồng nhất .[0,1]2

Giả sử là một copula bivariate. Sau đó, ngay lập tức từ trên, chúng ta biết rằng , và , ví dụ.C ( u , v ) 0 C ( u , 1 ) = u C ( 1 , v ) = vC(u,v)C(u,v)0C(u,1)=uC(1,v)=v

Chúng ta có thể xây dựng các biến ngẫu nhiên bivariate trên mặt phẳng Euclide với các lề được chỉ định trước bằng cách chuyển đổi đơn giản một copula bivariate. Đặt và được phân phối biên quy định cho một cặp biến ngẫu nhiên . Sau đó, nếu là một copula bivariate, là một hàm phân phối hai biến có biên và . Để xem sự thật cuối cùng này, chỉ cần lưu ý rằng Đối số tương tự hoạt động cho .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2F1F2(X,Y)C(u,v)

F(x,y)=C(F1(x),F2(y))
F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
F2

Đối với và liên tục , định lý của Sklar khẳng định tính độc đáo ngụ ý. Nghĩa là, được phân phối hai biến với các lề liên tục , , copula tương ứng là duy nhất (trên không gian phạm vi thích hợp).F1F2F(x,y)F1F2

Bình thường bivariate là đặc biệt

Định lý của Sklar cho chúng ta (về cơ bản) rằng chỉ có một copula tạo ra phân phối chuẩn bivariate. Đây được đặt tên một cách khéo léo, copula Gaussian có mật độ trên trong đó tử số là phân phối chuẩn của bivariate với tương quan đánh giá tại và .[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

Tuy nhiên, có rất nhiều công thức khác và tất cả chúng sẽ phân phối bivariate với các lề bình thường không phải là bivariate bình thường bằng cách sử dụng phép biến đổi được mô tả trong phần trước.

Một số chi tiết về các ví dụ

Lưu ý rằng nếu là copula tùy ý với mật độ , mật độ bivariate tương ứng với các lề bình thường tiêu chuẩn theo phép biến đổi là C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

Lưu ý rằng bằng cách áp dụng copula Gaussian trong phương trình trên, chúng tôi phục hồi mật độ chuẩn bivariate. Nhưng, đối với bất kỳ lựa chọn nào khác của , chúng tôi sẽ không.c(u,v)

Các ví dụ trong hình được xây dựng như sau (đi qua từng hàng, mỗi cột một lần):

  1. Bivariate bình thường với các thành phần độc lập.
  2. Biến đổi bình thường với .ρ=0.4
  3. Các ví dụ được đưa ra trong câu trả lời này của Dilip Sarwate . Nó có thể dễ dàng được nhìn thấy bởi copula với mật độ .C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. Được tạo từ copula Frank với tham số .θ=2
  5. Được tạo từ copula Clayton với tham số .θ=1
  6. Được tạo ra từ một sửa đổi không đối xứng của copula Clayton với tham số .θ=3

7
+1 cho nhận xét rằng mật độ thông thường bivariate là trường hợp đặc biệt!
Dilip Sarwate

Có thể tôi đang thiếu một cái gì đó, nhưng nếu chúng tôi bắt đầu từ , phân phối chung sẽ tự động được xác định, độc lập với bất kỳ cấu trúc copula nào và nếu chúng tôi áp dụng không phải Việc xây dựng copula Gaussian cho CDF của họ, đúng là chúng ta sẽ có được CDF không phải Gaussian , nhưng nói chung chức năng này sẽ không phải là CDF của cặp biến ngẫu nhiên mà chúng ta đã bắt đầu, phải ? X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
RandomGuy

Ví dụ về cách mô phỏng như trong bảng dưới bên phải: library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
nửa vượt qua

1
@RandomGuy, Bạn đang thiếu một giả định không có căn cứ rằng . Nếu bạn cho rằng họ độc lập, thì có, bạn đã biết phân phối chung rồi. Không có giả định độc lập, biết các phân phối biên không cung cấp đủ thông tin để chỉ định phân phối chung. X1,X2independentN(0,1)
MentatOfDune

25

Đúng là mỗi phần tử của một vectơ bình thường đa biến được phân phối bình thường và bạn có thể suy ra phương tiện và phương sai của chúng. Tuy nhiên, không có sự thật rằng bất kỳ hai biến ngẫu nhiên Guassian nào được phân phối chung. Đây là một ví dụ:

Chỉnh sửa: Đáp lại sự đồng thuận rằng một biến ngẫu nhiên có khối lượng điểm có thể được coi là biến phân phối bình thường với , tôi đang thay đổi ví dụ của mình.σ2=0


Đặt và đặt trong đó là biến ngẫu nhiên . Nghĩa là, mỗi cái có xác suất .XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

Trước tiên chúng tôi cho thấy có phân phối chuẩn thông thường. YTheo định luật tổng xác suất ,

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

Kế tiếp,

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

Trong đó là CDF bình thường tiêu chuẩn . Tương tựΦ

P(Yy|B=1)=P(Xy)=Φ(y)

Vì thế,

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

vì vậy, CDF của là , do đó .YΦ()YN(0,1)

Bây giờ chúng tôi chỉ ra rằng không được phân phối chung. X,YNhư @cardinal chỉ ra, một đặc điểm của bình thường đa biến là mọi tổ hợp tuyến tính của các phần tử của nó thường được phân phối. không có tài sản này, vìX,Y

Y+X={2Xif B=10if B=0.

Do đó, là hỗn hợp của biến ngẫu nhiên và khối lượng điểm tại 0, do đó không thể phân phối bình thường.Y+X50/50N(0,4)


4
Tôi không đồng ý với câu trả lời này. Khối lượng điểm suy biến là tại thường được coi là biến ngẫu nhiên Gaussian suy biến với phương sai bằng không. Ngoài ra, không liên tục cùng nhau mặc dù chúng không liên tục. Để biết ví dụ về hai biến ngẫu nhiên liên tục chung là Gaussian nhưng không phải là Gaussian chung, hãy xem, ví dụ, nửa sau của câu trả lời này . 1μ(X,X)
Dilip Sarwate

4
@DilipSarwate, câu hỏi là đưa ra một ví dụ (nếu có tồn tại) hai biến được phân phối bình thường nhưng phân phối chung của chúng không phải là đa biến thông thường. Đây là một ví dụ. Hầu hết các định nghĩa chuẩn của phân phối chuẩn (ví dụ: wikipedia en.wikipedia.org/wiki/N normal_distribution ) yêu cầu phương sai phải hoàn toàn tích cực, do đó không bao gồm khối lượng điểm như một phần của họ các phân phối bình thường.
Macro

4
Một đặc tính tiêu chuẩn của Gaussian đa biến là là Gaussian đa biến khi và chỉ khi là Gaussian cho tất cả . Như @Dilip gợi ý, đáng để xem xét nếu điều này đúng với ví dụ của bạn. XRnaTXaRn
Đức hồng y

6
Vì rõ ràng bạn không thích kháng cáo về tính hợp lý ;-), làm thế nào để kháng cáo lên chính quyền? (Đó là một trò đùa, nếu nó không rõ ràng.) Tôi chỉ tình cờ gặp điều này hoàn toàn tình cờ khi tôi đang tìm kiếm một thứ khác: Ví dụ 2.4 , trang 22 của GAF Seber và AJ Lee, Phân tích hồi quy tuyến tính , lần 2. chủ biên, Wiley. Nó trích dẫn: "Đặt và đặt ... Do đó có phân phối chuẩn nhiều biến số." YN(μ,σ2)Y=(Y,Y)Y
Đức hồng y

5
Các cuộc thảo luận là về định nghĩa. Rõ ràng, nếu ma trận hiệp phương sai theo định nghĩa được yêu cầu là Macro không đơn lẻ cung cấp một ví dụ, nhưng đây không phải là một ví dụ theo định nghĩa tự do hơn mà @cardinal đề cập đến. Một lý do chính đáng để thích định nghĩa tự do hơn là sau đó tất cả các phép biến đổi tuyến tính của các biến thông thường là bình thường. Cụ thể, trong hồi quy tuyến tính với sai số bình thường, phần dư có phân phối chuẩn khớp nhưng ma trận hiệp phương sai là số ít.
NRH

5

Bài viết sau đây chứa một phác thảo của một bằng chứng, chỉ để đưa ra những ý chính và giúp bạn bắt đầu.

Đặt là hai biến ngẫu nhiên Gaussian độc lập và đặt là z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

Mỗi , nhưng vì cả hai đều là kết hợp tuyến tính của cùng một r.vs độc lập, chúng phụ thuộc lẫn nhau.XiN(μi,σi2)

Định nghĩa Một cặp r.vs được gọi là bivariate phân phối bình thường nếu nó có thể được viết dưới dạng kết hợp tuyến tính của r.vs độc lập .x=(X1,X2)x=Azz=(Z1,Z2)

Bổ đề Nếu là một Gaussian hai biến, thì bất kỳ tổ hợp tuyến tính nào khác của chúng lại là một biến ngẫu nhiên bình thường.x=(X1,X2)

Bằng chứng . Tầm thường, bỏ qua để không xúc phạm ai.

Thuộc tính Nếu không tương thích, thì chúng độc lập và ngược lại.X1,X2

Phân phốiX1|X2

Giả sử là cùng một Gaussian r.vs như trước đây nhưng giả sử chúng có phương sai dương và không có nghĩa là đơn giản.X1,X2

Nếu là không gian con được kéo dài bởi , hãy để và .SX2X1S=ρσX1σX2X2X1S=X1X1S

X1 và là kết hợp tuyến tính của , vì vậy cũng vậy. Họ là Gaussian chung, không tương quan (chứng minh điều đó) và độc lập.X2zX2,X1S

Phân tách giữ với

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

Rồi

X1|X2N(X1S,(1ρ)2σX12).

Hai biến ngẫu nhiên Gaussian đơn biến là Gaussian chung nếu các điều kiện và cũng là Gaussian.X,YX|YY|X


2
Không rõ cách quan sát này trả lời câu hỏi. Vì quy tắc sản phẩm thực tế là định nghĩa của phân phối có điều kiện, nên nó không đặc biệt đối với các phân phối bất thường. Câu lệnh tiếp theo "sau đó theo thứ tự ..." không cung cấp bất kỳ lý do nào: chính xác tại sao các phân phối có điều kiện cũng phải bình thường?
whuber

whuber, tôi đang trả lời cho câu hỏi chính: "Tôi tự hỏi liệu có thể có một trường hợp mà xác suất chung của hai Gaussian không phải là Gaussian?". Vì vậy, câu trả lời là: khi điều kiện không bình thường. - Phụ trợ
phụ trợ

2
Bạn có thể hoàn thành cuộc biểu tình đó? Ngay bây giờ, đó chỉ là một khẳng định từ phía bạn, không có bằng chứng. Không có gì rõ ràng rằng nó đúng. Nó cũng chưa hoàn chỉnh, bởi vì bạn cần thiết lập sự tồn tại: nghĩa là bạn phải chứng minh rằng phân phối chung thực sự có thể có biên bình thường nhưng với ít nhất một điều kiện là không bình thường. Thực tế bây giờ điều đó là đúng, bởi vì bạn có thể tự do thay đổi từng phân phối có điều kiện của một số bất thường trên một tập hợp số 0 mà không thay đổi biên của nó - nhưng khả năng đó có vẻ mâu thuẫn với các khẳng định của bạn.
whuber

Xin chào @whuber, tôi hy vọng điều này sẽ giúp nhiều hơn. Bạn có bất cứ đề nghị hoặc chỉnh sửa để làm? Tôi đã viết điều này rất nhanh vì hiện tại tôi không có nhiều thời gian rảnh rỗi :-) nhưng tôi sẽ đánh giá cao bất kỳ đề xuất hoặc cải tiến nào bạn có thể thực hiện. Tốt nhất
phụ trợ

(1) Bạn đang cố gắng chứng minh điều gì? (2) Bởi vì câu hỏi đặt ra khi phân phối với các biên Gauss không cùng Gaussian, tôi không thấy cách lập luận này dẫn đến bất cứ điều gì có liên quan.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.