Đây là loại phân phối nào?


8

Tôi đã phải đối mặt với một phân phối giới hạn với hiệp phương sai bằng 0 giữa hai biến nhưng tương quan của chúng là . Có phân phối như vậy? Làm thế nào nó có thể được giải thích?1


Bạn nói đúng tôi có thể cần cung cấp thêm chi tiết. OK, X và Y là phân phối chuẩn bivariate với các phương sai và phương tiện khác nhau (không có n) nhưng đúng = 1- (1 / n), hiện đang điều tra phân phối giới hạn của Yn | Xn = x.


23
Phân phối đó được gọi là lỗi tính toán .
Có QUIT - Anony-Mousse

5
Vui lòng cung cấp các chi tiết để giải quyết sự khác biệt rõ ràng. Hoàn cảnh là gì?
Glen_b -Reinstate Monica

Vui lòng cung cấp thêm chi tiết về phân phối chung của và . Cụ thể, điều gì làm phát sinh ? Y n ρ n = 1 - 1 / nXnYnρn=11/n
Mico

Thật không may, tôi không có nhiều chi tiết hơn. Câu hỏi của bạn là một câu hỏi mà tôi đã suy nghĩ về quá. Làm thế nào n phụ thuộc vào n khi phương sai không có n? và nó chính xác có nghĩa là gì?
Behgol

Tại sao bạn nghĩ hiệp phương sai là 0 ?
Juho Kokkala

Câu trả lời:


5

Sau khi OP làm rõ, có vẻ như a) chúng tôi giả sử rằng hai biến theo sau là một biến số bivariate bình thường và b) mối quan tâm của chúng tôi là phân phối có điều kiện, sau đó là

YnXn=x  N(μy+σyσxρn(xμx),(1ρn2)σy2)

Sau đó, chúng ta thấy rằng khi , chúng tôi có ρ n1 , và phương sai của phân phối có điều kiện đi đến số không. Theo trực giác, nếu mối tương quan đi đến sự thống nhất, "biết x " cũng đủ để "biết y ".nρn1xy

Nhưng không nơi nào ở trên chúng ta nhận được bằng không. Ngay cả ở hiệp phương sai giới hạn sẽ vẫn bằng với COV ( Y n , X n ) σ y σ x . Cov(Yn,Xn)Cov(Yn,Xn)σyσx

Lưu ý rằng hiệp phương sai có điều kiện (và sau đó là tương quan có điều kiện) luôn luôn bằng không, bởi vì,

Cov(Yn,XnXn=x)=E(YnXnXn=x)E(YXn=x)E(XXn=x)

=xE(YnXn=x)xE(YXn=x)=0

Xn=x


Cảm ơn câu trả lời của bạn. Vì vậy, nó là một phân phối bình thường không có phương sai? Làm thế nào sẽ là hình dạng của nó?
Behgol


20

XY[1,1]

X=Yσx2Xlim σ 2 x0 corlimσx20cov(X,Y)=0limσx20cor(X,Y)=1

Lưu ý 1: khi mối tương quan hoàn toàn không được xác định vì mẫu số của nó sẽ bằng 0.σx2=0


Bạn đúng có thể tôi nên cung cấp thêm chi tiết. OK X và Y phân phối bình thường không phân biệt với phương sai và trung bình khác nhau (không có n) nhưng đúng = 1- (1 / n), hiện đang điều tra phân phối giới hạn của Yn | Xn = x.
Behgol

Từ ngữ "Vì hiệp phương sai phụ thuộc vào thang đo" ngụ ý rằng điều này được đưa ra trong câu hỏi. Tuy nhiên, điều đó dường như nhiều hơn câu hỏi ngụ ý. Dường như với tôi rằng bạn đang nói rằng điều này có thể là như vậy, với kết luận đã nêu. Hãy sửa tôi nếu điều đó sai.
Nick Cox

18

Theo như tôi có thể thấy (có lẽ bên ngoài một số trường hợp đặc biệt, nhưng bạn không đề cập đến bất kỳ), điều đó là không thể.

Tương quan là hiệp phương sai chia cho tích của hai độ lệch chuẩn, vì vậy nếu hiệp phương sai bằng 0, thì tương quan bằng 0 (khi cả hai độ lệch chuẩn đều khác không) hoặc không xác định (khi có ít nhất một độ lệch chuẩn là 0). Không nên là 1 khi hiệp phương sai bằng 0.

Tôi hy vọng bạn đã mắc một số lỗi trong phân tích hoặc mô tả của bạn không đủ rõ ràng để phân biệt chính xác tình huống.


1

Có lẽ bạn đang gặp khó khăn vì bạn đang hình dung dữ liệu là Gaussian.

Có thể tất cả dữ liệu đại diện cho cùng một điểm (mặc dù nó sẽ là dự phòng) và bạn có hai biến có tên khác nhau (bí danh của nhau) bao gồm dữ liệu. Điều này sẽ dẫn đến hiệp phương sai bằng 0 và tương quan 1 là về cơ bản, hiệp phương sai biểu thị mức độ lan truyền của dữ liệu trên không gian tính năng, trong khi tương quan biểu thị mức độ của một biến số phụ thuộc vào nhau hoặc mức độ ảnh hưởng của chúng đối với nhau. Nếu dữ liệu hoàn toàn không được trải ra, thì hiệp phương sai phải bằng không.

LƯU Ý Tuy nhiên, điều tốt nhất bạn có thể làm với một tập dữ liệu như vậy chỉ đơn giản là dự đoán tất cả các điểm có cùng một đầu ra, điều này rất có thể sẽ mang lại độ lệch cao


2
Dường như có khá nhiều điều khác nhau đang diễn ra trong câu trả lời này, và tôi gặp khó khăn khi nhìn thấy mối quan hệ. Ví dụ, đoạn 1 có liên quan như thế nào? Đoạn 3 có liên quan như thế nào? Ngoài ra, làm thế nào để bạn đạt được hiệp phương sai trong đoạn 2?
Richard Hardy

Cảm ơn @Richard Hardy đã chỉ ra nó. Một trong những câu trả lời khác ban đầu đề xuất một giải pháp Gaussian. Đó là lý do tại sao đoạn 1. Trong đoạn 3, tôi chỉ đưa ra quan điểm của mình về những gì anh ta có thể làm với bộ dữ liệu đó. Về cơ bản, hiệp phương sai biểu thị mức độ lan truyền của dữ liệu trên không gian tính năng. Nếu dữ liệu không được trải ra tại, thì hiệp phương sai phải bằng không. Tôi cũng đã thêm câu này vào câu trả lời
RS Nikhil Krishna
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.