Sự tương quan là gì nếu độ lệch chuẩn của một biến là 0?


15

Theo tôi hiểu, chúng ta có thể có được mối tương quan bằng cách bình thường hóa hiệp phương sai bằng phương trình

ρi,j=cov(Xi,Xj)σiσj

trong đó là độ lệch chuẩn củaXi.σi=E[(Xiμi)2]Xi

Mối quan tâm của tôi là gì nếu độ lệch chuẩn bằng 0? Có điều kiện nào đảm bảo nó không thể bằng không?

Cảm ơn.


11
Không có biến nào có độ lệch chuẩn 0 có thể tương quan với biến khác (không hằng). Tương quan là thước đo giá trị của các giá trị lớn / nhỏ trong một biến tương ứng với các giá trị lớn / nhỏ trong một biến khác - nếu một trong các biến đó bằng một hằng số có xác suất 1 (hậu quả của việc có độ lệch chuẩn 0), thì nó có thể ' t có thể cung cấp thông tin về việc biến khác là nhỏ hay lớn. Tôi không biết quy ước là gì nhưng có vẻ như mối tương quan nên được định nghĩa là 0 trong trường hợp đó.
Macro

Cảm ơn rất nhiều Macro. Tôi nghĩ ý tưởng của bạn giống như câu trả lời dưới đây. Tuy nhiên, tôi không thể bỏ phiếu nhận xét của bạn do hạn chế về điểm. Cảm ơn.
chepukha

4
Bạn đã chấp nhận một câu trả lời rồi, và vì vậy tôi sẽ chỉ viết một bình luận. Nếu một biến ngẫu nhiên có độ lệch chuẩn σ Y = 0 , sau đó cov ( X , Y ) = E [ ( X - μ X ) ( Y - μ Y ) ] = 0 đối với bất kỳ biến ngẫu nhiên khác X (từ ( Y - μ Y ) = 0 với xác suất 1YσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(YμY)=01). Do đó, định nghĩa của hệ số tương quan cung cấp cho các hình thức không xác định0ρX,Y=cov(X,Y)σXσY . Thông thường,định nghĩaρX,Ybằng0trong trường hợp này và điều này có thể được bảo vệ trên cơ sở giá trị giới hạn củaρX,YσY0,v.v.00 ρX,Y0ρX,YσY0
Dilip Sarwate

6
@Dilip, nếu đó là một câu trả lời thì nó nên đi như một câu trả lời. Nó không quan trọng cho dù một câu trả lời đã được chấp nhận.
Andy W

1
@Dilip Vấn đề với Hình thức 0 là ngay cả khi nó có thể được tạo ra để có giá trị xác định bằng thao tác giới hạn, giá trị phụ thuộc vàocáchbạn thực hiện giới hạn. Từ đâu, lập luận rằngρX,Y=0là không đầy đủ (và có sức thuyết phục). Bạn có thể trích dẫn một nguồn thông qua quy ước này và hỗ trợ nó với một lý do hợp lệ? 00ρX,Y=0
whuber

Câu trả lời:


14

Đúng là, nếu một trong các SD của bạn bằng 0, phương trình đó không được xác định. Tuy nhiên, một cách tốt hơn để suy nghĩ về điều này là nếu một trong số SD của bạn bằng 0, thì không có mối tương quan nào. Trong các thuật ngữ khái niệm lỏng lẻo, một mối tương quan sẽ cho bạn biết về cách một biến di chuyển xung quanh khi biến khác di chuyển xung quanh. SD bằng 0 ngụ ý rằng biến đó không phải là 'di chuyển xung quanh'. Bạn sẽ phải có một vectơ hằng, chẳng hạn nhưrep(constant, n_times) .


Cảm ơn rất nhiều. Tôi nghĩ nó có nghĩa. Thật thú vị khi tôi không thấy bất kỳ cuốn sách giáo khoa nào đề cập đến trường hợp đó.
chepukha

@gung Đây có phải là một giới hạn trong định nghĩa hệ số tương quan, ý tôi là phương trình tương quan có thể có hai giá trị, một giá trị được đưa ra trong phương trình trên và 0 khi SD của một trong các biến là 0.
prashanth

@prashanth, tôi cho là vậy.
gung - Tái lập Monica

2

Một điều khác cần suy nghĩ là các giả định cơ bản khi chúng ta nói về phương tiện và độ lệch chuẩn và tương quan.

Nếu chúng ta đang nói về một mẫu dữ liệu, một giả định phổ biến là dữ liệu (ít nhất là xấp xỉ) được phân phối bình thường hoặc có thể được chuyển đổi sao cho nó (ví dụ thông qua một biến đổi nhật ký). Nếu bạn quan sát độ lệch chuẩn bằng 0, có hai trường hợp: độ lệch chuẩn thực tế là khác không, nhưng rất nhỏ, và do đó, tập dữ liệu bạn có các mẫu đều có giá trị trung bình (ví dụ, điều này có thể xảy ra nếu bạn đang đo dữ liệu ở mức độ chính xác thô); hoặc mô hình bị sai.

Trong kịch bản thứ hai này, độ lệch chuẩn và do đó là mối tương quan, là một thước đo vô nghĩa.

Tổng quát hơn, các bản phân phối cơ bản phải có cả giây thứ hai hữu hạn và do đó độ lệch chuẩn khác không, để tương quan là một khái niệm hợp lệ.


Có thể đáng lưu ý rằng câu hỏi ban đầu là về phân phối (lý thuyết), không phải về dữ liệu.
whuber

Nếu đó là trường hợp, thì độ lệch chuẩn bằng 0 sẽ hàm ý phân phối suy biến với số đo chỉ ở giá trị trung bình (nghĩa là hàm hằng) ... một lần nữa độ lệch chuẩn chỉ có nghĩa là phân phối cơ bản là bình thường. Nếu độ lệch chuẩn bằng 0, PDF của Gaussian không được xác định đúng và do đó không được phép trong mô hình.
tdc

Tôi ngạc nhiên về sự xuất hiện của Gaussian trong bình luận của bạn, Tom. Điều này có vẻ như một hạn chế không cần thiết. Yêu cầu sự tồn tại của pdf cũng có vẻ hạn chế (xét cho cùng, không có phân phối rời rạc nào có pdf). Cũng lưu ý rằng SD được xác định rõ - "có ý nghĩa" - bất cứ khi nào khoảnh khắc thứ hai là hữu hạn và điều này bao gồm các nguyên tử xác suất (chức năng "Dirac delta" của bạn).
whuber

Ok tôi đồng ý có lẽ đã bị hạn chế quá mức, nhưng nói chung đây là ý nghĩa của mọi người đối với SD. ví dụ từ Wolfram: "Độ lệch chuẩn có thể được xác định cho bất kỳ phân phối nào trong hai thời điểm đầu tiên hữu hạn, nhưng thông thường nhất là giả định rằng phân phối cơ bản là bình thường." Bạn có đưa ra quan điểm của tôi không, rằng nếu SD = 0 cho một trong các biến, các giả định cơ bản làm cơ sở cho khái niệm thống kê về tương quan sẽ không được đáp ứng?
tdc

Vâng, Tom, tuyên bố cuối cùng của bạn là tại chỗ và tôi vui vẻ chấp nhận nó. Tuy nhiên, ý tưởng mà nó thể hiện không xuất hiện rất nổi bật trong câu trả lời của bạn; nếu nó ở đó, nó bị chôn vùi trong các nhận xét về phân phối bình thường, nhật ký, hàm delta và tập trung vào dữ liệu thay vì chính các bản phân phối. BTW, người ta nên cẩn thận về các báo cáo thống kê xuất hiện trên trang Wolfram: nó được định hướng rất nhiều về toán học đến nỗi các đặc tính của nó về thực hành thống kê có thể gây nghi ngờ. Ở đây, nó đã sai: việc sử dụng SD vượt xa các cài đặt phân phối Bình thường.
whuber

2

Một tương quan là cosin của góc giữa hai vectơ. Để nói rằng độ lệch chuẩn cho Y bằng 0 cũng giống như nói rằng vectơ Y-mean (Y) bằng 0 (hoặc, nghiêm ngặt hơn, nó đại diện cho 0 trong không gian vectơ thích hợp). Vì vậy, câu hỏi trở thành "Người ta có thể nói gì về góc (cosin của) giữa vectơ không và vectơ X-mean (X)?". Tổng quát hơn, trong bất kỳ không gian vectơ nào có sản phẩm bên trong, góc giữa vectơ không và một số vectơ khác có nghĩa là gì? Theo tôi, chỉ có một câu trả lời duy nhất và đó là khái niệm "góc" trong tình huống này là vô nghĩa, và vì vậy khái niệm tương quan trong tình huống này là vô nghĩa.


0

Từ chối trách nhiệm, tôi nhận ra rằng đã có một câu trả lời chất lượng được chấp nhận, vì vậy đây sẽ là một câu trả lời, nhưng tôi không có điểm kinh nghiệm để cho phép nó. @Dilip đã đề cập rằng bạn có thể định nghĩa tương quan là 0 cho quy ước, nhưng điều này có vẻ có vấn đề vì nó sẽ có cách hiểu rất khác với tương quan thực sự bằng 0 (với SD khác không). Câu hỏi ban đầu cho biết "nếu SD của một biến bằng 0". Nếu chúng ta chỉ dừng lại và nghĩ về định nghĩa của 'biến' thì chúng ta sẽ có được đường dẫn trực tiếp hơn đến câu trả lời. Một biến có 0 SD hoàn toàn không phải là một biến, nó là một hằng số. Vì vậy, trong trường hợp đó, bạn không có hai biến, vì vậy về mặt khái niệm nó không có ý nghĩa gì để xác định một mối tương quan.


Nếu bạn không có đủ điểm để bình luận, bạn không nên bình luận qua câu trả lời.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.