nếu hiệp phương sai là -150, loại mối quan hệ giữa hai biến là gì?


8

Hiệp phương sai của hai biến đã được tính là -150. số liệu thống kê nói gì về mối quan hệ giữa hai biến?


9
Hiệp phương sai không phải là đơn vị tự do, vì vậy giá trị số thô không tự nó truyền đạt ý nghĩa. Ngoài thực tế là nó ít hơn 0, không có gì nhiều để nói.
Glen_b -Reinstate Monica

9
Biến của tôi có giá trị trung bình là . Nó lớn hay nhỏ? 317
whuber

Câu trả lời:


34

Để thêm vào câu trả lời của Łukasz Deryło : khi ông viết, một hiệp phương sai -150 ngụ ý một mối quan hệ tiêu cực. Cho dù đây là mối quan hệ mạnh hay yếu, phụ thuộc vào phương sai của các biến. Dưới đây tôi vẽ các ví dụ cho một mối quan hệ mạnh mẽ (mỗi biến riêng biệt có phương sai 200, vì vậy hiệp phương sai lớn, về mặt tuyệt đối, so với phương sai) và đối với mối quan hệ yếu (mỗi phương sai là 2000, nên hiệp phương sai nhỏ , trong điều khoản tuyệt đối, so với phương sai).

Mối quan hệ mạnh mẽ, variance <- 200:

mối quan hệ bền chặt

Mối quan hệ yếu, variance <- 2000:

nhập mô tả hình ảnh ở đây

Mã R:

library(MASS)

nn <- 100
epsilon <- 0.1
variance <- 2000 # weak relationship

opar <- par(mfrow=c(2,2))
    for ( ii in 1:4 ) {
        while ( TRUE ) {
            dataset <- mvrnorm(n=100,mu=c(0,0),Sigma=rbind(c(2000,-150),c(-150,2000)))
            if ( abs(cov(dataset)[1,2]-(-150)) < epsilon ) break
        }   
        plot(dataset,pch=19,xlab="",ylab="",main=paste("Covariance:",cov(dataset)[1,2]))
    }
par(opar)

EDIT: Bộ tứ của Anscombe

Như whuber lưu ý, hiệp phương sai tự nó không thực sự cho chúng ta biết nhiều về một tập dữ liệu. Để minh họa, tôi sẽ lấy bộ tứ của Anscombe và sửa đổi nó một chút. Lưu ý rằng các biểu đồ phân tán rất khác nhau có thể có cùng hiệp phương sai (làm tròn) là -150:

Anscombe

anscombe.mod <- anscombe
anscombe.mod[,c("x1","x2","x3","x4")] <- sqrt(150/5.5)*anscombe[,c("x1","x2","x3","x4")]
anscombe.mod[,c("y1","y2","y3","y4")] <- -sqrt(150/5.5)*anscombe[,c("y1","y2","y3","y4")]
opar <- par(mfrow=c(2,2))
    with(anscombe.mod,plot(x1,y1,pch=19,main=paste("Covariance:",round(cov(x1,y1),0))))
    with(anscombe.mod,plot(x2,y2,pch=19,main=paste("Covariance:",round(cov(x2,y2),0))))
    with(anscombe.mod,plot(x3,y3,pch=19,main=paste("Covariance:",round(cov(x3,y3),0))))
    with(anscombe.mod,plot(x4,y4,pch=19,main=paste("Covariance:",round(cov(x4,y4),0))))
par(opar)

EDIT CUỐI CÙNG (Tôi hứa!)

Cuối cùng, đây là một hiệp phương sai của -150 với "mối quan hệ tiêu cực" khó hiểu nhất giữa và có thể tưởng tượng được:xy

sau cùng

xx <- yy <- seq(0,100,by=10)
yy[9] <- -336.7
plot(xx,yy,pch=19,main=paste("Covariance:",cov(xx,yy)))

Thật tuyệt khi thấy các lô. Hai gợi ý: (1) cho thấy phạm vi hành vi có thể rộng hơn. Vì hiệp phương sai cho chúng ta hoàn toàn không có gì về mối quan hệ tổng thể, bạn có thể minh họa rằng bằng cách ném vào một ngoại lệ có ảnh hưởng để minh họa làm thế nào mối quan hệ có thể mạnh mẽ và nhất quán tích cực , nhưng hiệp phương sai có thể tiêu cực. (2) Hiệu quả hơn: sau khi tạo dữ liệu mẫu, chỉ cần khôi phục chúng để đạt được hiệp phương sai mong muốn. Điều này cản trở việc tạo dữ liệu lặp đi lặp lại cho đến khi đạt được ngưỡng; nó đảm bảo một giá trị chính xác ; và nó cho thấy ý nghĩa của "-150" rất ít.
whuber

@whuber: Tôi sẽ thành thật - Tôi đã quá ngu ngốc khi tìm ra cách thay đổi một tập dữ liệu nhất định để đạt được một hiệp phương sai nhất định. Googling và tìm kiếm trên CV không giúp được gì, vì vậy cuối cùng tôi đã đi lấy mẫu từ chối vũ phu. Tôi hơi thất vọng với bản thân mình; Bất kỳ gợi ý sẽ được đánh giá cao.
Stephan Kolassa

Chỉ cần một cái gì đó thêm là, bạn đã thấy Datasaurus Dozen? Là một phiên bản thậm chí còn phóng đại hơn của bộ tứ Anscombe được xuất bản đầu năm nay. Bạn có thể tìm thấy ấn phẩm trực tuyến gốc tại đây
Guilherme Marthe

1
Tôi, trước hết, nghĩ về bạn như đối lập với "ngu ngốc" và tôi sẽ vui lòng chỉ ra một phương pháp. Bạn có thể chia tỷ lệ một hoặc cả hai và . Để làm như vậy đối xứng, tạo dữ liệu . Hãy để hiệp phương sai tính toán của họ là . Xác định "tỷ lệ" là và "dấu hiệu" là khi , nếu không. Dữ liệu (sẽ giữ nguyên thứ tự của và có thể đảo ngược ) có hiệp phương sai vìxyx,yvS= =|-150/v|bạn-1-150/v<01(Sx,bạnSy)xy-150
Cov(Sx,bạnSy)= =S(bạnS)Cov(x,y)= =bạnS2v= =±bạn(-150v)v= =-150.
(+1 cho các chỉnh sửa, btw.)
whuber

@Guilherme Trong câu trả lời tại stats.stackexchange.com/a/152034/919 Tôi đã vượt xa tất cả điều đó bằng cách cung cấp phần mềm sẽ tạo ra các ví dụ như vậy chỉ bằng cách chỉ định các thuộc tính bạn muốn chúng có. Để làm ví dụ, tôi đã sử dụng mã để tái tạo Bộ tứ của Anscombe.
whuber

7

Nó chỉ cho bạn biết mối quan hệ đó là tiêu cực. Điều này có nghĩa là các giá trị thấp của một biến có xu hướng xảy ra cùng với các giá trị cao của biến khác.

Thật khó để biết hiệp phương sai này lớn hay nhỏ (nếu mối quan hệ của bạn mạnh hay yếu) vì nằm trong khoảng từ đến . Vì vậy, nó phụ thuộc vào quy mô của các biến của bạn.- s d ( X ) s d ( Y ) s d ( X ) s d ( Y )cov(X,Y)-Sd(X)Sd(Y)Sd(X)Sd(Y)

Để đánh giá mối quan hệ này có mạnh mẽ hay không, bạn cần chuyển đổi hiệp phương sai thành tương quan (chia nó cho ). Điều này nằm trong phạm vi từ đến và nhiều hướng dẫn khác nhau để giải thích có thể được tìm thấy trong Web và sách giáo khoa.- 1 1Sd(X)Sd(Y)-11

Bạn có thể chạy thử nghiệm cho tầm quan trọng của mối tương quan quá.


2
Giải thích này, mặc dù phổ biến, nhầm lẫn có nghĩa là với xu hướng chung. Hiệp phương sai có thể dễ dàng âm tính ngay cả khi phần lớn dữ liệu theo mối quan hệ tích cực.
whuber

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.