Ai đó có thể minh họa làm thế nào có thể có sự phụ thuộc và hiệp phương sai không?


12

Ai đó có thể minh họa, như Greg làm, nhưng chi tiết hơn, làm thế nào các biến ngẫu nhiên có thể phụ thuộc, nhưng không có hiệp phương sai? Greg, một poster ở đây, đưa ra một ví dụ sử dụng một vòng tròn ở đây .

Ai đó có thể giải thích quá trình này chi tiết hơn bằng cách sử dụng một chuỗi các bước minh họa quá trình ở một số giai đoạn không?

Ngoài ra, nếu bạn biết về một ví dụ từ tâm lý học, vui lòng minh họa bằng khái niệm này bằng một ví dụ liên quan. Xin hãy thật chính xác và tuần tự trong lời giải thích của bạn, và cũng nêu rõ một số hậu quả có thể xảy ra.


Một liên kết đến bài viết mà bạn tham khảo sẽ giúp.
gui11aume

1
Tôi khá chắc chắn chủ đề ở đây: stats.stackexchange.com/questions/12842/ và câu trả lời của Greg (Snow) có ở đây: stats.stackexchange.com/a/12898/2073
Andy McKenzie

Ban đầu tôi nghĩ đóng câu hỏi này là đúng nhưng tôi nghĩ có lẽ nó hỏi một câu hỏi khác một cách tinh tế từ đây stats.stackexchange.com/questions/12842/, vì chủ đề đó chỉ hỏi về các ví dụ toán học, trong khi câu hỏi này xuất hiện để tìm hiểu chính xác tại sao hai cái này không tương đương
Macro

Câu trả lời:


21

Ý tưởng cơ bản ở đây là hiệp phương sai chỉ đo lường một loại phụ thuộc cụ thể , do đó hai loại này không tương đương. Đặc biệt,

  • Hiệp phương sai là thước đo mức độ liên quan tuyến tính của hai biến. Nếu hai biến không liên quan tuyến tính, điều này sẽ không được phản ánh trong hiệp phương sai. Một mô tả chi tiết hơn có thể được tìm thấy ở đây .

  • Sự phụ thuộc giữa các biến ngẫu nhiên đề cập đến bất kỳ loại mối quan hệ nào giữa hai biến khiến chúng hành động "cùng nhau" khác với "chúng". Cụ thể, sự phụ thuộc giữa các biến ngẫu nhiên bao gồm bất kỳ mối quan hệ nào giữa hai biến khiến phân phối chung của chúng không phải là sản phẩm của phân phối biên của chúng. Điều này bao gồm các mối quan hệ tuyến tính cũng như nhiều người khác.

  • Nếu hai biến không liên quan tuyến tính , thì chúng có khả năng có 0 hiệp phương sai nhưng vẫn phụ thuộc - nhiều ví dụ được đưa ra ở đây và âm mưu dưới đây từ wikipedia đưa ra một số ví dụ đồ họa ở hàng dưới cùng:

    nhập mô tả hình ảnh ở đây

  • Một ví dụ nơi zero hiệp phương sai và sự độc lập giữa các biến ngẫu nhiên là điều kiện tương đương là khi các biến được cùng nhau phân phối bình thường (có nghĩa là, hai biến theo một phân phối chuẩn hai biến , mà không phải là tương đương với hai biến được cá nhân thường được phân phối). Một trường hợp đặc biệt khác là các cặp biến bernoulli không tương thích khi và chỉ khi chúng độc lập (cảm ơn @cardinal). Nhưng, nói chung cả hai không thể được coi là tương đương.

Do đó, nói chung, người ta không thể kết luận rằng hai biến độc lập chỉ vì chúng có vẻ không tương quan (ví dụ: không từ chối giả thuyết khống không có tương quan). Một người được khuyên nên vẽ dữ liệu để suy luận xem hai cái đó có liên quan với nhau không, không chỉ dừng lại ở một thử nghiệm tương quan. Ví dụ: (cảm ơn @gung), nếu một người chạy hồi quy tuyến tính (nghĩa là kiểm tra tương quan khác không) và tìm thấy một kết quả không quan trọng, người ta có thể bị kết luận rằng các biến không liên quan, nhưng bạn ve chỉ điều tra một mối quan hệ tuyến tính .

Tôi không biết nhiều về Tâm lý học nhưng điều đó có ý nghĩa rằng có thể có mối quan hệ phi tuyến tính giữa các biến ở đó. Như một ví dụ về đồ chơi, có vẻ như khả năng nhận thức không liên quan tuyến tính với tuổi tác - những người rất trẻ và rất già không sắc sảo như một người 30 tuổi. Nếu người ta vạch ra một số biện pháp về khả năng nhận thức so với tuổi, người ta có thể mong đợi thấy khả năng nhận thức cao nhất ở độ tuổi vừa phải và phân rã xung quanh đó, đó sẽ là một mô hình phi tuyến tính.


1
Chỉ là một ghi chú ( pedantic?! ), Nhưng các biến ngẫu nhiên Bernoulli là độc lập khi và chỉ khi chúng không tương thích. :)
Đức hồng y

@cardinal, đừng lo lắng rằng chỉ cần tôi từ bỏ tính hợp lý một lần nữa, giống như khi bạn nói rằng một đa biến bình thường với ma trận hiệp phương sai số ít là "thường được sử dụng và có liên quan thống kê".
Macro

Lần tới khi tôi ở Ann Arbor, tôi sẽ mua cho bạn một ly cà phê để cố gắng bù đắp cho trò đùa đó. :) Hãy thoải mái đặt câu hỏi về sự hợp lý của tôi trong lúc này. :)
Đức hồng y

Ah, nhưng trích dẫn cuối cùng là đúng . ;-) Nó xuất hiện ở một số nơi phổ biến đáng ngạc nhiên. :) (Mặc dù điều đó hơi lạc đề ở đây.)
Đức hồng y

(+1) Tôi đã loại trên hàng rào về việc liệu câu hỏi này có nên được đóng lại dưới dạng trùng lặp hay không. Nhưng, tôi nghĩ rằng những câu trả lời tốt có thể khiến những câu hỏi rất giống nhau đáng được lưu giữ. Có tất cả mọi thứ liên kết giúp.
Đức hồng y

7

Một cách tiêu chuẩn để dạy / hình dung một mối tương quan hoặc hiệp phương sai là vẽ đồ thị dữ liệu, vẽ các đường thẳng theo giá trị trung bình của 'x' và 'y', sau đó vẽ các hình chữ nhật từ điểm 2 có nghĩa là các điểm dữ liệu riêng lẻ, như sau:

nhập mô tả hình ảnh ở đây

Các hình chữ nhật (điểm) trong góc phần tư phía trên bên phải và dưới cùng bên trái (màu đỏ trong ví dụ) đóng góp giá trị dương cho tương quan / hiệp phương sai, trong khi hình chữ nhật (điểm) ở góc phần tư phía trên bên trái và dưới cùng bên phải (màu xanh lam trong ví dụ) các giá trị cho mối tương quan / hiệp phương sai. Nếu tổng diện tích của hình chữ nhật màu đỏ bằng tổng diện tích của hình chữ nhật màu xanh thì tích cực và phủ định sẽ loại bỏ và bạn có được hiệp phương sai bằng không. Nếu có nhiều diện tích hơn trong màu đỏ thì hiệp phương sai sẽ dương và nếu có nhiều diện tích hơn trong màu xanh thì hiệp phương sai sẽ âm.

Bây giờ hãy xem xét một ví dụ từ các cuộc thảo luận trước:

nhập mô tả hình ảnh ở đây

Các điểm riêng lẻ theo một parabol, do đó chúng phụ thuộc, nếu bạn biết 'x' thì bạn biết chính xác 'y', nhưng bạn cũng có thể thấy rằng với mỗi hình chữ nhật màu đỏ có một hình chữ nhật màu xanh phù hợp, do đó hiệp phương sai cuối cùng sẽ là 0 .


(1) là có một Rgói mà làm cho những lô (tôi nhớ lại whuber hiển thị một âm mưu như thế này một lần) hoặc bạn đã làm điều này từ đầu?
Macro

@Macro, câu hỏi hay, mặc dù tôi nghĩ rằng các nhà sản xuất đã được thực hiện trong Mathematica. Thật đơn giản để thực hiện việc này "bằng tay" trong R bằng cách sử dụng polygonhoặc rectmột thiết bị hỗ trợ độ trong suốt alpha.
Đức hồng y

Tôi đã viết một hàm để thực hiện cốt truyện này và có thể sẽ sớm thêm nó vào TeachingDemosgói. Suy nghĩ đầu tiên của tôi là rút ngắn cụm từ "hình chữ nhật tương quan" thành "chính xác" là tên của hàm, sau đó một chút nhận ra rằng tên đó có thể dễ bị hiểu nhầm là làm một việc gì đó hoàn toàn khác. Vì vậy, tôi cần phải đưa ra một cái tên tốt hơn, thêm một vài tùy chọn và tải nó lên R-Forge.
Greg Snow

3

Một thử nghiệm đơn giản nếu dữ liệu về cơ bản theo một mẫu đối xứng quanh trục dọc hoặc trục ngang thông qua các phương tiện, thì phương sai sẽ khá gần với không. Ví dụ: nếu đối xứng nằm quanh trục y, điều đó có nghĩa là với mỗi giá trị với một y cho trước, có một chênh lệch x dương so với trung bình x và chênh lệch âm so với trung bình x. Việc thêm y * x cho các giá trị đó sẽ bằng không. Bạn có thể thấy điều này được minh họa độc đáo trong bộ sưu tập các ô mẫu trong các câu trả lời khác. Có những mô hình khác sẽ mang lại sự đồng biến bằng 0 nhưng không độc lập, nhưng nhiều ví dụ có thể dễ dàng đánh giá bằng cách tìm kiếm sự đối xứng hay không.


1

Một ví dụ từ Wikipedia :

"Nếu các biến là độc lập, hệ số tương quan của Pearson là 0, nhưng điều ngược lại là không đúng vì hệ số tương quan chỉ phát hiện các phụ thuộc tuyến tính giữa hai biến. Ví dụ: giả sử biến ngẫu nhiên X được phân phối đối xứng khoảng 0 và Y = X ^ 2. Sau đó, Y hoàn toàn được xác định bởi X, do đó X và Y hoàn toàn phụ thuộc, nhưng tương quan của chúng bằng không, chúng không tương quan. Tuy nhiên, trong trường hợp đặc biệt khi X và Y cùng bình thường, sự không tương quan tương đương với sự độc lập. "

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.