Làm thế nào bạn sẽ giải thích hiệp phương sai cho một người chỉ hiểu ý nghĩa?


207

... giả sử rằng tôi có thể nâng cao kiến ​​thức của họ về phương sai theo cách trực quan ( Hiểu "phương sai" bằng trực giác ) hoặc bằng cách nói: Đó là khoảng cách trung bình của các giá trị dữ liệu từ 'trung bình' - và vì phương sai là hình vuông đơn vị, chúng tôi lấy căn bậc hai để giữ các đơn vị giống nhau và đó được gọi là độ lệch chuẩn.

Chúng ta hãy giả sử rằng điều này được khớp nối và (hy vọng) được hiểu bởi 'người nhận'. Bây giờ hiệp phương sai là gì và làm thế nào người ta có thể giải thích nó bằng tiếng Anh đơn giản mà không sử dụng bất kỳ thuật ngữ / công thức toán học nào? (Tức là, giải thích trực quan .;)

Xin lưu ý: Tôi biết các công thức và toán học đằng sau khái niệm này. Tôi muốn có thể 'giải thích' giống nhau một cách dễ hiểu, không bao gồm toán học; tức là, "hiệp phương sai" thậm chí có nghĩa là gì?


1
@ Tây An - 'làm thế nào' chính xác bạn sẽ xác định nó thông qua hồi quy tuyến tính đơn giản ? Tôi thực sự muốn biết ...
Tiến sĩ

3
Giả sử bạn đã có một biểu đồ phân tán gồm hai biến của mình, x so với y, với gốc tại (0,0), chỉ cần vẽ hai dòng tại x = mean (x) (dọc) và y = mean (x) (ngang): sử dụng hệ tọa độ mới này (gốc tọa độ là (trung bình (x), trung bình (y)), đặt dấu "+" trong các góc phần tư phía trên bên phải và dưới cùng bên trái, dấu "-" trong hai góc phần tư khác; bạn đã nhận được dấu hiệu của hiệp phương sai, về cơ bản là những gì @Peter đã nói . Mở rộng các đơn vị x và y (bằng SD) dẫn đến một bản tóm tắt dễ hiểu hơn, như được thảo luận trong chủ đề tiếp theo .
chl

1
@chl - bạn có thể vui lòng đăng nó như một câu trả lời và có thể sử dụng đồ họa để mô tả nó không!
Tiến sĩ

Tôi tìm thấy video trên trang web này để giúp tôi vì tôi thích hình ảnh hơn những giải thích trừu tượng. Trang web có video Cụ thể hình ảnh này : ! [ Nhập mô tả hình ảnh tại đây ] ( i.stack.imgur.com/xGZFv.png )
Karl Morrison

Câu trả lời:


375

Đôi khi chúng ta có thể "nâng cao kiến ​​thức" bằng một cách tiếp cận khác thường hoặc khác biệt. Tôi muốn câu trả lời này có thể truy cập được cho các học sinh mẫu giáo và cũng có một số niềm vui, vì vậy mọi người hãy lấy bút màu của bạn ra!

Cho dữ liệu được ghép nối , vẽ biểu đồ phân tán của chúng. (Học ​​sinh nhỏ hơn có thể cần một giáo viên sản xuất cái này cho chúng. :-) Mỗi ​​cặp điểm , trong ô đó xác định một hình chữ nhật: đó là hình chữ nhật nhỏ nhất, có các cạnh song song với các trục, chứa các điểm đó. Do đó, các điểm nằm ở góc trên bên phải và góc dưới bên trái (mối quan hệ "dương") hoặc chúng nằm ở góc trên bên trái và góc dưới bên phải (mối quan hệ "tiêu cực").(x,y)(xi,yi)(xj,yj)

Vẽ tất cả các hình chữ nhật có thể như vậy. Tô màu chúng trong suốt, làm cho hình chữ nhật dương có màu đỏ (nói) và hình chữ nhật âm "chống đỏ" (màu xanh). Theo cách này, bất cứ nơi nào hình chữ nhật trùng nhau, màu sắc của chúng sẽ được tăng cường khi chúng giống nhau (xanh dương và xanh dương hoặc đỏ và đỏ) hoặc hủy bỏ khi chúng khác nhau.

Hình chữ nhật dương và âm

( Trong hình minh họa hình chữ nhật dương (đỏ) và âm (xanh dương) này, phần trùng lặp phải có màu trắng; thật không may, phần mềm này không có màu "chống đỏ" thực sự. Phần trùng lặp có màu xám, vì vậy nó sẽ làm tối màu cốt truyện, nhưng nhìn chung các ròng lượng màu đỏ là đúng. )

Bây giờ chúng tôi đã sẵn sàng để giải thích hiệp phương sai.

Hiệp phương sai là lượng màu đỏ ròng trong ô (coi màu xanh là giá trị âm).

Dưới đây là một số ví dụ với 32 điểm bất thường được rút ra từ các bản phân phối với hiệp phương sai đã cho, được sắp xếp theo thứ tự từ âm nhất (bluest) đến dương nhất (đỏ nhất).

Lô đất hiệp phương, cập nhật 2019

Chúng được vẽ trên các trục chung để làm cho chúng có thể so sánh được. Các hình chữ nhật được phác thảo nhẹ để giúp bạn nhìn thấy chúng. Đây là phiên bản cập nhật (2019) của bản gốc: nó sử dụng phần mềm hủy bỏ đúng màu đỏ và màu lục lam trong các hình chữ nhật chồng chéo.

Hãy suy ra một số tính chất của hiệp phương sai. Hiểu biết về các tính chất này sẽ có thể truy cập được đối với bất kỳ ai đã thực sự vẽ một vài hình chữ nhật. :-)

  • Song phương. Bởi vì lượng màu đỏ phụ thuộc vào kích thước của ô, hiệp phương sai tỷ lệ thuận với tỷ lệ trên trục x và tỷ lệ trên trục y.

  • Tương quan. Hiệp phương sai tăng khi các điểm xấp xỉ một đường dốc lên và giảm khi các điểm xấp xỉ một đường dốc xuống. Điều này là do trong trường hợp trước, hầu hết các hình chữ nhật đều dương và trong trường hợp sau, hầu hết là âm.

  • Mối quan hệ với các hiệp hội tuyến tính. Bởi vì các hiệp hội phi tuyến tính có thể tạo ra hỗn hợp các hình chữ nhật dương và âm, chúng dẫn đến hiệp phương sai không thể đoán trước (và không hữu ích). Các hiệp hội tuyến tính có thể được giải thích đầy đủ bằng hai đặc tính trước.

  • Nhạy cảm với ngoại lệ. Một ngoại lệ hình học (một điểm đứng cách xa khối lượng) sẽ tạo ra nhiều hình chữ nhật lớn liên kết với tất cả các điểm khác. Nó một mình có thể tạo ra một lượng màu đỏ dương hoặc âm trong bức tranh tổng thể.

Ngẫu nhiên, định nghĩa hiệp phương sai này khác với thông thường chỉ bởi một hằng số tỷ lệ chung (không phụ thuộc vào kích thước tập dữ liệu). Các nghiêng về mặt toán học sẽ không gặp khó khăn khi thực hiện chứng minh đại số rằng công thức đưa ra ở đây luôn luôn gấp đôi so với hiệp phương sai thông thường.


92
+1 Wow. Điều này thậm chí hoạt động để giải thích hiệp phương sai cho những người đã nghĩ rằng họ biết nó là gì.
Aaron

7
+1 Tôi thực sự thích đọc phản hồi của bạn. Tôi sẽ vẽ một số hình chữ nhật, và để con trai tôi vẽ chúng :)
chl

18
Bây giờ nếu chỉ có tất cả các khái niệm thống kê giới thiệu có thể được trình bày cho sinh viên theo cách sáng suốt này thì
MannyG

4
Thật là đẹp Và rất rất rõ ràng.
Đồi Benjamin Mako

4
@fcoppens Thật vậy, có một lời giải thích truyền thống tiến hành như bạn đề xuất. Tôi nghĩ về điều này bởi vì tôi không muốn đưa ra một ý tưởng không cần thiết - cụ thể là xây dựng trọng tâm . Điều đó sẽ khiến lời giải thích không thể tiếp cận với đứa trẻ năm tuổi với một hộp bút chì màu. Một số kết luận tôi rút ra cuối cùng cũng sẽ không ngay lập tức. Ví dụ, sẽ không còn quá rõ ràng rằng hiệp phương sai nhạy cảm với các loại ngoại lệ nhất định. (x¯,y¯)
whuber

61

Để giải thích về nhận xét của tôi, tôi đã từng dạy hiệp phương sai như là thước đo của sự đồng biến (trung bình) giữa hai biến, giả sử và .xy

Rất hữu ích khi nhớ lại công thức cơ bản (đơn giản để giải thích, không cần nói về các kỳ vọng toán học cho một khóa học giới thiệu):

cov(x,y)=1ni=1n(xix¯)(yiy¯)

để chúng ta thấy rõ rằng mỗi quan sát, , có thể đóng góp tích cực hoặc tiêu cực cho hiệp phương sai, tùy thuộc vào sản phẩm độ lệch của chúng so với giá trị trung bình của hai biến, và . Lưu ý rằng tôi không nói về độ lớn ở đây, mà chỉ đơn giản là dấu hiệu của sự đóng góp của quan sát thứ i.(xi,yi)x¯y¯

Đây là những gì tôi đã mô tả trong các sơ đồ sau. Dữ liệu nhân tạo được tạo bằng mô hình tuyến tính (trái, ; phải, , trong đó được rút ra từ phân phối gaussian với giá trị trung bình bằng 0 và , và từ một phân phối đồng đều trong khoảng ).y=1.2x+εy=0.1x+εεSD=2x[0,20]

nhập mô tả hình ảnh ở đây

Các thanh dọc và ngang tương ứng là giá trị trung bình của và . Điều đó có nghĩa là thay vì "nhìn vào các quan sát riêng lẻ" từ gốc , chúng ta có thể thực hiện từ . Đây chỉ là một bản dịch trên trục x và y. Trong hệ tọa độ mới này, mọi quan sát nằm ở góc phần tư phía trên bên phải hoặc phía dưới bên trái đều đóng góp tích cực vào hiệp phương sai, trong khi các quan sát nằm trong hai góc phần tư khác đóng góp tiêu cực vào nó. Trong trường hợp đầu tiên (bên trái), hiệp phương sai bằng 30,11 và phân phối trong bốn góc phần tư được đưa ra dưới đây:xy(0,0)(x¯,y¯)

   +  -
+ 30  2
-  0 28

Rõ ràng, khi các nằm trên giá trị trung bình của chúng, do đó, các tương ứng (wrt. ). Bắt mắt hình dạng của đám mây điểm 2D, khi giá trị tăng giá trị có xu hướng tăng. (Nhưng hãy nhớ rằng chúng ta cũng có thể sử dụng thực tế là có mối quan hệ rõ ràng giữa hiệp phương sai và độ dốc của đường hồi quy, tức là .)xiyiy¯xyb=Cov(x,y)/Var(x)

Trong trường hợp thứ hai (phải, cùng ), hiệp phương sai bằng 3,54 và phân bố trên các góc phần tư là "đồng nhất" hơn như dưới đây:xi

   +  -
+ 18 14
- 12 16

Nói cách khác, số trường hợp tăng của và không đồng biến theo cùng một hướng wrt. phương tiện của họ.xiyi

Lưu ý rằng chúng ta có thể giảm hiệp phương sai bằng cách chia tỷ lệ hoặc . Trong bảng điều khiển bên trái, hiệp phương sai của (hoặc ) giảm đi mười lần (3,01). Do các đơn vị đo lường và mức độ lan truyền của và (so với phương tiện của chúng) gây khó khăn cho việc diễn giải giá trị của hiệp phương sai theo thuật ngữ tuyệt đối, chúng tôi thường chia tỷ lệ cả hai biến bằng độ lệch chuẩn của chúng và lấy hệ số tương quan. Điều này có nghĩa là ngoài việc định tâm lại phân tán của chúng tôi thànhy ( x / 10 , y ) ( x , y / 10 ) x y ( x , y ) ( ˉ x , ˉ y ) x yxy(x/10,y)(x,y/10)xy(x,y)(x¯,y¯)chúng tôi cũng chia tỷ lệ đơn vị x và y theo độ lệch chuẩn, dẫn đến một phép đo dễ hiểu hơn về sự cộng hưởng tuyến tính giữa và .xy


28

Hiệp phương sai là thước đo xem một biến tăng lên bao nhiêu khi biến kia tăng.


1
Có phải nó luôn theo hướng 'giống nhau' không? Ngoài ra, nó có áp dụng cho các mối quan hệ nghịch đảo không (nghĩa là khi một người đi lên thì người khác đi xuống)?
Tiến sĩ

4
@nupul Vâng, ngược lại "lên" là "xuống" và ngược lại với "tích cực" là "tiêu cực". Tôi đã cố gắng đưa ra một câu trả lời. Của bạn là hoàn thiện hơn nhiều. Ngay cả "cách hai biến thay đổi" của bạn cũng đầy đủ hơn, nhưng, tôi nghĩ, khó hiểu hơn một chút.
Peter Flom

1
+1 để phù hợp với nó trong một câu đơn giản, nhưng đó không phải là mối tương quan? Ý tôi là, tôi biết cov lớn hơn => đúng hơn, nhưng với câu đó, tôi mong đợi một câu như "80%" là một câu trả lời, tương ứng với Corr = 0.8. Không cov cũng mô tả phương sai trong dữ liệu? I E. "Hiệp phương sai tỷ lệ thuận với mức tăng của một biến khi biến kia tăng lên và cũng tỷ lệ thuận với sự lan truyền của dữ liệu trong cả hai biến", hay điều gì?
ness101

4
Đúng vậy, Peter, đó là lý do tại sao @ naught101 đưa ra nhận xét đó: bạn mô tả nghe có vẻ như là một tỷ lệ thay đổi, do đó đơn vị của nó sẽ là [đơn vị của một biến] / [đơn vị của biến khác] (nếu chúng tôi diễn giải nó giống như một đạo hàm ) hoặc sẽ chỉ là [đơn vị của một biến] (nếu chúng tôi hiểu là một sự khác biệt thuần túy). Chúng không phải là hiệp phương sai (có đơn vị đo là sản phẩm của các đơn vị cho hai biến) cũng không tương quan (không có đơn vị).
whuber

1
@nbro Xem xét bất kỳ ví dụ cụ thể nào: giả sử bạn biết hiệp phương sai của các biến và là chẳng hạn. Ngay cả với sự hiểu biết hào phóng nhất về "biến số" và "đi lên", bạn có thể nói từ thông tin đó một mình tăng bao nhiêu khi tăng một lượng nhất định không? Câu trả lời là không: thông tin duy nhất nó cung cấp cho bạn là sẽ có xu hướng tăng lên. Trong bài này, Peter đã nhầm lẫn hiệp phương sai với một hệ số hồi quy (trong đó có hai, nhân tiện, và chúng thường khác nhau). Y 1 , Y X YXY1,YXY
whuber

12

Tôi đang trả lời câu hỏi của riêng tôi, nhưng tôi nghĩ thật tuyệt vời cho những người đi qua bài đăng này để xem một số giải thích trên trang này .

Tôi đang diễn giải một trong những câu trả lời rất rõ ràng (bởi một người dùng'Zhop '). Tôi đang làm như vậy trong trường hợp nếu trang web đó ngừng hoạt động hoặc trang bị gỡ xuống khi có ai đó truy cập bài đăng này;)

Hiệp phương sai là thước đo mức độ hai biến thay đổi cùng nhau. So sánh điều này với Phương sai, chỉ là phạm vi mà một số đo (hoặc biến) thay đổi.

Trong nghiên cứu các mô hình xã hội, bạn có thể đưa ra giả thuyết rằng những người giàu có có khả năng được giáo dục nhiều hơn, vì vậy bạn sẽ thử xem các biện pháp giàu có và giáo dục chặt chẽ như thế nào với nhau. Bạn sẽ sử dụng một biện pháp hiệp phương sai để xác định điều này.

...

Tôi không chắc ý của bạn là gì khi bạn hỏi nó áp dụng như thế nào cho thống kê. Đây là một biện pháp được dạy trong nhiều lớp thống kê. Ý bạn là, khi nào bạn nên sử dụng nó?

Bạn sử dụng nó khi bạn muốn xem hai hoặc nhiều biến thay đổi liên quan đến nhau.

Hãy nghĩ về những người trong một nhóm. Nhìn vào cách họ thay đổi vị trí địa lý so với nhau. Khi đội đang chơi hoặc luyện tập, khoảng cách giữa các thành viên là rất nhỏ và chúng tôi sẽ nói họ ở cùng một vị trí. Và khi vị trí của chúng thay đổi, nó sẽ thay đổi cho tất cả các cá nhân cùng nhau (giả sử, đi trên xe buýt đến một trò chơi). Trong tình huống này, chúng tôi sẽ nói rằng họ có mức độ hiệp phương cao. Nhưng khi họ không chơi, thì tỷ lệ hiệp phương sai có thể sẽ khá thấp, bởi vì tất cả họ đều đi đến những nơi khác nhau với tốc độ khác nhau.

Vì vậy, bạn có thể dự đoán vị trí của một thành viên trong nhóm, dựa trên vị trí của một thành viên khác trong nhóm khi họ đang luyện tập hoặc chơi một trò chơi với độ chính xác cao. Phép đo hiệp phương sai sẽ gần bằng 1, tôi tin thế. Nhưng khi họ không luyện tập hoặc chơi, bạn sẽ có cơ hội dự đoán vị trí của một người nhỏ hơn nhiều, dựa trên vị trí của một thành viên trong nhóm. Nó sẽ gần bằng không, có lẽ, mặc dù không phải là không, vì đôi khi các thành viên trong nhóm sẽ là bạn bè và có thể đi chơi cùng nhau vào thời gian riêng của họ.

Tuy nhiên, nếu bạn chọn ngẫu nhiên các cá nhân ở Hoa Kỳ và cố gắng sử dụng một trong số họ để dự đoán các vị trí của người khác, có lẽ bạn sẽ thấy hiệp phương sai bằng không. Nói cách khác, hoàn toàn không có mối quan hệ nào giữa địa điểm của một người được chọn ngẫu nhiên ở Hoa Kỳ và của một người khác.

Thêm một số khác (bởi 'CatofGrey') giúp tăng cường trực giác:

Trong lý thuyết xác suất và thống kê, hiệp phương sai là thước đo xem hai biến ngẫu nhiên khác nhau như thế nào (khác biệt với phương sai, đo lường mức độ của một biến duy nhất thay đổi).

Nếu hai biến có xu hướng thay đổi cùng nhau (nghĩa là khi một trong số chúng nằm trên giá trị mong đợi của nó, thì biến còn lại cũng có xu hướng cao hơn giá trị mong đợi của nó), thì hiệp phương sai giữa hai biến sẽ dương. Mặt khác, nếu một trong số chúng vượt quá giá trị mong đợi của nó và biến còn lại có xu hướng thấp hơn giá trị mong đợi của nó, thì hiệp phương sai giữa hai biến sẽ âm.

Hai điều này cùng nhau đã khiến tôi hiểu hiệp phương sai vì tôi chưa bao giờ hiểu nó trước đây! Đơn giản là tuyệt vời!!


15
Mặc dù các mô tả này mang tính gợi ý về mặt định tính, nhưng thật đáng buồn là chúng không đầy đủ: chúng không phân biệt hiệp phương sai với tương quan (trên thực tế, mô tả đầu tiên có thể làm lẫn lộn cả hai, trên thực tế), cũng không đưa ra giả định cơ bản về biến đổi tuyến tính . Ngoài ra, không giải quyết khía cạnh quan trọng mà hiệp phương sai phụ thuộc (tuyến tính) vào thang đo của từng biến.
whuber

@whuber - đồng ý! Và do đó không đánh dấu tôi là câu trả lời :) (chưa phải vậy;)
Tiến sĩ

12

Tôi thực sự thích câu trả lời của Whuber, vì vậy tôi đã thu thập thêm một số tài nguyên. Hiệp phương sai mô tả cả hai biến được lan truyền bao xa và bản chất của mối quan hệ của chúng.

Hiệp phương sai sử dụng các hình chữ nhật để mô tả mức độ quan sát cách xa trung bình trên biểu đồ phân tán:

  • Nếu một hình chữ nhật có các cạnh dài và chiều rộng cao hoặc cạnh ngắn và chiều rộng ngắn, nó cung cấp bằng chứng cho thấy hai biến di chuyển cùng nhau.

  • Nếu một hình chữ nhật có hai cạnh tương đối dài cho các biến đó và hai mặt tương đối ngắn cho biến khác, thì quan sát này cung cấp bằng chứng cho thấy các biến không di chuyển rất tốt với nhau.

  • Nếu hình chữ nhật nằm trong góc phần tư thứ 2 hoặc thứ 4, thì khi một biến lớn hơn giá trị trung bình, biến còn lại nhỏ hơn giá trị trung bình. Sự gia tăng trong một biến có liên quan đến sự giảm trong biến khác.

Tôi đã tìm thấy một hình ảnh trực quan tuyệt vời về điều này tại http://sciguides.com/guides/covariance/ , Nó giải thích hiệp phương sai là gì nếu bạn chỉ biết ý nghĩa.


7
+1 Giải thích hay (đặc biệt là tóm tắt một câu giới thiệu). Các liên kết là thú vị. Vì nó không có kho lưu trữ trên máy Wayback nên có khả năng nó là mới. Bởi vì nó rất giống với câu trả lời của tôi (ba tuổi), ngay từ khi lựa chọn màu đỏ cho màu dương và màu xanh dương cho mối quan hệ tiêu cực, tôi nghi ngờ đó là một dẫn xuất (không phân bổ) của tài liệu trên trang web này.
whuber

4
Liên kết "trực quan tuyệt vời" đã chết ....
whuber

1
@MSIS Điều đó không thể tìm ra, bởi vì có rất nhiều phân phối có thể có trên vòng tròn. Nhưng nếu bạn đang đề cập đến phân phối đồng đều , sẽ không có gì để tính toán, bởi vì (như tôi nhớ lại nhận xét trong chủ đề của bạn tại stats.stackexchange.com/q/414365/919 ) hệ số tương quan phải bằng âm của chính nó, QED.
whuber

1
XX0XX2X1,XX2:11
whuber

1
α,a<αb((ba)mod2π)/(2π).

10

Đây là một nỗ lực khác để giải thích hiệp phương sai với một hình ảnh. Mỗi bảng trong hình bên dưới chứa 50 điểm được mô phỏng từ phân phối hai biến có tương quan giữa x & y là 0,8 và phương sai như được hiển thị trong nhãn hàng và cột. Hiệp phương sai được hiển thị ở góc dưới bên phải của mỗi bảng.

Hiệp phương sai khác nhau, tất cả đều có tương quan = 0,8

Bất cứ ai quan tâm đến việc cải thiện điều này ... đây là mã R:

library(mvtnorm)

rowvars <- colvars <- c(10,20,30,40,50)

all <- NULL
for(i in 1:length(colvars)){
  colvar <- colvars[i]
  for(j in 1:length(rowvars)){
    set.seed(303)  # Put seed here to show same data in each panel
    rowvar <- rowvars[j]
    # Simulate 50 points, corr=0.8
    sig <- matrix(c(rowvar, .8*sqrt(rowvar)*sqrt(colvar), .8*sqrt(rowvar)*sqrt(colvar), colvar), nrow=2)
    yy <- rmvnorm(50, mean=c(0,0), sig)
    dati <- data.frame(i=i, j=j, colvar=colvar, rowvar=rowvar, covar=.8*sqrt(rowvar)*sqrt(colvar), yy)
    all <- rbind(all, dati)
  }
}
names(all) <- c('i','j','colvar','rowvar','covar','x','y')
all <- transform(all, colvar=factor(colvar), rowvar=factor(rowvar))
library(latticeExtra)
useOuterStrips(xyplot(y~x|colvar*rowvar, all, cov=all$covar,
                      panel=function(x,y,subscripts, cov,...){
                        panel.xyplot(x,y,...)
                        print(cor(x,y))
                        ltext(14,-12, round(cov[subscripts][1],0))
                      }))

10

Tôi yêu câu trả lời của @whuber - trước đây tôi chỉ có một ý tưởng mơ hồ trong đầu về cách thức hiệp phương sai có thể được hình dung, nhưng những mảnh đất hình chữ nhật đó là thiên tài.

Tuy nhiên, vì công thức hiệp phương sai liên quan đến giá trị trung bình và câu hỏi ban đầu của OP đã nói rằng 'người nhận' không hiểu khái niệm về giá trị trung bình, tôi nghĩ rằng tôi sẽ có một vết nứt trong việc điều chỉnh các ô hình chữ nhật @ whuber để so sánh từng điểm dữ liệu với có nghĩa là x và y, vì điều này càng thể hiện những gì đang diễn ra trong công thức hiệp phương sai. Tôi nghĩ rằng nó thực sự đã kết thúc trông khá trực quan: "Đồ thị hiệp phương sai cho một biến có tương quan khác nhau"

Dấu chấm màu xanh ở giữa mỗi ô là giá trị trung bình của x (x_mean) và trung bình của y (y_mean).

Các hình chữ nhật đang so sánh giá trị của x - x_mean và y - y_mean cho mỗi điểm dữ liệu.

Hình chữ nhật có màu xanh khi:

  • cả x và y đều lớn hơn phương tiện tương ứng
  • cả x và y đều nhỏ hơn phương tiện tương ứng

Hình chữ nhật có màu đỏ khi:

  • x lớn hơn x_mean nhưng y nhỏ hơn y_mean
  • x nhỏ hơn x_mean nhưng y lớn hơn y_mean

Hiệp phương sai (và tương quan) có thể là tiêu cực mạnh và tích cực mạnh. Khi biểu đồ bị chi phối bởi một màu nhiều hơn màu kia, điều đó có nghĩa là dữ liệu chủ yếu tuân theo một mẫu nhất quán.

  • Nếu đồ thị có nhiều màu xanh hơn màu đỏ, điều đó có nghĩa là y thường tăng khi x tăng.
  • Nếu biểu đồ có nhiều màu đỏ hơn màu xanh lá cây, điều đó có nghĩa là y thường giảm khi x tăng.
  • Nếu biểu đồ không bị chi phối bởi màu này hay màu khác, điều đó có nghĩa là không có nhiều mẫu cho cách x và y liên quan đến nhau.

Giá trị thực của hiệp phương sai cho hai biến x và y khác nhau, về cơ bản là tổng của tất cả các vùng màu xanh lá cây trừ đi tất cả các vùng màu đỏ, sau đó chia cho tổng số điểm dữ liệu - hiệu quả là độ xanh trung bình so với màu đỏ của biểu đồ .

Làm thế nào mà âm thanh / nhìn?


3

Phương sai là mức độ mà một vai trò ngẫu nhiên thay đổi liên quan đến giá trị dự kiến ​​của nó Do tính chất ngẫu nhiên của quá trình cơ bản mà biến ngẫu nhiên đại diện.

Hiệp phương sai là mức độ mà hai biến ngẫu nhiên khác nhau thay đổi liên quan đến nhau. Điều này có thể xảy ra khi các biến ngẫu nhiên được điều khiển bởi cùng một quá trình cơ bản hoặc các dẫn xuất của chúng. Cả hai quá trình được đại diện bởi các biến ngẫu nhiên này đều ảnh hưởng lẫn nhau hoặc đó là cùng một quá trình nhưng một trong các biến ngẫu nhiên được lấy từ biến khác.


2

Tôi chỉ đơn giản là sẽ giải thích mối tương quan đó là khá trực quan. Tôi sẽ nói "Tương quan đo lường sức mạnh của mối quan hệ giữa hai biến X và Y. Tương quan là giữa -1 và 1 và sẽ gần bằng 1 về giá trị tuyệt đối khi mối quan hệ mạnh. Hiệp phương sai chỉ là tương quan nhân với độ lệch chuẩn của hai biến. Vì vậy, trong khi tương quan là không thứ nguyên, hiệp phương sai nằm trong tích của các đơn vị cho biến X và biến Y.


10
Điều này có vẻ không đầy đủ vì không có đề cập đến tuyến tính. X và Y có thể có mối quan hệ bậc hai mạnh mẽ nhưng có tương quan bằng không.
đánh dấu999

0

Hai biến có hiệp phương sai dương (tương quan) cao sẽ là số người trong một phòng và số ngón tay ở trong phòng. (Khi số người tăng lên, chúng tôi hy vọng số lượng ngón tay cũng tăng theo.)

Một cái gì đó có thể có hiệp phương sai (tương quan) sẽ là tuổi của một người, và số lượng nang tóc trên đầu của họ. Hoặc, số lượng zits trên khuôn mặt của một người (trong một nhóm tuổi nhất định) và số ngày họ có trong một tuần. Chúng tôi hy vọng những người có nhiều năm sẽ có ít tóc hơn và những người có nhiều mụn trứng cá sẽ có ít ngày hơn .. Đây là những mối tương quan tiêu cực.


2
Hiệp phương sai không nhất thiết có thể thay thế cho nhau bằng tương quan - trước đây phụ thuộc rất nhiều vào đơn vị. Tương quan là một số từ -1 đến 1 vô hướng đơn vị đại diện cho 'sức mạnh' của IMO hiệp phương sai và điều đó không rõ ràng từ câu trả lời của bạn
Tiến sĩ

Downvote là câu trả lời ngụ ý rằng hiệp phương sai và tương quan có thể được sử dụng thay thế cho nhau.
sapo_cosmico
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.