Trực giác đằng sau mối tương quan 'một phần' và 'cận biên'


12

Có ai có ý tưởng về lý do tại sao tương quan có điều kiện giữa 2 biến được gọi là tương quan "một phần" và tương quan đơn giản giữa chúng (vì vậy, khi không dựa trên bất kỳ biến nào khác) được gọi là tương quan "cận biên" không? Trực giác đằng sau các từ "một phần" và "cận biên" là gì? Họ làm gì với "các phần" hoặc "lề"?

Sẽ tốt hơn nếu tìm hiểu câu trả lời để hiểu những khái niệm đó tốt hơn.


Câu trả lời:


11

Thuật ngữ "cận biên" rất cũ. Nếu bạn quay trở lại đủ xa trong lịch sử, không có tạp chí khoa học nào (rõ ràng họ đã bắt đầu vào khoảng năm 1665 ). Thay vào đó, kết quả tạm thời được truyền đạt qua thư viết tay và kết quả cuối cùng được viết trong sách. Không có xu hướng đồ họa dữ liệu trước Playfair , nhưng sách thường có thể có các bảng với các số trong các điều kiện khác nhau. Xem xét bảng này:
xI,AIAIx

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
; nghĩa là, họ đưa ra một con số cho một sự kết hợp cụ thể của các điều kiện. Tuy nhiên, đôi khi độc giả muốn biết một điều kiện cụ thể là như thế nào mà không quan tâm đến biến khác. Hãy tưởng tượng là số lần một cái gì đó đã xảy ra khi các biến đầu tiên là và biến thứ hai là . Sau đó, ai đó có thể muốn biết, tần suất này đã xảy ra khi biến đầu tiên là dù biến thứ hai là gì? Thật dễ dàng để tìm ra điều này, bạn chỉ cần tổng hợpxI,AIAIxs trong hàng đầu tiên và bỏ qua các cột. Mọi người thường làm những việc như vậy một cách phổ biến, và họ (tự nhiên) đã viết những con số trong lề của cuốn sách bên cạnh bàn. Trong khi các số ban đầu là có điều kiện, không có tên cho các loại số khác; họ được gọi là " cận biên ".

Những con số đó có liên quan gì? Chà, đó không phải là một kết nối trực tiếp, nhưng một khi bạn có ý tưởng 'không tính đến các biến khác' và bạn có một tên cho điều đó ("cận biên"), khi một bối cảnh mới xuất hiện tương tự (ví dụ, tương quan) , tên và ý tưởng được áp dụng đơn giản.


Tôi không biết từ nguyên của tương quan một phần, nhưng tôi có thể cung cấp cho bạn trực giác. Điều đó khá đơn giản, thực sự: bạn đang xử lý mối tương quan giữa một phần của một biến và một phần của biến khác. Hãy xem xét con số này:

nhập mô tả hình ảnh ở đây

Chúng ta có thể tưởng tượng vòng tròn bên trái là một biến , vòng tròn bên phải là một biến , và các vòng tròn trên cùng là một biến . Mối tương quan giữa hai biến có liên quan đến mức độ trùng lặp của các vòng tròn (trên thực tế, chúng ta có thể tưởng tượng diện tích của các vòng tròn biểu thị sự biến thiên của từng biến và tỷ lệ phần trăm của khu vực là ). Bây giờ rõ ràng là có một số mối tương quan giữa và , nhưng cũng có một số tương quan giữa và , và giữa và . Điều gì sẽ xảy ra nếu bạn muốn biết mối tương quan giữa các phần củaY Z r 2 X Y X Z Y Z X Y ZXYZr2XYXZYZXvà không liên quan đếnYZ ? Đó sẽ là mối tương quan một phần . Nó có liên quan đến sự chồng chéo giữa hai phần của các vòng tròn không bao gồm các phần trên cùng giao nhau với vòng tròn trên cùng.

Tôi thích trang web này vì đã cung cấp một cuộc thảo luận dễ hiểu về tương quan một phần và các chủ đề liên quan. Chỉ phần đầu tiên là về tương quan một phần mỗi se, nhưng tôi khuyên bạn nên đọc toàn bộ trang (mặc dù nó khá dài). Mặc dù không liên quan trực tiếp, cuộc thảo luận tại chủ đề này: Đâu là phương sai được chia sẻ giữa tất cả các IV trong phương trình hồi quy tuyến tính bội? , có thể hữu ích là tốt.


1
Cảm ơn! Rút ra điều này dẫn tôi đến một câu hỏi khác liên quan đến tính đối xứng. Chúng tôi biết rằng . Có phải cùng một thuộc tính giữ cho tương quan một phần, tức là ? Sử dụng công thức trên, chúng tôi có thể viết: và tôi không nghĩ rằng sẽ luôn bằng vì mẫu số có thể thay đổi (kích thước của các vòng tròn đại diện cho và dựa trên số đo của tập và số đo của tập ? )? ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|ZρYX|Z=Area(1)Area(X(2+center))ρXY|ZρYX|ZXYXY
Kiran K

1
Đó có lẽ là một câu hỏi mới, @KiranK. Đó là một câu hỏi hay và chúng tôi không muốn nó bị chôn vùi trong những bình luận mà mọi người sẽ không bao giờ tìm thấy nó.
gung - Phục hồi Monica

Ý tưởng hay, tôi đã đăng lại như một câu hỏi ở đây: stats.stackexchange.com/questions/195410/ dọa
Kiran K.

0

Tương quan giữa 2 biến (mà bạn gọi là tương quan biên) chỉ ra rằng cả hai biến mẫu đều thể hiện sự phụ thuộc.ρXYX,Y

Tương quan một phần đo lường mối tương quan còn lại giữa một khi ảnh hưởng của biến gây nhiễu đã được loại bỏ bằng hồi quy tuyến tính.ρXYZX,YZ

Theo thuật ngữ toán học, điều này được thể hiện dưới dạng:

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

Để minh họa các thuộc tính đến từ định nghĩa này, chúng ta có thể xem xét hai trường hợp giới hạn:

  • nếu và đều tương quan 0% với biến , thì tương quan một phần là tương quan:XYZ

    ρXYZ=ρXY

  • Tuy nhiên, nếu tương quan 100% với , thì tương quan một phần luôn là 0 bất kể giá trị của .YZρXY

ρXYZ=0

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.