Nếu mối tương quan không ngụ ý nhân quả thì giá trị của việc biết mối tương quan giữa hai biến là gì?


11

Giả sử như một chủ doanh nghiệp (hoặc tiếp thị hoặc bất kỳ ai hiểu về biểu đồ phân tán) được hiển thị một biểu đồ phân tán gồm hai biến: số lượng quảng cáo so với số lượng sản phẩm bán ra mỗi tháng trong 5 năm qua (hoặc quy mô thời gian khác để bạn có nhiều mẫu hơn. Tôi chỉ làm cái này lên).

Bây giờ anh ấy / cô ấy nhìn thấy âm mưu phân tán và được cho biết rằng hệ số tương quan (đúng) là:

  1. 1 hoặc
  2. 0,5 hoặc
  3. 0,11 hoặc
  4. 0 hoặc
  5. -0,75 hoặc
  6. -1

Về cơ bản bất kỳ giá trị hợp lệ cho corr

Câu hỏi: Điều này thậm chí có ý nghĩa gì đối với người ra quyết định hoặc bất kỳ người tiêu dùng nào của âm mưu phân tán? Những quyết định nào người ta có thể đưa ra chỉ dựa trên điều này?

Tức là: việc sử dụng để thấy mối tương quan giữa hai biến bất kỳ và người ta có thể làm gì với thông tin đó một cách cô lập? Có phải chỉ để xem những gì nên và không xem xét để đưa vào phân tích hồi quy hoặc có sử dụng thực tế hơn không?

Chỉ tò mò, tôi đã luôn làm việc với kỹ thuật này, nhưng tôi đã được bảo rằng sự tương quan tự nó không được sử dụng nhiều - vậy "IS" sử dụng là gì?

Câu trả lời:


12

Một vài suy nghĩ:

  • Canard cũ về mối tương quan không phải là nhân quả chỉ là một nửa câu chuyện. Tương quan có thể không phải là quan hệ nhân quả, nhưng một số hình thức liên kết giữa hai biến là một bước cần thiết dọc theo con đường để hiển thị quan hệ nhân quả và mối tương quan có thể giúp cho thấy điều đó.
  • Nó giúp chỉ ra xu hướng. Hiển thị nó cho chủ doanh nghiệp và họ có thể nói "Vâng, điều đó hợp lý, bạn thấy Widget X và Widget Y cuối cùng đều được sử dụng bởi một nhóm người cụ thể, mặc dù họ không thực sự liên quan. Hoặc họ có thể nói "Đó là ... kỳ quặc", tại thời điểm đó bạn đã nhắc điều tra thêm.
  • Nhìn nó theo cách này. Tương quan là một công cụ. Một cái búa, tự nó, không phải là tất cả hữu ích. Nó chắc chắn sẽ không tự xây một ngôi nhà. Nhưng bạn đã bao giờ thử xây một ngôi nhà không có búa chưa?

5
Trong viên đạn đầu tiên của bạn, bạn nói rằng mối tương quan là điều kiện cần thiết cho quan hệ nhân quả - điều đó không đúng. Nếu có mối quan hệ không đơn điệu giữa hai biến thì chúng có thể không tương quan - điều này không loại trừ nguyên nhân.
Macro

@Macro - đúng và được chỉnh sửa
Fomite

@Macro Đúng, nhưng trong thực tế, bạn có thể áp dụng một hàm cho biến của mình để làm cho mối quan hệ được kiểm tra đơn điệu. nếu bạn không biết chức năng này, thì ... bạn không biết nhiều về những gì bạn đang tìm kiếm
RockScience

@EpiGrad: Giả sử biểu đồ tương quan XY của hai biến trông giống như một nụ cười hạnh phúc (hoặc bất kỳ hình dạng nào khác trên mỗi se). Hệ số tương quan thực sự sẽ khá nhỏ, nhưng chắc chắn sẽ có một số mối quan hệ tương tác, phải không? Làm thế nào / người ta nên làm gì trong trường hợp như vậy?
Tiến sĩ

@Nupul Một cuộc thăm dò XY phức tạp hơn một chút ngoài tuyến tính.
Fomite

7

Nhìn vào nó từ một quan điểm cờ bạc. Giả sử chúng ta biết rằng trung bình những người mặc đồ công sở đi làm sẽ có 1,5 vết thương trong công việc và những người mang giày đế sẽ có trung bình 0,05 vết thương. Hoặc, có thể khả năng chấn thương của một người mặc đồ công sở là 0,85 và khả năng gây thương tích cho người mang giày đế bằng là .1.

Nếu tôi chọn ngẫu nhiên một người trong dân số và nói với bạn rằng người đó đang mặc đồ công sở, và đề nghị bạn đặt cược ngay cả tiền vào việc họ có bị chấn thương tại nơi làm việc vào năm ngoái không, bạn có đặt cược không? Chà, bạn sẽ đặt cược nếu bạn có thể đặt cược về phía họ bị chấn thương .. 85% thời gian bạn sẽ thắng, và bạn thậm chí còn nhận được tiền.

Vấn đề là, biết rằng thông tin đó cung cấp cho chúng tôi thông tin về việc họ có khả năng gặp chấn thương tại nơi làm việc hay không. Thực tế, đôi giày này không có liên quan gì đến nó là loại công việc đi cùng với những người lao động .. Và có thể những thứ khác như người có thể liều lĩnh hơn.


6

Cụm từ "tương quan không ngụ ý nhân quả" bị quá lời. (Như Cohen đã viết, "đó là một gợi ý cực kỳ lớn".) Chúng tôi đánh bại cụm từ này thành sinh viên vì thiên kiến ​​nội tâm đối với tâm trí con người. Khi bạn nghe thấy 'tỷ lệ tội phạm tương quan với tỷ lệ nghèo', hoặc đại loại như thế, bạn không thể không nghĩ rằng điều này có nghĩa là nghèo đói gây ra tội ác. Mọi người đều cho rằng điều này là tự nhiên, bởi vì đó là cách mà tâm trí hoạt động. Chúng tôi sử dụng cụm từ nhiều lần với hy vọng chống lại điều đó. Tuy nhiên, một khi bạn đã tiếp thu ý tưởng, cụm từ sẽ mất phần lớn giá trị của nó và đã đến lúc chuyển sang một cách hiểu phức tạp hơn.

Khi có mối tương quan giữa hai biến, có hai khả năng: tất cả chỉ là trùng hợp ngẫu nhiên hoặc có một số mô hình nguyên nhân tại nơi làm việc. Gọi một mô hình trên thế giới là một sự trùng hợp ngẫu nhiên là một khung giải thích khủng khiếp và có lẽ nên là phương sách cuối cùng của bạn. Điều đó để lại nhân quả. Vấn đề là chúng ta không biết bản chất của mô hình nhân quả đó. Cũng có thể nghèo đói gây ra tội ác, nhưng cũng có thể là tội phạm gây ra nghèo đói (ví dụ, mọi người không muốn sống trong một khu vực tội phạm cao, vì vậy họ chuyển đi và giá trị tài sản giảm, v.v.). Cũng có thể có một số biến số hoặc nhóm biến số thứ ba gây ra cả tội phạm và nghèo đói, nhưng trên thực tế, không có trực tiếpmối liên hệ nhân quả giữa tội phạm và nghèo đói (được gọi là mô hình 'nguyên nhân chung'). Điều này đặc biệt nguy hiểm, bởi vì, trong một mô hình thống kê, tất cả các nguồn biến thể khác được thu gọn vào cụm từ lỗi của biến phụ thuộc. Kết quả là, biến độc lập có tương quan với (gây ra bởi) thuật ngữ lỗi, dẫn đến vấn đề nội sinh . Những vấn đề này rất khó khăn, và không nên xem nhẹ. Tuy nhiên, ngay cả trong kịch bản này, điều quan trọng là phải nhận ra rằng có nhân quả thực sự trong công việc.

Nói tóm lại, khi bạn nhìn thấy một mối tương quan, bạn nên nghĩ rằng có thể có một số loại nhân quả đang chơi ở đâu đó , nhưng bạn không biết bản chất của mô hình nhân quả đó.


4

Tôi nghĩ rằng tôi đã hiểu biết về những điều này, nhưng chỉ mới tháng trước tôi đã tra cứu "ngụ ý" trong từ điển và thấy nó có hai ý nghĩa khác nhau đáng kinh ngạc. 1. Gợi ý và 2. Cần thiết. (!) Hiếm khi tương quan đòi hỏi phải có nhân quả, nhưng chắc chắn nó có thể gợi ý nó. Như @EpiGrad chỉ ra, đó là điều kiện cần mặc dù không đủ để thiết lập quan hệ nhân quả.

Khi thời gian trôi qua, người ta hy vọng tìm thấy một nền tảng trung gian giữa việc xem mối tương quan là kết thúc và hoàn toàn vô dụng. Và người ta đưa vào tài khoản kiến ​​thức chủ đề- / tên miền / / nội dung cụ thể trong việc diễn giải các kết quả tương quan. Ít người sẽ thắc mắc rằng có ít nhất một số liên kết nhân quả khi nhìn thấy kết quả bán hàng quảng cáo mà bạn mô tả. Nhưng thật tốt khi luôn mở cho các khả năng khác, các biến khác ít nhất có thể giải thích một phần mối quan hệ được quan sát. Các bài đọc về các biến gây nhiễu, tính hợp lệ và các khoản tương tự được trả với cổ tức lớn. Ví dụ, Quasi-Experimentation cổ điển cũ của Cook và Campbell có một phần hay về tính hợp lệ và các mối đe dọa đối với tính hợp lệ.


1
Như tôi đã chỉ ra cho @EpiGrad, mối tương quan không phải là điều kiện cần thiết cho quan hệ nhân quả. Có một quan niệm phổ biến trong phân tích dữ liệu rằng mối quan hệ giữa các biến luôn đề cập đến mối quan hệ đơn điệu, được giả định ngầm bằng cách cho rằng mối tương quan là điều kiện cần thiết cho quan hệ nhân quả.
Macro

1
Đủ công bằng. Chúng ta hãy nói "hiệp hội thống kê" là cần thiết, sau đó.
rolando2

2

Một hệ số tương quan, như các biện pháp liên kết khác, rất hữu ích nếu bạn muốn biết giá trị của X là bao nhiêu thông tin về giá trị của Y. Điều này khác với việc bạn có đặt X thành một giá trị cụ thể hay không, điều gì sẽ xảy ra giá trị của Y bạn sẽ nhận được (đó là bản chất của một cách giải thích chính xác về quan hệ nhân quả).

Tuy nhiên, trong nhiều bối cảnh (ví dụ dự đoán) suy luận dựa trên mối tương quan sẽ có giá trị theo cách riêng của họ. Răng vàng có liên quan đến ung thư phổi (vì cả hai đều có khả năng gây ra bởi ung thư). Không có nguyên nhân giữa hai điều này: làm trắng răng sẽ không chữa được ung thư phổi. Nhưng nếu bạn cần xét nghiệm sàng lọc nhanh cho những người có khả năng bị ung thư phổi, kiểm tra răng vàng có thể là bước đầu tiên tốt.

Đó là một câu hỏi khác nhau liệu hệ số tương quan có phải là thước đo liên kết tốt nhất hiện có hay không, nhưng tôi nghĩ câu hỏi này liên quan nhiều hơn đến giá trị của việc biết mối liên hệ phi nhân quả là gì.

Btw, không chỉ là mối tương quan không đủ thể hiện quan hệ nhân quả, mà nó cũng không cần thiết. Hai biến có thể liên quan đến quan hệ nhân quả nhưng không có mối tương quan trong bất kỳ tập dữ liệu cụ thể nào (ví dụ do sai lệch lựa chọn hoặc các yếu tố gây nhiễu).


1

tương quan tự nó không được sử dụng nhiều - vậy "IS" sử dụng là gì?

Hãy để tôi không đồng ý với cụm từ này, mối tương quan cho biết mức độ liên kết giữa 2 biến. Sau đó, nó rất hữu ích khi cố gắng giải thích mối quan hệ giữa các biến như vậy. Mặt khác, tương quan (như Macro đã viết) không phải là điều kiện cần thiết cho quan hệ nhân quả, tuy nhiên, đủ để giải thích mức độ liên kết. Hơn nữa, bạn có thể kiểm tra tính độc lập của các biến, nhưng mối tương quan có thể cung cấp cho bạn một thông tin hữu ích khác, hệ số xác định.

Tuy nhiên, các nhà phân tích phải biết tên miền để có thể giải thích các loại quan hệ.


Tôi không chắc ý của bạn là gì:Furthermore, you can test the independence of the variables, but correlation can give you another useful information, the coefficient of determination
Tiến sĩ

Ý tôi là: "bạn có thể kiểm tra tính độc lập của các biến" nhưng dù sao, ngay cả khi không kiểm tra tính độc lập, thông tin về tương quan và coef. xác định là "hữu ích" để hiểu và giải thích loại mối quan hệ giữa các biến.
Jose Zubcoff

1

Tôi nghĩ rằng thu thập dữ liệu và thiết kế nghiên cứu cũng có thể đóng một vai trò trong việc trả lời câu hỏi này. Bạn sẽ không thiết kế một nghiên cứu và thu thập một tập hợp dữ liệu hoàn toàn không liên quan đến nhau, ngay cả trong các nghiên cứu quan sát. Do đó, "mối tương quan không ngụ ý nhân quả" có thể được biện minh. Mặc dù đó không phải là mối quan hệ nhân quả, nhưng có thể có một hiệp hội liên quan.

Tuy nhiên nếu bạn đang nói về hai tập dữ liệu hoàn toàn không liên quan, nhưng bạn vẫn muốn sử dụng mối tương quan để giải thích mối liên hệ và nguyên nhân, thì nó có thể không phù hợp. Ví dụ: nếu hai tập dữ liệu đều có xu hướng giảm, giả sử doanh số bán kem và số lượng kết hôn, hệ số tương quan có thể rất cao. Nhưng nó có cần thiết để có nghĩa là một hiệp hội?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.