Ví dụ cho việc giảng dạy: Tương quan không có nghĩa là nhân quả


74

Có một câu nói cũ: "Tương quan không có nghĩa là nhân quả". Khi tôi dạy, tôi có xu hướng sử dụng các ví dụ tiêu chuẩn sau để minh họa điểm này:

  1. số lượng cò và tỷ lệ sinh ở Đan Mạch;
  2. số linh mục ở Mỹ và nghiện rượu;
  3. vào đầu thế kỷ 20, người ta đã lưu ý rằng có một mối tương quan mạnh mẽ giữa 'Số lượng radio' và 'Số người trong Nhà thương điên'
  4. và yêu thích của tôi: cướp biển gây ra sự nóng lên toàn cầu .

Tuy nhiên, tôi không có bất kỳ tài liệu tham khảo nào cho các ví dụ này và trong khi gây cười, chúng rõ ràng là sai.

Có ai có bất kỳ ví dụ tốt khác?


2
Lướt qua Freakonomics cho một số ví dụ tuyệt vời. Thư mục của họ là đầy ắp các tài liệu tham khảo.
Stephen Turner


5
Biểu đồ cướp biển / sự nóng lên toàn cầu rõ ràng được các nhà lý thuyết âm mưu nấu chín rõ ràng - bất kỳ ai cũng có thể thấy họ đã cố tình vạch ra khoảng cách trong khoảng thời gian không đồng đều để tránh cho thấy sự gia tăng mạnh về nhiệt độ gần đây vì cướp biển gần như bị xóa sổ hoàn toàn. Chúng ta đều biết rằng khi nhiệt độ tăng lên, nó làm cho rượu rum bốc hơi và cướp biển không thể sống sót trong những điều kiện đó. ;-)
AdamV

4
WTF có đúng với trục x trên biểu đồ cướp biển đó không?
ness101

1
Hoặc gần như mọi thứ bạn đưa vào Google Correlate , hãy đến đó.
liên hợp chiến

Câu trả lời:


39

Có thể hữu ích để giải thích rằng "nguyên nhân" là mối quan hệ bất đối xứng (X nguyên nhân Y khác với Y gây ra X), trong khi "tương quan với" là mối quan hệ đối xứng.

Ví dụ, dân số vô gia cư và tỷ lệ tội phạm có thể tương quan với nhau, trong đó cả hai đều có xu hướng cao hoặc thấp ở cùng một địa điểm. Cũng có giá trị như nhau khi nói rằng dân số vô gia cư có tương quan với tỷ lệ tội phạm hoặc tỷ lệ tội phạm có tương quan với dân số vô gia cư. Nếu nói rằng tội phạm gây ra tình trạng vô gia cư, hoặc dân số vô gia cư gây ra tội phạm là những tuyên bố khác nhau. Và mối tương quan không ngụ ý rằng một trong hai là đúng. Chẳng hạn, nguyên nhân cơ bản có thể là biến số thứ 3 như lạm dụng thuốc hoặc thất nghiệp.

Toán học về thống kê không tốt trong việc xác định các nguyên nhân cơ bản, đòi hỏi một số hình thức phán đoán khác.


3
Phán quyết là một từ tốt, vì tất cả những gì chúng ta có thể quan sát là sự tương quan. Tất cả những gì thí nghiệm và / hoặc thống kê thông minh có thể làm là cho phép chúng tôi loại trừ một số giải thích thay thế cho những gì có thể gây ra hiệu ứng.
Jonas

Nhận xét rất tốt về các mối quan hệ đối xứng / không đối xứng. Người ta cũng có thể cho rằng sự nóng lên toàn cầu khiến nạn vi phạm bản quyền gia tăng.
Andre Holzner

27

Mục yêu thích của tôi:

1) Càng nhiều lính cứu hỏa được gửi đến một đám cháy, thiệt hại càng nhiều.

2) Trẻ em được dạy kèm có điểm kém hơn trẻ em không được dạy kèm

và (đây là đầu trang của tôi)

3) Trong những năm đầu tiểu học, dấu hiệu chiêm tinh có tương quan với IQ, nhưng mối tương quan này yếu dần theo tuổi tác và biến mất khi đến tuổi trưởng thành.


2
(@xmjx Đã cung cấp ví dụ đầu tiên vào năm ngoái.) Tôi thích ví dụ chiêm tinh.
whuber

Bạn có thể giải thích các mẫu với dấu hiệu chiêm tinh xin vui lòng?
Eugene D. Gubenkov 18/03/17

2
Không sao, tôi hiểu rồi. Điều đó có liên quan đến sự khác biệt tuổi tác giữa những người sinh ra vào đầu năm và những người sinh ra vào cuối năm. Đẹp.
Eugene D. Gubenkov 18/03/17

24

Tôi luôn thích cái này:

chanh vs cái chết

nguồn: http://pub.acs.org/doi/abs/10.1021/ci700332k


1
Đẹp, nhưng tôi không thể thấy bất cứ ai cố gắng đưa ra kết luận về quan hệ nhân quả ở đó. Hay những tài xế xe tải chanh của Mexico nổi tiếng là nguy hiểm một khi họ vượt qua biên giới?
AdamV

2
Rõ ràng là một tác dụng phụ chưa được giải quyết của việc truyền bá luật chanh ở Mỹ. Ví dụ: xem: en.wikipedia.org/wiki/Lemon_law
Thylacoleo

11
Một đồng nghiệp của tôi đã xem xét dữ liệu cho điều này trong giai đoạn sau năm 2000, và thấy rằng mối quan hệ được tổ chức khá tốt 'ngoài mẫu', điều này thậm chí còn đáng lo ngại hơn ...
shabbychef


Một sự hợp lý hóa đơn giản sẽ là cả hai đều giảm theo thời gian. Dữ liệu sau năm 2000 có hỗ trợ điều đó không? PS, Box Hunter và Hunter (xem bên dưới) giải thích ví dụ về con cò theo cùng một cách: cả hai đều tăng theo thời gian trong khoảng thời gian được đề cập.
Emil Friedman

23
  1. Đôi khi tương quan là đủ. Ví dụ, trong bảo hiểm xe hơi, các tài xế nam có tương quan với nhiều vụ tai nạn hơn, vì vậy các công ty bảo hiểm tính phí cho họ nhiều hơn. Không có cách nào bạn thực sự có thể kiểm tra điều này cho quan hệ nhân quả. Bạn không thể thay đổi giới tính của trình điều khiển bằng thực nghiệm. Google đã kiếm được hàng trăm tỷ đô la không quan tâm đến quan hệ nhân quả.

  2. Để tìm mối quan hệ nhân quả, bạn thường cần dữ liệu thử nghiệm, không phải dữ liệu quan sát. Mặc dù, trong kinh tế học, họ thường sử dụng các "cú sốc" quan sát được vào hệ thống để kiểm tra nguyên nhân, như nếu một CEO đột ngột qua đời và giá cổ phiếu tăng lên, bạn có thể giả định nguyên nhân.

  3. Tương quan là một điều kiện cần nhưng không đủ cho quan hệ nhân quả. Để hiển thị quan hệ nhân quả đòi hỏi một thực tế.


1
Tôi thích ví dụ đầu tiên bạn đưa ra. Điều đó chắc chắn sẽ khiến các sinh viên nói chuyện;)
csgillespie

1
Có một cuộc thảo luận thú vị của Steve Steinberg trên blog của anh ấy ở đây: blog.steinberg.org/?p=11 về một số ý nghĩa của 1 và nơi nó có thể dẫn đến vấn đề AI yếu.
A-mốt

Ai đó có thể mở rộng câu cuối cùng một chút không?
ness101

4
Chỉ cần làm rõ một cách nhanh chóng: Tương quan là không cần thiết cho quan hệ nhân quả (tùy thuộc vào ý nghĩa của tương quan): nếu mối tương quan là tương quan tuyến tính (mà khá nhiều người có một ít thống kê sẽ mặc định sử dụng khi thuật ngữ này được sử dụng) nhưng nguyên nhân là phi tuyến. Ví dụ: nếu trong trực tiếp gây ra (lấy các giá trị trong ), nhưng . Nếu các được phân phối đối xứng, và sẽ không tương quan mặc dù phụ thuộc hoàn toàn. ( - 1 , 1 ) Y ( 0 , 1 ) Y = X(1,1)Y(0,1) X'sXYY=1X2XsXY
Glen_b

18

Tôi có một vài ví dụ tôi muốn sử dụng.

  1. Khi điều tra nguyên nhân của tội phạm ở thành phố New York vào những năm 80, khi họ đang cố gắng làm sạch thành phố, một học giả đã tìm thấy mối tương quan mạnh mẽ giữa số lượng tội phạm nghiêm trọng và số lượng kem được bán bởi những người bán hàng rong! (Đó là nguyên nhân và đó là tác động?) Rõ ràng, có một biến không quan sát được gây ra cả hai. Mùa hè là khi tội phạm là lớn nhất và khi nhiều kem nhất được bán.

  2. Kích thước lòng bàn tay của bạn tương quan nghịch với thời gian bạn sẽ sống (thực sự!). Trên thực tế, phụ nữ có xu hướng có lòng bàn tay nhỏ hơn và sống lâu hơn.

  3. [Yêu thích của tôi] Tôi đã nghe nói về một nghiên cứu vài năm trước đây cho thấy lượng soda mà một người uống có liên quan tích cực đến khả năng béo phì.(Tôi tự nói với bản thân mình - điều đó có ý nghĩa vì nó phải là do mọi người uống soda có đường và nhận được tất cả lượng calo rỗng đó.) Một vài ngày sau đó có thêm thông tin chi tiết. Hầu như tất cả các mối tương quan là do sự gia tăng tiêu thụ nước ngọt chế độ ăn uống. (Điều đó đã thổi bay lý thuyết của tôi!) Vậy, cách nào là nhân quả? Có phải chế độ ăn uống nước ngọt làm cho một người tăng cân, hoặc tăng cân gây ra sự tiêu thụ tăng trong nước giải khát chế độ ăn uống? (Trước khi bạn kết luận đó là nghiên cứu sau, hãy xem nghiên cứu trong đó một thí nghiệm có kiểm soát với chuột cho thấy nhóm được cho ăn sữa chua với chất làm ngọt nhân tạo tăng cân hơn so với nhóm được cho ăn sữa chua bình thường.) Hai tài liệu tham khảo: Uống thêm Diet Soda , Tăng cân nhiều hơn? ; Soda ăn kiêng liên quan đến béo phì. Tôi nghĩ họ vẫn đang cố gắng sắp xếp cái này ra.


4
Cái cuối cùng phức tạp hơn một chút so với bạn trình bày, nhưng tôi đồng ý nhiều mối liên hệ quan sát được tìm thấy giữa soda / soda ăn kiêng và béo phì nên được nhìn bằng con mắt quan trọng. Về mặt lý thuyết, một số người đã cho rằng các chất thay thế đường / chất béo giả có tác dụng sinh lý khác ngoài lượng calo đơn giản. Xem ví dụ thí nghiệm này trên chuột và chất béo tổng hợp (lấy từ blog Freakonomics).
Andy W

18

Số lượng giải thưởng Nobel giành được của một quốc gia (điều chỉnh theo dân số) tương quan tốt với mức tiêu thụ sô cô la trên đầu người. ( Tạp chí Y học New England )

nhập mô tả hình ảnh ở đây


2
+1 Tôi đã rất thất vọng với NEJM khi họ xuất bản bài này
MattBagg

5
Có vẻ như cũng tương quan khá tốt với sự gần gũi với Thụy Điển ..
naught101

2
Tiêu thụ sô cô la (bình quân đầu người) cũng tương quan đáng kể với số người giết người hàng loạt trên đầu người. sao chép trên mạng
Harvey Motulsky

2
Tôi đã hỏi ba người đoạt giải Nobel mà tôi (mơ hồ) biết, và cả ba đều nói rằng họ đã ăn sô cô la nhiều hơn hầu hết các đồng nghiệp của họ. Tất nhiên, những câu trả lời này được đưa ra sau khi họ đọc bài báo NEJM!
Harvey Motulsky

4
@MattBagg Điều này đã được xuất bản dưới dạng "Ghi chú thỉnh thoảng" và rõ ràng là không được coi trọng.
Pascal

13

Mặc dù đây là một minh họa cho vấn đề so sánh nhiều, nhưng đây cũng là một ví dụ điển hình về nguyên nhân phân bổ sai:

Bóng bầu dục (tôn giáo xứ Wales) và ảnh hưởng của nó đối với nhà thờ Công giáo: Giáo hoàng Benedict XVI có nên lo lắng?

"mỗi khi xứ Wales giành được danh hiệu bóng bầu dục lớn, một Giáo hoàng qua đời, ngoại trừ năm 1978 khi xứ Wales thực sự tốt và hai Giáo hoàng đã chết."


9

Có hai khía cạnh của vấn đề này hoc ergo propter hoc mà tôi muốn đề cập đến: (i) nhân quả ngược và (ii) tính nội sinh

Một ví dụ về nhân quả ngược "có thể": Uống rượu và thu nhập xã hội - người uống rượu kiếm được nhiều tiền hơn theo Bethany L. Peters & Edward Stringham (2006. "Không Booze? Bạn có thể thua: Tại sao người uống rượu kiếm được nhiều tiền hơn người không uống", Tạp chí Lao động Nghiên cứu, Nhà xuất bản giao dịch, tập 27 (3), trang 411-421, tháng 6). Hay những người kiếm được nhiều tiền hơn uống nhiều hơn vì họ có thu nhập khả dụng cao hơn hoặc do căng thẳng? Đây là một bài viết tuyệt vời để thảo luận cho tất cả các loại lý do bao gồm lỗi đo lường, sai lệch phản hồi, quan hệ nhân quả, v.v.

Một ví dụ về tính nội sinh "có thể": Phương trình khai thác giải thích thu nhập nhật ký theo giáo dục, kinh nghiệm và bình phương. Có một tài liệu dài về chủ đề này. Các nhà kinh tế học lao động muốn ước tính mối quan hệ nhân quả của giáo dục về thu nhập nhưng có lẽ giáo dục là nội sinh vì "khả năng" có thể làm tăng lượng giáo dục của một cá nhân (bằng cách giảm chi phí để có được nó) và có thể dẫn đến tăng thu nhập, bất kể trình độ học vấn Một giải pháp tiềm năng cho điều này có thể là một biến công cụ. Cuốn sách của Angrist và Pischke, Chủ yếu là Kinh tế lượng vô hại bao gồm điều này và liên quan đến các chủ đề rất chi tiết và rõ ràng.

Các ví dụ ngớ ngẩn khác mà tôi không có hỗ trợ bao gồm: - Số lượng tivi trên đầu người và số lượng tỷ lệ tử vong. Vì vậy, hãy gửi TV đến các nước đang phát triển. Rõ ràng cả hai đều nội sinh với một cái gì đó như GDP. - Số lần tấn công cá mập và bán kem. Cả hai đều nội sinh với nhiệt độ có lẽ?

Tôi cũng thích kể chuyện cười khủng khiếp về người mất trí và con nhện. Một kẻ mất trí đang lang thang trên hành lang của một trại tị nạn với một con nhện mà anh ta đang mang trong lòng bàn tay. Anh ta đến gặp bác sĩ và nói: "Hãy nhìn bác sĩ, tôi có thể nói chuyện với những con nhện. Hãy xem cái này." Nhện, đi bên trái! "Con nhện di chuyển sang bên trái. Anh ta tiếp tục," Nhện, đi bên phải. " bên phải lòng bàn tay của mình. Bác sĩ trả lời, "Thật thú vị, có lẽ chúng ta nên nói về điều này trong phiên nhóm tiếp theo." Những người vặn vẹo mất trí, "Đó không phải là gì cả. Xem cái này đi. "Anh ta lần lượt rút từng chân của con nhện ra và sau đó hét lên," Con nhện, đi bên trái! "Con nhện nằm bất động trên lòng bàn tay và người mất trí quay sang bác sĩ và kết luận:" Nếu bạn kéo con nhện ra chân anh ấy sẽ bị điếc. "


8

Điều tốt nhất tôi được dạy là số vụ chết đuối và doanh số bán kem có thể có mối tương quan cao nhưng điều đó không ngụ ý cái này gây ra cái khác. Đuối nước và doanh số bán kem rõ ràng là cao hơn trong những tháng mùa hè khi thời tiết tốt. Biến thứ ba aka thời tiết tốt gây ra chúng.


6

Là một khái quát của 'cướp biển gây ra sự nóng lên toàn cầu': Chọn bất kỳ hai đại lượng nào (đơn điệu) tăng hoặc giảm theo thời gian và bạn sẽ thấy một số mối tương quan.


6

Bạn có thể dành vài phút cho Google Correlate và đưa ra tất cả các loại tương quan giả.


1
Mặc dù liên kết này có thể trả lời câu hỏi, tốt hơn là bao gồm các phần thiết yếu của câu trả lời ở đây và cung cấp liên kết để tham khảo. Câu trả lời chỉ liên kết có thể trở nên không hợp lệ nếu trang được liên kết thay đổi.
gung - Phục hồi Monica

1
@gung bạn có nghiêm túc không? Liên kết là một ứng dụng, không phải là một trang đơn giản mô tả một câu trả lời. Câu trả lời sẽ trở nên không hợp lệ nếu trang được liên kết thay đổi, vì công cụ sẽ không khả dụng (ở dạng hiện tại).
Jerome Baum

6

Tôi làm việc với các sinh viên trong việc dạy tương quan và nhân quả trong các lớp Đại số của tôi. Chúng tôi kiểm tra rất nhiều ví dụ có thể. Tôi thấy bài viết Gói trẻ sơ sinh và Kem nguy hiểm: Puzzlers tương quan từ Giáo viên toán học tháng 2 năm 2013 là hữu ích. Tôi thích ý tưởng nói về "các biến ẩn". Ngoài ra phim hoạt hình này là một cuộc trò chuyện bắt đầu dễ thương:

nhập mô tả hình ảnh ở đây

Chúng tôi xác định biến độc lập và phụ thuộc trong phim hoạt hình và nói về việc đây có phải là một ví dụ về nguyên nhân hay không, nếu không thì tại sao không.


4

Tôi đã đọc (một thời gian dài trước đây) về một ví dụ thú vị về việc giảm tỷ lệ sinh (hoặc tỷ lệ sinh nếu bạn thích biện pháp đó), đặc biệt là ở Mỹ, bắt đầu từ đầu những năm 1960, vì thử nghiệm vũ khí hạt nhân ở mức cao nhất mọi thời đại (năm 1961, quả bom hạt nhân lớn nhất từng phát nổ đã được thử nghiệm ở Liên Xô). Tỷ giá tiếp tục phân định cho đến cuối thế kỷ XX khi hầu hết các nước cuối cùng đã ngừng làm việc này.

Bây giờ tôi không thể tìm thấy tài liệu tham khảo kết hợp những số liệu này, nhưng bài viết trên Wikipedia này có số liệu về số lượng thử nghiệm vũ khí hạt nhân theo quốc gia.

Tất nhiên, có thể có ý nghĩa tốt hơn khi xem xét mối tương quan của tỷ lệ sinh với việc giới thiệu và hợp pháp hóa thuốc tránh thai "tình cờ" bắt đầu từ đầu những năm 1960. (Chỉ ở một số tiểu bang trước, sau đó tất cả các tiểu bang chỉ dành cho phụ nữ đã kết hôn, sau đó một số cho những người chưa kết hôn, sau đó qua hội đồng quản trị), nhưng thậm chí đó chỉ có thể là một phần của nguyên nhân; rất nhiều khía cạnh khác của bình đẳng, thay đổi kinh tế và các yếu tố khác đóng một phần quan trọng.


Ví dụ thú vị, vì thoạt nhìn, giống như một mối quan hệ nhân quả có thể xảy ra, không giống như nhiều ví dụ điển hình nhất.
Bossykena

1
Điều tôi thích là bạn có thể kích động nhiều cuộc thảo luận về việc liệu "hiệu ứng" có thực sự ảnh hưởng đến khả năng sinh sản (theo nghĩa y học về khả năng thụ thai) hay là do xã hội ("Tôi không muốn đưa một đứa trẻ vào tình trạng tồi tệ này thế giới "). Sau đó thả vỏ bom về Pill nếu không có ai khác đưa nó lên. Và sau đó chỉ ra rằng thậm chí đây chỉ có thể là một yếu tố có thể và thảo luận về một số yếu tố khác.
AdamV

4

Một mối tương quan tự nó không bao giờ có thể thiết lập một liên kết nhân quả. David Hume (1771-1776) đã lập luận khá hiệu quả rằng chúng ta không thể có được kiến thức nhất định về tính chính đáng bằng các phương tiện thực nghiệm thuần túy. Kant đã cố gắng giải quyết vấn đề này, trang Wikipedia cho Kant dường như tổng hợp nó khá độc đáo:

Kant tin rằng mình đang tạo ra một sự thỏa hiệp giữa những người theo chủ nghĩa kinh nghiệm và những người theo chủ nghĩa duy lý. Những người theo chủ nghĩa kinh nghiệm tin rằng kiến ​​thức có được thông qua kinh nghiệm một mình, nhưng những người theo chủ nghĩa duy lý cho rằng kiến ​​thức đó mở ra cho sự nghi ngờ của Cartesian và chính lý do đó cung cấp cho chúng ta kiến ​​thức. Tuy nhiên, Kant lập luận rằng việc sử dụng lý trí mà không áp dụng nó vào kinh nghiệm sẽ chỉ dẫn đến ảo tưởng, trong khi kinh nghiệm sẽ hoàn toàn chủ quan mà không bị thu hẹp dưới lý do thuần túy.

Nói cách khác, Hume nói với chúng ta rằng chúng ta không bao giờ có thể biết mối quan hệ nhân quả tồn tại chỉ bằng cách quan sát mối tương quan, nhưng Kant gợi ý rằng chúng ta có thể sử dụng lý do của mình để phân biệt giữa các mối tương quan có liên quan đến mối quan hệ nhân quả với những người không. Tôi không nghĩ Hume sẽ không đồng ý, miễn là Kant viết về mặt chính đáng hơn là kiến ​​thức nhất định.

Nói tóm lại, một mối tương quan cung cấp bằng chứng gián tiếp ngụ ý mối liên hệ nhân quả, nhưng trọng lượng của bằng chứng phụ thuộc rất lớn vào các trường hợp cụ thể liên quan và chúng ta không bao giờ có thể chắc chắn tuyệt đối. Khả năng dự đoán tác động của các can thiệp là một cách để có được sự tự tin (chúng tôi không thể chứng minh bất cứ điều gì, nhưng chúng tôi có thể bác bỏ bằng chứng quan sát, do đó ít nhất chúng tôi đã cố gắng làm sai lệch lý thuyết về mối liên hệ nhân quả). Có một mô hình đơn giản giải thích lý do tại sao chúng ta nên quan sát một mối tương quan cũng giải thích các dạng bằng chứng khác là một cách khác mà chúng ta có thể áp dụng lý luận của mình như Kant gợi ý.

Caveat emptor: Hoàn toàn có thể tôi đã hiểu sai triết lý, tuy nhiên vẫn còn trường hợp một mối tương quan không bao giờ có thể cung cấp bằng chứng về mối liên hệ nhân quả.


2
Đối với những gì nó có giá trị, theo thuật ngữ hiện tại tôi nghĩ người ta nên đọc Kant như khẳng định, ví dụ như trong Tương tự thứ hai, rằng bất kỳ mối tương quan nào bạn quan sát được, có một số biểu đồ nhân quả tạo ra chúng. Theo như tôi biết thì anh ta không có phương pháp đặc biệt nào để xác định cấu trúc nhưng đã cho rằng nó phải được kết nối đầy đủ (vì 'mọi sự kiện đều có nguyên nhân'). Theo nghĩa này, ông là người đương thời: suy luận nguyên nhân đòi hỏi một hỗn hợp các giả định nguyên nhân, ví dụ được thể hiện thông qua biểu đồ và quan sát các quy tắc trong dữ liệu. Và bạn thường không thể tránh phần đầu tiên cũng như không tạo ra nó từ dữ liệu
liên hợp

+1 giải thích tốt! Có thể tôi quá Bayes, nhưng tôi không quá bận tâm với ý tưởng rằng chúng ta có thể không có kiến thức nhất định về bất kỳ mối quan hệ nhân quả nào.
Dikran Marsupial



3

Số lượng tinh trùng ở những con đực ở các làng tiếng Hindi và số lượng gấu (cũng ở Slovenia) cho thấy mối tương quan tiêu cực. Một số người thấy điều này rất đáng lo ngại. Tôi sẽ thử và có được nghiên cứu đã làm điều này.


3

Gần đây tôi đã tham dự một hội nghị và một trong những diễn giả đã đưa ra ví dụ rất thú vị này (mặc dù vấn đề là để minh họa một điều khác):

  • Người Mỹ và tiếng Anh ăn nhiều thức ăn béo. Có một tỷ lệ cao các bệnh tim mạch ở Hoa Kỳ và Vương quốc Anh.

  • Người Pháp ăn nhiều thực phẩm chất béo, nhưng họ có tỷ lệ thấp (er) các bệnh tim mạch.

  • Người Mỹ và người Anh uống rất nhiều rượu. Có một tỷ lệ cao các bệnh tim mạch ở Hoa Kỳ và Vương quốc Anh.

  • Người Ý uống rất nhiều rượu nhưng, một lần nữa, họ có tỷ lệ mắc bệnh tim mạch thấp.

Kết luận? Ăn và uống những gì bạn muốn. Và bạn có nguy cơ bị đau tim cao hơn nếu bạn nói tiếng Anh!


3
Đó cũng là một ví dụ điển hình về sai lầm sinh thái (nghĩa là suy luận về cấp độ cá nhân từ dữ liệu cấp độ nhóm).
Jeromy Anglim


3

Một ví dụ khác về mối tương quan tôi đã sử dụng là sự gia tăng lớn số người ăn thực phẩm hữu cơ và sự gia tăng số trẻ em được chẩn đoán mắc chứng tự kỷ ở Mỹ Có một biểu đồ nhại trên web - đồ thị thực phẩm hữu cơ tự kỷ


3

http://tylervigen.com/

Điều này cho thấy rất nhiều mối tương quan rõ ràng không liên quan gì đến quan hệ nhân quả - Hoặc bạn có biết ý kiến ​​nào về mối tương quan giữa Age of Miss America tương quan với Kẻ giết người bằng hơi nước, hơi nóng và vật nóng không

??


2

Dạy "Tương quan không có nghĩa là nhân quả" không thực sự giúp được ai vì vào cuối ngày, tất cả các lập luận suy diễn đều dựa một phần vào mối tương quan.

Con người rất tệ trong việc học không làm gì đó.

Mục tiêu nên là mang tính xây dựng: Luôn luôn nghĩ về các lựa chọn thay thế cho các giả định bắt đầu của bạn có thể tạo ra cùng một dữ liệu.


1
Điều này không trả lời cho câu hỏi: có lẽ nó nên được hiểu là một nhận xét.
whuber

2

Giáo sư của tôi đã sử dụng chúng trong lớp xác suất giới thiệu:

1) Cỡ giày tương quan với khả năng đọc

2) Cuộc tấn công của cá mập có tương quan với việc bán kem.


2

Càng nhiều xe cứu hỏa được gửi đến một đám cháy, thiệt hại càng lớn.


1
Vấn đề duy nhất với điều này là một ví dụ là có quan hệ nhân quả ngược rõ ràng.
ness101

1

Tôi nghĩ rằng một mô hình tốt hơn có thể là quan hệ nhân quả đòi hỏi sự tương quan liên quan đến một cơ chế đáng tin cậy và tốt nhất đã được chứng minh. Tôi nghĩ từ này nên được sử dụng rất ít trong bối cảnh này, vì nó có một số ý nghĩa bao gồm cả gợi ý.


1

Ví dụ về con cò nằm ở trang 8 của ấn bản đầu tiên (1978) của Box, cuốn sách của Hunter & Hunter có tên "Thống kê cho những người thử nghiệm ..." (Wiley). Tôi không biết liệu nó có trong phiên bản 2 hay không. Họ xác định thành phố là Oldenburg và khoảng thời gian là 1930-1936.

Họ tham khảo Ornithologische Monatsberichte , 44 , No 2, Jahrgang, 1936, Berlin, và 48 , No 1, Jahrgang, 1940, Berlin, và Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer.


0

Tôi thấy một điều buồn cười trong một bài viết.

Sản xuất bơ ở Bangladesh có một trong những mối tương quan cao nhất với S & P 500 trong khoảng thời gian mười năm.

http://www.forbes.com/sites/davidleinweber/2012/07/24/stool-data-miner-tricks-quants-fooling-themselves-the-ecusiness-indicator-in-your-pants/


2
Huh? Biểu đồ cho thấy S & P theo thời gian. Tiêu đề nói về sản xuất bơ và pho mát, không thể nhìn thấy trên biểu đồ. ???
Harvey Motulsky


3
OK, bây giờ tôi hiểu rồi. Biểu đồ cho thấy dự đoán của mô hình hồi quy bội, cho thấy bao gồm ba biến ngớ ngẩn thực hiện công việc khá tốt là làm cho mô hình dự đoán thay đổi trong SP500 theo thời gian. Đây là một ví dụ điển hình về việc cung cấp quá nhiều trong hồi quy bội và gián tiếp cho thấy rằng mối tương quan (hoặc mức độ phù hợp được cải thiện của mô hình ưa thích) không bao hàm nguyên nhân.
Harvey Motulsky

0

Đây là một trong những hoàn hảo. Thật không may, nó có thể được sử dụng như một điểm giảng dạy tuyệt vời bởi vì cả nhân viên của Washington Post và Trung tâm kiểm soát và phòng ngừa dịch bệnh đều không thể hiện bất kỳ kiến ​​thức nào rằng bài báo nên là một tác phẩm châm biếm trong Hành tây.

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=9


3
Hãy tóm tắt những gì được nói đằng sau liên kết, không chỉ bạn đánh giá nó là sai.
cbeleites

Lấy làm tiếc. Nhưng tôi nghĩ rằng điều này là tự giải thích.
Đánh dấu C.

2
Liên kết là tốt khi tham chiếu đến nguồn, nhưng bạn không nên cho rằng mọi người thực sự có thể đọc nó (hoặc không có nhiều rắc rối). Xin lưu ý: Các liên kết như vậy rất có thể bị thối liên kết và không phải tất cả các tờ báo phục vụ tất cả các khu vực địa lý (ví dụ: có những tờ báo của Hoa Kỳ quyết định rằng việc tuân thủ GDPR của EU không đáng bận tâm và do đó ai sẽ chặn độc giả với IP EU địa chỉ nhà).
cbeleites

-2

Có người nói, tương quan có thể không có nghĩa là nhân quả nhưng nó chắc chắn có thể là một gợi ý tốt :)

Ok bỏ qua phần vui vẻ, chính xác là nhân quả là gì? Chúng ta có thực sự chắc chắn rằng cướp biển không gây ra sự nóng lên toàn cầu?

Phản trực giác, nhưng những gì được coi là nguyên nhân và những gì là hiệu quả (trong một nghiên cứu tương quan không rõ ràng). Tất nhiên nhiều lần cả hai chỉ có thể là tác động của nguyên nhân chung (và do đó tương quan)

Tất cả sôi sục đến phương pháp xác định quan hệ nhân quả.

Đây là nguyên nhân (ý định chơi chữ) của câu nói:

Có những lời nói dối nhỏ nhặt. Có những lời nói dối lớn Và có số liệu thống kê.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.