Những thành kiến ​​phổ biến nhất mà con người tạo ra khi thu thập hoặc giải thích dữ liệu là gì?


39

Tôi là một econ / stat chính. Tôi biết rằng các nhà kinh tế đã cố gắng sửa đổi các giả định của họ về hành vi và tính hợp lý của con người bằng cách xác định các tình huống trong đó mọi người không cư xử hợp lý. Ví dụ: giả sử tôi cung cấp cho bạn 100% cơ hội thua lỗ 1000 đô la hoặc 50% cơ hội thua lỗ 2500 đô la , mọi người chọn tùy chọn 2500 đô la mặc dù giá trị kỳ vọng sau này là tổn thất lớn hơn 1000 đô la được đảm bảo mất mát. Điều này được gọi là "mất ác cảm". Các nhà kinh tế học hành vi hiện đang nghiên cứu các mô hình này và cố gắng xác định cách con người đi chệch khỏi những tiên đề thường được coi là cấu thành hành vi "hợp lý". Ở đây, tôi cho rằng nó là hợp lý để thích mất mát ít mong đợi nhất.

Tôi đã tự hỏi nếu các nhà thống kê đã xác định các mô hình phổ biến trong việc thu thập dữ liệu mang lại kết quả sai lệch trong cách mọi người giải thích dữ liệu. Nếu về cơ bản có một cách "hợp lý" để thu thập dữ liệu, tôi cho rằng có những ví dụ mà con người đi chệch khỏi điều này và thể hiện sự "thiên vị". Nếu vậy, những thành kiến ​​phổ biến nhất mà con người tạo ra khi thu thập hoặc giải thích dữ liệu là gì?


5
Có một bài báo tuyệt vời của Podsakoff et al. đánh giá các xu hướng phương pháp phổ biến và đề xuất cả biện pháp thống kê và biện pháp thủ tục: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf Hãy xem Bảng 2.
ayhan


10
Bạn có một giả định phi lý của sự bất hợp lý. Bạn đang không áp dụng một chức năng tiện ích cho kết quả. Trong ví dụ đã nêu của bạn, giả sử rằng người đó có 1000 đô la và phải sử dụng nó để trả nợ cho một tay xã hội đen một phút kể từ bây giờ, hoặc sẽ bị giết bởi gangster. 100% khả năng mất 1000 đô la dẫn đến 100% cơ hội bị giết, trong khi đó 50% khả năng mất 2500 đô la chỉ dẫn đến 50% cơ hội bị giết. Là một chuyên gia kinh tế, bạn nên được quan tâm đến tiện ích như một điểm khởi đầu trước khi tuyên bố sự bất hợp lý.
Mark L. Stone

3
Các nhà thống kê thường không làm loại nghiên cứu đó. Tôi tự hỏi liệu Q này có phù hợp hơn với trang SE Tâm lý học & Thần kinh học không .
gung - Phục hồi Monica

3
Tôi nghĩ hiệu ứng đèn đường - tìm kiếm các phím (dữ liệu) bị mất dưới cột đèn bởi vì đó là nơi có ánh sáng vào ban đêm - là cực kỳ phổ biến, đặc biệt là bây giờ, với rất nhiều dữ liệu dễ dàng trên máy. // Không có "cách hợp lý" để thu thập dữ liệu vì bạn - nhà nghiên cứu thu thập dữ liệu - không được chọn ngẫu nhiên.
NHƯ

Câu trả lời:


23

Tôi nghĩ trong giới hàn lâm, giá trị p rất thường bị hiểu sai. Mọi người có xu hướng quên rằng giá trị p biểu thị một xác suất có điều kiện. Ngay cả khi một thử nghiệm đã được tiến hành hoàn hảo và tất cả các yêu cầu của thử nghiệm thống kê đã chọn đều được đáp ứng, tỷ lệ phát hiện sai thường cao hơn nhiều so với mức ý nghĩa alpha. Tỷ lệ phát hiện sai tăng lên cùng với việc giảm sức mạnh thống kê và mức độ phổ biến của dương tính thật (Colquhoun, 2014; Nuzzo, 2014).

Ngoài ra, mọi người có xu hướng coi ước tính của họ là sự thật và thông số họ ước tính là ngẫu nhiên (Haller & Kraus, 2002). Ví dụ, khi họ nói rằng trong 95% các trường hợp, khoảng tin cậy được xác định này bao gồm tham số ...

Nhầm lẫn về mối tương quan và nguyên nhân có lẽ cũng là một lỗi rất phổ biến trong việc giải thích dữ liệu.

Về mặt thu thập dữ liệu, tôi nghĩ một lỗi phổ biến là lấy mẫu dễ truy cập nhất thay vì mẫu đại diện nhất.

Colquhoun, D. (2014). Một cuộc điều tra về tỷ lệ phát hiện sai và giải thích sai các giá trị P. Khoa học mở của Hội Hoàng gia, 1 1515.

Nuzzo, R. (2014). Lỗi thống kê: Giá trị P, tiêu chuẩn vàng của Vàng có hiệu lực thống kê không đáng tin cậy như nhiều nhà khoa học giả định. Thiên nhiên, 506, 150 Thẻ 152.

Haller, H. & Kraus, S. (2002): Giải thích sai về ý nghĩa: Một vấn đề sinh viên chia sẻ với giáo viên của họ? Phương pháp nghiên cứu tâm lý trực tuyến, tập 7, số 1


19

Tôi muốn nói rằng không có khả năng chung để đánh giá sự ngẫu nhiên thực sự trông như thế nào. Mọi người dường như mong đợi quá ít mô hình giả so với thực tế xảy ra trong chuỗi các sự kiện ngẫu nhiên. Điều này cũng xuất hiện khi chúng ta cố gắng tự mô phỏng sự ngẫu nhiên.

Một điều khá phổ biến khác là không hiểu sự độc lập, như trong ngụy biện của con bạc. Đôi khi chúng tôi nghĩ rằng các sự kiện trước đó có thể ảnh hưởng đến những sự kiện trong tương lai ngay cả khi điều đó rõ ràng là không thể, như thỏa thuận trước đó về một cỗ bài xáo trộn ảnh hưởng đến một tương lai.


7

Người ta đã chỉ ra rằng nhiều hành vi và quá trình suy nghĩ được gắn nhãn "phi lý" hoặc "thiên vị" bởi các nhà kinh tế (hành vi) thực sự rất thích ứng và hiệu quả trong thế giới thực. Tuy nhiên, câu hỏi của OP rất thú vị. Tuy nhiên, tôi nghĩ rằng có thể có lợi khi tham khảo các kiến ​​thức cơ bản, mô tả hơn về các quá trình nhận thức của chúng ta, thay vì tìm kiếm các "thành kiến" cụ thể tương ứng với các thảo luận trong tài liệu kinh tế (ví dụ, ác cảm mất mát, hiệu ứng sở hữu, bỏ bê cơ sở, vv).

Ví dụ, evaluability chắc chắn là một vấn đề trong phân tích dữ liệu. Lý thuyết đánh giá nói rằng chúng ta thừa cân thông tin mà chúng ta thấy dễ giải thích hoặc đánh giá. Hãy xem xét trường hợp của một hệ số hồi quy. Đánh giá các hậu quả "thế giới thực" của một hệ số có thể là công việc khó khăn. Chúng ta cần xem xét các đơn vị của biến độc lập và biến phụ thuộc cũng là phân phối của biến độc lập và biến phụ thuộc để hiểu liệu một hệ số có phù hợp thực tế hay không. Đánh giá tầm quan trọng của một hệ số, mặt khác, thật dễ dàng: Tôi chỉ so sánh giá trị p của nó với mức độ alpha của tôi. Với khả năng đánh giá giá trị p lớn hơn so với chính hệ số, thật đáng ngạc nhiên khi có rất nhiều giá trị được tạo ra từ giá trị p.

(Chuẩn hóa làm tăng khả năng đánh giá của một hệ số, nhưng nó có thể làm tăng sự mơ hồ : ý nghĩa rằng thông tin liên quan không có sẵn hoặc bị giữ lại, bởi vì dạng "dữ liệu gốc" của dữ liệu chúng tôi đang xử lý không có sẵn cho chúng tôi.)

Một "thiên vị" nhận thức liên quan là nguyên tắc cụ thể hóa, xu hướng thừa cân thông tin là "ngay tại đó" trong bối cảnh quyết định và không yêu cầu truy xuất từ ​​bộ nhớ. (Nguyên tắc cụ thể cũng nêu rõ rằng chúng ta có khả năng sử dụng thông tin theo định dạng được cung cấp và có xu hướng tránh thực hiện các phép biến đổi.) Việc diễn giải một giá trị p có thể được thực hiện bằng cách chỉ nhìn vào đầu ra hồi quy; nó không yêu cầu tôi lấy bất kỳ kiến ​​thức thực tế nào về thứ mà tôi đang làm người mẫu.

Tôi hy vọng rằng nhiều sự thiên vị trong việc giải thích dữ liệu thống kê có thể bắt nguồn từ sự hiểu biết chung rằng chúng ta có khả năng đi theo con đường dễ dàng khi giải quyết vấn đề hoặc hình thành một phán đoán (xem "sự khốn khổ về nhận thức", "tính duy lý bị ràng buộc", v.v.) . Liên quan, làm một cái gì đó "dễ dàng" thường làm tăng sự tự tin mà chúng tôi giữ niềm tin kết quả ( lý thuyết trôi chảy ). (Người ta cũng có thể xem xét khả năng dữ liệu dễ phát hiện hơn- cho chính chúng ta hoặc cho người khác - bị quá tải trong các phân tích của chúng tôi.) Tôi nghĩ rằng điều này trở nên đặc biệt thú vị khi chúng ta xem xét các ngoại lệ có thể. Một số nghiên cứu tâm lý cho thấy, ví dụ, nếu chúng ta tin rằng một vấn đề khó giải quyết, thì chúng ta có thể ủng hộ các phương pháp và giải pháp ít cụ thể và khó khăn hơn, ví dụ, chọn phương pháp phức tạp hơn phương pháp đơn giản hơn.


7

Yếu tố đơn lẻ lớn nhất tôi có thể nghĩ đến được biết đến rộng rãi là "xu hướng xác nhận". Đã giải quyết được những gì tôi nghĩ rằng nghiên cứu của tôi sẽ hiển thị, tôi chấp nhận một cách thô bạo dữ liệu dẫn đến kết luận đó, đồng thời đưa ra lý do cho tất cả các điểm dữ liệu xuất hiện để bác bỏ nó. Tôi vô tình có thể từ chối là "lỗi công cụ rõ ràng" (hoặc một số tương đương) bất kỳ điểm dữ liệu nào không phù hợp với kết luận của tôi. Trong một số trường hợp, nó sẽ không hoàn toàn trắng trợn; thay vì loại bỏ hoàn toàn các điểm dữ liệu đó, tôi sẽ đưa ra một số công thức để loại bỏ "lỗi", điều này sẽ giúp điều khiển kết quả một cách thuận tiện để xác nhận kết luận đã định trước của tôi.

Không có gì đặc biệt bất chính về điều này; đó chỉ là cách bộ não của chúng ta hoạt động. Phải mất rất nhiều nỗ lực để lọc ra sự thiên vị như vậy, và đó là một trong những lý do tại sao các nhà khoa học thích pha chế các nghiên cứu mù đôi, để người thực hiện các phép đo không biết thí nghiệm dự kiến ​​sẽ chứng minh điều gì. Sau đó, nó đòi hỏi kỷ luật rất lớn để không điều chỉnh đi những gì anh ta đã đo lường một cách trung thực.


1
Tôi nghĩ rằng đây thực sự là sai lệch nguy hiểm nhất vì nó có thể xảy ra trong giai đoạn thu thập dữ liệu, ví dụ: thu thập dữ liệu trong một mẫu nhỏ có khả năng xác nhận kỳ vọng của bạn hoặc sử dụng các câu hỏi khảo sát hàng đầu.
stijn

1
Xu hướng xác nhận có thể rất tệ giữa các ngành, trong đó ngay cả cơ sở được cho là cơ bản của các ngành là khác nhau, khẳng định hàng đầu rằng "X là không thể (sử dụng) kỷ luật của bạn (với phương pháp cảm nhận của nó), nhưng rõ ràng là ở tôi (chúng ta có thể nghĩa X) ". vd: Táo có nghĩa là treo trên cây, hoặc nằm trên mặt đất; họ không thể 'gục ngã' theo ý mình. Thông thường, trong các ngành khoa học vật lý, có một sự thay đổi về cơ sở toán học che giấu sự nhầm lẫn.
Philip Oakley

6

Tuyến tính .

Tôi nghĩ rằng một sai lệch phổ biến trong quá trình giải thích / phân tích dữ liệu là mọi người thường nhanh chóng đảm nhận các mối quan hệ tuyến tính. Về mặt toán học, một mô hình hồi quy giả định rằng thành phần xác định của nó là một hàm tuyến tính của các yếu tố dự đoán; tiếc là điều đó không phải lúc nào cũng đúng. Gần đây tôi đã đi đến một hội nghị poster đại học và số lượng các xu hướng bậc hai hoặc phi tuyến tính thẳng thắn mà tôi thấy được trang bị một mô hình tuyến tính là đáng lo ngại để nói rằng ít nhất.

(Điều này ngoài các đề cập về ngụy biện của người đánh bạc, giải thích sai giá trị và tính ngẫu nhiên thực sự; +1 cho tất cả các bài đăng có liên quan.)p


2

Một trường hợp xen kẽ là các cuộc thảo luận của Gamblers Fallacy.

Dữ liệu hiện có nên được bao gồm hoặc loại trừ? Nếu tôi đã đi trước với sáu sáu, những thứ này có được bao gồm trong hàng tá lần thử của tôi không? Hãy rõ ràng về dữ liệu trước.

Khi nào tôi nên thay đổi từ số tuyệt đối sang tỷ lệ? Phải mất một thời gian dài để lợi thế có được trong một chuỗi chiến thắng nội bộ để trở về số không (một bước đi ngẫu nhiên).

0,1% của một triệu đô la có thể không nhiều đối với một công ty lớn, nhưng để mất 1000 đô la có thể là sự sống và cái chết đối với một nhà giao dịch duy nhất (đó là lý do tại sao các nhà đầu tư muốn "thúc đẩy" mọi người đầu tư vào). Có thể chuyển sang tỷ lệ phần trăm có thể là một thiên vị.

Ngay cả các nhà thống kê cũng có thành kiến.


2

Tôi muốn giới thiệu "Suy nghĩ, nhanh và chậm" của Daniel Kahneman , người giải thích nhiều khuynh hướng nhận thức trong ngôn ngữ sáng suốt.

Bạn cũng có thể tham khảo " http://www.burns-stat.com/review-thinking-fast-slow-daniel-kahneman/ " trong đó tóm tắt một số sai lệch trong cuốn sách trên.

Để biết thêm chi tiết về chương tóm tắt, bạn có thể muốn đọc " https://erikreads.files.wordpress.com/2014/04/thinking-fast-and-slow-book-summary.pdf ".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.