Tôi nghi ngờ rằng hầu hết người dùng các công cụ thống kê là người dùng phụ trợ (những người ít được đào tạo chính thức về thống kê). Các nhà nghiên cứu và các chuyên gia khác rất muốn áp dụng các phương pháp thống kê vào dữ liệu của họ chỉ vì họ đã thấy nó được thực hiện trước khi đưa vào các bài báo đánh giá ngang hàng, tài liệu xám, web hoặc tại một hội nghị. Tuy nhiên, làm như vậy mà không có sự hiểu biết rõ ràng về các giả định bắt buộc và các hạn chế của công cụ thống kê có thể dẫn đến kết quả sai lầm Các lỗi của lỗi thường không được kiểm chứng!
Tôi thấy rằng sinh viên đại học (đặc biệt là trong khoa học xã hội và tự nhiên) hoặc không biết về những cạm bẫy thống kê hoặc tìm thấy những cạm bẫy không quan trọng này (trường hợp thường gặp nhất). Mặc dù các ví dụ về việc sử dụng các công cụ thống kê không đúng cách có thể được tìm thấy trong nhiều sách giáo khoa giới thiệu, web hoặc StackExchange, tôi gặp khó khăn trong việc tìm kiếm các ví dụ trong thế giới thực có kết quả bất lợi (ví dụ: chi phí bằng $, bị ảnh hưởng và mất sự nghiệp) . Cuối cùng, tôi đang tìm kiếm các ví dụ trong thế giới thực làm nổi bật việc sử dụng sai các phương pháp thống kê:
- các phương pháp thống kê được sử dụng thường được đề cập trong các khóa học thống kê giới thiệu (ví dụ: thống kê suy luận, hồi quy, v.v.
- kết quả cuối cùng đã có hậu quả tốn kém (mất đô la, cuộc sống bị ảnh hưởng, sự nghiệp tan vỡ, v.v.
- các dữ liệu có sẵn để sử dụng như ví dụ làm việc trong một khóa học (mục đích là để có sinh viên làm việc thông qua các ví dụ thế giới thực mà đã có hậu quả thế giới thực.)
Một ví dụ phi thống kê mà tôi muốn đưa ra cho các sinh viên khi thảo luận về tầm quan trọng của việc xác định đúng các đơn vị trong một dự án nghiên cứu là số liệu sai lầm của các nhà cung cấp đã dẫn đến việc mất một vệ tinh trị giá 125 triệu đô la! Điều này thường gọi một yếu tố: -o từ các sinh viên và dường như có một ấn tượng lâu dài (ít nhất là trong suốt cuộc đời học tập ngắn ngủi của họ).