Tóm lại , tôi càng tìm hiểu về thống kê, tôi càng ít tin tưởng các bài báo được xuất bản trong lĩnh vực của mình; Tôi chỉ đơn giản tin rằng các nhà nghiên cứu không làm đủ số liệu thống kê của họ.
Tôi là một giáo dân, có thể nói như vậy. Tôi được đào tạo về sinh học nhưng tôi không được giáo dục chính thức về thống kê hay toán học. Tôi thích R và thường nỗ lực để đọc (và hiểu ...) một số nền tảng lý thuyết của các phương pháp mà tôi áp dụng khi thực hiện nghiên cứu. Tôi sẽ không ngạc nhiên nếu phần lớn những người thực hiện phân tích ngày nay không thực sự được đào tạo. Tôi đã xuất bản khoảng 20 bài báo gốc, một số trong đó đã được các tạp chí và nhà thống kê công nhận thường xuyên tham gia vào quá trình xem xét. Các phân tích của tôi thường bao gồm phân tích sinh tồn, hồi quy tuyến tính, hồi quy logistic, mô hình hỗn hợp. Không bao giờ có một nhà phê bình hỏi về các giả định mô hình, phù hợp hoặc đánh giá.
Vì vậy, tôi không bao giờ thực sự bận tâm quá nhiều về các giả định mô hình, sự phù hợp và đánh giá. Tôi bắt đầu với một giả thuyết, thực hiện hồi quy và sau đó trình bày kết quả. Trong một số trường hợp, tôi đã nỗ lực để đánh giá những điều này, nhưng tôi luôn kết thúc với " nó cũng không hoàn thành tất cả các giả định, nhưng tôi tin tưởng vào kết quả (" kiến thức chủ đề ") và chúng rất hợp lý, vì vậy nó vẫn ổn " và Khi tư vấn một nhà thống kê họ dường như luôn đồng ý.
Bây giờ, tôi đã nói chuyện với các nhà thống kê và phi thống kê khác (nhà hóa học, bác sĩ và nhà sinh học), những người thực hiện phân tích chính họ; Dường như mọi người không thực sự bận tâm quá nhiều về tất cả các giả định và đánh giá chính thức này. Nhưng ở đây trên CV, có rất nhiều người hỏi về số dư, mức độ phù hợp với mô hình, cách đánh giá nó, giá trị bản địa, vectơ và danh sách tiếp tục. Hãy để tôi nói theo cách này, khi lme4 cảnh báo về giá trị bản địa lớn, tôi thực sự nghi ngờ rằng nhiều người dùng của nó quan tâm để giải quyết rằng ...
Có đáng để nỗ lực thêm không? Có phải không có khả năng là phần lớn của tất cả các kết quả được công bố không tôn trọng các giả định này và có lẽ thậm chí không đánh giá chúng? Đây có lẽ là một vấn đề đang gia tăng vì cơ sở dữ liệu phát triển lớn hơn mỗi ngày và có một quan niệm rằng dữ liệu càng lớn thì càng ít quan trọng là các giả định và đánh giá.
Tôi có thể hoàn toàn sai, nhưng đây là cách tôi đã nhận thức được điều này.
Cập nhật: Trích dẫn mượn từ StasK (bên dưới): http://www.nature.com/news/science-joins-push-to-screen-statistic-in- con -.15509