Tôi thích cuốn sách của G van Belle về Quy tắc thống kê của ngón tay cái , và ở mức độ thấp hơn Các lỗi phổ biến trong Thống kê (và Cách tránh chúng) từ Phillip I Good và James W. Hardin. Họ giải quyết những cạm bẫy phổ biến khi diễn giải kết quả từ các nghiên cứu thực nghiệm và quan sát và đưa ra các khuyến nghị thực tế cho suy luận thống kê, hoặc phân tích dữ liệu thăm dò. Nhưng tôi cảm thấy rằng các hướng dẫn "hiện đại" là hơi thiếu, đặc biệt là việc sử dụng ngày càng nhiều các số liệu thống kê tính toán và mạnh mẽ trong các lĩnh vực khác nhau, hoặc giới thiệu các kỹ thuật từ cộng đồng học máy, ví dụ như thống kê sinh học lâm sàng hoặc dịch tễ di truyền.
Ngoài các thủ thuật tính toán hoặc cạm bẫy phổ biến trong trực quan hóa dữ liệu có thể được giải quyết ở nơi khác, tôi muốn hỏi: các quy tắc hàng đầu mà bạn muốn giới thiệu để phân tích dữ liệu hiệu quả là gì? ( một quy tắc cho mỗi câu trả lời, xin vui lòng ).
Tôi đang nghĩ về các hướng dẫn mà bạn có thể cung cấp cho một đồng nghiệp, một nhà nghiên cứu không có nền tảng vững chắc về mô hình thống kê hoặc một sinh viên trong khóa học từ trung cấp đến nâng cao. Điều này có thể liên quan đến các giai đoạn phân tích dữ liệu khác nhau, ví dụ như chiến lược lấy mẫu, lựa chọn tính năng hoặc xây dựng mô hình, so sánh mô hình, dự toán, v.v.