Tôi không chắc câu hỏi này thuộc về đâu: Xác thực chéo hoặc Nơi làm việc. Nhưng câu hỏi của tôi mơ hồ liên quan đến số liệu thống kê.
Câu hỏi này (hoặc tôi đoán câu hỏi) nảy sinh trong quá trình tôi làm "thực tập khoa học dữ liệu". Tôi đã xây dựng mô hình hồi quy tuyến tính này và kiểm tra lô dư. Tôi thấy dấu hiệu rõ ràng của sự không đồng nhất. Tôi nhớ rằng tính không đồng nhất làm biến dạng nhiều thống kê kiểm tra như khoảng tin cậy và kiểm tra t. Vì vậy, tôi đã sử dụng bình phương tối thiểu trọng số, theo những gì tôi đã học được ở trường đại học. Người quản lý của tôi đã nhìn thấy điều đó và khuyên tôi đừng làm điều đó bởi vì "tôi đang làm mọi thứ trở nên phức tạp", đó không phải là một lý do rất thuyết phục đối với tôi.
Một ví dụ khác là "loại bỏ một biến giải thích vì giá trị p của nó là không đáng kể". Để được, lời khuyên này chỉ không có ý nghĩa từ quan điểm logic. Theo những gì tôi đã học được, giá trị p không đáng kể có thể do các lý do khác nhau: cơ hội, sử dụng mô hình sai, vi phạm các giả định, v.v.
Một ví dụ khác là, tôi đã sử dụng xác nhận chéo k-Fold để đánh giá mô hình của mình. Theo kết quả, chỉ tốt hơn . Nhưng chúng tôi có thấp hơn cho mô hình 1 và lý do có liên quan đến việc đánh chặn . Tuy nhiên, người giám sát của tôi dường như thích mô hình 2 hơn vì nó có cao hơn . Lý do của anh ấy (chẳng hạn như là mạnh mẽ, hoặc xác nhận chéo là phương pháp học máy chứ không phải phương pháp thống kê) dường như không đủ sức thuyết phục để thay đổi suy nghĩ của tôi.
Là một người vừa tốt nghiệp đại học, tôi rất bối rối. Tôi rất say mê áp dụng số liệu thống kê chính xác để giải quyết các vấn đề trong thế giới thực, nhưng tôi không biết điều nào sau đây là đúng:
- Các số liệu thống kê tôi tự học là sai, vì vậy tôi chỉ đang phạm sai lầm.
- Có sự khác biệt rất lớn giữa thống kê lý thuyết và mô hình xây dựng trong các công ty. Và mặc dù lý thuyết thống kê là đúng, mọi người chỉ không tuân theo nó.
- Người quản lý không sử dụng số liệu thống kê chính xác.
Cập nhật vào ngày 17 tháng 4 năm 2017: Tôi đã quyết định theo đuổi bằng tiến sĩ. trong thống kê. Cảm ơn tất cả các bạn đã trả lời.