Tôi đang tham dự một lớp phân tích dữ liệu và một số ý tưởng có gốc rễ của tôi đang bị lung lay. Cụ thể, ý tưởng rằng lỗi (epsilon), cũng như bất kỳ loại phương sai nào khác, chỉ áp dụng (vì vậy tôi nghĩ) cho một nhóm (một mẫu hoặc toàn bộ dân số). Bây giờ, chúng ta được dạy rằng một trong những giả định hồi quy là phương sai là "giống nhau cho tất cả các cá nhân". Điều này bằng cách nào đó gây sốc cho tôi. Tôi luôn nghĩ rằng đó là phương sai trong Y trên tất cả các giá trị của X được coi là không đổi.
Tôi đã có một cuộc trò chuyện với prof, người nói với tôi rằng khi chúng tôi thực hiện hồi quy, chúng tôi cho rằng mô hình của chúng tôi là đúng. Và tôi nghĩ đó là phần khó khăn. Đối với tôi, thuật ngữ lỗi (epsilon) luôn có nghĩa như "bất kỳ yếu tố nào chúng tôi không biết và điều đó có thể ảnh hưởng đến biến kết quả của chúng tôi, cộng với một số lỗi đo lường". Theo cách mà lớp học được dạy, không có thứ gọi là "những thứ khác"; mô hình của chúng tôi được coi là đúng và đầy đủ. Điều này có nghĩa là tất cả các biến thể dư phải được coi là một sản phẩm của lỗi đo lường (do đó, đo một cá nhân 20 lần sẽ được dự kiến sẽ tạo ra phương sai tương tự như đo 20 cá thể một lần).
Tôi cảm thấy có gì đó không đúng ở đâu đó, tôi muốn có một số ý kiến chuyên gia về vấn đề này ... Có chỗ nào để giải thích về thuật ngữ lỗi là gì, nói một cách khái niệm không?