Sau khi tìm kiếm làm rõ về các hệ số mô hình tuyến tính ở đây, tôi có một câu hỏi tiếp theo liên quan đến việc không có ý nghĩa (giá trị p cao) cho các hệ số của các mức yếu tố.
Ví dụ: Nếu mô hình tuyến tính của tôi bao gồm một yếu tố có 10 cấp độ và chỉ có 3 trong số các mức đó có giá trị p đáng kể được liên kết với chúng, khi sử dụng mô hình để dự đoán Y, tôi có thể chọn không bao gồm thuật ngữ hệ số nếu đối tượng rơi vào một trong các mức độ không quan trọng?
Quyết liệt hơn, sẽ là sai lầm khi gộp 7 cấp độ không đáng kể thành một cấp độ và phân tích lại?