Khi tính toán các mô hình hồi quy với R, tôi cũng thường xuyên sử dụng hàm phát lại để lấy mô hình của mình để cung cấp cho tôi kết quả cho cấp độ khác. Tôi nhận thấy rằng đôi khi, nhưng không thường xuyên, điều này đã thay đổi mô hình theo nghĩa là mức độ của các yếu tố khác có ý nghĩa trước khi có liên quan không còn nữa. Đây có phải là cố hữu hoặc có liên quan và có thể do một số vấn đề với dữ liệu của tôi? Liệu nó cho thấy dữ liệu của tôi có khả năng không đáp ứng một trong những điều kiện tiên quyết của mô hình tuyến tính?
Liên quan đến điều đó, có ổn không nếu tôi sử dụng relevel, tính toán lại mô hình của mình và sau đó báo cáo các giá trị quan trọng từ cả hai mô hình trong bài viết của mình? Nếu tầm quan trọng khác nhau giữa hai mô hình cho một yếu tố nhất định, tôi cho rằng tôi nên đi với một mô hình ít lạc quan hơn?
Tôi cho rằng câu hỏi của tôi phản bội rằng tôi không biết đủ về lm để nắm bắt sự cần thiết của cấp độ cơ sở. Tôi nghĩ rằng tôi hiểu nó khá rõ;) Bằng cách nào đó, không có lời giới thiệu nào tôi đọc được giải thích về điểm đó, hoặc tôi quá ngu ngốc để nắm bắt nó. Vì vậy, nếu ai đó có thể hướng dẫn tôi đến một trang web nơi có điểm cơ bản trong lm được giải thích hoặc giải thích chính nó, điều đó cũng sẽ rất tuyệt!
Chỉnh sửa: Đây là một ví dụ tối thiểu:
library(datasets)
sprays<-OrchardSprays
model<-lm(decrease~treatment+rowpos+colpos,data=sprays)
summary(model)
Một phần của bản tóm tắt nói
treatmentC 20.625 9.731 2.120 0.03866 *
Vì vậy, nếu điều trị == C, điều này có ảnh hưởng tích cực đáng kể đến 'giảm'. Bây giờ tôi gửi lại 'điều trị' cho B để tìm hiểu ảnh hưởng của việc điều trị == A có:
sprays$treatment<-relevel(sprays$treatment,"B")
summary(model)
Và bây giờ điều trị == C không đáng kể trong mô hình mới này:
treatmentC 17.625 9.731 1.811 0.07567 .
Xin lỗi vì đăng sai chỗ! Tôi có thể chuyển câu hỏi của mình sang trạng thái trao đổi thống kê hay tôi nên mở một câu hỏi mới ở đó?
d <- data.frame(y=runif(300),f=factor(rep(LETTERS[1:3],each=100)); lm(y~f,data=d)
sẽ cho bạn một sự khởi đầu, mặc dù tất nhiên sẽ không có thay đổi đáng kể nào trong trường hợp đó (mặc dù các ước tính tham số và giá trị p chắc chắn sẽ thay đổi khi bạn phát hiện lại).