Hỏi: "... làm cách nào để diễn giải giá trị x2" Cao "? Ví dụ: x2s" Cao "có ảnh hưởng gì đến biến trả lời trong ví dụ được nêu ở đây ??
Trả lời: Bạn chắc chắn nhận thấy rằng không có đề cập đến x2 = "Cao" trong đầu ra. Tại thời điểm x2High được chọn làm "trường hợp cơ sở". Đó là bởi vì bạn đã cung cấp một biến nhân tố với mã hóa mặc định cho các cấp mặc dù thứ tự sẽ là L / M / H tự nhiên hơn đối với tâm trí con người. Nhưng "H" là từ vựng trước cả "L" và "M" trong bảng chữ cái, được R chọn làm trường hợp cơ sở.
Vì 'x2' không được đặt hàng, mỗi độ tương phản được báo cáo có liên quan đến x2 = "Cao" và do đó x2 == "Thấp" được ước tính là -0,78 so với x2 = "Cao". Tại thời điểm, Chặn là giá trị ước tính của "Y" khi x2 = "Cao" và x1 = 0. Bạn có thể muốn chạy lại hồi quy của mình sau khi thay đổi thứ tự mức (nhưng không thực hiện yếu tố theo thứ tự).
x2a = factor(x2, levels=c("Low", "Medium", "High"))
Sau đó, ước tính 'Trung bình' và 'Cao' của bạn sẽ phù hợp hơn với những gì bạn mong đợi.
Chỉnh sửa: Có các cách sắp xếp mã hóa thay thế (hoặc sắp xếp chính xác hơn của ma trận mô hình.) Lựa chọn mặc định cho độ tương phản trong R là "độ tương phản xử lý" chỉ định một mức yếu tố (hoặc một kết hợp cụ thể của các mức yếu tố) làm mức tham chiếu và báo cáo ước tính sự khác biệt trung bình cho các cấp độ hoặc kết hợp khác. Tuy nhiên, bạn có thể có mức tham chiếu là giá trị trung bình tổng thể bằng cách buộc Chặn là 0 (không được khuyến nghị) hoặc sử dụng một trong các lựa chọn tương phản khác:
?contrasts
?C # which also means you should _not_ use either "c" or "C" as variable names.
Bạn có thể chọn các độ tương phản khác nhau cho các yếu tố khác nhau, mặc dù làm như vậy dường như sẽ đặt ra một gánh nặng diễn giải bổ sung. S-Plus sử dụng độ tương phản Helmert theo mặc định và SAS sử dụng độ tương phản điều trị nhưng chọn mức yếu tố cuối cùng thay vì mức đầu tiên làm mức tham chiếu.