Các giá trị vô nghĩa của các biến lồng nhau không được ảnh hưởng đến mô hình của bạn: Desideratum
quan trọng với loại phân tích dữ liệu này là nested
biến không được tác động đến mô hình nếu explanatory
biến ban đầu không thừa nhận nó là biến có ý nghĩa. Nói cách khác, mô hình phải có dạng bỏ qua các giá trị vô nghĩa của biến lồng nhau . Đây là một yêu cầu quan trọng đối với một mô hình hợp lệ với các biến lồng nhau, vì nó đảm bảo rằng đầu ra mô hình không bị ảnh hưởng bởi các lựa chọn mã hóa tùy ý.
Mô hình hóa với các biến lồng nhau: Yêu cầu này đạt được bằng cách đưa nested
biến vào mô hình chỉ như một tương tác với explanatory
biến ban đầu , mà không bao gồm nó làm hiệu ứng chính. (Cụ thể hơn, biến lồng nhau phải được tương tác với một câu lệnh logic trên biến giải thích chỉ ra rằng đó là một biến có ý nghĩa.) Lưu ý rằng đây là một ngoại lệ đối với quy tắc chung rằng các thuật ngữ không nên được đưa vào dưới dạng tương tác mà không có thuật ngữ hiệu ứng chính .
Xem xét trường hợp chung trong đó nested
biến chỉ có ý nghĩa khi explanatory
biến nằm trong một số bộ giá trị A
. Trong trường hợp đó, bạn sẽ sử dụng một mẫu mô hình như thế này:
response ~ 1 + explanatory + (explanatory %in% A):nested + ...
Trong trường hợp phổ biến trong đó explanatory
biến của bạn là biến chỉ báo (với giá trị là một biến làm cho biến lồng nhau có ý nghĩa), mẫu mô hình này đơn giản hóa điều này:
response ~ 1 + explanatory + explanatory:nested + ...
Quan sát rằng trong các câu lệnh mô hình này không có thuật ngữ hiệu ứng chính cho nested
biến. Đây là do thiết kế --- biến lồng nhau không nên có thuật ngữ hiệu ứng chính, vì nó không phải là biến có ý nghĩa trong trường hợp không có điều kiện trên biến giải thích. Với dạng mẫu mô hình này, bạn sẽ có được ước tính về tác động của biến giải thích và ước tính khác cho tác động của biến lồng nhau.
Mã hóa các biến lồng nhau trong dữ liệu của bạn: Khi xử lý các khung dữ liệu liệt kê các biến cho hồi quy, cách tốt nhất là các giá trị của nested
biến được mã hóa như NA
trong trường hợp nó không phát sinh một cách có ý nghĩa từ biến giải thích. Điều này cho người đọc biết rằng không có biến có ý nghĩa ở đây. Một số nhà phân tích mã hóa các biến này với các giá trị khác, như số không, nhưng đó thường là thông lệ xấu, vì nó có thể bị nhầm lẫn với một số lượng có ý nghĩa.
Về mặt toán học, nếu bạn nhân bất kỳ số thực nào với số 0, bạn sẽ nhận được số không. Tuy nhiên, nếu bạn đang viết mã, R
bạn phải cẩn thận ở đây vì chương trình sẽ nhân 0:NA
lên NA
thay vì 0
. Điều này có nghĩa là bạn có thể cần mã lại các NA
giá trị về 0 cho mục đích khớp mô hình hoặc xây dựng ma trận thiết kế cho mô hình để các giá trị này được đặt thành 0.
Các trường hợp trong đó biến cơ sở là một hàm của biến lồng nhau: Một tình huống đôi khi phát sinh trong phân tích hồi quy liên quan đến các biến lồng nhau là trường hợp biến lồng nhau có một lượng chi tiết đủ để xác định đầy đủ biến giải thích ban đầu mà nó phát sinh từ - - tức là biến giải thích ban đầu là một hàm của biến lồng nhau. Một ví dụ về điều này xảy ra trong câu hỏi này , trong đó nhà phân tích có một biến chỉ thị DrugA
cho việc có sử dụng thuốc hay không và một biến lồng nhau DrugA_Conc
cho nồng độ của thuốc. Trong ví dụ này, biến sau cho phép giá trị nồng độ bằng 0, tương đương với thuốc không được sử dụng và DrugA
tương đương với DrugA_Conc != 0
.
Trong các loại trường hợp này, thuật ngữ tương tác giữa biến giải thích và biến lồng nhau có chức năng tương đương với biến lồng nhau, và do đó, có thể (và thường là mong muốn) để loại bỏ biến giải thích ban đầu khỏi mô hình và chỉ cần sử dụng hoàn toàn biến lồng nhau trên chính nó. Điều này là hợp pháp trong trường hợp này, bởi vì các giá trị trong biến lồng nhau xác định giá trị của biến giải thích ban đầu. Chúng tôi đã lưu ý ở trên rằng thường thích hợp để mã các biến lồng nhau NA
khi điều kiện cho chúng không được áp dụng. Nếu điều kiện phát sinh từ một biến giải thích là một chỉ báo và chỉ báo tương ứng với việc sử dụng biến lồng nhau, thì sự kiện nested != NA
này tương đương vớiexplanatory
. Trong các trường hợp như vậy, có thể mã hóa lại biến lồng nhau để biến giải thích ban đầu không cần thiết trong mô hình.
Lưu ý rằng phải cẩn thận khi xem xét tình huống này. Ngay cả trong trường hợp bạn đang sử dụng biến giải thích ban đầu là biến chỉ báo, nó có thể hữu ích cho mục đích diễn giải không hợp nhất biến giải thích và biến lồng nhau. Hơn nữa, trong trường hợp biến giải thích không phải là biến chỉ báo, nó thường sẽ chứa thông tin không có trong biến lồng nhau và do đó không thể xóa được.