Tôi đã đọc chương hồi quy của Phân tích dữ liệu và Đồ họa bằng R: Cách tiếp cận dựa trên ví dụ và hơi bối rối khi biết rằng nó khuyên bạn nên kiểm tra mối quan hệ tuyến tính giữa các biến giải thích (sử dụng biểu đồ phân tán) và, trong trường hợp có aren ' t bất kỳ, chuyển họ để họ làm trở tuyến tính hơn có liên quan. Dưới đây là một số trích đoạn này:
6.3 Chiến lược phù hợp với nhiều mô hình hồi quy
(...)
Kiểm tra ma trận phân tán liên quan đến tất cả các biến giải thích. (Bao gồm cả biến phụ thuộc là, tại thời điểm này, là tùy chọn. ) Trước tiên hãy tìm bằng chứng về tính phi tuyến tính trong các lô của các biến giải thích đối với nhau.
(...)
Điểm này xác định chiến lược tìm kiếm mô hình - tìm kiếm các mô hình trong đó mối quan hệ hồi quy giữa các biến giải thích theo dạng tuyến tính "đơn giản" . Do đó, nếu một số sơ đồ cặp cho thấy bằng chứng về tính phi tuyến tính, hãy xem xét sử dụng (các) phép biến đổi để đưa ra các mối quan hệ gần như tuyến tính hơn . Mặc dù có thể không nhất thiết phải chứng minh là có thể, theo chiến lược này, để mô hình hóa đầy đủ mối quan hệ hồi quy, đây là một chiến lược tốt, vì những lý do được đưa ra dưới đây, để bắt đầu tìm kiếm.
(...)
Nếu mối quan hệ giữa các biến giải thích xấp xỉ tuyến tính, có lẽ sau khi biến đổi, thì có thể giải thích các sơ đồ của các biến dự đoán dựa vào biến trả lời một cách tự tin.
(...)
Có thể không thể tìm thấy các phép biến đổi của một hoặc nhiều biến giải thích để đảm bảo các mối quan hệ (cặp) được hiển thị trong các bảng xuất hiện tuyến tính. Điều này có thể tạo ra các vấn đề cả cho việc giải thích các sơ đồ chẩn đoán cho bất kỳ phương trình hồi quy được trang bị nào và cho việc giải thích các hệ số trong phương trình phù hợp. Xem Cook và Weisberg (1999).
Tôi không nên lo lắng về mối quan hệ tuyến tính giữa các biến phụ thuộc (vì nguy cơ đa cộng đồng) thay vì chủ động theo đuổi chúng? Những lợi thế của việc có các biến liên quan tuyến tính là gì?
Các tác giả đã giải quyết vấn đề về đa cộng đồng sau này trong chương này, nhưng các khuyến nghị này dường như có mâu thuẫn với việc tránh đa cộng đồng.