Dải màu xám là dải tin cậy cho đường hồi quy. Tôi không đủ quen thuộc với ggplot2 để biết chắc chắn đó là dải tin cậy 1 SE hay dải tin cậy 95%, nhưng tôi tin rằng đó là trước đây ( Chỉnh sửa: rõ ràng đó là 95% CI ). Một dải tin cậy cung cấp một đại diện cho sự không chắc chắn về đường hồi quy của bạn. Theo một nghĩa nào đó, bạn có thể nghĩ rằng đường hồi quy thực sự cao bằng đỉnh của dải đó, thấp như đáy hoặc lắc lư khác nhau trong dải. (Lưu ý rằng giải thích này nhằm mục đích trực quan và không chính xác về mặt kỹ thuật, nhưng phần lớn giải thích hoàn toàn chính xác là khó cho hầu hết mọi người làm theo.)
Bạn nên sử dụng dải tin cậy để giúp bạn hiểu / nghĩ về đường hồi quy. Bạn không nên sử dụng nó để suy nghĩ về các điểm dữ liệu thô. Hãy nhớ rằng đường hồi quy đại diện cho giá trị trung bình của tại mỗi điểm trong X (nếu bạn cần hiểu điều này đầy đủ hơn, nó có thể giúp bạn đọc câu trả lời của tôi ở đây: Trực giác đằng sau các phân phối Gaussian có điều kiện là gì? ). Mặt khác, bạn chắc chắn không mong đợi mọi điểm dữ liệu quan sát được bằng giá trị trung bình có điều kiện. Nói cách khác, bạn không nên sử dụng dải tin cậy để đánh giá xem điểm dữ liệu có phải là ngoại lệ hay không. YX
( Chỉnh sửa: ghi chú này là ngoại vi cho câu hỏi chính, nhưng tìm cách làm rõ một điểm cho OP. )
Hồi quy đa thức không phải là hồi quy phi tuyến tính, mặc dù những gì bạn nhận được không giống như một đường thẳng. Thuật ngữ 'tuyến tính' có một ý nghĩa rất cụ thể trong ngữ cảnh toán học, cụ thể là các tham số bạn đang ước tính - betas - đều là các hệ số. Hồi quy đa thức chỉ có nghĩa là các đồng biến của bạn là , X 2 , X 3 , v.v., nghĩa là chúng có mối quan hệ phi tuyến tính với nhau, nhưng betas của bạn vẫn là hệ số, do đó nó vẫn là mô hình tuyến tính. Nếu betas của bạn là, giả sử, số mũ, thì bạn sẽ có một mô hình phi tuyến tính. XX2X3
Tóm lại, việc một dòng có nhìn thẳng hay không không liên quan gì đến việc một mô hình có tuyến tính hay không. Khi bạn phù hợp với một mô hình đa thức (giả sử với và X 2 ), mô hình đó không 'biết' rằng, ví dụ, X 2 thực sự chỉ là bình phương của X 1 . Nó 'nghĩ' đây chỉ là hai biến số (mặc dù nó có thể nhận ra rằng có một số đa cộng đồng). Như vậy, trong sự thật nó được lắp một (thẳng / căn hộ) hồi quy máy bay trong một không gian ba chiều chứ không phải là một (cong) hồi quy dòng trong một không gian hai chiều. Điều này không hữu ích cho chúng ta khi nghĩ về, và trên thực tế, cực kỳ khó thấy kể từ X 2XX2X2X1X2là một chức năng hoàn hảo của . Kết quả là, chúng tôi không bận tâm đến việc nghĩ theo cách này và âm mưu của chúng tôi thực sự là hai hình chiếu hai chiều trên mặt phẳng ( X , Y ) . Tuy nhiên, trong không gian thích hợp, đường thẳng thực sự là 'thẳng' theo một nghĩa nào đó. X(X, Y)
Từ góc độ toán học, một mô hình là tuyến tính nếu các tham số bạn đang cố ước tính là các hệ số. Để làm rõ hơn nữa, hãy xem xét so sánh giữa tiêu chuẩn (OLS) tuyến tính hồi quy mô hình, và một mô hình hồi quy logistic đơn giản trình bày trong hai hình thức khác nhau:
ln ( π ( Y )
Y=β0+β1X+ε
ln(π(Y)1−π(Y))=β0+β1X
π(Y)=exp(β0+β1X)1+exp(β0+β1X)
βββ mô hình tuyến tính , bởi vì nó có thể được viết lại dưới dạng mô hình tuyến tính. Để biết thêm thông tin về điều đó, có thể giúp đọc câu trả lời của tôi ở đây:
Sự khác biệt giữa mô hình logit và probit .)