Để giải quyết câu hỏi đầu tiên , hãy xem xét mô hình
Y=X+sin(X)+ε
với iid có nghĩa là không và phương sai hữu hạn. Khi phạm vi của (được coi là cố định hoặc ngẫu nhiên) tăng lên, chuyển sang 1. Tuy nhiên, nếu phương sai của là nhỏ (khoảng 1 hoặc ít hơn), dữ liệu sẽ "phi tuyến tính rõ rệt". Trong các ô, .X R 2 ε v một r ( ε ) = 1εXR2εvar(ε)=1
Ngẫu nhiên, một cách dễ dàng để có nhỏ là cắt các biến độc lập thành các phạm vi hẹp. Hồi quy (sử dụng chính xác cùng một mô hình ) trong mỗi phạm vi sẽ có thấp ngay cả khi hồi quy đầy đủ dựa trên tất cả dữ liệu có . Chiêm ngưỡng tình huống này là một bài tập thông tin và chuẩn bị tốt cho câu hỏi thứ hai.R 2 R 2R2R2R2
Cả hai lô sau đều sử dụng cùng một dữ liệu. Các cho hồi quy đầy đủ là 0,86. Các cho các slice (chiều rộng 1/2 từ -5/2 đến 5/2) là 0,16, 0,18, 0,07, 0,14, 0,08, 0,17, 0,20, 0,12, 0,01 , 0,00, đọc từ trái sang phải. Nếu bất cứ điều gì, sự phù hợp trở nên tốt hơn trong tình huống bị cắt bởi vì 10 dòng riêng biệt có thể phù hợp chặt chẽ hơn với dữ liệu trong phạm vi hẹp của chúng. Mặc dù cho tất cả các lát nằm dưới đầy đủ , nhưng sức mạnh của mối quan hệ, độ tuyến tính cũng như bất kỳ khía cạnh nào của dữ liệu (ngoại trừ phạm vi được sử dụng cho hồi quy) đã thay đổi.R 2 R 2 R 2 XR2R2R2R2X
(Người ta có thể phản đối rằng quy trình cắt này thay đổi phân phối của Điều đó đúng, nhưng nó vẫn tương ứng với việc sử dụng phổ biến nhất trong mô hình hiệu ứng cố định và cho thấy mức độ mà đang nói với chúng ta về phương sai của trong tình huống hiệu ứng ngẫu nhiên. Đặc biệt, khi bị hạn chế thay đổi trong một khoảng nhỏ hơn trong phạm vi tự nhiên của nó, thường sẽ giảm xuống.)R 2 R 2 X X R 2XR2R2XXR2
Vấn đề cơ bản với là nó phụ thuộc vào quá nhiều thứ (ngay cả khi được điều chỉnh theo hồi quy bội), nhưng đặc biệt nhất là về phương sai của các biến độc lập và phương sai của phần dư. Thông thường nó không cho chúng ta biết gì về "tuyến tính" hay "sức mạnh của mối quan hệ" hay thậm chí là "mức độ phù hợp" để so sánh một chuỗi các mô hình.R2
Hầu hết thời gian bạn có thể tìm thấy một thống kê tốt hơn . Để lựa chọn mô hình, bạn có thể tìm đến AIC và BIC; để thể hiện sự đầy đủ của một mô hình, hãy nhìn vào phương sai của phần dư. R2
Điều này cuối cùng đưa chúng ta đến câu hỏi thứ hai . Một tình huống trong đó có thể có một số sử dụng là khi các biến độc lập được đặt thành giá trị tiêu chuẩn, về cơ bản kiểm soát ảnh hưởng của phương sai của chúng. Thì thực sự là một ủy quyền cho phương sai của phần dư, được chuẩn hóa phù hợp. 1 - R 2R21−R2