Các biến số / thay đổi tỷ lệ sẽ không ảnh hưởng đến mối tương quan của chúng với phản hồi
Để xem tại sao điều này là đúng, giả sử rằng mối tương quan giữa và là . Khi đó mối tương quan giữa và làX ρ Y ( X - a ) / bYXρY( X- a ) / b
c o v (Y, ( X- a ) / b )S D ((X- một ) / b ) ⋅ S D ( Y)= c o v ( Y, X/ b)S D (X/ b)⋅ S D (Y)= 1b⋅ c o v ( Y, X)1bS D (X) ⋅ S D ( Y)= ρ
theo định nghĩa của mối tương quan và ba sự kiện:
c o v (Y, X+ a ) = c o v ( Y, X) + c o v ( Y, a )= 0= c o v ( Y, X)
c o v (Y, một chữ X) = a c o v ( Y, X)
S D (aX) = a ⋅ S D ( X)
Do đó, về mặt phù hợp với mô hình (ví dụ hoặc các giá trị được trang bị), việc dịch chuyển hoặc chia tỷ lệ các biến của bạn (ví dụ: đặt chúng trên cùng một tỷ lệ) sẽ không thay đổi mô hìnhR2 , vì các hệ số hồi quy tuyến tính có liên quan đến mối tương quan giữa các biến. Nó sẽ chỉ thay đổi thang đo của các hệ số hồi quy của bạn , điều này cần được ghi nhớ khi bạn diễn giải đầu ra nếu bạn chọn chuyển đổi các dự đoán của mình.
Chỉnh sửa: Ở trên đã giả sử rằng bạn đang nói về hồi quy thông thường với phần chặn. Một vài điểm nữa liên quan đến điều này (cảm ơn @cardinal):
Chặn có thể thay đổi khi bạn chuyển đổi các biến của mình và, như @cardinal chỉ ra trong các nhận xét, các hệ số sẽ thay đổi khi bạn thay đổi các biến của mình nếu bạn bỏ qua phần chặn từ mô hình, mặc dù tôi cho rằng bạn không làm điều đó trừ khi bạn có một lý do tốt (xem ví dụ câu trả lời này ).
Nếu bạn đang thường xuyên hóa các hệ số của mình theo một cách nào đó (ví dụ Lasso, hồi quy sườn), thì việc định tâm / chia tỷ lệ sẽ tác động đến sự phù hợp. Ví dụ: nếu bạn đang phạt (hình phạt hồi quy sườn núi) thì bạn không thể phục hồi mức phù hợp tương đương sau khi tiêu chuẩn hóa trừ khi tất cả các biến có cùng tỷ lệ ở vị trí đầu tiên, nghĩa là không có bội số liên tục sẽ phục hồi cùng một hình phạt.∑β2i
Về thời điểm / lý do tại sao một nhà nghiên cứu có thể muốn chuyển đổi các yếu tố dự đoán
Một tình huống phổ biến (được thảo luận trong câu trả lời tiếp theo của @Paul) là các nhà nghiên cứu sẽ chuẩn hóa các dự đoán của họ để tất cả các hệ số sẽ ở cùng một thang đo. Trong trường hợp đó, kích thước của các ước tính điểm có thể đưa ra một ý tưởng sơ bộ về các yếu tố dự đoán nào có ảnh hưởng lớn nhất một khi cường độ số của yếu tố dự đoán đã được chuẩn hóa.
Một lý do khác mà một nhà nghiên cứu có thể muốn mở rộng các biến rất lớn là do các hệ số hồi quy không ở quy mô cực kỳ nhỏ. Ví dụ: nếu bạn muốn xem xét ảnh hưởng của quy mô dân số của một quốc gia đến tỷ lệ tội phạm (không thể nghĩ ra một ví dụ tốt hơn), bạn có thể muốn đo kích thước dân số theo hàng triệu thay vì theo đơn vị ban đầu, vì hệ số có thể là một cái gì đó như ..00000001