Câu trả lời:
Về mặt khái niệm, bạn đang thêm không có thông tin "mới", nhưng bạn "biết" thông tin đó chính xác hơn.
Do đó, điều này sẽ dẫn đến các hệ số hồi quy tương tự, với các lỗi tiêu chuẩn nhỏ hơn.
Ví dụ, trong Stata, hàm x mở rộng nhân đôi mỗi lần quan sát x lần.
sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .001586 -2.43 0.018 -.0070138 -.0006891
length | -.0795935 .0553577 -1.44 0.155 -.1899736 .0307867
_cons | 47.88487 6.08787 7.87 0.000 35.746 60.02374
------------------------------------------------------------------------------
expand 5
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .0006976 -5.52 0.000 -.0052232 -.0024797
length | -.0795935 .0243486 -3.27 0.001 -.1274738 -.0317131
_cons | 47.88487 2.677698 17.88 0.000 42.61932 53.15043
------------------------------------------------------------------------------
Như bạn có thể thấy, các hệ số (độ dài) không đáng kể trước đây trở nên có ý nghĩa thống kê trong mô hình mở rộng, thể hiện độ chính xác mà bạn "biết" những gì bạn biết.