Giả sử tập dữ liệu của bạn bao gồm một tập hợp (xi,yi) cho i=1,…,n và bạn muốn xem xét sự phụ thuộc của y vào x .
Giả sử bạn tìm thấy những giá trị α và β của α và β giảm thiểu số tiền còn lại của hình vuông
n Σ i = 1 ( y i - ( α + β x i ) ) 2 .
Sau đó, bạn lấy y = α + β x được dự đoán y -giá trị cho bất kỳ (không nhất thiết đã quan sát) x giá trị. Đó là hồi quy tuyến tính.α^β^αβ
∑i=1n(yi−(α+βxi))2.
y^=α^+β^xyx
Bây giờ hãy xem xét phân tách tổng số bình phương
vớin-1bậc tự do, vào "giải thích" và các bộ phận "không giải thích được":
n Σ i = 1 ( ( α + β x i ) - ˉ y ) 2 ⏟ giải thích+ n Σ i = 1 ( y i - ( α + β x i ) ) 2 ⏟ không giải thích được.
với1
∑i=1n(yi−y¯)2where y¯=y1+⋯+ynn
n−1∑i=1n((α^+β^xi)−y¯)2explained + ∑i=1n(yi−(α^+β^xi))2unexplained.
1và
độ tự do, tương ứng. Đó là phân tích phương sai, và một sau đó xem xét những thứ như F-thống kê
F = Σ n i = 1 ( ( α + β x i ) - ˉ y ) 2 / 1n−2ĐâyF-statistic kiểm tra giả thuyết
β=0.
F=∑ni=1((α^+β^xi)−y¯)2/1∑ni=1(yi−(α^+β^xi))2/(n−2).
β=0
y=α+βi
ikk−1n−k
Một vài điểm bổ sung:
- Đối với một số nhà toán học, tài khoản ở trên có thể cho thấy toàn bộ lĩnh vực chỉ là những gì nhìn thấy ở trên, do đó có vẻ bí ẩn khi cả hồi quy và phân tích phương sai đều là lĩnh vực nghiên cứu tích cực. Có nhiều điều không phù hợp với câu trả lời thích hợp để đăng ở đây.
- y=α+βx