Với điểm dữ liệu ( x tôi , y i ) , i = 1 , 2 , ... n , trong mặt phẳng, chúng ta hãy vẽ một đường thẳng
y = một x + b . Nếu chúng ta dự đoán một x i + b là giá trị y i của y i , thì lỗi là ( y i - y i ) = ( yn(xi,yi),i=1,2,…ny=ax+baxi+by^iyi ,sai số bình phươnglà
( y i - a x i - b ) 2 vàtổng bình phương lỗi ∑ n i = 1 ( y i - a x i - b ) 2 . Chúng tôi hỏi(yi−y^i)=(yi−axi−b)(yi−axi−b)2 ∑ni=1(yi−axi−b)2
Có gì lựa chọn và b Giảm thiểu
S = n Σ i = 1 ( y i - một x i - b ) 2 ?abS=∑i=1n(yi−axi−b)2
Vì là khoảng cách dọc của ( x i , y i ) từ đường thẳng, nên chúng tôi yêu cầu đường thẳng sao cho tổng bình phương của khoảng cách dọc của các điểm từ dòng càng nhỏ càng tốt. Bây giờ S là hàm bậc hai của cả a và b và đạt giá trị tối thiểu khi a và b sao cho
∂ S(yi−axi−b)(xi,yi)Sabab
Từ phương trình thứ hai, chúng tôi nhận
b=1
∂S∂a∂S∂b=2∑i=1n(yi−axi−b)(−xi)=2∑i=1n(yi−axi−b)(−1)=0=0
trong đó
μy=1b=1n∑i=1n(yi−axi)=μy−aμx
là các giá trị trung bình số học của
yivà
xi. Thay vào phương trình đầu tiên, ta được
a=( 1μy=1n∑i=1nyi, μx=1n∑i=1nxiyixi
Do đó, dòng thu nhỏ
Scó thể được biểu thị là
y=ax+b=μy+((1a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x.
Sy=ax+b=μy+((1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x)(x−μx),
SSmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1x2i)−μ2x.
Nếu chúng ta trao đổi vai trò của và , hãy vẽ một đường
và yêu cầu các giá trị của
và làm giảm thiểu
nghĩa là chúng ta muốn đường thẳng sao cho tổng bình phương của khoảng cách ngang của các điểm từ dòng càng nhỏ càng tốt, sau đó chúng tôi nhận đượcxyx=a^y+b^a^b^
T=∑i=1n(xi−a^yi−b^)2,
x=a^y+b^=μx+((1n∑ni=1xiyi)−μxμy(1n∑ni=1y2i)−μ2y)(y−μy)
và giá trị tối thiểu của là
TTmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1y2i)−μ2y.
Lưu ý rằng cả hai dòng đều đi qua điểm
nhưng các sườn là
nói chung là khác nhau. Thật vậy, như @whuber chỉ ra trong một nhận xét, các sườn giống nhau khi tất cả các điểm nằm trên cùng một đường thẳng. Để thấy điều này, lưu ý rằng
(μx,μy)
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x, a^−1=(1n∑ni=1y2i)−μ2y(1n∑ni=1xiyi)−μxμy
(xi,yi)a^−1−a=Smin(1n∑ni=1xiyi)−μxμy=0⇒Smin=0⇒yi=axi+b,i=1,2,…,n.