Câu trả lời ngắn
Mật độ xác suất của biến phân phối Gaussian đa biến , với trung bình có liên quan đến bình phương của euclide khoảng cách giữa giá trị trung bình và biến ( ), hay nói cách khác là tổng bình phương.x=(x1,x2,...,xn)μ=(μ1,μ2,...,μn)|μ−x|22
Câu trả lời dài
Nếu bạn nhân nhiều phân phối Gaussian cho lỗi của bạn , trong đó bạn giả sử độ lệch bằng nhau, thì bạn sẽ có được một tổng bình phương.n
L ( μj, xtôi j) =P( xtôi j| μj)= ∏ni = 112 πσ2√e x p [ - ( xtôi j- μTôi)22 σ2]= ( 12 πσ2√)ne x p [ - Σni = 1( xtôi j- μTôi)22 σ2]
hoặc ở dạng logarit thuận tiện:
đăng nhập( L ( μj, xtôi j) ) =nđăng nhập( 12 πσ2----√) - 12 σ2Σi = 1n( xtôi j- μj)2
Vì vậy, tối ưu hóa để giảm thiểu tổng bình phương bằng với tối đa hóa khả năng (log) (nghĩa là sản phẩm của nhiều phân phối Gaussian hoặc phân phối Gaussian đa biến).μ
Đây là hình vuông lồng nhau của sự khác biệt bên trong cấu trúc hàm mũ, , điều mà các bản phân phối khác không có.(μ−x)exp[(xi−μ)2]
So sánh ví dụ với trường hợp phân phối Poisson
log(L)=log(∏μxijjxij!exp[−μj])=−∑μj−∑log(xij!)+∑log(μj)xij
có tối đa khi tối thiểu hóa những điều sau đây:
∑μj−log(μj)xij
đó là một con thú khác nhau
Ngoài ra (lịch sử)
Lịch sử của phân phối bình thường (bỏ qua deMoivre đến phân phối này như là một xấp xỉ cho phân phối nhị thức) thực sự là khám phá phân phối làm cho MLE tương ứng với phương pháp bình phương nhỏ nhất (chứ không phải là phương pháp bình phương nhỏ nhất là phương pháp có thể biểu thị MLE của phân phối chuẩn, đầu tiên là phương pháp bình phương nhỏ nhất, thứ hai là phân phối Gaussian)
Lưu ý rằng Gauss, kết nối 'phương pháp khả năng tối đa' với 'phương pháp bình phương tối thiểu', đã đưa ra 'phân phối Gaussian', , là phân phối lỗi duy nhất dẫn chúng ta đến tạo kết nối này giữa hai phương thứce−x2
Từ bản dịch của Charles Henry Davis (Lý thuyết về chuyển động của các thiên thể di chuyển về mặt trời trong các phần hình nón. Bản dịch của "Theoria motus" của Gauss, với một phụ lục) ...
Gauss định nghĩa:
Theo đó, xác suất được chỉ định cho từng lỗi sẽ được biểu thị bằng hàm mà chúng ta sẽ biểu thị bằng .ΔΔψΔ
(Việc in nghiêng do tôi thực hiện)
Và tiếp tục ( trong phần 177 trang 258 ):
... từ đó có thể dễ dàng suy ra rằng phải là một số lượng không đổi. mà chúng ta sẽ biểu thị bằng . Do đó, chúng tôi có biểu thị cơ sở của logarit hyperbol bằng và giả sửψ′ΔΔklog ψΔ=12kΔΔ+Constant
ψΔ=xe12kΔΔ
eConstant=logx
kết thúc (sau khi bình thường hóa và nhận ra ) trongk<0
ψΔ=hπ−−√e−hhΔΔ
Viết bởi StackExchangeStrike