Người ta thường nói rằng tối thiểu hóa phần dư bình phương tối thiểu được ưu tiên hơn tối thiểu hóa phần dư tuyệt đối vì lý do là nó đơn giản hơn về mặt tính toán . Nhưng, nó cũng có thể tốt hơn vì những lý do khác. Cụ thể, nếu các giả định là đúng (và điều này không quá phổ biến) thì nó cung cấp một giải pháp (trung bình) chính xác hơn.
Khả năng tối đa
Hồi quy bình phương nhỏ nhất và hồi quy lượng tử (khi được thực hiện bằng cách giảm thiểu số dư tuyệt đối) có thể được xem là tối đa hóa hàm khả năng cho các lỗi phân tán Gaussian / Laplace và theo nghĩa này có liên quan rất nhiều.
Phân phối Gaussian:
f(x)=12πσ2−−−−√e−(x−μ)22σ2
với khả năng đăng nhập được tối đa hóa khi tối thiểu hóa tổng số dư bình phương
logL(x)=−n2log(2π)−nlog(σ)−12σ2∑i=1n(xi−μ)2sum of squared residuals
Phân phối Laplace:
f(x)=12be−|x−μ|b
với khả năng đăng nhập được tối đa hóa khi tối thiểu hóa tổng số dư tuyệt đối
logL(x)=−nlog(2)−nlog(b)−1b∑i=1n|xi−μ|sum of absolute residuals
Lưu ý: phân phối Laplace và tổng số dư tuyệt đối liên quan đến trung vị, nhưng nó có thể được khái quát hóa cho các lượng tử khác bằng cách cho các trọng số khác nhau đối với phần dư âm và dương.
Phân phối lỗi đã biết
Khi chúng ta biết phân phối lỗi (khi các giả định có khả năng đúng), sẽ hợp lý khi chọn hàm khả năng liên quan. Giảm thiểu chức năng đó là tối ưu hơn.
Rất thường các lỗi được (khoảng) phân phối bình thường. Trong trường hợp đó sử dụng ít nhất là hình vuông là cách tốt nhất để tìm các tham số μ (mà liên quan đến cả hai giá trị trung bình và trung bình). Đó là cách tốt nhất vì nó có phương sai mẫu thấp nhất (thấp nhất trong tất cả các công cụ ước tính không thiên vị ). Hoặc bạn có thể nói mạnh mẽ hơn: rằng nó chiếm ưu thế một cách ngẫu nhiên (xem hình minh họa trong câu hỏi này so sánh sự phân bố của trung vị mẫu và giá trị trung bình của mẫu).
Vì vậy, khi các lỗi được phân phối bình thường, thì giá trị trung bình mẫu là một ước lượng tốt hơn của trung vị phân phối so với trung bình mẫu . Hồi quy bình phương nhỏ nhất là một ước lượng tối ưu hơn của các lượng tử. Nó là tốt hơn so với việc sử dụng tổng số dư tuyệt đối.
Bởi vì rất nhiều vấn đề đối phó với các lỗi phân tán thông thường, việc sử dụng phương pháp bình phương nhỏ nhất là rất phổ biến. Để làm việc với các loại phân phối khác, người ta có thể sử dụng mô hình tuyến tính Tổng quát . Và, phương pháp bình phương tối thiểu lặp lại, có thể được sử dụng để giải GLM, cũng hoạt động cho phân phối Laplace (nghĩa là cho độ lệch tuyệt đối ), tương đương với việc tìm trung bình (hoặc trong phiên bản tổng quát khác các lượng tử khác).
Phân phối lỗi không xác định
Mạnh mẽ
Trung bình hoặc các lượng tử khác có lợi thế là chúng rất mạnh về loại phân phối. Các giá trị thực tế không quan trọng lắm và các lượng tử chỉ quan tâm đến thứ tự. Vì vậy, bất kể phân phối là gì, tối thiểu hóa số dư tuyệt đối (tương đương với việc tìm các lượng tử) đang hoạt động rất tốt.
Câu hỏi trở nên phức tạp và rộng rãi ở đây và nó phụ thuộc vào loại kiến thức chúng ta có hoặc không có về chức năng phân phối. Ví dụ, một phân phối có thể được phân phối xấp xỉ bình thường nhưng chỉ với một số ngoại lệ bổ sung. Điều này có thể được xử lý bằng cách loại bỏ các giá trị bên ngoài. Việc loại bỏ các giá trị cực đoan này thậm chí còn có tác dụng trong việc ước tính tham số vị trí của phân phối Cauchy trong đó giá trị trung bình bị cắt có thể là một công cụ ước tính tốt hơn so với trung vị. Vì vậy, không chỉ cho tình huống lý tưởng khi các giả định nắm giữ, mà còn cho một số ứng dụng ít lý tưởng hơn (ví dụ: các ngoại lệ bổ sung) có thể có các phương pháp mạnh mẽ vẫn sử dụng một số dạng của phần dư bình phương thay vì tổng dư tuyệt đối.
Tôi tưởng tượng rằng hồi quy với phần dư bị cắt có thể phức tạp hơn nhiều về mặt tính toán. Vì vậy, nó thực sự có thể là hồi quy lượng tử, là loại hồi quy được thực hiện vì lý do là nó đơn giản hơn về mặt tính toán (không đơn giản hơn bình phương tối thiểu thông thường, nhưng đơn giản hơn bình phương tối thiểu bị cắt cụt ).
Xu hướng / không thiên vị
Một vấn đề khác là thiên vị so với ước tính không thiên vị. Trong phần trên tôi đã mô tả ước tính khả năng tối đa cho giá trị trung bình, tức là giải pháp bình phương nhỏ nhất, như một công cụ ước tính tốt hoặc tốt hơn bởi vì nó thường có phương sai thấp nhất trong tất cả các ước lượng không thiên vị (khi các lỗi được phân phối bình thường). Nhưng, các ước tính sai lệch có thể tốt hơn (tổng bình phương lỗi dự kiến thấp hơn).
Điều này làm cho câu hỏi một lần nữa rộng và phức tạp. Có nhiều người ước tính khác nhau và nhiều tình huống khác nhau để áp dụng chúng. Việc sử dụng một tổng số thích ứng của hàm mất dư bình phương thường hoạt động tốt để giảm lỗi (ví dụ: tất cả các loại phương pháp chính quy), nhưng nó có thể không cần hoạt động tốt trong mọi trường hợp. Theo trực giác, không có gì lạ khi tưởng tượng rằng, vì tổng hàm mất phần dư bình phương thường hoạt động tốt cho tất cả các công cụ ước lượng không thiên vị, nên các công cụ ước tính thiên vị tối ưu có lẽ là một cái gì đó gần với tổng hàm mất phần dư bình phương.