Tại sao chúng ta tìm cách giảm thiểu x^2
thay vì giảm thiểu |x|^1.95
hoặc |x|^2.05
. Có những lý do tại sao số phải chính xác là hai hoặc nó chỉ đơn giản là một quy ước có lợi thế của việc đơn giản hóa toán học?
Tại sao chúng ta tìm cách giảm thiểu x^2
thay vì giảm thiểu |x|^1.95
hoặc |x|^2.05
. Có những lý do tại sao số phải chính xác là hai hoặc nó chỉ đơn giản là một quy ước có lợi thế của việc đơn giản hóa toán học?
Câu trả lời:
Câu hỏi này khá cũ nhưng tôi thực sự có một câu trả lời không xuất hiện ở đây và một câu hỏi đưa ra lý do thuyết phục tại sao (theo một số giả định hợp lý) lỗi bình phương là chính xác, trong khi bất kỳ sức mạnh nào khác là không chính xác.
Giả sử chúng ta có một số dữ liệu và muốn tìm ra tuyến tính (hoặc bất kỳ) chức năng f phù hợp nhất với dự đoán các dữ liệu, theo nghĩa là mật độ xác suất p f ( D ) để quan sát dữ liệu này nên được tối đa đối với với f (cái này được gọi làước tính khả năng tối đa ). Nếu chúng ta giả định rằng các dữ liệu được xác định bởi cộng với một số hạng sai số phân phối chuẩn với độ lệch chuẩn σ , sau đó p f ( D ) = n Π i = 1 1 Điều này tương đương với 1
Chẳng có lý do gì bạn không thể cố gắng giảm thiểu các chỉ tiêu khác ngoài x ^ 2, chẳng hạn, đã có toàn bộ sách viết về hồi quy lượng tử, chẳng hạn, giảm thiểu ít nhiều | x | nếu bạn đang làm việc với trung bình. Nói chung, việc này khó thực hiện hơn và, tùy thuộc vào mô hình lỗi, có thể không đưa ra các công cụ ước tính tốt (tùy thuộc vào việc điều đó có nghĩa là các công cụ ước tính thấp hoặc không thiên vị hoặc MSE thấp trong ngữ cảnh).
Về lý do tại sao chúng ta thích các số nguyên hơn các số có giá trị bằng số thực, lý do chính có thể là do trong khi các số nguyên của số thực luôn dẫn đến số thực, thì các số không nguyên của số thực âm tạo ra các số phức, do đó yêu cầu sử dụng một giá trị tuyệt đối. Nói cách khác, trong khi khoảnh khắc thứ 3 của một biến ngẫu nhiên có giá trị thực là có thật, thì khoảnh khắc thứ 3,2 không nhất thiết là có thật và do đó gây ra các vấn đề diễn giải.
Ngoài ra ...
Chúng tôi cố gắng giảm thiểu phương sai còn lại trong các mô tả. Tại sao phương sai? Đọc câu hỏi này ; điều này cũng đi kèm với giả định (chủ yếu là im lặng) rằng các lỗi thường được phân phối.
Gia hạn:
Hai đối số bổ sung:
Đối với phương sai, chúng ta có "luật" tốt đẹp này rằng tổng phương sai bằng với phương sai của tổng, đối với các mẫu không tương quan. Nếu chúng tôi cho rằng lỗi không tương quan với trường hợp, việc giảm thiểu các ô vuông còn lại sẽ hoạt động đơn giản để tối đa hóa phương sai được giải thích, đó có thể là thước đo chất lượng không tốt nhưng vẫn phổ biến.
Nếu chúng ta giả sử tính chuẩn của một lỗi, thì ước lượng sai số bình phương nhỏ nhất là khả năng tối đa.
Trong bình phương tối thiểu thông thường, giải pháp cho (A'A) ^ (- 1) x = A'b giảm thiểu mất bình phương lỗi và là giải pháp khả năng tối đa.
Vì vậy, phần lớn là do toán học dễ dàng trong trường hợp lịch sử này.
Nhưng nhìn chung mọi người giảm thiểu nhiều hàm mất mát khác nhau , chẳng hạn như hàm mũ, logistic, cauch, laplace, huber, v.v ... Những hàm mất mát kỳ lạ này thường đòi hỏi nhiều tài nguyên tính toán và không có giải pháp dạng đóng (nói chung), vì vậy Bây giờ họ chỉ bắt đầu trở nên phổ biến hơn.