Giảm thiểu tổng độ lệch tuyệt đối ( Khoảng cách)


15

Tôi có một tập dữ liệu và muốn tìm tham số sao cho nó thu nhỏ tổng đó làx1,x2,,xkm

i=1k|mxi|.

minmi=1k|mxi|.

2
Bạn có thể xây dựng một chút?
Geoff Oxberry

Trong trường hợp đó, liệu giải pháp sau đó có phải là trung điểm giữa các giá trị tối đa và tối thiểu không?
Paul

@ Paul trung bình có thể giảm thiểu số tiền nhưng muốn biết làm thế nào nó có thể được thực hiện phân tích, đặc biệt là l1-giảm thiểu
mayenew

@kadu đúng vậy, trung vị là giải pháp. Tính toán trung bình phân tích là tầm thường; Chỉ cần sắp xếp và sau đó lấy giá trị trung bình.
David Ketcheson

Câu trả lời:


22

Có lẽ bạn yêu cầu một bằng chứng rằng trung vị giải quyết vấn đề? Vâng, điều này có thể được thực hiện như thế này:

Mục tiêu là piecewise tuyến tính và do đó khác biệt ngoại trừ các điểm . Độ dốc của vật kính là một số điểm m x i ? Chà, độ dốc là tổng các độ dốc của ánh xạ m | m - x j | và đây là + 1 (đối với m > x j ) hoặc - 1 (đối với m < x j ). Do đó, độ dốc biểu thị có bao nhiêu x i nhỏ hơn mm=ximxim|mxj|+1m>xj1m<xjxim. Bạn thấy rằng độ dốc bằng 0 nếu có nhiều nhỏ hơn và lớn hơn m (cho và số chẵn của x i ). Nếu có một số lẻ của x i thì độ dốc là - 1 bên trái của "middlest" và + 1 bên phải của nó, do đó mức trung bình là tối thiểu.ximxixi1+1


16

Một khái quát của vấn đề này cho nhiều chiều được gọi là vấn đề trung bình hình học . Như David chỉ ra, trung vị là giải pháp cho trường hợp 1-D; ở đó, bạn có thể sử dụng các thuật toán lựa chọn tìm trung bình , hiệu quả hơn so với sắp xếp. Sắp xếp là trong khi các thuật toán lựa chọn là O ( n ) ; sắp xếp chỉ hiệu quả hơn nếu cần nhiều lựa chọn, trong trường hợp đó bạn có thể sắp xếp (chi phí) một lần, và sau đó chọn liên tục từ danh sách đã sắp xếp.O(nlogn)O(n)

Liên kết đến vấn đề trung bình hình học đề cập đến các giải pháp cho các trường hợp đa chiều.


6

Giải pháp rõ ràng về mặt trung vị là chính xác, nhưng để đáp lại nhận xét của mayenew, đây là một cách tiếp cận khác.

Nó được nổi tiếng mà vấn đề giảm thiểu nói chung và vấn đề đăng tải nói riêng, có thể được giải quyết bằng cách quy hoạch tuyến tính.1

Công thức LP sau đây sẽ làm cho bài tập đã cho với ẩn số :zi,m

như rằng: z im - x i z ix i - m

minzi
zimxi
zixim

Rõ ràng phải bằng | x i - m | ở mức tối thiểu, do đó, yêu cầu tổng các giá trị tuyệt đối của các lỗi được giảm thiểu.zi|xim|


2

Cách phân tích lồi quá mạnh để chỉ ra rằng đây chỉ là những người nâng cấp. Trong thực tế, điều này tương đương với lý luận được sử dụng trong một số câu trả lời khác liên quan đến độ dốc.

|mxi|

m<xi

m=xi

m>xi

mx1,xk


0

argminmi=1N|mxi|

d|x|dx=sign(x)L1
i=1Nsign(mxi)
m=median{x1,x2,,xN}

Người ta cần lưu ý rằng medianmột nhóm riêng biệt không được xác định duy nhất.
Hơn nữa, nó không nhất thiết là một mục trong nhóm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.