Phối hợp gốc xuống cập nhật một tham số tại một thời điểm, trong khi độ dốc gốc cố gắng cập nhật tất cả các tham số cùng một lúc.
Thật khó để xác định chính xác khi nào một thuật toán sẽ làm tốt hơn thuật toán kia. Ví dụ, tôi đã rất sốc khi biết rằng phối hợp gốc là trạng thái nghệ thuật cho LASSO. Và tôi không phải là người duy nhất; xem slide 17 .
Như đã nói, có một số tính năng có thể khiến vấn đề trở nên dễ sửa đổi hơn để phối hợp gốc:
(1) Cập nhật điều kiện nhanh. Nếu, vì một số lý do, vấn đề cho phép một người tối ưu hóa các tham số riêng lẻ rất nhanh, phối hợp gốc có thể sử dụng điều này. Ví dụ, người ta có thể cập nhật một số tham số nhất định chỉ bằng một tập hợp con của dữ liệu, giúp giảm đáng kể chi phí tính toán của các cập nhật này. Một trường hợp khác là nếu có một giải pháp dạng đóng cho một tham số riêng lẻ, có điều kiện dựa trên các giá trị của tất cả các tham số khác.
(2) Các chế độ tương đối độc lập cho các tham số. Nếu giá trị tối ưu của một tham số hoàn toàn độc lập với các giá trị tham số khác, thì một vòng gốc tọa độ sẽ dẫn đến giải pháp (giả sử rằng mỗi cập nhật tọa độ tìm thấy chế độ hiện tại). Mặt khác, nếu chế độ cho một tham số đã cho phụ thuộc rất nhiều vào các giá trị tham số khác, thì việc giảm tọa độ rất có thể sẽ nhích lên, với các cập nhật rất nhỏ ở mỗi vòng.
Thật không may, đối với hầu hết các vấn đề, (2) không giữ được, vì vậy hiếm khi phối hợp gốc không thực hiện tốt so với các thuật toán thay thế. Tôi tin rằng lý do nó hoạt động tốt cho LASSO là có rất nhiều thủ thuật người ta có thể sử dụng để ban hành điều kiện (1).
α