Tôi đang cố gắng để hiểu tối ưu hóa độ dốc gốc trong thuật toán ML (machine learning). Tôi hiểu rằng có một hàm chi phí, trong đó mục đích là để giảm thiểu lỗi . Trong trường hợp trọng số đang được tối ưu hóa để đưa ra lỗi tối thiểu và các đạo hàm riêng đang được sử dụng, nó có thay đổi cả và trong mỗi bước hay không hoặc là một sự kết hợp (ví dụ: trong vài lần lặp lại chỉ được thay đổi và khi không giảm lỗi nữa, đạo hàm bắt đầu bằng )? Ứng dụng này có thể là mô hình hồi quy tuyến tính, mô hình hồi quy logistic hoặc tăng thuật toán.
w1
, giảmw2
dựa trên hướng từ đạo hàm riêng để đạt cực tiểu cục bộ và chỉ để xác nhận thuật toán sẽ không nhất thiết phải đưa ra cực tiểu toàn cầu luôn?