Trong blog học máy tôi thường xuyên bắt gặp từ "vanilla". Ví dụ: "Vanilla Gradient Descent" hoặc "Vanilla method". Thuật ngữ này theo nghĩa đen là không bao giờ thấy trong bất kỳ sách giáo khoa tối ưu hóa.
Ví dụ, trong bài viết này , nó nói:
Đây là hình thức đơn giản nhất của kỹ thuật giảm độ dốc. Ở đây, vani có nghĩa là tinh khiết / không có bất kỳ sự pha trộn nào. Tính năng chính của nó là chúng tôi thực hiện các bước nhỏ theo hướng cực tiểu bằng cách lấy độ dốc của hàm chi phí.
Xin cầu nguyện, "ngoại tình" nghĩa là gì trong bối cảnh này? Tác giả đi xa hơn bằng cách đối chiếu độ dốc vanilla với độ dốc dốc với động lượng. Vì vậy, trong trường hợp này, vanilla gradient descent là một từ khác để chỉ độ dốc.
Trong một bài viết khác , nó nói,
Giảm dần độ dốc vani, còn gọi là giảm độ dốc hàng loạt, ...
Đáng buồn là tôi cũng chưa bao giờ nghe nói về việc giảm độ dốc hàng loạt. Oh Boy.
Ai đó có thể làm rõ "vanilla" nghĩa là gì và nếu có một định nghĩa toán học vững chắc hơn cho nó?