Trong nhiều ứng dụng học máy, cái gọi là phương pháp tăng dữ liệu đã cho phép xây dựng các mô hình tốt hơn. Ví dụ, giả sử một bộ huấn luyện gồm hình ảnh của mèo và chó. Bằng cách xoay, phản chiếu, điều chỉnh độ tương phản, v.v ... có thể tạo ra hình ảnh bổ sung từ ảnh gốc.
Trong trường hợp hình ảnh, việc tăng dữ liệu tương đối đơn giản. Tuy nhiên, giả sử (ví dụ) rằng người ta có một bộ huấn luyện gồm mẫu và vài trăm biến liên tục đại diện cho những thứ khác nhau. Việc tăng dữ liệu không còn có vẻ trực quan nữa. Những gì có thể được thực hiện trong trường hợp như vậy?