Tôi không biết đây có phải là cách làm phổ biến / tốt nhất không, nhưng đó là một quan điểm khác về vấn đề này.
Nếu bạn có, giả sử, một ngày, bạn có thể coi mỗi trường là "biến danh mục" thay vì "biến liên tục". Ngày sẽ có một giá trị trong tập {1, 2 ..., 31}, tháng sẽ có giá trị trong {1, ..., 12} và trong năm, bạn chọn giá trị tối thiểu và tối đa và xây dựng một bộ.
Sau đó, vì các giá trị số cụ thể của ngày, tháng và năm có thể không hữu ích cho việc tìm xu hướng trong dữ liệu, hãy sử dụng biểu diễn nhị phân để mã hóa các giá trị số, mỗi bit là một tính năng. Ví dụ: tháng 5 sẽ là 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 là vị trí 1 trên 5, mỗi bit là một tính năng).
Vì vậy, ví dụ, có 10 năm trong "bộ năm", một ngày sẽ được chuyển thành một vectơ gồm 43 tính năng (= 31 + 12 + 10). Sử dụng "vectơ thưa thớt", số lượng tính năng không phải là vấn đề.
Một cái gì đó tương tự có thể được thực hiện cho dữ liệu thời gian, ngày trong tuần, ngày trong tháng ...
Tất cả phụ thuộc vào câu hỏi bạn muốn mô hình học máy của bạn trả lời.