Vì vậy, tôi đã chơi xung quanh với các SVM và tôi tự hỏi liệu đây có phải là một điều tốt để làm không:
Tôi có một bộ các tính năng liên tục (0 đến 1) và một bộ các tính năng phân loại mà tôi đã chuyển đổi thành các biến giả. Trong trường hợp cụ thể này, tôi mã hóa ngày của phép đo trong một biến giả:
Có 3 giai đoạn tôi có dữ liệu và tôi dành 3 số tính năng cho chúng:
20: 21: 22:
Vì vậy, tùy thuộc vào thời gian dữ liệu đến từ đâu, các tính năng khác nhau sẽ được gán 1; những người khác sẽ nhận được 0.
SVM sẽ hoạt động đúng với điều này hay đây là một điều xấu phải làm?
Tôi sử dụng SVMLight và một kernel tuyến tính.