Bối cảnh: SysID và điều khiển anh chàng đã vào ML.
Tôi nghĩ rằng câu trả lời của user110686 thực hiện công việc giải thích một số khác biệt. SysID nhất thiết là về các mô hình động từ dữ liệu đầu vào / đầu ra, trong khi ML bao gồm một loại vấn đề rộng hơn. Nhưng sự khác biệt lớn nhất tôi thấy là làm với (a) bộ nhớ (số lượng tham số); (b) sử dụng cuối mô hình "đã học". Nhận dạng hệ thống rất giống một cách tiếp cận xử lý tín hiệu khi xem xét các biểu diễn miền tần số, phân tích tần số thời gian, v.v. Một số người ML gọi đây là "kỹ thuật tính năng".
(một bộ nhớ:SysID trở nên nổi bật từ lâu trước khi ML trở thành một lĩnh vực nghiên cứu. Do đó, thống kê và xử lý tín hiệu là cơ sở chính cho nền tảng lý thuyết, và tính toán là đáng sợ. Do đó, mọi người đã làm việc với lớp mô hình rất đơn giản (trao đổi Bias-Variance) với rất ít tham số. Chúng ta đang nói đến tối đa 30-40 tham số và chủ yếu là các mô hình tuyến tính ngay cả đối với các trường hợp mọi người biết rõ vấn đề là phi tuyến tính. Tuy nhiên, hiện tại tính toán rất rẻ nhưng SysID vẫn chưa ra khỏi vỏ. Mọi người nên bắt đầu nhận ra rằng chúng ta có các cảm biến tốt hơn nhiều bây giờ, có thể dễ dàng ước tính 1000 thông số với các bộ mô hình rất phong phú. Một số nhà nghiên cứu đã cố gắng sử dụng các mạng thần kinh cho SysID nhưng nhiều người dường như miễn cưỡng chấp nhận chúng là "chính thống" vì không có nhiều đảm bảo về mặt lý thuyết.
(b) Kết thúc sử dụng mô hình đã học: Bây giờ đây là một điều SysID đã rất đúng, nhưng nhiều thuật toán ML không thể nắm bắt được. Điều quan trọng là phải nhận ra rằng đối với các ứng dụng mục tiêu, bạn nhất thiết phải xây dựng các mô hình có thể được sử dụng hiệu quả để tối ưu hóa trực tuyến.Các mô hình này sẽ được sử dụng để tuyên truyền cho bất kỳ quyết định kiểm soát nào được đưa ra và khi thiết lập điều này thành một vấn đề kiểm soát tối ưu, các mô hình trở thành các ràng buộc. Vì vậy, khi sử dụng một cấu trúc mô hình cực kỳ phức tạp, nó làm cho việc tối ưu hóa trực tuyến trở nên khó khăn hơn nhiều. Cũng lưu ý rằng các quyết định trực tuyến này được thực hiện theo tỷ lệ giây hoặc ít hơn. Một giải pháp thay thế được đề xuất là trực tiếp tìm hiểu hàm giá trị theo cách ngoài chính sách để kiểm soát tối ưu. Điều này về cơ bản là củng cố việc học và tôi nghĩ có sự phối hợp tốt giữa SysID và RL.