Học máy vs Nhận dạng hệ thống?


12

Bất cứ ai có thể giải thích cho tôi sự khác biệt và tương đồng giữa học máy và nhận dạng hệ thống? Có phải đây chỉ là hai tên của cùng một thứ? Trong trang này , họ nói:

Các cộng đồng học máy và nhận dạng hệ thống đang phải đối mặt với các vấn đề tương tự trong đó người ta cần xây dựng một mô hình từ các quan sát hạn chế hoặc ồn ào.

Tôi cũng đã đọc các chương đầu của cuốn sách nổi tiếng Nhận dạng mẫu và Học máy của Christopher M. Bishop. Cho đến nay, kết luận của tôi là vấn đề mà nhận dạng hệ thống đang cố gắng giải quyết là một tập hợp con của những gì mà máy học đang cố gắng giải quyết.

Câu trả lời:


6

Nhận dạng hệ thống là khoa học xây dựng các mô hình động từ dữ liệu quan sát. Có hai cách tiếp cận chính: Xác định lỗi dự đoán (PEI) và Nhận dạng không gian con (SID). Cả hai đều cung cấp một mô hình tham số gọi là mô hình tham số cố định. Thông thường, đó là trường hợp người dùng chọn cấu trúc của hệ thống cơ bản (đặc biệt là trong các phương thức PEI) hoặc ít nhất là thứ tự của hệ thống (trong cả hai phương thức). Mặc dù không cần thiết, một hệ thống thứ tự thấp được tìm kiếm (có nghĩa là, số lượng các hệ số cơ bản là tương đối nhỏ) vì nó thường được sử dụng cho mục đích kiểm soát, vì vậy chúng tôi phải giữ nó đơn giản nhất có thể để tránh các vấn đề tính toán, vv Mô hình này có thể được sử dụng để đưa ra dự đoán về hành vi trong tương lai của hệ thống được đưa ra một số đầu vào.

Mặt khác, machine learning (ML) có hai nhánh chính là thuật toán phân loại và hồi quy. Những cái sau cũng được sử dụng cho mục đích dự đoán. Hai trong số các phương pháp tiếp cận nổi tiếng nhất trong học máy là Support Vector Machines (SVM) và quy trình Gaussian (GP). Sự khác biệt chính với các kỹ thuật nhận dạng hệ thống là các kỹ thuật ML đang cung cấp một mô hình không tham số. Cái sau có nghĩa là dự đoán cho một đầu vào mới được đưa ra như là một hàm của các điểm dữ liệu được sử dụng cho "đào tạo" (học tập, nhận dạng) của mô hình. Do đó, nếu chúng tôi sử dụng N = 1000 điểm dữ liệu cho khóa đào tạo, thì dự đoán sẽ được biểu thị dưới dạng một hàm của các điểm dữ liệu này. Các phương thức ML linh hoạt hơn vì chúng không yêu cầu bất kỳ lựa chọn cấu trúc nào từ người dùng, nhưng chúng phải đối mặt với các hạn chế khác (ví dụ:

Cho đến gần đây, ML và các kỹ thuật nhận dạng hệ thống đang phát triển độc lập. Nhưng trong những năm sau đó, có một nỗ lực lớn để thiết lập một điểm chung (ví dụ: xem bài viết "Bốn cuộc gặp gỡ với nhận dạng hệ thống" từ Ljung)


3

Bối cảnh: SysID và điều khiển anh chàng đã vào ML.

Tôi nghĩ rằng câu trả lời của user110686 thực hiện công việc giải thích một số khác biệt. SysID nhất thiết là về các mô hình động từ dữ liệu đầu vào / đầu ra, trong khi ML bao gồm một loại vấn đề rộng hơn. Nhưng sự khác biệt lớn nhất tôi thấy là làm với (a) bộ nhớ (số lượng tham số); (b) sử dụng cuối mô hình "đã học". Nhận dạng hệ thống rất giống một cách tiếp cận xử lý tín hiệu khi xem xét các biểu diễn miền tần số, phân tích tần số thời gian, v.v. Một số người ML gọi đây là "kỹ thuật tính năng".

(một bộ nhớ:SysID trở nên nổi bật từ lâu trước khi ML trở thành một lĩnh vực nghiên cứu. Do đó, thống kê và xử lý tín hiệu là cơ sở chính cho nền tảng lý thuyết, và tính toán là đáng sợ. Do đó, mọi người đã làm việc với lớp mô hình rất đơn giản (trao đổi Bias-Variance) với rất ít tham số. Chúng ta đang nói đến tối đa 30-40 tham số và chủ yếu là các mô hình tuyến tính ngay cả đối với các trường hợp mọi người biết rõ vấn đề là phi tuyến tính. Tuy nhiên, hiện tại tính toán rất rẻ nhưng SysID vẫn chưa ra khỏi vỏ. Mọi người nên bắt đầu nhận ra rằng chúng ta có các cảm biến tốt hơn nhiều bây giờ, có thể dễ dàng ước tính 1000 thông số với các bộ mô hình rất phong phú. Một số nhà nghiên cứu đã cố gắng sử dụng các mạng thần kinh cho SysID nhưng nhiều người dường như miễn cưỡng chấp nhận chúng là "chính thống" vì không có nhiều đảm bảo về mặt lý thuyết.

(b) Kết thúc sử dụng mô hình đã học: Bây giờ đây là một điều SysID đã rất đúng, nhưng nhiều thuật toán ML không thể nắm bắt được. Điều quan trọng là phải nhận ra rằng đối với các ứng dụng mục tiêu, bạn nhất thiết phải xây dựng các mô hình có thể được sử dụng hiệu quả để tối ưu hóa trực tuyến.Các mô hình này sẽ được sử dụng để tuyên truyền cho bất kỳ quyết định kiểm soát nào được đưa ra và khi thiết lập điều này thành một vấn đề kiểm soát tối ưu, các mô hình trở thành các ràng buộc. Vì vậy, khi sử dụng một cấu trúc mô hình cực kỳ phức tạp, nó làm cho việc tối ưu hóa trực tuyến trở nên khó khăn hơn nhiều. Cũng lưu ý rằng các quyết định trực tuyến này được thực hiện theo tỷ lệ giây hoặc ít hơn. Một giải pháp thay thế được đề xuất là trực tiếp tìm hiểu hàm giá trị theo cách ngoài chính sách để kiểm soát tối ưu. Điều này về cơ bản là củng cố việc học và tôi nghĩ có sự phối hợp tốt giữa SysID và RL.


1
Chào mừng bạn đến với Sàn giao dịch Khoa học Máy tính , Aravind!
David Richerby

2

Tôi muốn nói thêm rằng cũng có những cách tiếp cận phi tham số để nhận dạng hệ thống. Xem hộp công cụ SysId của MATLAB hoặc sách của Ljung để biết chi tiết. Phương pháp tiếp cận phi tham số thường được sử dụng để xác định trước các lớp mô hình cho các nghiên cứu tham số sau này. Ngoài ra, điều quan trọng là phải tách vấn đề ước tính khỏi vấn đề kiểm soát (nghĩ vòng lặp Aluminium). Khi xác định một hệ thống, mục tiêu thường là đặc trưng cho hệ thống mà không có bất kỳ đầu vào điều khiển cụ thể nào thuộc loại sẽ được thiết kế sau (nhưng điều này không phải lúc nào cũng có thể). Cuối cùng, tôi nghĩ thật hữu ích khi nhận ra rằng một hệ thống theo quan điểm toán học, một toán tử ánh xạ một không gian hàm thành một không gian hàm. Do đó phương trình vi phân thường là các loại điều được xác định và các hàm ánh xạ này cho các hàm. Các chức năng trong SysID thường là các chức năng liên tục của thời gian, còn gọi là tín hiệu thời gian liên tục. (Nhưng chúng cũng có thể là thời gian rời rạc.) Vì vậy, SysID không chỉ cố gắng ánh xạ các số thực (hoặc vectơ) thành số thực (hoặc vectơ); nó tìm cách xác định toán tử tốt nhất (LTI, LTV, phi tuyến tính, v.v.) để ánh xạ tín hiệu đầu vào thành tín hiệu đầu ra.


-2

Học máy: mô hình hóa cho mô hình tĩnh và mô hình động, Nhận dạng hệ thống: tập trung vào mô hình động hoặc quy trình động


1
Bạn trả lời hơi ngắn gọn, bạn có thể giải thích câu trả lời của mình một chút để cung cấp thêm chi tiết - ví dụ: sự khác biệt (nếu có - tôi không phải là chuyên gia) giữa mô hình động học máy và mô hình động nhận dạng hệ thống - hoặc là bạn nói rằng nhận dạng hệ thống chỉ tập trung vào học máy động, trong khi khu vực rộng có thành phần tĩnh? (Chỉ là ý tưởng về cách bạn có thể mở rộng câu trả lời của mình để làm cho câu trả lời tốt hơn - có thể chúng không phải là câu trả lời hay)
Luke Mathieson 30/03/13
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.