Tương tự
Về cơ bản cả hai loại thuật toán đã được phát triển để trả lời một câu hỏi chung trong các ứng dụng học máy:
Đưa ra các yếu tố dự đoán (yếu tố) - làm thế nào để kết hợp các tương tác giữa các yếu tố này để tăng hiệu suất?x1, x2, Lọ , xp
Một cách là chỉ cần giới thiệu dự đoán mới: Tuy nhiên, điều này chứng tỏ là ý tưởng tồi do số lượng lớn các thông số và loại rất cụ thể của sự tương tác.xp + 1= x1x2, xp + 2= x1x3, ...
Cả hai thuật toán mô hình đa cấp và Deep Learning đều trả lời câu hỏi này bằng cách giới thiệu mô hình tương tác thông minh hơn nhiều. Và từ quan điểm này, chúng rất giống nhau.
Sự khác biệt
Bây giờ hãy để tôi cố gắng đưa ra hiểu biết của tôi về sự khác biệt khái niệm lớn giữa chúng là gì. Để đưa ra một số lời giải thích, chúng ta hãy xem các giả định mà chúng ta đưa ra trong mỗi mô hình:
Mô hình đa cấp: 1 lớp phản ánh cấu trúc dữ liệu có thể được biểu diễn dưới dạng Mạng phân cấp Bayes . Mạng này là cố định và thường đến từ các ứng dụng miền.1
Deep Learning: 2 dữ liệu được tạo ra bởi sự tương tác của nhiều yếu tố. Cấu trúc của các tương tác không được biết, nhưng có thể được biểu diễn dưới dạng một hệ số phân lớp: các tương tác cấp cao hơn có được bằng cách chuyển đổi các biểu diễn cấp thấp hơn.2
Sự khác biệt cơ bản đến từ cụm từ "cấu trúc của các tương tác không được biết đến" trong Deep Learning. Chúng ta có thể giả sử một số linh mục về loại tương tác, nhưng thuật toán xác định tất cả các tương tác trong quá trình học tập. Mặt khác, chúng ta phải xác định cấu trúc của các tương tác cho mô hình đa cấp (chúng ta chỉ học thay đổi các tham số của mô hình sau đó).
Ví dụ
x1, x2, x3{ x1}{ x2, x3}
x1x2x1x3x2x3
Trong Deep learning, ví dụ như trong các máy Boltzmann đa cấp ( RBM ) có hai lớp ẩn và chức năng kích hoạt tuyến tính, chúng ta sẽ có tất cả các tương tác đa thức có thể có độ nhỏ hơn hoặc bằng ba.
Ưu điểm và nhược điểm chung
Mô hình đa cấp
(-) cần xác định cấu trúc của các tương tác
(+) kết quả thường dễ giải thích hơn
(+) có thể áp dụng các phương pháp thống kê (đánh giá khoảng tin cậy, kiểm tra các giả thuyết)
Học kĩ càng
(-) yêu cầu lượng dữ liệu khổng lồ để đào tạo (và cả thời gian đào tạo nữa)
(-) kết quả thường không thể diễn giải (được cung cấp dưới dạng hộp đen)
(+) không có kiến thức chuyên môn cần thiết
(+) một khi được đào tạo tốt, thường vượt trội so với hầu hết các phương pháp chung khác (không dành riêng cho ứng dụng)
Hy vọng nó sẽ giúp!