Mạng lưới niềm tin sâu sắc hay Deep Boltzmann Machines?


28

Tôi bối rối. Có sự khác biệt giữa mạng niềm tin Deep và Máy Deep Boltzmann không? Nếu vậy, sự khác biệt là gì?


2
bài viết trên wikipedia về các mạng lưới niềm tin sâu sắc khá rõ ràng mặc dù sẽ rất hữu ích / sâu sắc khi có một bức tranh lớn hơn về từ nguyên / lịch sử của các thuật ngữ. về cơ bản, một mạng lưới niềm tin sâu tương đối giống với một mạng lưới thần kinh sâu từ PTC xác suất, và các máy Boltzmann sâu là một thuật toán được sử dụng để thực hiện một mạng lưới niềm tin sâu sắc. rõ ràng tất cả các ANN đều có các mô hình / mô hình xác suất nhưng chúng không dễ dàng / trực tiếp thu được như một số mô hình "niềm tin" theo định hướng bay bổng / xác suất.
vzn

Câu trả lời:


19

Mặc dù Deep Belief Networks (DBNs) và Deep Boltzmann Machines (DBMs) về mặt sơ đồ trông rất giống nhau, nhưng thực tế chúng rất khác nhau về chất. Điều này là do các DBN được định hướng và DBM không bị ảnh hưởng. Nếu chúng ta muốn ghép chúng vào bức tranh ML rộng hơn, chúng ta có thể nói DBN là mạng niềm tin sigmoid với nhiều lớp biến liên kết dày đặc và DBM là các trường ngẫu nhiên markov với nhiều lớp biến ẩn dày đặc được kết nối.

Vì vậy, họ thừa hưởng tất cả các thuộc tính của các mô hình. Ví dụ, trong một máy tính DBN , trong đó là lớp hiển thị và là các biến ẩn là dễ dàng. Mặt khác, tính toán của bất cứ thứ gì thường không thể tính toán được trong DBM do chức năng phân vùng khó điều khiển.v h PP(v|h)vhP

Điều đó đang được nói có những điểm tương đồng. Ví dụ:

  1. Các DBN và DBM ban đầu đều hoạt động bằng cách sử dụng các sơ đồ khởi tạo dựa trên đào tạo từng lớp tham lam của các máy Bolzmann bị hạn chế (RBM),
  2. Cả hai đều "sâu".
  3. Cả hai đều có các lớp biến tiềm ẩn được kết nối dày đặc với các lớp bên trên và bên dưới, nhưng không có kết nối nội bộ, v.v.

1
Làm thế nào các DBN có thể là mạng lưới niềm tin sigmoid? !! Các lớp của một DBN là RBM, vì vậy mỗi lớp là một trường ngẫu nhiên markov!
Jack Twain

Tôi nghĩ rằng có một lỗi đánh máy ở đây "Điều này là do DBM được định hướng và DBM không bị ảnh hưởng." Tôi nghĩ bạn có nghĩa là các DBN không bị ảnh hưởng
Jack Twain

@AlexTwain Có, nên đọc "DBNs được hướng dẫn". Mặc dù bạn có thể giới thiệu một DBN bằng cách đầu tiên học một loạt RBM, nhưng cuối cùng, bạn thường cởi trói cho các trọng số và kết thúc với một mạng lưới niềm tin sigmoid sâu (theo chỉ dẫn). Trong rất nhiều công việc DBN ban đầu, mọi người đã bỏ đi lớp trên cùng mà không bị ảnh hưởng và sau đó bị phạt với một cái gì đó như thức dậy, trong trường hợp bạn có một con lai.
alto

Bạn có nghĩa là trong 3. rằng họ không có các kết nối intralayer "(ví dụ giữa các nút trong lớp ẩn) chứ không phải * interlayer (ví dụ: từ đầu vào đến lớp ẩn)?
ddiez

@ddiez Vâng, đó là cách nên đọc. Cảm ơn đã sửa chữa.
alto

4

Cả hai đều là mô hình đồ họa xác suất bao gồm các lớp RBM xếp chồng lên nhau. Sự khác biệt là cách các lớp này được kết nối.

Liên kết này làm cho nó khá rõ ràng: http://jmlr.org/proceedings/ con / v5 / salakhutdinov09a / salakhutdinov09a.pdf . Hình 2 và Mục 3.1 đặc biệt có liên quan.

Để tóm tắt:

Trong một DBN, các kết nối giữa các lớp được định hướng. Do đó, hai lớp đầu tiên tạo thành một RBM (một mô hình đồ họa không bị ngăn cản), sau đó các lớp tiếp theo tạo thành một mô hình thế hệ có hướng.

Trong một DBM, kết nối giữa tất cả các lớp là không bị ảnh hưởng, do đó mỗi cặp lớp tạo thành một RBM.


Vì vậy, một máy Boltzmann sâu vẫn được xây dựng từ RBM? Tôi đang dựa vào kết luận của mình về phần giới thiệu và hình ảnh trong bài báo
Marin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.