Tiền xử lý là gì và làm thế nào để bạn ngăn chặn một mạng lưới thần kinh?


10

Tôi hiểu rằng sơ tuyển được sử dụng để tránh một số vấn đề với đào tạo thông thường. Nếu tôi sử dụng backpropagation, giả sử là một bộ mã hóa tự động, tôi biết rằng tôi sẽ gặp phải các vấn đề về thời gian bởi vì backpropagation chậm và tôi cũng có thể bị mắc kẹt trong tối ưu cục bộ và không học được một số tính năng nhất định.

Những gì tôi không hiểu là làm thế nào chúng ta giả bộ một mạng và cụ thể chúng ta làm gì để giả bộ. Ví dụ: nếu chúng tôi được cung cấp một nhóm Máy Boltzmann bị hạn chế, chúng tôi sẽ xử lý mạng này như thế nào?


2
Trừ khi bạn ở trong một môi trường chỉ có một vài mẫu được dán nhãn và nhiều mẫu không nhãn, việc sơ chế được coi là lỗi thời. Nếu đó không phải là trường hợp, sử dụng hàm truyền chỉnh lưu và các trình tối ưu hóa nâng cao (rmsprop, adadelta, adam) hoạt động tốt như nhau đối với các mạng thần kinh sâu. f(x)=max(x,0)
bayerj

Vâng, tôi đang làm việc theo một giả định rằng có một lượng lớn các mẫu không nhãn và một vài mẫu không có nhãn.
Michael Yousef

Câu trả lời:


2

Bạn bắt đầu bằng cách đào tạo từng RBM trong ngăn xếp riêng biệt và sau đó kết hợp thành một mô hình mới có thể được điều chỉnh thêm.

Giả sử bạn có 3 RBM, bạn huấn luyện RBM1 với dữ liệu của mình (ví dụ: một loạt các hình ảnh). RBM2 được đào tạo với đầu ra của RBM1. RBM3 được đào tạo với đầu ra của RBM2. Ý tưởng là mỗi mô hình RBM có tính năng đại diện cho hình ảnh và trọng lượng mà chúng học được khi làm như vậy rất hữu ích trong các nhiệm vụ phân biệt đối xử khác như phân loại.


0

Tiền xử lý một RBM xếp chồng là để tham lam từng lớp giảm thiểu năng lượng xác định, nghĩa là tối đa hóa khả năng. G. Hinton đã đề xuất thuật toán CD-k, có thể được xem như là một lần lặp lại của việc lấy mẫu Gibbs.


Vì vậy, việc xử lý trước RBM xếp chồng cho phép chúng ta giảm thiểu năng lượng xác định và có được kết quả tốt hơn. Và sau đó, thuật toán phân kỳ tương phản của Hinton là cách chúng ta thực sự giả bộ. Làm thế nào chính xác làm yếu tố trước khi học các tính năng bổ sung? Tôi giả sử về vấn đề tốc độ, thuật toán CD nhanh hơn nhiều so với truyền ngược.
Michael Yousef
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.