Câu hỏi được gắn thẻ «deep-learning»

Một lĩnh vực học máy liên quan đến việc học các biểu diễn phân cấp của dữ liệu, chủ yếu được thực hiện với các mạng lưới thần kinh sâu.


2
Mối quan hệ của hàm mục tiêu lấy mẫu âm (NS) với hàm mục tiêu ban đầu trong word2vec là gì?
Tôi đã đọc mô hình word2vec tiêu chuẩn / nổi tiếng và theo ghi chú của standord cho cs224n , hàm mục tiêu thay đổi từ: Joriginal=−∑j=0,j≠m2mu⊤c−m+jvc+2mlog(∑k=1|V|exp(u⊤kvc))Joriginal=−∑j=0,j≠m2muc−m+j⊤vc+2mlog(∑k=1|V|exp(uk⊤vc))J_{original} = -\sum^{2m}_{j=0,j\neq m} u^\top_{c-m+j} v_c + 2m log \left( \sum^{|V|}_{k=1} exp(u^{\top}_k v_c) \right) đến: JNS1=−logσ(u⊤c−m+jvc)−∑k=1Klogσ(−u⊤kvc)JNS1=−logσ(uc−m+j⊤vc)−∑k=1Klogσ(−uk⊤vc)J_{NS1} = -log \sigma( u^\top_{c-m+j} v_c ) - \sum^{K}_{k=1} …


1
vá đào tạo khôn ngoan và đào tạo tích chập hoàn toàn trong mạng lưới thần kinh tích chập hoàn toàn
Trong bài báo về mạng nơ ron tích chập hoàn toàn , các tác giả đề cập đến cả vá đào tạo khôn ngoan và đào tạo chập hoàn toàn. Sự hiểu biết của tôi cho việc xây dựng tập huấn luyện như sau: Đưa ra một M*Mhình ảnh, trích …

3
Tính toán Cập nhật Gradient diễn viên trong thuật toán Gradient chính sách xác định sâu (DDPG)
Câu hỏi này liên quan đến bài viết Deepmind trên DDPG: https://arxiv.org/pdf/1509.02971v5.pdf . Hầu hết (tất cả?) Việc triển khai thuật toán DDPG mà tôi đã thấy tính toán cập nhật độ dốc cho mạng diễn viên theo , trong đó đại diện cho các tham số của mạng diễn …





1
Có sự đồng thuận hiện tại về giá trị của Nguyên tắc tắc nghẽn thông tin để hiểu Deep Learning không?
Vào năm 2015, Tishby và Zaslavsky đã xuất bản một bài báo nổi tiếng tuyên bố rằng cái gọi là Nguyên tắc thắt cổ chai thông tin có thể được sử dụng để hiểu một số hành vi của các mạng lưới thần kinh sâu sắc. Trong một bài báo …





1
Giảm kích thước phi tuyến: thuật toán hình học / cấu trúc liên kết so với bộ tự động
Theo tôi hiểu, có ba cách tiếp cận chính để giảm kích thước phi tuyến: Học tập đa dạng (các thuật toán hình học / topo như ISOMAP, LLE, LTSA) Bộ tự động những thứ không phù hợp với 2 loại đầu tiên (xác suất lấy cảm hứng từ t-SNE, …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.