Tìm sự khác biệt có thể được thực hiện bằng cách nhìn vào các mô hình. Trước tiên hãy xem mã hóa thưa thớt.
Mã hóa thưa thớt
Mã hóa thưa thớt giảm thiểu mục tiêu
trong đó là ma trận cơ sở, H là ma trận mã và là ma trận dữ liệu chúng ta muốn biểu diễn. thực hiện một giao dịch giữa thưa thớt và tái thiết. Lưu ý rằng nếu chúng ta được cung cấp , việc ước tính là dễ dàng thông qua các bình phương tối thiểu.
Lsc=||WH−X||22reconstruction term+λ||H||1sparsity term
WXλHW
Ban đầu, chúng tôi không có tuy nhiên. Tuy nhiên, nhiều thuật toán tồn tại mà có thể giải quyết được mục tiêu trên đối với với . Trên thực tế, đây là cách chúng ta suy luận: chúng ta cần giải quyết một vấn đề tối ưu hóa nếu chúng ta muốn biết thuộc về một không nhìn thấy .HHxhx
Bộ mã hóa tự động
Bộ mã hóa tự động là một họ của các mạng thần kinh không được giám sát. Có khá nhiều trong số họ, ví dụ như bộ mã hóa tự động sâu hoặc những người có các thủ thuật chính quy hóa khác nhau được đính kèm - ví dụ như khử nhiễu, hợp đồng, thưa thớt. Thậm chí còn tồn tại những mạng xác suất, chẳng hạn như mạng ngẫu nhiên thế hệ hoặc bộ mã hóa tự động đa dạng. Hình thức trừu tượng nhất của họ là
nhưng chúng tôi sẽ đi cùng với một đơn giản hơn nhiều một cho bây giờ:
L ae = | | W σ ( W T X )
D(d(e(x;θr);θd),x)
nơi
σ là một hàm phi tuyến như sigmoid logistic
σ ( x ) = 1Lae=||Wσ(WTX)−X||2
σ .
σ(x)=11+exp(−x)
Điểm tương đồng
Lưu ý rằng ngoại hình gần giống như L một e khi chúng tôi thiết H = σ ( W T X ) . Sự khác biệt của cả hai là i) bộ mã hóa tự động không khuyến khích sự thưa thớt ở dạng chung ii) bộ mã hóa tự động sử dụng mô hình để tìm mã, trong khi mã hóa thưa thớt làm như vậy bằng phương pháp tối ưu hóa.LscLaeH=σ(WTX)
Đối với dữ liệu hình ảnh tự nhiên, bộ mã hóa tự động thường xuyên và mã hóa thưa thớt có xu hướng mang lại rất giống nhau . Tuy nhiên, bộ mã hóa tự động hiệu quả hơn nhiều và dễ dàng khái quát hóa cho các mô hình phức tạp hơn nhiều. Ví dụ, bộ giải mã có thể rất phi tuyến, ví dụ như một mạng nơ ron sâu. Hơn nữa, người ta không bị ràng buộc với tổn thất bình phương (theo đó ước tính của W cho L s cWWLsc .)
Ngoài ra, các phương pháp khác nhau của biểu diễn năng suất chính quy với đặc tính khác nhau. Bộ mã hóa tự động khử nhiễu cũng đã được chứng minh là tương đương với một dạng RBM nhất định, v.v.
Nhưng tại sao?
Nếu bạn muốn giải quyết vấn đề dự đoán, bạn sẽ không cần bộ mã hóa tự động trừ khi bạn chỉ có ít dữ liệu được dán nhãn và nhiều dữ liệu không được gắn nhãn. Sau đó, bạn thường sẽ tốt hơn để đào tạo một bộ mã hóa tự động sâu và đặt một SVM tuyến tính lên trên thay vì đào tạo một mạng lưới thần kinh sâu.
Tuy nhiên, chúng là những mô hình rất mạnh để nắm bắt đặc điểm phân phối. Điều này là mơ hồ, nhưng nghiên cứu biến điều này thành sự thật thống kê cứng hiện đang được tiến hành. Các mô hình Gaussian tiềm ẩn sâu hay còn gọi là Bộ mã hóa tự động biến đổi hoặc mạng ngẫu nhiên chung là những cách khá thú vị để có được bộ mã hóa tự động có thể ước tính phân phối dữ liệu cơ bản.