Mọi kiến trúc bộ mã hóa tự động mà tôi thấy có một kiến trúc tương tự nhau, chủ yếu là bộ giải mã chỉ là mặt trái của bộ mã hóa. Nếu mục tiêu của bộ giải mã tự động là học tính năng chiều thấp, tại sao bộ giải mã không đơn giản? Một ví dụ sẽ là một phép biến đổi tuyến tính Ở đâu là một quan sát bởi ma trận tính năng (tức là nút cổ chai) và là một ma trận trọng lượng đã học mà bản đồ đến kích thước tính năng đầu vào ban đầu. Trong trường hợp bộ mã hóa tự động sâu có nhiều lớp ẩn, bộ giải mã trong ví dụ trên sẽ có dung lượng thấp so với bộ mã hóa.
Trực giác của tôi là như sau:
Nếu bộ giải mã đơn giản, thì bộ mã hóa tự động buộc phải tìm hiểu các tính năng chất lượng cao hơn trong nút cổ chai để bù lại. Ngược lại, nếu bộ giải mã có khả năng biểu diễn cao, nó có thể ánh xạ một nút cổ chai được học kém để tái cấu trúc đầu ra một cách hiệu quả. Lỗi tái cấu trúc có thể thấp hơn trong trường hợp này, nhưng điều đó không nhất thiết có nghĩa là các tính năng đã học thực sự tốt hơn.
Trong ứng dụng của riêng tôi (tính năng học trên biểu đồ), tôi đã thấy rằng một bộ giải mã đơn giản dẫn đến các tính năng được học tốt hơn so với bộ giải mã chỉ phản chiếu bộ mã hóa. Trong bài báo này , các tác giả thiết kế một bộ giải mã tự động đồ thị với bộ giải mã rất đơn giản như Ở đâu là ma trận kề đồ thị được xây dựng lại, là ma trận tính năng đã học và là một số chuyển đổi phi tuyến tính như ReLU.
Tôi đã tìm kiếm một câu trả lời cho câu hỏi này trong một thời gian nhưng tôi không tìm thấy bất kỳ lời giải thích hoặc kết quả lý thuyết nào về lý do tại sao một bộ giải mã công suất cao hơn là thích hợp hơn với một công suất thấp (hoặc ngược lại ). Nếu bất cứ ai có thể cung cấp một lời giải thích hoặc chỉ cho tôi đi đúng hướng tôi sẽ biết ơn.