Cho một mạng nơ ron lấy điểm dữ liệu đầu vào : . Ta nói là hoán vị bất biến nếu
cho bất kỳ hoán vị .
Ai đó có thể đề nghị một điểm bắt đầu (bài viết, ví dụ hoặc bài báo khác) cho các mạng nơ ron bất biến hoán vị?
Cho một mạng nơ ron lấy điểm dữ liệu đầu vào : . Ta nói là hoán vị bất biến nếu
cho bất kỳ hoán vị .
Ai đó có thể đề nghị một điểm bắt đầu (bài viết, ví dụ hoặc bài báo khác) cho các mạng nơ ron bất biến hoán vị?
Câu trả lời:
Theo tôi biết, không ai đã thử điều này, do cách cấu trúc mạng. Mỗi đầu vào có một tập các trọng số, được kết nối với nhiều đầu vào hơn. Nếu đầu vào chuyển đổi, đầu ra cũng sẽ .
Tuy nhiên, bạn có thể xây dựng một mạng tiếp cận hành vi này. Trong tập huấn luyện của bạn, hãy sử dụng học tập theo đợt và cho từng mẫu đào tạo, đưa ra tất cả các hoán vị có thể có cho mạng để nó học được bất biến hoán vị. Điều này sẽ không bao giờ chính xác là bất biến, nó chỉ có thể là gần gũi .
Một cách khác để làm điều này là có trọng số được nhân rộng cho tất cả các đầu vào. Ví dụ: giả sử bạn có 3 đầu vào (i0, i1, i2) và lớp ẩn tiếp theo có 2 nút (hl0, hl1) và chức năng kích hoạt F. Giả sử một lớp được kết nối đầy đủ, bạn có 2 trọng số w0 và w1. Các nút của lớp ẩn hl0 và hl1 được đưa ra, tương ứng, bởi
hl0 = F (i0w0 + i1w0 + i2w0)
hl1 = F (i0w1 + i1w1 + i2w1)
Do đó cung cấp cho bạn một lớp ẩn có giá trị là bất biến hoán vị từ đầu vào. Từ bây giờ, bạn có thể tìm hiểu và xây dựng phần còn lại của mạng khi bạn thấy phù hợp. Đây là một cách tiếp cận bắt nguồn từ các lớp chập.
Off-topic, đây có vẻ như là một dự án tuyệt vời. Nếu bạn muốn hợp tác trong một số dự án nghiên cứu, liên hệ với tôi (kiểm tra hồ sơ của tôi)
Đây là một vài thứ có thể là thứ bạn đang tìm kiếm:
Tôi đã triển khai Lớp Permutational tại đây bằng cách sử dụng Keras: https://github.com/off99555/superkeras/blob/master/permutational_layer.py
Bạn có thể gọi PermutationalModule
hàm để sử dụng nó.
Thực hiện theo bài viết này: https://arxiv.org/pdf/1612.04530.pdf
Ý tưởng là so sánh tất cả các cặp N ^ 2 cặp từ N đầu vào, sử dụng mô hình với các trọng số được chia sẻ, sau đó sử dụng hàm gộp N lần trên N đầu vào. Đầu ra bạn có thể sử dụng gộp lại nhưng trong bài báo, họ không đề cập đến việc gộp khác.