Định lý của Deep Deep Noether: Xây dựng trong các ràng buộc đối xứng


9

Nếu tôi có một vấn đề học tập cần có sự đối xứng vốn có, có cách nào để đặt vấn đề học tập của tôi vào một ràng buộc đối xứng để tăng cường học tập không?

Ví dụ, nếu tôi đang thực hiện nhận dạng hình ảnh, tôi có thể muốn đối xứng xoay 2D. Có nghĩa là phiên bản xoay của một hình ảnh sẽ nhận được kết quả giống như bản gốc.

Hoặc nếu tôi đang học chơi tic-tac-toe, thì xoay 90deg sẽ mang lại cách chơi tương tự.

Đã có nghiên cứu nào được thực hiện về điều này?



@Emre Cảm ơn! Bạn có biết về bất kỳ công việc nào bên ngoài CNN không?
Aidan.plenert.macdonald

Không, tôi chỉ có kiến ​​thức hời hợt về lĩnh vực này. Mặc dù vậy, CNN dường như là một khung cảnh tự nhiên ...
Emre

3
Tôi cũng nên đề cập đến luận án tiến sĩ của Risi Kondor, Phương pháp lý thuyết nhóm trong học máy (pdf)
Emre

Câu trả lời:


8

Từ nhận xét của Emre ở trên, Phần 4.4 của các phương pháp lý thuyết nhóm trong học máy của Risi Kondor có thông tin chi tiết và bằng chứng về việc tạo các phương thức kernel vốn có đối xứng. Tôi sẽ tóm tắt nó một cách trực quan hy vọng (tôi là một nhà vật lý không phải là nhà toán học!).

Hầu hết các thuật toán ML có phép nhân ma trận như, với là đầu vào và là trọng số chúng tôi muốn đào tạo.

si=jWij xj=jWij (ejx)
xWij

Phương pháp hạt nhân

Nhập địa hạt của các phương thức kernel và để thuật toán xử lý đầu vào thông qua, trong đó bây giờ chúng ta khái quát hóa cho .

si=jWij k(ej, x)
x,ejX

Hãy xem xét một nhóm có tác dụng trên qua cho . Một cách đơn giản để làm cho thuật toán của chúng ta bất biến trong nhóm này là tạo kernel, với .GXxTg(x)gG

kG(x,y)=1|G|gGk(x,Tg(y))
k(x,y)=k(Tg(x),Tg(y))

Vì vậy,

kG(x,Th(y))=1|G|gGk(x,Tgh(y))=1|G|gGk(x,Tg(y))=1|G|gGk(Tg(x),y)

Với hoạt động cho tất cả các biểu diễn đơn nhất,k(x,y)=xy

kG(x,Th(y))=[1|G|gGTg(x)]y

Cung cấp một ma trận biến đổi có thể đối xứng hóa đầu vào thành thuật toán.

Ví dụ SO (2)

Trên thực tế, chỉ có nhóm ánh xạ tới các phép quay để đơn giản.π2

Chúng ta hãy chạy hồi quy tuyến tính trên dữ liệu trong đó chúng ta mong đợi sự đối xứng quay.(xi,yi)R2×R

Vấn đề tối ưu hóa của chúng tôi trở thành,

minWji12(yiy~i)2y~i=jWjkG(ej,xi)+bi

Hạt nhân thỏa mãn . Bạn cũng có thể sử dụng và nhiều loại nhân.k(x,y)=xy2k(x,y)=k(Tg(x),Tg(y))k(x,y)=xy

Do đó,

kG(ej,xi)=14n=14R(nπ/2) ejxi2=14n=14(cos(nπ/2)xi1)2+(sin(nπ/2)xi2)2=14[2xi12+2xi22+(1xi1)2+(1xi2)2+(1+xi1)2+(1+xi2)2]=xi12+xi22+1

Lưu ý rằng chúng ta không cần tổng hợp vì nó giống nhau cho cả hai. Vì vậy, vấn đề của chúng tôi trở thành, j

minWi12(yiy~i)2y~i=W[xi12+xi22+1]+bi

Mà mang lại sự đối xứng hình cầu dự kiến!

TIC Tac Toe

Mã ví dụ có thể được nhìn thấy ở đây . Nó cho thấy làm thế nào chúng ta có thể tạo ra một ma trận mã hóa đối xứng và sử dụng nó. Lưu ý rằng điều này thực sự tồi tệ khi tôi thực sự chạy nó! Làm việc với các hạt nhân khác tại thời điểm này.


Làm tốt lắm, Aidan! Nếu bạn có thời gian, bạn có thể viết một bài đăng blog chi tiết hơn. Cộng đồng sẽ được quan tâm nhất.
Emre

1
Không chắc bạn đang đề cập đến cộng đồng nào, nhưng tôi bắt đầu viết nhiều hơn. Tôi muốn tìm một cách để ước tính hạt nhân tối ưu được cung cấp một bộ dữ liệu. Vì vậy, tôi đã tối ưu hóa entropy trên không gian kernel để có được một bộ tính năng mới bị ràng buộc đối xứng và cũng là entropic tối đa (nghĩa là thông tin). Bây giờ cho dù đó là cách tiếp cận đúng. Tôi không thể nói. Chỉ cần một cảnh báo, toán học là một chút của một công việc hack ngay bây giờ và loại ra khỏi stat mech. overleaf.com/read/kdfzdbyhpbbq
aidan.plenert.macdonald

Có cách tiếp cận có ý nghĩa nào khi nhóm đối xứng không được biết đến?
leitasat

@leitasat Làm sao bạn biết nó đối xứng nếu bạn không biết nhóm?
Aidan.plenert.macdonald

@ Aidan.plenert.macdonald từ dữ liệu. Giả sử chúng ta có 1000 bộ 100 hình ảnh mỗi bộ và trong mỗi bộ có hình ảnh của một đối tượng từ các quan điểm khác nhau. Bất kỳ thuật toán nào có thể "tìm hiểu ý tưởng" về tính đối xứng SO (3) và sử dụng nó trên các đối tượng chưa từng thấy trước đây?
leitasat

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.