Hình học và AI
Ma trận, hình khối, lớp, ngăn xếp và phân cấp là những gì chúng ta có thể gọi chính xác cấu trúc liên kết . Xem xét cấu trúc liên kết trong bối cảnh này thiết kế hình học cấp cao hơn của một hệ thống học tập.
Khi độ phức tạp tăng lên, thường rất hữu ích khi biểu diễn các cấu trúc liên kết này dưới dạng cấu trúc đồ thị có hướng. Biểu đồ trạng thái và công việc của Markov về lý thuyết trò chơi là hai nơi thường sử dụng biểu đồ có hướng. Đồ thị có hướng có các đỉnh (thường được hình dung dưới dạng hình kín) và các cạnh thường được hình dung như mũi tên nối các hình.
Chúng ta cũng có thể biểu diễn GAN dưới dạng biểu đồ có hướng, trong đó đầu ra của mỗi mạng thúc đẩy việc đào tạo cái khác theo kiểu đối nghịch. GAN giống như một dải Mobius về mặt tôpô.
Chúng ta không thể khám phá các thiết kế và kiến trúc mới mà không hiểu toán học không chỉ hội tụ một giải pháp tối ưu hoặc theo dõi một mà còn các cấu trúc liên kết mạng có thể hỗ trợ sự hội tụ như vậy. Nó giống như lần đầu tiên phát triển bộ xử lý trong khi tưởng tượng một hệ điều hành sẽ cần gì trước khi viết hệ điều hành.
Để xem sơ qua những cấu trúc liên kết mà chúng ta KHÔNG YÊN xem xét, trước tiên hãy xem xét những cái nào đã được.
Bước một - Đùn trong chiều thứ hai
Trong những năm 1980, thành công đã đạt được với việc mở rộng thiết kế perceptron ban đầu. Các nhà nghiên cứu đã thêm một chiều thứ hai để tạo ra một mạng lưới thần kinh nhiều lớp. Sự hội tụ hợp lý đã đạt được thông qua việc truyền ngược lại độ dốc của hàm lỗi thông qua các gradient của các hàm kích hoạt bị suy giảm bởi tốc độ học tập và được làm ẩm bằng các tham số meta khác.
Bước hai - Thêm kích thước cho tín hiệu đầu vào rời rạc
Chúng tôi thấy sự xuất hiện của các mạng tích chập dựa trên các kỹ thuật tích chập hình ảnh được điều chỉnh thủ công hiện có đã đưa các kích thước vào đầu vào mạng: Vị trí dọc, các thành phần màu và khung. Chiều hướng cuối cùng này rất quan trọng đối với CGI, thay thế khuôn mặt và các kỹ thuật hình thái khác trong quá trình làm phim đương đại. Không có nó, chúng ta có thể tạo hình ảnh, phân loại và loại bỏ nhiễu.
Bước ba - Ngăn xếp mạng
Chúng ta thấy các chồng lưới thần kinh xuất hiện vào cuối những năm 1990, nơi việc đào tạo một mạng được giám sát bởi một mạng khác. Đây là sự giới thiệu của các lớp khái niệm, không phải theo nghĩa các lớp tế bào thần kinh liên tiếp cũng như ý nghĩa của các lớp màu trong một hình ảnh. Kiểu phân lớp này cũng không phải là đệ quy. Nó giống như thế giới tự nhiên nơi một cấu trúc là một cơ quan trong một loại cấu trúc hoàn toàn khác.
Bước bốn - Phân cấp mạng
Chúng ta thấy hệ thống các mạng lưới thần kinh xuất hiện thường xuyên trong nghiên cứu phát sinh từ những năm 2000 và đầu những năm 2010 (Laplacian và những người khác), tiếp tục sự tương tác giữa các mạng lưới thần kinh và tiếp tục sự tương tự não của động vật có vú. Bây giờ chúng ta thấy cấu trúc meta, trong đó toàn bộ các mạng trở thành các đỉnh trong một biểu đồ có hướng đại diện cho một cấu trúc liên kết.
Bước năm% mdash; Khởi hành từ định hướng Cartesian
Non-Cartesian lặp đi lặp lại một cách có hệ thống các tế bào và các kết nối giữa chúng đã bắt đầu xuất hiện trong tài liệu. Ví dụ: Mạng tương đương đo lường tương đương và CNN của Icosah thờ (Taco S. Cohen, Maurice Weiler, Berkay Kicanaoglu, Max Welling, 2019) kiểm tra việc sử dụng một sự sắp xếp dựa trên một icosahedron thông thường lồi.
Tóm tắt
Các lớp có các hàm kích hoạt có giá trị thông thường cho các đỉnh và ma trận suy giảm được ánh xạ tới một tập hợp đầy đủ các cạnh có hướng giữa các lớp liền kề [1]. Các lớp chập hình ảnh thường được sắp xếp theo đỉnh hai chiều với các khối suy giảm được ánh xạ tới một tập hợp các cạnh được định hướng giữa các lớp liền kề [2]. Các ngăn xếp có toàn bộ các lớp được xếp lớp như các đỉnh trong đồ thị siêu hướng và các đỉnh meta đó được kết nối theo một chuỗi với mỗi cạnh là một tham số meta đào tạo, tín hiệu gia cố (phản hồi thời gian thực) hoặc một số điều khiển học tập khác . Hệ thống phân cấp của lưới phản ánh khái niệm rằng nhiều điều khiển có thể được tổng hợp và học trực tiếp ở cấp độ thấp hơn hoặc trường hợp lật trong đó nhiều yếu tố học tập có thể được kiểm soát bởi một mạng lưới giám sát cấp cao hơn.
Phân tích xu hướng học tập cấu trúc liên kết
Chúng ta có thể phân tích xu hướng trong kiến trúc máy học. Chúng tôi có ba xu hướng tô pô.
Độ sâu trong kích thước quan hệ nhân quả - Các lớp để xử lý tín hiệu trong đó đầu ra của một lớp kích hoạt được đưa qua một ma trận các tham số suy giảm (trọng số) cho đầu vào của lớp tiếp theo. Khi các điều khiển lớn hơn được thiết lập, chỉ bắt đầu với việc giảm độ dốc cơ bản trong propatagion trở lại, độ sâu lớn hơn có thể đạt được.
Thứ nguyên tín hiệu đầu vào - Từ đầu vào vô hướng đến siêu âm (video có chiều ngang, chiều dọc, độ sâu màu bao gồm độ trong suốt và khung - Lưu ý rằng điều này không giống với số lượng đầu vào theo nghĩa perceptron.
Phát triển tô pô - Hai loại trên là bản chất của Cartesian. Kích thước được thêm vào ở góc bên phải với kích thước hiện có. Vì các mạng được nối theo thứ bậc (như trong Laplacian HVELies) và dải Mobius giống như các vòng tròn (như trong GAN), các xu hướng là địa hình và được biểu thị tốt nhất bằng các đồ thị có hướng trong đó các đỉnh không phải là nơ-ron mà là các mạng nhỏ hơn.
Topo nào đang thiếu?
Phần này mở rộng về ý nghĩa của câu hỏi tiêu đề.
- Có bất kỳ lý do tại sao nhiều đỉnh meta, mỗi đỉnh đại diện cho một mạng lưới thần kinh, có thể được sắp xếp sao cho nhiều đỉnh meta giám sát có thể kết hợp với nhau, giám sát nhiều đỉnh meta của nhân viên không?
- Tại sao sự lan truyền ngược của tín hiệu lỗi chỉ tương đương phi tuyến tính với phản hồi âm?
- Không thể hợp tác giữa các đỉnh meta thay vì giám sát, trong đó có hai cạnh đối ứng đại diện cho các điều khiển?
- Vì lưới thần kinh được sử dụng chủ yếu để tìm hiểu các hiện tượng phi tuyến, tại sao lại cấm các loại đường dẫn khép kín khác trong thiết kế lưới hoặc liên kết của chúng?
- Có bất kỳ lý do tại sao âm thanh không thể được thêm vào hình ảnh để các video clip có thể được phân loại tự động? Nếu đó là trường hợp, một kịch bản có thể là một tính năng trích xuất của một bộ phim và một kiến trúc đối nghịch có thể được sử dụng để tạo ra các kịch bản phim và sản xuất các bộ phim mà không có hệ thống phim trường không? Cấu trúc liên kết đó trông như thế nào như một biểu đồ có hướng?
- Mặc dù các ô được sắp xếp trực giao có thể mô phỏng sự sắp xếp đóng gói đều đặn tùy ý của các đỉnh và cạnh không trực giao, nhưng liệu có hiệu quả trong tầm nhìn máy tính trong đó độ nghiêng của máy ảnh không phải là cộng hoặc trừ 90 độ là phổ biến?
- Có hiệu quả không khi sắp xếp các tế bào riêng lẻ trong các mạng hoặc mạng của các tế bào trong các hệ thống AI trực giao trong các hệ thống học tập nhằm mục đích hiểu và lắp ráp ngôn ngữ tự nhiên hoặc nhận thức nhân tạo?
Ghi chú
Các tế bào nhân tạo trong MLP sử dụng các hàm truyền số học điểm nổi hoặc cố định thay vì truyền xung điện hóa dựa trên biên độ và ngưỡng dựa gần. Chúng không phải là mô phỏng thực tế của các nơ-ron thần kinh, vì vậy việc gọi các nơ-ron đỉnh sẽ là một cách gọi sai cho loại phân tích này.
Sự tương quan của các tính năng hình ảnh và thay đổi tương đối giữa các pixel ở gần nhau cao hơn nhiều so với các pixel ở xa.