Nhận dạng các mô hình mạng thần kinh


8

Nó khá trực quan mà hầu hết các cấu trúc / cấu trúc mạng thần kinh không thể xác định được. Nhưng một số kết quả nổi tiếng trong lĩnh vực này là gì? Có những điều kiện đơn giản cho phép / ngăn chặn nhận dạng? Ví dụ,

  • tất cả các mạng có chức năng kích hoạt phi tuyến và nhiều hơn một lớp ẩn không thể nhận dạng được
  • tất cả các mạng có nhiều hơn hai đơn vị ẩn không thể nhận dạng được

Hoặc những thứ như thế này. LƯU Ý : Tôi không nói rằng những điều kiện này ngăn cản sự nhận dạng (mặc dù chúng có vẻ là ứng cử viên khá tốt đối với tôi). Chúng chỉ là ví dụ về những gì tôi muốn nói với "điều kiện đơn giản".

Nếu nó giúp thu hẹp câu hỏi, vui lòng chỉ xem xét các kiến ​​trúc chuyển tiếp và lặp lại. Nếu điều này vẫn chưa đủ, tôi sẽ hài lòng với câu trả lời bao gồm ít nhất một kiến ​​trúc giữa MLP, CNN và RNN. Tôi đã có một cái nhìn nhanh trên Web nhưng có vẻ như cuộc thảo luận duy nhất tôi có thể tìm thấy là trên Reddit. Thôi nào mọi người, chúng ta có thể làm tốt hơn Reddit ;-)


1
mục đích của bài tập học tập này là gì?
Aksakal

1
Tôi có thể hỏi, bạn đã xem xét / kiểm tra những gì từ các tài liệu hiện có? Đây có vẻ như là một câu hỏi rất thích hợp; rất ít tài liệu tham khảo có liên quan mà tôi đã thấy liên quan đến tài liệu nhận dạng hệ thống thay vì ML tiêu chuẩn (ví dụ: 1 , 2 , 3 ). Bạn có thể vui lòng xác định câu hỏi của bạn nhiều hơn một chút trong ngữ cảnh của ML không? Nhận dạng chủ yếu là một khía cạnh của Hệ thống kiểm soát; bạn "chỉ" đề cập đến mối quan hệ 1-1?
usεr11852

Tôi nghĩ bạn sẽ có thể dễ dàng chứng minh những kết quả này bằng cách sử dụng định lý hàm ẩn.
Alex R.

1
@Aksakal mục đích của việc tính toán xác suất để chiếc bình rỗng vào buổi trưa, sau những bước vô hạn trong đó 10 quả bóng được thêm vào và một quả bóng bị loại bỏ? . Không ai, nhưng câu hỏi rất vui. Không phải tất cả các câu hỏi cần phải có liên quan thực tế, để có giá trị trả lời. Hoặc bạn có thể nói rằng việc thiếu nhận dạng ngăn bạn thực hiện suy luận chính xác về trọng số NN, nhưng đó sẽ là một lời biện minh sai lầm vì hầu như không ai quan tâm ...
DeltaIV

3
@DeltaIV, đó là một câu hỏi hợp lệ cho CV. Vấn đề là không ai quan tâm đến suy nghĩ về công cụ này, tôi sợ. Mọi người đều bận rộn xây dựng mô hình và kiếm tiền, khi các mô hình ngừng hoạt động, khi những người suy nghĩ AI thất nghiệp sẽ suy ngẫm về khả năng nhận dạng
Aksakal

Câu trả lời:


3

FFN tuyến tính, một lớp không được xác định

Câu hỏi như đã được chỉnh sửa để loại trừ trường hợp này; Tôi giữ nó ở đây vì hiểu trường hợp tuyến tính là một ví dụ đơn giản về hiện tượng quan tâm.

Hãy xem xét một mạng lưới thần kinh feedforward với 1 lớp ẩn và tất cả các kích hoạt tuyến tính. Nhiệm vụ này là một nhiệm vụ hồi quy OLS đơn giản.

Vậy ta có mô hình và mục tiêu là y^=XAB

minA,B12||yXAB||22

cho một số lựa chọn của có hình dạng phù hợp. là các trọng số đầu vào-ẩn và là các trọng số ẩn-đầu ra.A,BAB

Rõ ràng các yếu tố của ma trận trọng số nói chung không thể xác định được, vì có bất kỳ số lượng cấu hình có thể có mà hai cặp ma trận có cùng một sản phẩm.A,B

FFN phi tuyến, một lớp vẫn chưa được xác định

Xây dựng từ FFN tuyến tính, một lớp, chúng ta cũng có thể quan sát tính không thể nhận dạng trong FFN một lớp, phi tuyến .

Như một ví dụ, thêm một phi tuyến với bất kỳ kích hoạt tuyến tính tạo ra một mạng lưới phi tuyến. Mạng này vẫn chưa được xác định, bởi vì đối với bất kỳ giá trị tổn thất nào, một hoán vị trọng lượng của hai (hoặc nhiều) nơ-ron ở một lớp và các nơ-ron tương ứng của chúng ở lớp tiếp theo cũng sẽ dẫn đến cùng một giá trị mất.tanh

Nói chung, mạng lưới thần kinh là không xác định

Chúng ta có thể sử dụng cùng một lý do để chỉ ra rằng các mạng thần kinh không được xác định trong tất cả các tham số nhưng rất đặc biệt.

Ví dụ, không có lý do cụ thể nào mà bộ lọc tích chập phải xảy ra theo bất kỳ thứ tự cụ thể nào. Cũng không yêu cầu các bộ lọc tích chập có bất kỳ dấu hiệu cụ thể nào, vì các trọng số tiếp theo có thể có dấu hiệu ngược lại để "đảo ngược" lựa chọn đó.

Tương tự như vậy, các đơn vị trong RNN có thể được thẩm thấu để có được cùng một tổn thất.

Xem thêm: Chúng ta có thể sử dụng MLE để ước tính trọng lượng Mạng thần kinh không?


Tôi đã đặc biệt loại trừ trường hợp này (các hàm kích hoạt tuyến tính) trong các bình luận cho câu hỏi của tôi, bởi vì việc lấy một mô hình có thể nhận dạng được, bắt đầu từ mô hình này, đưa ra dự đoán chính xác , với một phép lặp lại đơn giản. Đó không phải là "bản chất không thể nhận dạng", có thể nói như vậy. Vì vậy, tôi đã đặc biệt đề cập đến các chức năng kích hoạt phi tuyến. Nhưng tôi nghĩ rằng tôi nên đưa nó vào câu hỏi của mình, không chỉ để nó vào bình luận. Trong một vài giờ tôi sẽ sửa đổi câu hỏi của tôi cho phù hợp.
DeltaIV

Đó là cách tốt nhất để chỉnh sửa câu hỏi của bạn để làm rõ những gì bạn quan tâm muốn biết.
Sycorax nói Phục hồi lại

bạn nói đúng, tôi thường làm, nhưng lần này tôi quên mất. Lỗi của tôi.
DeltaIV

4

Có ít nhấttối ưu toàn cầu khi lắp mạng lưới thần kinh 1 lớp, cấu thành từ nơ-ron. Điều này xuất phát từ thực tế rằng, nếu bạn trao đổi hai nơ-ron ở một mức độ cụ thể, và sau đó bạn trao đổi các trọng số quy cho các nơ-ron này ở cấp độ tiếp theo, bạn sẽ có được sự phù hợp chính xác.n!n

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.