Sử dụng mạng nơ ron để nhận dạng các mẫu trong ma trận

10

Tôi đang cố gắng phát triển một mạng lưới thần kinh có thể xác định các tính năng thiết kế trong các mô hình CAD (ví dụ: khe, trùm, lỗ, túi, bước).

Dữ liệu đầu vào tôi dự định sử dụng cho mạng là ma trận lo lắng (trong đó n là số mặt trong mô hình CAD). Một '1' trong tam giác trên cùng bên phải trong ma trận biểu thị mối quan hệ lồi giữa hai mặt và '1' ở tam giác dưới bên trái thể hiện mối quan hệ lõm. Số 0 ở cả hai vị trí có nghĩa là các mặt không liền kề. Hình ảnh dưới đây cho một ví dụ về một ma trận như vậy.

Hãy nói rằng tôi đặt kích thước mô hình tối đa là 20 mặt và áp dụng phần đệm cho bất cứ thứ gì nhỏ hơn đó để làm cho các đầu vào vào mạng có kích thước không đổi.

Tôi muốn có thể nhận ra 5 tính năng thiết kế khác nhau và do đó sẽ có 5 nơ ron đầu ra - [khe, túi, lỗ, trùm, bước]

Tôi có đúng không khi nói rằng điều này trở thành một loại vấn đề 'nhận dạng mẫu'? Ví dụ: nếu tôi cung cấp cho mạng một số mô hình đào tạo - cùng với các nhãn mô tả tính năng thiết kế tồn tại trong mô hình, liệu mạng có học cách nhận ra các mẫu kề nhau cụ thể được thể hiện trong ma trận liên quan đến các tính năng thiết kế nhất định không?

Tôi là người mới bắt đầu hoàn toàn trong học máy và tôi đang cố gắng kiểm tra xem phương pháp này có hiệu quả hay không - nếu cần thêm thông tin để hiểu vấn đề hãy để lại nhận xét. Bất kỳ đầu vào hoặc trợ giúp sẽ được đánh giá cao, cảm ơn.

— Darren Tag hành
nguồn

1

Điều này trông thực sự thú vị. Nhưng bạn đang nói về tam giác nào? Bạn có thể vẽ nó cho rõ ràng?

— FelicityC

1

Tôi có đúng không khi nói rằng điều này trở thành một loại vấn đề 'nhận dạng mẫu'?

Về mặt kỹ thuật, vâng. Trong thực tế: không.

Tôi nghĩ rằng bạn có thể đang diễn giải thuật ngữ "nhận dạng mẫu" hơi quá theo nghĩa đen. Mặc dù wikipedia định nghĩa Nhận dạng mẫu là "một nhánh của học máy tập trung vào nhận dạng các mẫu và tính đều đặn trong dữ liệu", nhưng không phải là giải quyết các vấn đề có thể "dễ dàng" suy luận bằng lý luận logic.

Ví dụ bạn nói vậy

Một '1' trong tam giác trên cùng bên phải trong ma trận biểu thị mối quan hệ lồi giữa hai mặt và '1' ở tam giác dưới bên trái thể hiện mối quan hệ lõm

Điều này đúng luôn . Trong một tình huống học máy thông thường, bạn sẽ không (thường) có kiến thức trước đó. Ít nhất là không đến mức nó có thể dễ dàng giải quyết bằng cách giải quyết bằng tay.

Nhận dạng mẫu thông thường là một cách tiếp cận thống kê để giải quyết các vấn đề khi chúng quá phức tạp để phân tích với các mô hình suy luận logic thông thường và mô hình hồi quy đơn giản hơn. Wikipedia cũng tuyên bố (với một nguồn) rằng nhận dạng mẫu "trong một số trường hợp được coi là gần như đồng nghĩa với học máy".

Điều đó đang được nói: bạn có thể sử dụng nhận dạng mẫu cho vấn đề này. Tuy nhiên, có vẻ như quá mức cần thiết trong trường hợp này. Vấn đề của bạn, theo như tôi có thể hiểu, có một giải pháp "phân tích" thực sự. Đó là: bạn có thể, theo logic, có được kết quả chính xác 100% mọi lúc. Về mặt lý thuyết, máy học có thể thực hiện điều này, và trong trường hợp đó, và nhánh ML này được gọi là Meta Modelling [1].

Ví dụ: nếu tôi cung cấp cho mạng một số mô hình đào tạo - cùng với các nhãn mô tả tính năng thiết kế tồn tại trong mô hình, liệu mạng có học cách nhận ra các mẫu kề nhau cụ thể được thể hiện trong ma trận liên quan đến các tính năng thiết kế nhất định không?

Trong một từ: Có thể. Cách tốt nhất để đi? Chắc là không. Tại sao không, bạn hỏi?

Luôn có khả năng mô hình của bạn không học chính xác những gì bạn muốn. Ngoài ra, bạn có nhiều thách thức như vượt quá mức mà bạn cần quan tâm. Đó là một cách tiếp cận thống kê, như tôi đã nói. Ngay cả khi nó phân loại tất cả dữ liệu kiểm tra của bạn là chính xác 100%, không có cách nào (trừ khi bạn kiểm tra các phép toán khó hiểu) để chắc chắn 100% rằng nó sẽ luôn phân loại chính xác. Tôi nghi ngờ thêm rằng cuối cùng bạn cũng sẽ dành nhiều thời gian hơn để làm việc với mô hình của mình, sau đó sẽ mất thời gian để suy luận logic.

Tôi cũng không đồng ý với @Bitzel: Tôi sẽ không làm một CNN (mạng lưới thần kinh tích chập) về điều này. CNN được sử dụng khi bạn muốn xem xét các phần cụ thể của ma trận và mối quan hệ và kết nối giữa các pixel rất quan trọng - ví dụ như trên hình ảnh. Vì bạn chỉ có 1 và 0, tôi cực kỳ nghi ngờ rằng một CNN sẽ quá mức cần thiết. Và với tất cả sự thưa thớt (nhiều số không), bạn sẽ kết thúc với rất nhiều số không trong các kết quả.

Tôi thực sự đề xuất một mạng lưới thần kinh vanilla (feed Forward) đơn giản, mặc dù có sự thưa thớt, tôi nghĩ rằng sẽ có thể thực hiện phân loại này khá dễ dàng.

— Andreas Storvik Strauman
nguồn

1

Câu trả lời rất kỹ lưỡng. Một phiên bản ngắn là đối với các câu hỏi có giải pháp phân tích, ML thường không phải là phương pháp phù hợp.

— Amrinder Arora 19/12/18

0

Theo tôi hiểu, có vấn đề của bạn liên quan đến nhận dạng mẫu. Vì cách tiếp cận là phân loại các đầu vào với các nhãn mà bạn cung cấp trước đây cho mạng lưới thần kinh, tôi nghĩ rằng một mạng lưới thần kinh tích chập có thể hoạt động cho vấn đề của bạn.

— Bitzel
nguồn

0

Vấn đề

Dữ liệu đào tạo cho hệ thống đề xuất như sau.

Một ma trận Boolean đại diện cho sự phụ thuộc bề mặt của một thiết kế hình học vững chắc
Cũng được thể hiện trong ma trận là sự khác biệt giữa các góc bên trong và bên ngoài của các cạnh
Nhãn (mô tả bên dưới)

Lồi và lõm không phải là thuật ngữ chính xác để mô tả sự gián đoạn độ dốc bề mặt. Một cạnh bên trong, chẳng hạn như được tạo bởi một nhà máy cuối, thực sự không phải là một bề mặt lõm. Sự gián đoạn độ dốc bề mặt, từ quan điểm của mô hình rắn lý tưởng hóa, có bán kính bằng không. Một cạnh bên ngoài không phải là một phần lồi của một bề mặt vì lý do tương tự.

Đầu ra dự định của hệ thống được đào tạo được đề xuất là một mảng Boolean cho thấy sự hiện diện của các tính năng thiết kế hình học rắn cụ thể.

Một hoặc nhiều khe
Một hoặc nhiều ông chủ
Một hoặc nhiều lỗ
Một hoặc nhiều túi
Một hoặc nhiều bước

Mảng giá trị Boolean này cũng được sử dụng làm nhãn cho đào tạo.

Có thể hãy cẩn thận trong cách tiếp cận

Có sự không phù hợp ánh xạ trong phương pháp này. Họ rơi vào một trong bốn loại.

Sự mơ hồ được tạo bằng cách ánh xạ cấu trúc liên kết trong mô hình CAD vào ma trận - hình học rắn không bắt được trong mã hóa ma trận được đề xuất
Các mô hình CAD không tồn tại ma trận - trường hợp các cạnh thay đổi từ góc trong sang góc ngoài hoặc xuất hiện từ độ cong
Sự mơ hồ trong việc xác định các tính năng từ ma trận - chồng chéo giữa các tính năng có thể xác định mẫu trong ma trận
Ma trận mô tả các tính năng không nằm trong số năm - điều này có thể trở thành vấn đề mất dữ liệu ở hạ nguồn trong quá trình phát triển

Đây chỉ là một vài ví dụ về các vấn đề cấu trúc liên kết có thể phổ biến trong một số lĩnh vực thiết kế cơ học và làm xáo trộn ánh xạ dữ liệu.

Một lỗ có ma trận giống như khung hình hộp với bán kính trong.
Bán kính bên ngoài có thể dẫn đến sự đơn giản hóa trong ma trận.
Các lỗ giao nhau với các cạnh có thể không thể phân biệt với các cấu trúc liên kết khác ở dạng ma trận.
Hai hoặc nhiều giao nhau qua các lỗ có thể thể hiện sự mơ hồ kề nhau.
Mặt bích và xương sườn hỗ trợ các ông chủ tròn có lỗ trung tâm có thể không thể phân biệt được.
Một quả bóng và một hình xuyến có cùng một ma trận.
Một đĩa và dải có hình lục giác có độ xoắn 180 độ có cùng ma trận.

Những cảnh báo có thể có thể có hoặc không đáng quan tâm đối với dự án được xác định trong câu hỏi.

Đặt kích thước khuôn mặt cân bằng hiệu quả với độ tin cậy nhưng hạn chế khả năng sử dụng. Có thể có các cách tiếp cận tận dụng một trong các biến thể của RNN, có thể cho phép bao phủ các kích thước mô hình tùy ý mà không ảnh hưởng đến hiệu quả đối với hình học đơn giản. Cách tiếp cận như vậy có thể liên quan đến việc phát ra ma trận như một chuỗi cho mỗi ví dụ, áp dụng chiến lược chuẩn hóa được hình thành tốt cho mỗi ma trận. Đệm có thể có hiệu quả nếu không có ràng buộc chặt chẽ về hiệu quả đào tạo và tối đa thực tế cho số lượng khuôn mặt tồn tại.

Coi số lượng và sự chắc chắn là đầu ra

Để xử lý một số sự mơ hồ này, một sự chắc chắn có thể là phạm vi của các chức năng kích hoạt của các ô đầu ra mà không thay đổi nhãn của dữ liệu huấn luyện. $\in [0.0, 1.0]$

Khả năng sử dụng đầu ra số nguyên không âm, như một biểu diễn nhị phân không dấu được tạo bằng cách tổng hợp nhiều ô đầu ra nhị phân, thay vì một Boolean cho mỗi tính năng ít nhất cũng nên được xem xét. Ở hạ lưu, khả năng đếm các tính năng có thể trở nên quan trọng.

Điều này dẫn đến năm hoán vị thực tế để xem xét, có thể được tạo ra bởi mạng được đào tạo cho từng tính năng của từng mô hình hình học rắn.

Boolean chỉ sự tồn tại
Số nguyên không âm cho biết số lượng cá thể
Boolean và sự chắc chắn thực sự của một hoặc nhiều ví dụ
Số nguyên không âm biểu thị hầu hết số lượng cá thể và độ chắc chắn thực sự của một hoặc nhiều phiên bản
Độ lệch chuẩn không âm và độ lệch chuẩn

Nhận dạng mẫu hay gì?

Trong văn hóa hiện tại, việc áp dụng một mạng nhân tạo cho vấn đề này thường không được mô tả là nhận dạng mẫu theo nghĩa thị giác máy tính hoặc xử lý âm thanh. Nó được coi là học một ánh xạ chức năng phức tạp thông qua hội tụ theo hướng thô của ánh xạ ý tưởng, với các tiêu chí gần gũi, chính xác và độ tin cậy. Các tham số của hàm , được đưa vào đầu vào , được hướng tới các nhãn liên quan trong quá trình đào tạo. $f$ $\mathcal{X}$ $\mathcal{Y}$

f (X) ⟹ Y

$f(\mathcal{X}) \implies \mathcal{Y}$

Nếu lớp khái niệm được mạng xấp xỉ về mặt chức năng được thể hiện đầy đủ trong mẫu được sử dụng cho đào tạo và mẫu ví dụ đào tạo được vẽ theo cách tương tự như ứng dụng đích sau này sẽ rút ra, thì phép tính gần đúng là đủ.

Trong thế giới của lý thuyết thông tin, có một sự mờ nhạt về sự khác biệt giữa nhận dạng mẫu và xấp xỉ chức năng, vì cần phải có sự trừu tượng hóa khái niệm AI ở cấp độ cao hơn.

Tính khả thi

Mạng sẽ học cách ánh xạ ma trận tới [mảng] Boolean [chỉ số] của các tính năng thiết kế?

Nếu các cảnh báo được liệt kê ở trên được các bên liên quan của dự án chấp nhận, các ví dụ được dán nhãn và cung cấp đủ số lượng, và chuẩn hóa dữ liệu, hàm mất, siêu tham số và sắp xếp lớp được thiết lập tốt, có khả năng hội tụ sẽ xảy ra trong thời gian đào tạo và một hệ thống nhận dạng tính năng tự động hợp lý. Một lần nữa, khả năng sử dụng của nó bản lề trên hình học rắn mới được rút ra từ lớp khái niệm giống như các ví dụ đào tạo. Độ tin cậy của hệ thống phụ thuộc vào đào tạo là đại diện cho các trường hợp sử dụng sau này.

— Douglas Daseeco
nguồn