Điều gì làm cho mạng lưới thần kinh rất tốt trong dự đoán?


12

Tôi chưa quen với mạng lưới thần kinh và tôi đang cố gắng hiểu về mặt toán học điều gì làm cho mạng lưới thần kinh rất tốt trong các vấn đề phân loại.

Bằng cách lấy ví dụ về một mạng nơ ron nhỏ (ví dụ: một có 2 đầu vào, 2 nút trong một lớp ẩn và 2 nút cho đầu ra), tất cả những gì bạn có là một hàm phức tạp ở đầu ra chủ yếu là sigmoid trên một tổ hợp tuyến tính của sigmoid.

Vì vậy, làm thế nào mà làm cho họ giỏi dự đoán? Liệu chức năng cuối cùng dẫn đến một số loại đường cong phù hợp?

Câu trả lời:


6

Mạng lưới thần kinh rất tốt trong việc phân loại. Trong một số tình huống đi xuống dự đoán, nhưng không nhất thiết.

Lý do toán học cho sức mạnh của mạng lưới thần kinh trong phân loại là định lý gần đúng phổ quát . Trong đó nêu rõ rằng một mạng nơ ron có thể xấp xỉ bất kỳ hàm có giá trị thực liên tục nào trên một tập hợp con nhỏ gọn. Chất lượng của xấp xỉ phụ thuộc vào số lượng tế bào thần kinh. Nó cũng đã được chứng minh rằng việc thêm các nơ-ron vào các lớp bổ sung thay vì thêm chúng vào các lớp hiện có sẽ cải thiện chất lượng của xấp xỉ nhanh hơn.

Thêm vào đó là tính hiệu quả chưa được hiểu rõ của thuật toán backpropagation và bạn có một thiết lập sau đó thực sự có thể tìm hiểu chức năng mà UAT hứa hẹn hoặc một cái gì đó gần gũi.


0

Trong Mạng nơ-ron, chúng tôi xem xét mọi thứ ở chiều cao và cố gắng tìm một siêu phẳng phân loại chúng bằng những thay đổi nhỏ ...

Có lẽ khó có thể chứng minh rằng nó hoạt động nhưng trực giác nói rằng nếu nó có thể được phân loại, bạn có thể làm điều đó bằng cách thêm một mặt phẳng thư giãn và để nó di chuyển giữa các dữ liệu để tìm một tối ưu cục bộ ...


0

Với Mạng nơ-ron, bạn chỉ cần phân loại dữ liệu. Nếu bạn phân loại chính xác, vì vậy bạn có thể thực hiện phân loại trong tương lai.

Làm thế nào nó hoạt động?

Các mạng thần kinh đơn giản như Perceptron có thể vẽ một ranh giới quyết định để phân loại dữ liệu.

Ví dụ: giả sử bạn muốn giải quyết vấn đề AND đơn giản với Mạng thần kinh đơn giản. Bạn có 4 dữ liệu mẫu chứa x1 và x2 và vectơ trọng lượng chứa w1 và w2. Giả sử vectơ trọng lượng ban đầu là [0 0]. Nếu bạn thực hiện tính toán phụ thuộc vào NN algoritm. Cuối cùng, bạn nên có một vectơ trọng lượng [1 1] hoặc một cái gì đó như thế này.

nhập mô tả hình ảnh ở đây

Hãy tập trung vào đồ họa.

Nó nói: Tôi có thể phân loại các giá trị đầu vào thành hai lớp (0 và 1). Đồng ý. Sau đó, làm thế nào tôi có thể làm điều này? Nó quá đơn giản. Tổng giá trị đầu vào đầu tiên (x1 và x2).

0 + 0 = 0

0 + 1 = 1

1 + 0 = 1

1 + 1 = 2

Nó nói rằng:

nếu tổng <1,5 thì lớp của nó bằng 0

nếu tổng> 1,5 thì lớp của nó là 1


0

Mạng lưới thần kinh nổi trội ở nhiều nhiệm vụ khác nhau, nhưng để hiểu chính xác lý do tại sao, có thể dễ dàng thực hiện một nhiệm vụ cụ thể như phân loại và lặn sâu hơn.

Nói một cách đơn giản, các kỹ thuật học máy học tìm hiểu một chức năng để dự đoán một đầu vào cụ thể thuộc về lớp nào, tùy thuộc vào các ví dụ trong quá khứ. Điều làm nên sự khác biệt của mạng lưới thần kinh là khả năng xây dựng các chức năng này có thể giải thích các mẫu thậm chí phức tạp trong dữ liệu. Trung tâm của mạng lưới thần kinh là một chức năng kích hoạt như Relu, cho phép nó vẽ một số ranh giới phân loại cơ bản như:Ví dụ ranh giới phân loại cho Relu

Bằng cách kết hợp hàng trăm Relus như vậy với nhau, các mạng thần kinh có thể tạo ra các ranh giới phân loại phức tạp tùy ý, ví dụ:nhập mô tả hình ảnh ở đây

Trong bài viết này, tôi cố gắng giải thích trực giác đằng sau những gì làm cho mạng lưới thần kinh hoạt động: https://medium.com/machine-intellect-report/how-do-neural-networks-work-57d1ab5337ce

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.