Định nghĩa của một mạng lưới thần kinh sâu sắc là gì? Tại sao chúng rất phổ biến hoặc quan trọng?
Định nghĩa của một mạng lưới thần kinh sâu sắc là gì? Tại sao chúng rất phổ biến hoặc quan trọng?
Câu trả lời:
Mạng lưới thần kinh sâu (DNN) không gì khác ngoài mạng lưới thần kinh có nhiều lớp, trong đó nhiều mạng có thể chủ quan.
IMHO, bất kỳ mạng nào có 6 hoặc 7 lớp trở lên được coi là sâu. Vì vậy, ở trên sẽ tạo thành một định nghĩa rất cơ bản về một mạng lưới sâu.
Mạng sâu có hai điểm khác biệt chính với mạng 'bình thường'.
Đầu tiên là sức mạnh tính toán và bộ dữ liệu đào tạo đã tăng lên rất nhiều, có nghĩa là nó thực tế để chạy các mạng lớn hơn và có giá trị thống kê (nghĩa là chúng ta có đủ các ví dụ đào tạo mà chúng ta sẽ không gặp phải vấn đề quá lớn với các mạng lớn hơn).
Thứ hai là sự lan truyền trở lại bị hạn chế càng nhiều lớp bạn có; mỗi lớp biểu thị một độ dốc của lỗi và do đó, tại thời điểm một lớp sâu khoảng sáu lớp, sẽ không còn nhiều lỗi để sửa đổi các trọng số nơ-ron. Nhưng người ta có thể mong đợi một cách hợp lý các tế bào thần kinh sớm hơn quan trọng hơn các tế bào thần kinh sau này, vì chúng đại diện cho 'các khái niệm' gần với các đầu vào thô.
Các kỹ thuật đào tạo mới vượt qua vấn đề này, điển hình là bằng cách học tập không giám sát trên các đầu vào thô, tạo ra các 'khái niệm' cấp độ cao hơn, hữu ích như đầu vào cho việc học có giám sát.
(Ví dụ, hãy xem xét vấn đề xác định xem hình ảnh có chứa con mèo từ các pixel hay không. Các lớp đầu của mạng phải làm những việc như phát hiện các cạnh, mà người ta có thể mong đợi được chia sẻ giữa tất cả các hình ảnh và chủ yếu là độc lập với những gì người ta đang cố gắng thực hiện với các lớp đầu ra, do đó cũng khó có thể luyện qua 'mèo không phải mèo' báo hiệu nhiều lớp.
Cấu trúc chung của một mạng nơ ron nhân tạo
Lớp đầu vào + Lớp ẩn + Lớp đầu ra
Nếu có nhiều lớp ẩn trong mạng nơ ron nhân tạo, thì mạng nơ ron được gọi là mạng nơ ron sâu. Có bao nhiêu chính xác tạo thành một mạng lưới thần kinh sâu là một điểm tranh luận, nhưng nói chung, các lớp ẩn càng nhiều, sâu là mạng lưới thần kinh.
Đến với lý do tại sao chúng rất phổ biến hoặc quan trọng, nhiều vấn đề như phát hiện đối tượng, phân loại, nhận diện khuôn mặt, nhận dạng giọng nói đã được giải quyết với sự ra đời của mạng lưới thần kinh sâu. Không phải nói quá khi nói rằng, hiệu suất của các mạng lưới thần kinh sâu đã vượt qua cả hiệu suất của con người trong nhiều nhiệm vụ được đề cập ở trên. Điều đó có nghĩa là bây giờ một chiếc máy tính là thứ tốt nhất để thực hiện các nhiệm vụ trên hơn con người. Tất cả các vấn đề nêu trên đã nằm trong lĩnh vực nghiên cứu từ gần 5 thập kỷ. Tất cả chúng đã được giải quyết hoàn hảo chỉ trong 4,5 năm qua chỉ vì sự thành công của mạng lưới thần kinh sâu sắc. Đó là lý do tại sao chúng rất phổ biến và quan trọng. Tôi đã đề cập rất ít vấn đề mà tôi đã làm việc, có nhiều nhiệm vụ tương tự mà các mạng lưới thần kinh sâu đã giải quyết dễ dàng trong thập kỷ qua.
Và, tại thời điểm này, nhiều người trên khắp thế giới đang nghiên cứu giải quyết vô số ứng dụng bằng cách sử dụng mạng lưới thần kinh sâu.