Vấn đề nhân viên bán hàng du lịch với mạng lưới thần kinh


7

Tôi tò mò liệu có bất kỳ sự phát triển mới nào trong việc giải quyết vấn đề nhân viên bán hàng du lịch bằng cách sử dụng một cái gì đó như mạng lưới thần kinh tái phát Hopfield. Tôi cảm thấy như tôi đã thấy một cái gì đó về nghiên cứu gần đây đang có một bước đột phá trong việc này, nhưng tôi không thể tìm thấy các bài báo học thuật ở bất cứ đâu. Có ai biết về bất kỳ sự phát triển mới, mới lạ trong lĩnh vực này?


Bạn đã làm nghiên cứu gì? Bạn đã tìm kiếm trên Google Scholar?
DW

Tôi đã đọc bài viết trên Stack LSTM, mà tôi được cho biết có thể giúp ích: arxiv.org/pdf/1506.02516.pdf , nhưng tôi không thấy kết nối.
Rob

ghé qua Trò chuyện về Khoa học Máy tính để có thể thảo luận / phân tích nhiều hơn
vzn

Câu trả lời:


4

Bài trung bình này liệt kê các nghiên cứu mới nhất (không phải là danh sách đầy đủ) trong lĩnh vực tối ưu hóa tổ hợp. Cả ba bài viết đều sử dụng Học tập tăng cường sâu, không cần bất kỳ tập huấn nào mà học hoàn toàn từ kinh nghiệm của chính nó.

Tôi đã làm việc trên bài báo đầu tiên một thời gian và thời gian suy luận là ở mức mili giây. Theo các thí nghiệm của họ, tỷ lệ gần đúng (một số liệu họ sử dụng để đánh giá phương pháp của chính họ) trên 1000-1200 trường hợp thử nghiệm đạt tới 1,11.


7

nhiều bài viết về việc sử dụng các mạng thần kinh nhân tạo để giải quyết TSP bao gồm các mạng Hopfield và tái phát, và chúng "thành công" theo nghĩa thô, nhưng cho đến nay dường như không có bất kỳ bằng chứng nào cho thấy các kỹ thuật này theo bất kỳ cách nào (mạnh mẽ?) vượt trội so với các phương pháp tiếp cận thuật toán khác, vì vậy nó giống như một sự tò mò nghiên cứu tại thời điểm này. việc sử dụng ANN cho vấn đề này thực sự trái ngược với thuật toán tổ hợp và các cơ chế mà các đầu vào / đầu ra của vấn đề được mã hóa là mới và có xu hướng thay đổi, và có thể chưa được chuẩn hóa. các tác giả dường như có thể quan tâm nhiều hơn đến việc chứng minh "bằng chứng về khái niệm" và so sánh với các loại thuật toán khác có vẻ hiếm hơn (có một số trong bài báo trước). xem ví dụ


3
Tôi tin rằng các mạng thần kinh sẽ có thể giải quyết trong một khoảng tin cậy với sự nhất quán. Như trong a top 5% solution 85% of the time, tôi chỉ tò mò muốn tìm hiểu cách giải quyết vấn đề này với một mạng lưới thần kinh, bởi vì tôi chỉ đọc bài báo sâu sắc về Ngăn xếp thần kinh. Có vẻ như Mạng lưới thần kinh, đặc biệt là mạng học tập Củng cố sâu, có thể xử lý bất kỳ vấn đề nào mà thuật toán di truyền sẽ gặp phải trong quá khứ. Vì vậy, đó là sự tiến bộ trong tâm trí của tôi.
Rob

3

Tôi nhận xét điều này trên một câu trả lời khác, nhưng tôi nghĩ rằng nó xứng đáng với câu trả lời của riêng mình. Một số nghiên cứu sinh Google Brain đã trình bày một phương pháp để giải quyết TSP bằng cách sử dụng kiến ​​trúc gợi nhớ đến seq2seq trong bài viết năm 2017 TỐI ƯU HÓA HOÀN TOÀN YÊU CẦU VỚI TÌM HIỂU . Trong phần giới thiệu, họ gọi ra một bài báo (1985) sử dụng mạng Hopfield để giải quyết TSP. Vì vậy, ý tưởng đó đã được khoảng một thời gian.

Một câu trả lời khác đề cập đến bài báo "Mạng con trỏ" năm 2015. Nó đã làm một cái gì đó tương tự như bài báo này, nhưng nó là một thuật toán được giám sát - nó cần dữ liệu được dán nhãn. Bài viết năm 2017 không yêu cầu điều này (bằng cách sử dụng thời lượng tham quan tiêu cực làm tín hiệu phần thưởng trong thuật toán học tăng cường).

Các heuristic "luôn đặt cược vào mạng lưới thần kinh" đã không làm tôi thất vọng (nhưng một lần nữa, tôi chưa bao giờ trải qua một mùa đông AI).


1
Mặc dù vậy, hãy coi chừng: bài báo nói rõ rằng kết quả của họ "khác xa với công nghệ hiện đại" trong việc giải quyết TSP. Nó giống như ngạc nhiên trước một con chó nhảy múa. Vấn đề không phải là nó nhảy đặc biệt tốt; phần tuyệt vời là nó có thể làm bất cứ điều gì tiếp cận nhảy múa.
DW

Cảm ơn bạn đã phản hồi, tôi rất vui khi xem lại sự tò mò này một lần nữa!
Cướp

Tôi không biết DW, tôi nhớ khi học sâu là con chó nhảy nhận dạng hình ảnh ... và mô hình ngôn ngữ ... và cờ vua ... và Đi ...
Sam H.

0

Tôi không thấy bất kỳ lý do nào để mong đợi các mạng thần kinh tái phát Hopfield sẽ giúp giải quyết vấn đề nhân viên bán hàng du lịch.

Mạng nơ-ron là một hình thức học máy và chúng có hiệu quả khi chúng ta có một tập huấn luyện có nhãn: một loạt các trường hợp, trong đó mỗi trường hợp chúng ta biết đầu vào (vectơ đặc trưng) và nhãn / phân loại / đầu ra chính xác. Học máy thường hữu ích cho việc tìm kiếm các mẫu khi chúng tôi không chắc chắn chính xác cách xác định đầu ra đúng là gì; "Chúng tôi biết điều đó khi chúng tôi nhìn thấy nó".

Ngược lại, vấn đề nhân viên bán hàng du lịch là một vấn đề kết hợp: chúng tôi muốn biết con đường ngắn nhất thông qua biểu đồ. Không có vấn đề trong việc xác định hoặc chỉ định đầu ra đúng là gì: đó là một vấn đề toán học được xác định rõ. Không có lý do rõ ràng để nghĩ rằng học máy sẽ hữu ích cho vấn đề nhân viên bán hàng du lịch.


Bài viết này đề cập đến việc cố gắng áp dụng một mạng lưới thần kinh cho vấn đề nhân viên bán hàng du lịch: arxiv.org/pdf/1506.03134.pdf . Vì vậy, tôi không hoàn toàn điên rồ. Sự tò mò của tôi về vấn đề này là làm thế nào nó có thể được sử dụng bởi vì tôi không thể tưởng tượng ra một cách. Tôi đánh giá cao việc bạn dành thời gian và nếu bạn xem qua bài viết tôi rất muốn nghe những gì bạn nghĩ.
Rob

Ngoài ra, bài viết này đề cập đến việc sử dụng mạng hopfield để giải quyết vấn đề nhân viên bán hàng du lịch cdn.intechopen.com/pdfs-wm/4612.pdf , do đó, không phải là trò chơi bingo buzzword ;-)
Rob

@Rob, rằng ai đó đã viết lên một cái gì đó và đăng nó lên arXiv không có nghĩa là nó không tắt. Trừ khi điều này được xem xét nghiêm túc, tôi sẽ rất cảnh giác.
vonbrand

1
Một số PHd từ UC Berkeley làm việc cho google nghe có vẻ như là một nhóm đủ uy tín đối với tôi .....
Rob

Dưới đây là nhóm Google Brain hiển thị tối ưu hóa TSP bằng mô hình seq2seq openreview.net/pdf?id=rJY3vK9eg "Chúng tôi tập trung vào vấn đề nhân viên bán hàng du lịch (TSP) và huấn luyện một mạng lưới thần kinh tái diễn, đưa ra một tọa độ thành phố, dự đoán phân phối trên các hoán vị thành phố khác nhau. Sử dụng thời lượng tham quan âm làm tín hiệu phần thưởng, chúng tôi tối ưu hóa các tham số của mạng thần kinh tái phát bằng phương pháp gradient chính sách. "
Sam H.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.