Tại sao nghiên cứu về các thuật toán di truyền bị chậm lại?


45

Trong khi thảo luận về một số chủ đề cấp độ giới thiệu ngày hôm nay, bao gồm việc sử dụng các thuật toán di truyền; Tôi đã nói rằng nghiên cứu đã thực sự chậm lại trong lĩnh vực này. Lý do được đưa ra là hầu hết mọi người đang tập trung vào học máy và khai thác dữ liệu.
Cập nhật: Điều này có chính xác không? Và nếu vậy, ML / DM có những lợi thế gì khi so sánh với GA?


2
Vui lòng điều chỉnh lại câu hỏi để nó hỏi ít ý kiến ​​hơn nhưng nhiều sự thật hơn (ví dụ: nhược điểm của GA / EA đã trở nên rõ ràng hơn theo thời gian).
Raphael

1
Theo như tôi biết, nếu nhiều thuật toán được đưa ra có thể giải quyết một vấn đề cụ thể, GA sẽ không phải là thuật toán tốt nhất trong hầu hết các trường hợp.
Strin

Câu trả lời:


33

Chà, học máy theo nghĩa nhận dạng mẫu thống kê và khai thác dữ liệu chắc chắn là những lĩnh vực nóng hơn, nhưng tôi không nói rằng nghiên cứu về các thuật toán tiến hóa đã đặc biệt chậm lại. Hai lĩnh vực thường không được áp dụng cho cùng một loại vấn đề. Chẳng hạn, ngay lập tức cách thức tiếp cận dựa trên dữ liệu giúp bạn tìm ra cách lên lịch tốt nhất cho nhân viên thay đổi hoặc định tuyến các gói hiệu quả hơn.

Các phương pháp tiến hóa thường được sử dụng nhất cho các vấn đề tối ưu hóa cứng hơn là nhận dạng mẫu. Các đối thủ cạnh tranh trực tiếp nhất là các phương pháp nghiên cứu hoạt động, về cơ bản là lập trình toán học và các hình thức tìm kiếm heuristic khác như tìm kiếm tabu, mô phỏng, và hàng tá thuật toán khác được gọi chung là "siêu dữ liệu". Có hai hội nghị thường niên rất lớn về tính toán tiến hóa (GECCO và CEC), một loạt các hội nghị nhỏ hơn như PPSN, EMO, FOGA và Evostar, và ít nhất là hai tạp chí chất lượng cao chính (Giao dịch của IEEE về tính toán tiến hóa và Báo chí MIT tạp chí Evolution Computing) cũng như một số phần nhỏ hơn bao gồm phần EC trong trọng tâm rộng lớn hơn của họ.

Tất cả những gì đã nói, có một số lợi thế mà lĩnh vực thường được coi là "học máy" có trong bất kỳ so sánh nào về "độ nóng". Thứ nhất, nó có xu hướng trên nền tảng lý thuyết vững chắc hơn nhiều, điều mà các nhà toán học luôn thích. Hai, chúng ta đang ở thời kỳ hoàng kim của dữ liệu và rất nhiều phương pháp học máy tiên tiến thực sự chỉ bắt đầu tỏa sáng khi được cung cấp hàng tấn dữ liệu và hàng tấn sức mạnh tính toán, và ở cả hai khía cạnh, thời gian đều có ý nghĩa "đúng".


Bạn có thể vui lòng làm rõ / làm nổi bật câu trả lời của bạn cho câu hỏi là gì không?
Raphael

Tôi không chắc chắn cụ thể những gì bạn muốn tôi giải thích.
deong

Chỉ cần trả lời rõ ràng câu hỏi của OP: Ưu điểm (cứng) của ML so với GA / EA là gì? Hay bạn đang đề xuất một cái gì đó trực giao?
Raphael

2
Tôi đang nói rằng họ không (hầu hết) không áp dụng cho các vấn đề tương tự. Ưu điểm của ML là nó hoạt động thực sự tốt để nhận dạng và phân loại mẫu; lợi thế của GA là chúng hoạt động trên các vấn đề tối ưu hóa cứng. Ngoài ra, nó giống như yêu cầu lợi thế của ô tô so với nhà ở. Nhiều thuật toán ML liên quan đến việc giải quyết vấn đề tối ưu hóa như một bước đào tạo và có các phương pháp học tập dựa trên GA (hệ thống phân loại học tập), nhưng chủ yếu, chúng chỉ là các lĩnh vực hoàn toàn khác nhau.
deong

21

Vài thập kỷ trước, mọi người nghĩ rằng các thuật toán di truyền và tiến hóa là những con dao quân đội, được thúc đẩy bởi những kết quả ban đầu ngoạn mục. Các tuyên bố như giả thuyết khối xây dựng đã được đưa ra trong một nỗ lực để chứng minh rằng chúng nói chung là các chiến lược tốt.

Tuy nhiên, kết quả nghiêm ngặt đã đến chậm và thường rất tỉnh táo, nổi bật nhất là Định lý Không ăn trưa miễn phí . Rõ ràng là các thuật toán di truyền / tiến hóa thường là các heuristic phong nha nhưng không bao giờ tối ưu theo bất kỳ ý nghĩa nào.

Ngày nay chúng ta biết rằng chúng ta càng biết nhiều hơn về một vấn đề tương ứng với cấu trúc của nó, thì nó càng ít có ý nghĩa trong việc sử dụng các thuật toán di truyền / tiến hóa như các phương pháp khác sử dụng kiến thức này vượt trội hơn chúng theo cường độ. Tuy nhiên, trong trường hợp ít có thông tin về vấn đề này, chúng vẫn là một giải pháp thay thế khả thi vì chúng hoạt động hoàn toàn.


8
Tôi cảm thấy cần nhấn mạnh rằng NFLT đặt ra "những hạn chế" đối với không chỉ GA, mà trên tất cả các thuật toán tìm kiếm heuristic. Không ai trong số họ là tuyệt vời trên mọi trường hợp, và theo cách hiểu của bạn, không ai trong số họ là tối ưu theo bất kỳ ý nghĩa nào.
Juho

Tôi nhớ sử dụng các thuật toán di truyền để giải quyết vấn đề khí động học, và sau nhiều tuần và nhiều tuần tính toán, kết quả tồi tệ hơn nhiều so với kết quả được đưa ra bởi lý thuyết khí động học thô sơ nhất. Tôi có ấn tượng rằng trí thông minh nhân tạo và similars hoàn toàn không thay thế cho kiến ​​thức tên miền
user5193682

@ user9589 Cả hai không loại trừ lẫn nhau. Kiến thức tên miền có thể giúp bạn chọn và điều chỉnh các phương pháp heuristic.
Raphael

@Raphael Tôi muốn nói rằng trí tuệ nhân tạo giúp bạn điều chỉnh kiến ​​thức về miền.
dùng5193682

13

Một phần quan trọng của câu chuyện, như tôi thấy, đã bị thiếu trong các câu trả lời khác cho đến nay:

Các thuật toán di truyền chủ yếu hữu ích cho các vấn đề tìm kiếm vũ phu.

Trong nhiều bối cảnh, các chiến lược tối ưu hóa hoặc mô hình suy luận đơn giản hơn (cái mà bạn thường gọi là học máy) có thể thực hiện rất tốt và thực hiện hiệu quả hơn nhiều so với tìm kiếm vũ lực.

Các thuật toán di truyền, giống như ủ mô phỏng, có hiệu quả nhất như là một chiến lược để xử lý các vấn đề tìm kiếm khó khăn (ví dụ như NP hoàn chỉnh). Các miền này có xu hướng bị giới hạn bởi độ cứng nội tại của các vấn đề điều chỉnh và lặp lại các yếu tố khiêm tốn trong chiến lược giải pháp, bằng cách cải thiện dần các thuật toán di truyền, thường không được sử dụng nhiều và do đó không thú vị lắm.


12

Ở một mức độ nào đó, học máy đang trở nên toán học hơn và với các thuật toán có thể được 'chứng minh' để hoạt động. Theo một số cách, GA rất "đã xảy ra ở đó" và bạn không thể trả lời hoàn hảo câu hỏi "vậy chương trình của bạn đã làm gì?" (dù sao cũng trong mắt một số người).

Cá nhân tôi ủng hộ việc kết hợp mạng lưới thần kinh và GA = GANNs. Trong luận án danh dự của tôi, trước tiên tôi đã tạo ra một thuật toán dự đoán ma túy bằng cách sử dụng NN, sau đó là GA và cuối cùng là GANN, thứ tốt nhất của cả hai thế giới và vượt trội so với cả hai bộ khác. YMMV, tuy nhiên.


2
Vui lòng cho một ví dụ đơn giản trong đó những lợi thế của "ML" trở nên rõ ràng để cung cấp một số bằng chứng về (các) yêu cầu của bạn. Ngoài ra, xin vui lòng cung cấp một tài liệu tham khảo / liên kết thích hợp cho luận án của bạn.
Raphael


4

Học máy tiết lộ một phần lớn bộ máy toán học sẽ được phát triển và áp dụng. Các thuật toán di truyền chủ yếu được thực hiện bởi heuristic.


2
Bạn có thể chứng minh những điều về GA / EA. Đó là khó khăn, mặc dù. Trong khi ML có nền tảng nghiêm ngặt, những người áp dụng các kỹ thuật ML thường làm như vậy theo cách thức phi thường. Vì vậy, đối số của bạn chỉ tồn tại trên giấy, hoặc có một sự khác biệt trong thực tế?
Raphael
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.