Tại sao các cá nhân có thể lực thấp có cơ hội sống sót cho thế hệ tiếp theo?


24

Tôi hiện đang đọc và xem về thuật toán di truyền và tôi thấy nó rất thú vị (tôi chưa có cơ hội nghiên cứu nó khi còn ở trường đại học).

Tôi hiểu rằng đột biến dựa trên xác suất (tính ngẫu nhiên là gốc rễ của sự tiến hóa) nhưng tôi không hiểu tại sao sự sống còn.

Theo những gì tôi hiểu, một cá nhân có thể lực như đối với một cá nhân có thể lực chúng ta có , thì có xác suất tốt hơn để sống sót sang thế hệ tiếp theo.F ( i ) J F ( j ) F ( i ) > F ( j ) I JIF(i)JF(j)F(i)>F(j)IJ

Xác suất ngụ ý rằng có thể sống sót và có thể không (với "vận rủi"). Tôi không hiểu tại sao điều này là tốt cả? Nếu sẽ luôn luôn tồn tại sự lựa chọn, điều gì sẽ đi sai trong thuật toán? Tôi đoán là thuật toán sẽ tương tự như thuật toán tham lam nhưng tôi không chắc chắn.J I I


13
Bị mắc kẹt trong một tối thiểu địa phương.
Louis

Ngay cả trong cuộc sống thực, các đột biến có lợi không / thể dục môi trường lớn hơn không đảm bảo sự sống sót cho những người mắc bệnh này, điều này thực sự cho phép thể hiện nhiều đặc điểm hơn (và có khả năng có lợi nếu môi trường thay đổi bất ngờ, mặc dù điều đó không có khả năng cho một thuật toán tối ưu hóa). ... Và điều đó được nêu ở cuối câu trả lời của Nick, nên sao cũng được.
JAB

1
Nếu bạn giết chết kẻ yếu mọi lúc, bạn có gì ngoài một ngọn đồi đơn giản?
Raphael

Câu trả lời:


35

Ý tưởng chính là bằng cách cho phép các cá thể dưới mức tối ưu sống sót, bạn có thể chuyển từ một "đỉnh" trong cảnh tiến hóa sang một dạng khác thông qua một chuỗi các đột biến nhỏ tăng dần. Mặt khác, nếu bạn chỉ được phép đi lên dốc, nó đòi hỏi một sự đột biến khổng lồ và không có khả năng ồ ạt để chuyển đổi các đỉnh.

Đây là một sơ đồ cho thấy sự khác biệt:

nhập mô tả hình ảnh ở đây

Trên thực tế, tài sản toàn cầu hóa này là điểm bán chính của các thuật toán tiến hóa - nếu bạn chỉ muốn tìm một cực đại cục bộ thì tồn tại các kỹ thuật chuyên dụng hiệu quả hơn. (ví dụ: L-BFGS với độ dốc và tìm kiếm dòng khác nhau hữu hạn)

Trong thế giới thực của tiến hóa sinh học, cho phép các cá thể dưới mức tối ưu sống sót sẽ tạo ra sự mạnh mẽ khi cảnh quan tiến hóa thay đổi. Nếu tất cả mọi người tập trung ở một đỉnh, thì nếu đỉnh đó trở thành thung lũng thì toàn bộ dân số sẽ chết (ví dụ, khủng long là loài phù hợp nhất cho đến khi có một cuộc tấn công tiểu hành tinh và cảnh quan tiến hóa thay đổi). Mặt khác, nếu có sự đa dạng trong dân số thì khi cảnh quan thay đổi, một số người sẽ sống sót.


2
"Trong thế giới thực của tiến hóa sinh học, cho phép các cá thể dưới mức tối ưu sống sót sẽ tạo ra sự mạnh mẽ khi cảnh quan tiến hóa thay đổi" - như một nhà sinh vật học xếp hạng này. Những người có thể lực thấp không "được phép" sống sót để tối đa hóa thể lực vốn chỉ là bản chất của thực tế. Các sinh vật có thể lực thấp đang cố gắng sống sót nhiều như mọi thứ khác.
Jack Aidley

Tất nhiên bạn đúng, tự nhiên không quyết định cho phép hoặc không cho phép bất cứ điều gì, nó chỉ xảy ra. Mặt khác, có nhiều ví dụ trong đó con người đã chọn lọc các loài thực vật và động vật chỉ giữ "tốt nhất", tạo ra một nền độc canh không mạnh mẽ khi có một căn bệnh mới xuất hiện hoặc môi trường thay đổi.
Nick Alger

Có các kỹ thuật khác để chống lại hiệu ứng này, ví dụ như thực hiện các bước lớn hơn và chạy lại với các quần thể ban đầu ngẫu nhiên. Ngoài ra, với sự hiện diện của tái tổ hợp chéo, việc giữ kiểu gen yếu hơn có thể hữu ích nếu một loài mạnh hơn đột biến và lai giữa hai loài hóa ra còn mạnh hơn.
Raphael

13

Câu trả lời của Nick Alger rất hay, nhưng tôi sẽ làm cho nó trở nên toán học hơn một chút với một phương pháp ví dụ, phương pháp Metropolis-Hastings.

Kịch bản mà tôi sẽ khám phá là bạn có một dân số. Bạn đề xuất một đột biến từ trạng thái sang trạng thái với xác suất và chúng tôi cũng áp đặt điều kiện là . Chúng tôi cũng sẽ giả sử rằng cho tất cả ; nếu bạn không có thể lực trong mô hình của mình, bạn có thể khắc phục điều này bằng cách thêm một epsilon nhỏ ở mọi nơi.ijQ(i,j)Q(i,j)=Q(j,i)F(i)>0i

Chúng tôi sẽ chấp nhận chuyển đổi từ sang với xác suất:ij

min(1,F(j)F(i))

Nói cách khác, nếu phù hợp hơn, chúng tôi luôn lấy nó, nhưng nếu không phù hợp, chúng tôi sẽ lấy nó với xác suất , nếu không chúng tôi sẽ thử lại cho đến khi chúng tôi chấp nhận đột biến.j F ( j )jjF(j)F(i)

Bây giờ chúng tôi muốn khám phá , xác suất thực tế mà chúng tôi chuyển từ sang .i jP(i,j)ij

Rõ ràng đó là:

P(i,j)=Q(i,j)min(1,F(j)F(i))

Giả sử rằng . Sau đó = 1, và cứ thế:F(j)F(i)min(1,F(j)F(i))

F(i)P(i,j)
=F(i)Q(i,j)min(1,F(j)F(i))
=F(i)Q(i,j)
=Q(j,i)min(1,F(i)F(j))F(j)
=F(j)P(j,i)

Chạy đối số ngược và cũng kiểm tra trường hợp tầm thường trong đó , bạn có thể thấy điều đó cho tất cả và :i=jij

F(i)P(i,j)=F(j)P(j,i)

Điều này là đáng chú ý vì một vài lý do.

Xác suất chuyển tiếp không phụ thuộc vào . Tất nhiên, có thể chúng ta sẽ mất một thời gian để kết thúc với người thu hút, và có thể chúng ta sẽ mất một thời gian để chấp nhận một đột biến. Một khi chúng ta làm, xác suất chuyển tiếp là hoàn toàn phụ thuộc vào , và không phải trên .QFQ

Tổng kết tất cả những gì đưa ra:i

iF(i)P(i,j)=iF(j)P(j,i)

Rõ ràng phải tổng bằng nếu bạn tính tổng tất cả (nghĩa là xác suất chuyển tiếp ra khỏi một trạng thái phải tổng bằng ), vì vậy bạn nhận được:1 i 1P(j,i)1i1

F(j)=iF(i)P(i,j)

Nghĩa là, là hàm mật độ xác suất (không chuẩn hóa) trong đó nêu phương thức chọn. Bạn không chỉ được đảm bảo để khám phá toàn bộ cảnh quan, bạn còn làm như vậy theo tỷ lệ "phù hợp" với từng tiểu bang.F

Tất nhiên, đây chỉ là một ví dụ trong số nhiều người; như tôi đã lưu ý dưới đây, đây là một phương pháp rất dễ giải thích. Bạn thường sử dụng GA không phải để khám phá pdf, nhưng để tìm một điểm cực trị và bạn có thể thư giãn một số điều kiện trong trường hợp đó và vẫn đảm bảo sự hội tụ cuối cùng với xác suất cao.


Câu trả lời tuyệt vời! Tôi ước tôi có thể nâng cấp nó nhiều lần. Một câu hỏi: Bạn có thể thúc đẩy lý do tại sao chúng tôi sẽ chọn không? Được lựa chọn bởi vì sau đó tất cả phần còn lại của toán học hóa ra lại mang lại một kết quả rất tiện lợi? Hoặc có một số lý do bên ngoài tại sao đó là một lựa chọn tự nhiên cho ? (Tôi đã dự đoán rằng một giá trị tự nhiên cho sẽ là một giá trị vượt quá số lượng các cạnh ngoài từ trạng thái , trong trường hợp đó chúng ta sẽ không có vì nói chung, mức độ của và có thể khác nhau.)Q Q ( i , j ) i Q ( i , j ) = Q ( j , i )Q(i,j)=Q(j,i)QQ(i,j)iQ(i,j)=Q(j,i)jij
DW

Động lực trong trường hợp này là điều kiện cân bằng chi tiết, , là điều kiện đủ (mặc dù không cần thiết) để đảm bảo rằng là văn phòng phẩm pdf. Nếu bạn muốn pdf của bạn đứng yên, thì nó sẽ giúp quá trình có thể đảo ngược thời gian theo một nghĩa nào đó. Ngoài ra, nếu nó giúp, thuật toán MH được thiết kế cho các vấn đề liên tục (vận chuyển neutron) khi không có số lượng các cạnh ngoài rời rạc. Tất nhiên, nếu bạn đang cố gắng tìm mức tối đa toàn cầu, thì việc tìm kiếm toàn bộ pdf không phải lúc nào cũng là điều bạn thực sự muốn. Điều này chỉ nhằm mục đích minh họa. FF(i)P(i,j)=F(j)P(j,i)F
Bút danh

7

Ưu điểm của việc sử dụng GA là bạn có thể khám phá các không gian tìm kiếm rộng hơn bằng cách đi theo các đường dẫn đến từ các ứng cử viên có khả năng xấu hơn. Cần có những ứng cử viên tồi tệ hơn để khám phá những lĩnh vực tìm kiếm khác nhau này, không nhiều nhưng chắc chắn là một số ít. Nếu bạn bắt đầu chỉ dùng thứ tốt nhất mỗi khi bạn loại bỏ khía cạnh khám phá này của thuật toán và nó sẽ trở thành một người leo đồi nhiều hơn. Ngoài ra chỉ chọn tốt nhất liên tục có thể dẫn đến hội tụ sớm.


6

Trên thực tế, các thuật toán lựa chọn có cả hai cách tiếp cận. Một cách là những gì bạn đề xuất và cách khác là những người có thể lực cao hơn được chọn và những người có người thấp hơn thì không.

Cách tiếp cận bạn chọn để lựa chọn cũng phù hợp với vấn đề bạn đang cố gắng mô hình hóa. Trong một thử nghiệm hồi còn đi học, chúng tôi đã cố gắng phát triển những người chơi bài bằng cách cho họ chơi các trò chơi với nhau (ví dụ như lựa chọn giải đấu ). Trong một kịch bản như vậy, chúng tôi rất có thể luôn ưu tiên hơn (từ ví dụ của bạn) vì khía cạnh 'may mắn' đã có sẵn trong trò chơi. Ngay cả khi cho bất kỳ hai và , trong bất kỳ vòng nào, hoàn toàn bằng cách xử lý tay và cách người khác chơi, có thể giành chiến thắng trong vòng đó và do đó chúng tôi có thể kết thúc vớiIJF(i)>F(j)IJJF(j)>F(i). Hãy nhớ rằng một dân số thường đủ lớn để người ta có thể đủ khả năng để mất một số cá nhân tốt và nói chung, điều đó sẽ không quan trọng bằng.

Vì GA được mô hình hóa theo sự tiến hóa trong thế giới thực, khi phân phối xác suất được sử dụng, chúng chủ yếu được mô hình hóa về cách các cộng đồng thực sự phát triển trong đó đôi khi những người có thể lực thấp hơn có thể sống sót trong khi những người có thể lực cao hơn có thể không (tương tự thô thiển: tai nạn xe hơi, tự nhiên thảm họa v.v .:-)).


0

Rất đơn giản, từ một POV: đôi khi các giải pháp "trẻ em" có thể tập cao hơn có thể được sinh ra từ các giải pháp "cha mẹ" có thể lực thấp hơn thông qua trao đổi chéo hoặc đột biến (đó thực sự là rất nhiều lý thuyết về thuật toán di truyền). Vì vậy, nói chung, người ta muốn tìm kiếm / mang theo các giải pháp thể dục cao hơn nhưng quá chú trọng vào việc giữ / nhân giống chỉ các giải pháp thể dục cao có thể dẫn đến bị mắc kẹt trong cực tiểu địa phương và không tìm kiếm "cảnh quan tiến hóa" lớn. thực tế người ta có thể làm cho "mức cắt giảm thể lực cao hơn" để tồn tại nghiêm ngặt hoặc lỏng lẻo như mong muốn và thử nghiệm về cách nó ảnh hưởng đến chất lượng của giải pháp cuối cùng. cả hai chiến lược cắt giảm quá nghiêm ngặt hoặc quá lỏng lẻo sẽ dẫn đến các giải pháp cuối cùng kém hơn. tất nhiên tất cả điều này có một số mối quan hệ với tiến hóa sinh học thực sự. có nhiều hơn "

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.