Tôi có hai triển khai thuật toán di truyền được cho là hành xử tương đương. Tuy nhiên do các hạn chế kỹ thuật không thể giải quyết, đầu ra của chúng không hoàn toàn giống nhau, được đưa ra cùng một đầu vào.
Tuy nhiên, tôi muốn chứng minh rằng không có sự khác biệt đáng kể về hiệu suất.
Tôi có 20 lần chạy với cùng một cấu hình cho mỗi hai thuật toán, sử dụng các hạt số ngẫu nhiên ban đầu khác nhau. Cho mỗi lần chạy và thế hệ các lỗi tối thiểu thể dục của cá nhân tốt nhất trong dân số được ghi nhận. Thuật toán sử dụng một cơ chế bảo tồn ưu tú, do đó, thể lực của cá nhân tốt nhất đang giảm đi một cách đơn điệu. Một lần chạy bao gồm 1000 thế hệ, vì vậy tôi có 1000 giá trị mỗi lần chạy. Tôi không thể lấy thêm dữ liệu, vì các tính toán rất tốn kém.
Tôi nên sử dụng bài kiểm tra nào? Một cách dễ dàng có lẽ là chỉ so sánh lỗi trong các thế hệ cuối cùng (một lần nữa, tôi sẽ sử dụng thử nghiệm nào ở đây)? Nhưng người ta cũng có thể nghĩ về việc so sánh hành vi hội tụ nói chung.