Gần đây tôi đã biết về phỏng đoán tham lam cho vấn đề siêu dây ngắn nhất .
Trong bài toán này, chúng tôi được cung cấp một tập hợp các chuỗi và chúng tôi muốn tìm các chuỗi siêu ngắn nhất nghĩa là mỗi xuất hiện dưới dạng một chuỗi con của .
Vấn đề này là NP-hard và sau một chuỗi dài các bài báo, thuật toán xấp xỉ được biết đến nhiều nhất cho vấn đề này có tỷ lệ [Paluch '14].
Trong thực tế, các nhà sinh học sử dụng thuật toán Greedy sau:
Ở mỗi bước, hợp nhất hai chuỗi có sự chồng chéo tối đa trên tất cả các cặp (hậu tố tối đa là tiền tố của một chuỗi khác) và lặp lại trong trường hợp mới này cho đến khi chỉ còn một chuỗi (là siêu chuỗi của tất cả các chuỗi đầu vào )
Giới hạn dưới của trong tỷ lệ gần đúng của Thuật toán tham lam này có thể được lấy từ đầu vào .
Thật thú vị, nó đã được phỏng đoán rằng đây là ví dụ tồi tệ nhất, tức là Greedy đạt được một phép tính gần đúng cho bài toán siêu chuỗi ngắn nhất. Tôi đã rất ngạc nhiên khi thấy rằng một thuật toán tự nhiên và dễ dàng như vậy rất khó để phân tích.
Có bất kỳ trực giác, sự kiện, quan sát, ví dụ cho thấy tại sao câu hỏi này là thách thức?