Tại sao phỏng đoán tham lam rất khó khăn?

Gần đây tôi đã biết về phỏng đoán tham lam cho vấn đề siêu dây ngắn nhất .

Trong bài toán này, chúng tôi được cung cấp một tập hợp các chuỗi $s_1,\dots, s_n$ và chúng tôi muốn tìm các chuỗi siêu ngắn nhất nghĩa là mỗi xuất hiện dưới dạng một chuỗi con của . $s$ $s_i$ $s$

Vấn đề này là NP-hard và sau một chuỗi dài các bài báo, thuật toán xấp xỉ được biết đến nhiều nhất cho vấn đề này có tỷ lệ [Paluch '14]. $2+\frac{11}{30}$

Trong thực tế, các nhà sinh học sử dụng thuật toán Greedy sau:

Ở mỗi bước, hợp nhất hai chuỗi có sự chồng chéo tối đa trên tất cả các cặp (hậu tố tối đa là tiền tố của một chuỗi khác) và lặp lại trong trường hợp mới này cho đến khi chỉ còn một chuỗi (là siêu chuỗi của tất cả các chuỗi đầu vào )

Giới hạn dưới của $2$ trong tỷ lệ gần đúng của Thuật toán tham lam này có thể được lấy từ đầu vào $c(ab)^k,(ba)^k,(ab)^kc$ .

Thật thú vị, nó đã được phỏng đoán rằng đây là ví dụ tồi tệ nhất, tức là Greedy đạt được một phép tính gần đúng $2$ cho bài toán siêu chuỗi ngắn nhất. Tôi đã rất ngạc nhiên khi thấy rằng một thuật toán tự nhiên và dễ dàng như vậy rất khó để phân tích.

Có bất kỳ trực giác, sự kiện, quan sát, ví dụ cho thấy tại sao câu hỏi này là thách thức?

reference-request approximation-algorithms greedy-algorithms

— Mathieu Mari
nguồn

Một trong những lý do có thể là các thuộc tính đã biết của các biểu diễn đồ thị tiêu chuẩn của vấn đề (chẳng hạn như bất đẳng thức Monge và Triple) không đủ để chứng minh cho sự phỏng đoán tham lam. Xem, ví dụ, Laube, Weinard "Bất bình đẳng có điều kiện và vấn đề siêu chuỗi phổ biến ngắn nhất", và Weinard, Schnitger "Về phỏng đoán siêu chuỗi tham lam".

— Alex Golovnev

@AlexGolovnev: Có vẻ như là một câu trả lời hoàn toàn tốt cho tôi!

— Joshua Grochow

@JoshuaGrochow: Cảm ơn! Bây giờ tôi sẽ mở rộng nó để trả lời.

— Alex Golovnev

Trước tiên tôi xin thử tóm tắt những gì đã biết về Phỏng đoán tham lam.

Blum, Jiang, Li, Tromp, Yannakakis chứng minh rằng Thuật toán tham lam đưa ra một xấp xỉ 4, và Kaplan và Shafrir cho thấy rằng nó đưa ra một xấp xỉ 3,5 cho bài toán Siêu chuỗi phổ biến ngắn nhất.
Một phiên bản của thuật toán tham lam được biết là đưa ra một xấp xỉ 3 ( Blum, Jiang, Li, Tromp, Yannakakis ).
$3$ $4$
Giả thuyết tham lam giữ nếu thuật toán tham lam xảy ra để hợp nhất các chuỗi theo một số thứ tự cụ thể ( Weinard, Schnitger ; Laube, Weinard ).
Thuật toán tham lam đưa ra xấp xỉ 2 lần của Tarhio nén , Ukkonen (được định nghĩa là tổng chiều dài của chuỗi đầu vào trừ đi độ dài của siêu chuỗi phổ biến ngắn nhất).
Có một triển khai cực kỳ hiệu quả của Thuật toán Tham lam Ukkonen .

Tôi nghĩ rằng một trong những lý do tại sao thật khó để chứng minh Giả thuyết Tham lam có thể là như sau. Hầu hết các cách tiếp cận để chứng minh các đảm bảo gần đúng của Thuật toán tham lam phân tích biểu đồ chồng lấp (hoặc, tương đương, biểu đồ tiền tố) của bộ chuỗi đầu vào. Chúng tôi chỉ biết một số tính chất của các biểu đồ này (như bất đẳng thức Monge và Triple), nhưng các tính chất này không đủ để chứng minh Giả thuyết Tham lam ( Weinard, Schnitger ; Laube, Weinard ).

— Alex Golovnev
nguồn