Các vấn đề lớn chưa được giải quyết trong các hệ thống phân tán?

23

Lấy cảm hứng từ câu hỏi này , các vấn đề chính và các giải pháp hiện tại cần cải thiện trong lĩnh vực hệ thống phân tán (lý thuyết) là gì.

Một cái gì đó như giao thức thành viên, thống nhất dữ liệu?

big-list dc.distributed-comp

— zengr
nguồn

28

Xem, ví dụ, Tám vấn đề mở trong điện toán phân tán .

— Quán cà phê Massimo
nguồn

3

giấy tuyệt vời! Cuối tuần của tôi đi! :)

— zengr

14

Độ phức tạp thời gian phân tán của nhiều vấn đề đồ thị vẫn là một câu hỏi mở.

Nói chung, các thuật toán đồ thị phân tán là một lĩnh vực mà chúng ta mong đợi sẽ có (ít nhất là không có triệu chứng) khớp với giới hạn trên và dưới cho độ phức tạp thời gian phân tán của các vấn đề đồ thị. Ví dụ, đối với nhiều vấn đề tối ưu hóa giới hạn chặt chẽ được biết đến . Tuy nhiên, có rất nhiều vấn đề phá vỡ đối xứng cổ điển vẫn chưa được hiểu rõ.

Chúng tôi không biết, ví dụ, có bao nhiêu viên đạn lạc hiện nó đi để tìm một bộ tối đa độc lập , một phù hợp tối đa , một hợp đỉnh màu với màu, hoặc một hợp cạnh màu với màu sắc trong một biểu đồ với mức độ tối đa . Tất cả các vấn đề này đều dễ dàng giải quyết bằng các thuật toán tập trung tham lam và có các thuật toán phân tán hiệu quả cho từng vấn đề này, nhưng chúng tôi không biết liệu có bất kỳ thuật toán hiện tại nào là tối ưu không. $\Delta+1$ $2\Delta-1$ $\Delta$

Ví dụ, đối với tất cả các vấn đề này, có các thuật toán phân tán xác định cho mô hình LOCAL với thời gian chạy của , trong đó là số lượng nút. Người ta biết rằng những vấn đề này không thể được giải quyết trong các vòng , nhưng không biết liệu chúng có thể được giải quyết kịp thời vòng. Nói chung, chúng tôi không hiểu thời gian chạy phụ thuộc vào mức độ tối đa - đây là điều tôi gọi là vấn đề phối hợp cục bộ . $O(\Delta + \log^* n)$ $n$ $O(\Delta) + o(\log^* n)$ $o(\Delta) + O(\log^* n)$

Vai trò của sự ngẫu nhiên là một vấn đề lớn khác. Ví dụ: nhiều vấn đề được đề cập ở trên có thể được giải quyết trong thời gian polylog với các thuật toán ngẫu nhiên (nghĩa là thời gian là polylog trong đối với bất kỳ giá trị nào của ), nhưng không có thuật toán xác định thời gian polylog nào được biết đến như là độc lập tối đa bộ. Câu hỏi này, cũng như nhiều vấn đề mở khác, được thảo luận chi tiết hơn trong Phần 11 của cuốn sách gần đây của Barenboim và Elkin . $n$ $\Delta$

Ở trên, tôi đã tập trung vào các câu hỏi dành riêng cho điện toán phân tán. Ngoài ra còn có các câu hỏi mở trong các thuật toán đồ thị phân tán có các kết nối không cần thiết với các vấn đề mở trong khoa học máy tính lý thuyết nói chung. Ví dụ, giới hạn dưới không liên tục cho mô hình cụm bị tắc nghẽn là một câu hỏi mở lớn trong điện toán phân tán; gần đây người ta đã phát hiện ra rằng các giới hạn thấp hơn như vậy cũng sẽ bao hàm các giới hạn thấp mới cho ACC.

— Jukka Suomela
nguồn

7

Các vấn đề mở về "Thuật toán phân tán cho cây khoảng cách tối thiểu (MST)": (được liệt kê trong [1])

Liên quan đến thời gian phức tạp,

Các thuật toán tối ưu gần thời gian và giới hạn dưới xuất hiện trong [2] và các tài liệu tham khảo trong tài liệu này. Độ phức tạp thời gian tối ưu vẫn là một vấn đề mở.
Liên quan đến thông điệp phức tạp,

Theo độ phức tạp của thông điệp , mặc dù giới hạn chặt chẽ không có triệu chứng của cho vấn đề MST trong đồ thị nói chung đã được biết, việc tìm ra hằng số thực tế vẫn là một vấn đề mở. $O(m + n \log n)$
Liên quan đến mô hình đồng bộ :

Trong mô hình đồng bộ cho các mạng lớp phủ, trong đó tất cả các bộ xử lý được kết nối trực tiếp với nhau, MST có thể được xây dựng trong thời gian sublogarithmic, cụ thể là các vòng giao tiếp [3] và không biết giới hạn dưới tương ứng. $O(\log \log n)$

Cũng lưu ý rằng có một thuật toán xấp xỉ cho MST phân tán [4]. $O(\log n)$

[1] Thuật toán phân tán cho các cây kéo dài tối thiểu của Sergio Rajsbaum trong "Bách khoa toàn thư về thuật toán", 2008.

[2] MST phân phối cho đồ thị đường kính không đổi của Lotker et al. Phân phối. Tính toán., 2006.

[3] Xây dựng cây bao trùm trọng lượng tối thiểu trong các vòng giao tiếp $O(\log \log n)$ của Lotker et al. SIAM J. Tính toán, 35 (1), 2005.

[4] Thuật toán xấp xỉ phân tán nhanh cho các cây kéo dài tối thiểu của Khan et al. DISC 2006.

— hengxin
nguồn

3

Về mục thứ 3: một giới hạn trên của cũng được biết đến, xem arxiv.org/abs/1412.2333 - và như tôi đã đề cập ngắn gọn trong câu trả lời của mình, ngày nay chúng ta hiểu rõ hơn một chút tại sao có quá ít tiến bộ với giới hạn dưới cho mô hình cụm bị tắc nghẽn (giới hạn dưới không cần thiết cho mô hình cụm bị tắc nghẽn sẽ ngụ ý giới hạn phức tạp mạch không giới hạn).

O (\log \log \log n)

$O(\log \log \log n)$

— Jukka Suomela

4

xem thêm (gần đây hơn) một bài trình chiếu "Các vấn đề khoa học máy tính chưa được giải quyết trong điện toán phân tán" từ năm 2012 bởi nhà nghiên cứu của Notre Dame, Douglas Thain , người đứng đầu phòng thí nghiệm điện toán hợp tác của họ. nó có nhiều hơn một ứng dụng nghiêng nhưng các câu hỏi chính được liệt kê chắc chắn dẫn đến các lĩnh vực lý thuyết.

Vấn đề Kiloscale: Bất kỳ quy trình làm việc nào có đủ đồng thời sẽ có thể chạy chính xác trên lõi 1K lần đầu tiên và mỗi lần không có trợ giúp sysadmin.
Vấn đề dừng: Đưa ra một quy trình làm việc chạy trên một nghìn nút, làm cho nó dừng lại và dọn sạch tất cả trạng thái liên quan với sự chắc chắn hoàn toàn.
Vấn đề phụ thuộc:

(1) Đưa ra một chương trình, tìm ra mọi thứ mà nó thực sự cần để chạy trên một máy khác.

(2) Đưa ra một quy trình, tìm ra các tài nguyên (phân tán) mà nó thực sự sử dụng trong khi chạy.

(3) Mở rộng 1 và 2 cho toàn bộ quy trình làm việc.
Vấn đề kích thước phải: Đưa ra một ứng dụng (có cấu trúc) và một cụm, đám mây hoặc lưới nhất định, chọn một phân bổ tài nguyên đạt được hiệu suất tốt với chi phí chấp nhận được.
Sự cố khắc phục sự cố: Khi xảy ra lỗi ở giữa ngăn xếp phần mềm 100 lớp, làm thế nào và khi nào bạn báo cáo / thử lại / bỏ qua / khắc phục lỗi?
Vấn đề thiết kế: Các ứng dụng nên được thiết kế như thế nào để chúng phù hợp với điện toán phân tán?

— vzn
nguồn