Sắp xếp với trung bình so sánh

Có một thuật toán sắp xếp dựa trên so sánh sử dụng trung bình so sánh $\mathrm{lg}(n!)+o(n)$ không?

Sự tồn tại của thuật toán so sánh trường hợp xấu nhất $\mathrm{lg}(n!)+o(n)$ là một vấn đề mở, nhưng trường hợp trung bình đủ cho một thuật toán ngẫu nhiên với so sánh dự kiến $\mathrm{lg}(n!)+o(n)$ cho mọi đầu vào . Ý nghĩa của $\mathrm{lg}(n!)+o(n)$ là so sánh $o(n)$ từ tối ưu, lãng phí trung bình chỉ $o(1)$ so sánh cho mỗi yếu tố.

Vì tôi đã có một thuật toán như vậy, tôi đưa nó vào như một câu trả lời (sử dụng định dạng Q / A ), nhưng tôi hoan nghênh các câu trả lời bổ sung, bao gồm các thuật toán khác, cho dù thuật toán đó đã được biết đến, cải thiện $o(n)$ và tệ nhất- trường hợp $\mathrm{lg}(n!)+o(n)$ .

Công việc trước:
Sắp xếp hợp nhất sử dụng so sánh (ngay cả trong trường hợp xấu nhất). Sắp xếp hợp nhất (còn được gọi là sắp xếp Ford bồi Johnson) cũng sử dụng so sánh nhưng với hằng số nhỏ hơn nhiều trong . Cải thiện độ phức tạp trung bình để phân loại dựa trên so sánh (của Kazuo Iwama và Junichi Teruyama) - thuật toán chèn (1,2) của họ giống như một phần câu trả lời của tôi dưới đây. $\mathrm{lg}(n!)+ Θ(n)$
$\mathrm{lg}(n!)+ Θ(n)$ $Θ(n)$

cc.complexity-theory ds.algorithms sorting

— Dmytro Taranovsky
nguồn

Câu hỏi này trùng lặp với sắp xếp so sánh ngẫu nhiên tối ưu , nhưng được nhấn mạnh khác nhau (hành vi tiệm cận cụ thể ở đây - so với trạng thái kiến thức chung, tất cả các kích cỡ đầu vào và khác biệt với trường hợp xấu nhất ở đó), tôi quyết định sử dụng một câu hỏi mới.

— Dmytro Taranovsky

Cập nhật: Tôi đã mở rộng câu trả lời này thành một bài viết Sắp xếp với mức trung bình của so sánh $\mathrm{lg}(n!)+o(n)$ .

Vâng, một thuật toán như vậy tồn tại. Tôi sẽ chỉ chứng minh ràng buộc , nhưng theo giả định ngẫu nhiên có khả năng, chúng tôi cũng nhận được . Tôi cũng sẽ mô tả một nỗ lực cho và . $\mathrm{lg}(n!)+o(n)$ $\mathrm{lg}(n!)+O(n^{1-ε})$ $n^{0.5+o(1)}$ $O(n^{0.5-ε})$

Chúng ta có thể giả định rằng tất cả các yếu tố là khác biệt, bằng cách chú thích chúng nếu cần thiết; trường hợp trung bình sử dụng các yếu tố riêng biệt theo thứ tự ngẫu nhiên. Chúng ta có thể tính toán số lượng so sánh trung bình bằng cách thêm tổn thất entropy cho mỗi so sánh liên quan đến việc sử dụng một đồng tiền công bằng.

Điểm bắt đầu là sắp xếp chèn với tìm kiếm nhị phân để quyết định vị trí chèn phần tử tiếp theo vào tập hợp con sắp xếp . Khi , một phép chèn sử dụng tối đa so sánh, trong đó (về mặt entropy) là tối ưu cho đến một yếu tố phụ (và đối với độ phức tạp trong trường hợp trung bình, cũng hoạt động). Bây giờ, khikhông gần với lũy thừa 2, chèn một phần tử là tối ưu (ngay cả trong trường hợp trung bình và bất kể chúng ta cân bằng mỗi truy vấn như thế nào), nhưng nếu lãng phí so sánh , chúng ta có thể điều khiển phân phối đồng đều trong một khoảng $S$ $(1-ε)2^m ≤ |S| ≤ 2^m-1$ $m$ $O(ε)$ $2^m ≤ |S| ≤ (1+ε) 2^m$ $|S|$ $A$ $o(1)$ $A$ $S$ có độ dài gần bằng công suất 2, chúng ta có được sự tối ưu mong muốn.

Chúng tôi đạt được điều này bằng cách thêm các phần tử theo lô và đôi khi so sánh hiệu quả các phần tử của lô với nhau, sao cho khoảng tương ứng với phần tử giảm theo cách bán ngẫu nhiên (và với phân phối xác suất của trong khoảng gần thống nhất), và khi chiều dài khoảng là đủ gần để một sức mạnh của 2, làm việc tìm kiếm nhị phân để chèn . $S$ $A$ $A$ $A$

Cấu trúc chung

Chúng tôi sẽ giữ một tập hợp con của các phần tử được sắp xếp và với mỗi phần tử chưa được sắp xếp , chúng tôi sẽ theo dõi khoảng thời gian tối thiểu của nơi được biết là nằm. là độ dài của ; là theo danh tính của các khoảng. $S$ $A$ $I_A$ $S$ $A$ $|I_A|$ $I_A$ $I_A=I_B$

Đặt là: So sánh với và sau đó (theo thứ tự ngẫu nhiên) so sánh và với các phần tử tương ứng của cho đến khi các khoảng của chúng tách rời nhau (hoặc có độ dài 1). Phần tử của được chọn (một cách nhất quán) để làm cho xác suất so sánh càng gần 1/2 càng tốt, giả sử rằng khi được gọi, được phân phối đồng đều trên . Do sự khác biệt cuối cùng, duy trì giả định tính đồng nhất. $\mathrm{Compare}(A,B)$ $A$ $B$ $A$ $B$ $S$ $S$ $\mathrm{Compare}$ $(A,B)$ $I_A⨯I_B$ $\mathrm{Compare}$

Các phần sau đây có thể được đọc độc lập với nhau.

Một thuật toán $\mathrm{lg}(n!)+o(n)$

Đưa ra: Một sắp xếp danh sách , và một loạt yếu tố không được phân loại; ; các yếu tố không được phân loại là ngẫu nhiên so với . $S$ $m$ $m∈ω(1)∩o(|S|)$ $S$

Lặp lại (1) - (3) trong khi có thể:
1. Chọn hai phần tử và từ lô có (mọi lựa chọn sẽ hoạt động). 2. Chạy . 3. Nếu đủ gần với công suất 2, ^{(lưu ý 1)} loại bỏ khỏi lô (mà không quên ); và làm tương tự với . Cuối cùng: Chèn tất cả các yếu tố vào $A$ $B$ $I_A=I_B$
$\mathrm{Compare}(A,B)$
$|I_A|$ $A$ $I_A$ $B$
và hoàn thành việc sắp xếp. $S$

Lưu ý 1: Đối với "đủ gần", mọi lỗi tương đối (như hàm của ) hoạt động miễn là các phần tử sẽ bị xóa trong bước (4) (có thể bằng ghi chú 2). Theo giả định ngẫu nhiên được phỏng đoán, sử dụng lỗi tương đối bắt được các phần tử , cho phép một $o(1)$ $m$ $m-o(m)$ $c \log \log m / \log m$ $m(1-\log^{-Θ(c)}m)$ so sánh trung bình thuật toán sắp xếp. $\mathrm{lg}(n!)+O(n \log \log n / \log n)$

Lưu ý 2: Bởi vì cùng một chuỗi so sánh dẫn đến khoảng bounding cùng, gần như tất cả các yếu tố sẽ đi qua bước (1) lần (trừ khi bị loại bỏ ở bước 4). Ban đầu, nếu và chúng tôi chọn , chúng ta so sánh chống lại yếu tố $Ω(\log m)$ $A < B$ $A$ $A$ và mỗi ứng dụng của bước (3) đếncóxác suất giảmtrong $S[≈(1-1/\sqrt{2})|S|]$ $A$ $O(1)$ $|I_A|$ lần. Bây giờ cho mỗi tỷ lệmà không phải là một cường quốc hợp lý 2, chúng tôi đã $≈1/(1-1/\sqrt{2})$ $a>1$ , và vì vậy chúng tôi có đượcbị ràng buộc. $∀ε>0 ∀d>0 ∃m,n∈\mathbb{N} \,\, 1-ε < \frac{a^m}{d2^n} < 1+ε$ $o(n)$

Một khả năng thuật toán $\mathrm{lg}(n!)+O(n^{1-ε})$

Modulo một giả định ngẫu nhiên, chúng ta có thể đạt được so sánh trung bình như sau. $\mathrm{lg}(n!)+O(n^{1-ε})$

Xáo trộn ngẫu nhiên các mục và sắp xếp nửa đầu vào danh sách , trong khi giữ nửa sau là một lô chưa sắp xếp. $S$
Lặp lại cho đến khi lô trống:
Chọn ngẫu nhiên . Đặt . Nếu là trống rỗng, loại bỏ từ hàng loạt và chèn vào . Nếu không thì: $A∈\text{batch}$ $G = \{ B∈\text{batch}: |P(A < B) - 0.5| < n^{-0.51ε} \}$ $G$ $A$ $S$
1. Nếu có mà với xác suất (nói ≥0.05), làm trong phạm vi error lỗi tương đối của thừa 2, chạy và nếu thành công (tức là nằm trong $B∈G$ $Θ(1)$ $\mathrm{Compare}(A,B)$ $|I_A|$ $n^{-ε}$ $\mathrm{Compare}(A,B)$ $|I_A|$ sai số tương đối của một sức mạnh của 2), removetừ hàng loạt và chèn vào. $n^{-ε}$ $A$ $S$
2. Nếu không có như vậy , hãy chạy cho ngẫu nhiên . $B∈G$ $\mathrm{Compare}(A,B)$ $B∈G$

Nếu giả định ngẫu nhiên của chúng tôi hoạt động ra (tức là sự phân bố của độ dài khoảng thời gian và vị trí là đủ ngẫu nhiên), sau đó trong suốt phần lớn quá trình này, một điển hình có thể được hiệu quả so với lựa chọn các yếu tố (với độ dài khoảng khác nhau). Do đó, chúng tôi thường có thể chọn một so sánh cho (1) ở trên, và nếu chúng ta không may mắn với kết quả so sánh, chúng tôi vẫn nhận được cơ hội, do đó đạt được (nếu là đủ nhỏ, nói 0.01) một $A$ $n^{Θ(1)}$ $n^{Θ(1)}$ $Θ(\log n)$ $ε$ Thuật toán -comparison. Với một số thay đổi và xấp xỉ, phép tính tổng có thể được thực hiện theo chuẩn: Cho một phần tử , tính độ dài khoảng thời gian hứa hẹn, sau đó tra cứu s với tâm xấp xỉ đúng và độ dài khoảng. $\mathrm{lg}(n!)+O(n^{1-ε})$ $A$ $B$

Có một số cách để tối ưu hóa các so sánh, nhưng trở ngại là mỗi so sánh có thể không may mắn và chúng ta có một số lượng so sánh hạn chế. Nếu sau khi tối ưu hóa, thực hiện trung bình 4 so sánh và 'thành công' với 1/4 xác suất, chúng tôi nhận . $\mathrm{Compare}(A,B)$ $ε≈(1-ε)/4/\log_{4/3} 2 ≈ 0.09$

Một cách tiếp cận có lẽ tốt hơn nhiều là đợi cho đến khi một khoảng gần với công suất 2, kiểm soát không phải độ dài khoảng riêng lẻ mà là phân phối độ dài.

Nỗ lực ở thuật toán $\mathrm{lg}(n!)+n^{0.5+o(1)}$

Giả sử rằng và chúng tôi được cung cấp một lô phần tử chưa được sắp xếp với các khoảng cũng được đưa ra, với thường là và với $|S|=n$ $n$ $I_A$ $|I_A|$ $n^{1-o(1)}$ phân bố đều (lên đến một lỗi ngẫu nhiên, và giữ đủ độ chính xác ngay cả khi điều kiện trên). Sau đó, chúng ta có thể sắp xếp các mục lãng phí trung bìnhso sánh như sau: (*) Chèn tất cả các phần tử theo thứ tự ban đầu $\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$ $A < S[i]$ $n^{0.5+o(1)}$
. Bằng cách này, tất cả các phần tử được chèn khi độ dài khoảng của chúng gần với công suất 2. $\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$

Thuật toán sắp xếp sẽ là: Xáo trộn ngẫu nhiên danh sách và sắp xếp nửa đầu tiên . Để chèn nửa thứ hai, hãy phân phối đúng và thực hiện (*) ở trên. $S$

Để làm quyền phân phối, chúng ta có thể thực hiện phân phối 'ngẫu nhiên', và sau đó giữ lại phần đúng của các phần tử cho mỗikhi ngẫu nhiên phần còn lại (lặp lại nếu cần thiết). Tuy nhiên, trong khi điều này nên sửa $\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$ $|I_A|/2^{\lfloor \mathrm{lg} |I_A| \rfloor}$ toàn cầu, chúng tôi không biết liệu nó có thể được kiểm soát cục bộ với độ chính xác cần thiết hay không (do đó từ "nỗ lực" ở trên). $\frac{|I_A|}{2^{\lfloor \mathrm{lg} |I_A| \rfloor}}$

Để thực hiện phân phối 'ngẫu nhiên', chúng ta có thể sử dụng ngẫu nhiên với , ngoại trừ với ban đầu hoàn toàn giống nhau, chúng ta không mong đợi ngẫu nhiên tại một độ sâu sublogarithmic (tức là với đủ lâu). Tuy nhiên, tôi phỏng đoán rằng chúng ta có được sự ngẫu nhiên hóa ở độ sâu sublogarithmic bằng cách sử dụng các khái quát hóa (có thể là bất kỳ lựa chọn hợp lý nào sẽ hoạt động) của để $\mathrm{Compare}(A,B)$ $P(A < B)≈0.5$ $I_A$ $I_A$ $\mathrm{Compare}$ các yếu tố: Nếu chúng tôi tiếp tục các yếu tố vướng (tức là kết nối sử dụng kết quả so sánh), chúng ta nên có khoảng noncommuting sự lựa chọn cho từng so sánh với . Điều này sẽ cho phép sâu ngẫu nhiên, như mong muốn (giả định rằng là không quá lớn như chúng ta cần phải sâu $k=ω(1)$ $k=ω(1)$ $k$ $S$ $O(\log_k n + \log k)$ $k$ $Θ(\log k)$ để phân tâm các yếu tố). Tôi hy vọng rằng tính toán có thể được thực hiện quasilinear nếu sử dụng một đủ nhỏ . $k$

Kể từ khi so sánh với có khả năng chỉ chất thải entropy, các ngẫu nhiên ban đầu và nonuniformity nhẹ các yếu tố trong khoảng bounding của họ nên chỉ cần entropy thải. Nếu việc định hình phân phối thành công đủ tốt, chất thải entropy bắt nguồn chủ yếu từ sự không phù hợp độ dài khoảng thời gian trong (*) (do đó ). $1/2+n^{-0.5}$ $O(1/n)$ $n^{o(1)}$ $n^{0.5+o(1)}$

Một tổ hợp : $\mathrm{lg}(n!)+O(n^{0.5-ε})$ Nếu việc định hình phân phối hoạt động đủ tốt và chúng ta làm cho kích thước lô bằng nhau và chọn lọc từ chối yếu tố trong (*) (ở trên), chúng ta có thể chèn tất cả nhưng những yếu tố với chất thải entropy $|S|+n^{0.5+ε}$ $≈n^{0.5+ε}$ $≈n^{0.5+ε}$ như sau. Chiathành khoảng gần bằng nhau, và khi trong chèn, lắng về một khoảng thời gian, từ chối (tức là hủy chèn) nếu khoảng thời gian quá dài, do đó làm giảm sự biến đổi về độ dài của những khoảng thời gianlần, lần lượt làm giảm các biến thể độ dài của các khoảng thời gian ngẫu nhiêntrong $n^{0.5-ε/2+o(1)}$ $S$ $n^ε$ $I_A$ $Θ(n^{ε/2})$ $n^{1-o(1)}$ $n^{ε/2-o(1)}$ lần, khi cần thiết Bây giờ, chúng ta có thể sử dụng trên thuật toán để chèn các yếu tố còn lại với chất thải nếu là đủ nhỏ. $\mathrm{lg}(n!)+O(n^{1-ε})$ $O(n^{0.5-ε'})$ $ε$

Độ phức tạp trong trường hợp xấu nhất của sắp xếp: Rất có thể, có một thuật toán sắp xếp với so sánh trường hợp xấu nhất. Để tìm trung vị, có một khoảng cách tuyến tính giữa các trường hợp trung bình ( so sánh ) và trường hợp xấu nhất (ít nhất so sánh). Tuy nhiên, để sắp xếp, có rất nhiều sự tự do để sắp xếp so sánh và tìm kiếm các thuật toán sắp xếp mới. $\mathrm{lg}(n!)+o(n)$ $1.5n+o(n)$ $(2+ε)n-O(1)$

— Dmytro Taranovsky
nguồn

Tôi nghĩ bạn nên viết nó lên như một tờ giấy.

— Emil Jeřábek

@ EmilJeřábek Đồng ý. Là một trang web cấp độ nghiên cứu, nhiều câu hỏi và câu trả lời ở đây là các bài báo nhỏ, nhưng với độ dài và tầm quan trọng ở đây, một bài viết chính thức là đáng mong đợi. Vui lòng cho tôi biết (tại dmytro@mit.edu) về phần nào sẽ được mở rộng trong bài viết (với câu trả lời này vẫn là phiên bản ngắn gọn).

— Dmytro Taranovsky