Tài liệu tham khảo ban đầu cho Huffman hình Merge Sort?


8

Ấn phẩm đầu tiên của khái niệm tối ưu hóa sắp xếp hợp nhất là gì

  1. xác định chuỗi các vị trí liên tiếp theo thứ tự tăng dần (còn gọi là chạy) trong thời gian tuyến tính; sau đó
  2. liên tục hợp nhất hai chuỗi ngắn nhất như vậy và thêm kết quả của sự hợp nhất này vào danh sách các đoạn được sắp xếp.

Trong một số ấn phẩm của tôi (ví dụ: http://barbay.cl/publications.html#STACS2009 , http://barbay.cl/publications.html#TCS2013 ) Tôi đã sử dụng thủ thuật này để sắp xếp nhanh hơn và để tạo cấu trúc dữ liệu nén cho hoán vị.

Có vẻ như thủ thuật này đã được giới thiệu trước đây, chỉ trong bối cảnh sắp xếp nhanh hơn, nhưng cả tôi và học sinh của tôi đều không thể tìm lại tài liệu tham khảo?


bạn đã kiểm tra Knuth chưa? Tôi nhớ có khá nhiều hoạt động trong TAOCP.
Mikolas

1
n/2ρn(1+lgρ)(n1,Giáo dục,nρ)n(1+2H(n1,Giáo dục,nρ))

Ôi(n(1+tôig(r+1)))

Câu trả lời:


9

Tôi tìm thấy kết quả ẩn trong báo cáo kỹ thuật 4p tối nghĩa: Tôi chia sẻ kết quả của mình ở đây trong trường hợp người khác quan tâm.

  1. Knuth đề cập đến chạy trong mô tả của ông về "sắp xếp hợp nhất tự nhiên" (trang 160 của tome 3 của phiên bản thứ 3), nhưng ông chỉ phân tích mức độ phức tạp của nó trung bình (mang lại n / 2 lần chạy), không theo chức năng của số ρ của chạy
  2. vào năm 1985, Mannila đã chứng minh rằng Mergesort tự nhiên cần có thời gian trong O (n (1 + lg (r + 1))) để sắp xếp n các yếu tố hình thành nên các hoạt động r.
  3. n(1+2H(n1,Giáo dục,nρ))
  4. vào năm 2009, kỹ thuật này đã được trình bày tại Hội nghị chuyên đề Toán học của Khoa học máy tính (cùng với kết quả về cách sắp xếp, những con đường ngắn nhất và những cây bao trùm tối thiểu).
  5. vào năm 2010, nó đã được xuất bản trên tạp chí Xử lý thông tin với tiêu đề "Entropy as Computational Complexity", với một đồng tác giả được thêm vào, Yuji Nakagawa ( https://www.semanticscholar.org/author/Yuji-Nakagawa/2219943 ) .

Tôi tham gia các tài liệu tham khảo bibtex dưới đây.

@TechReport {1997-TR-MinimalMergesort-Takaoka, tác giả = {Tadao Takaoka}, title = {Minimal Mergesort}, tổ chức = {Đại học Canterbury}, năm = 1997, ghi chú = { http://ir.canterbury.ac. nz / handle / 10092/9676 , truy cập lần cuối [2016-08-23 Tue]}, trừu tượng = {Chúng tôi trình bày một thuật toán sắp xếp thích ứng mới, được gọi là sắp xếp hợp nhất tối thiểu, hợp nhất các bước tăng dần trong danh sách đầu vào từ ngắn hơn đến dài hơn, nghĩa là, hợp nhất hai danh sách ngắn nhất mỗi lần. Chúng tôi chỉ ra rằng thuật toán này là tối ưu đối với các biện pháp mới của sự sắp đặt trước, được gọi là entropy.}}

Trong bài báo này, chúng tôi giới thiệu thước đo entropy H (S) cho độ không đảm bảo của dữ liệu đầu vào được giải quyết một phần S (X) = (X 1, ..., X k), trong đó X là toàn bộ tập dữ liệu và mỗi X i là đã giải quyết xong. Chúng tôi sử dụng biện pháp entropy để phân tích ba vấn đề mẫu, sắp xếp, đường đi ngắn nhất và cây bao trùm tối thiểu. Để sắp xếp X i là một bước tăng dần và đối với các đường dẫn ngắn nhất, X i là một phần tuần hoàn trong biểu đồ đã cho. Đối với cây bao trùm tối thiểu, X i được hiểu là cây bao trùm tối thiểu thu được một phần cho sơ đồ con. Số đo entropy, H (S), được xác định bằng cách liên quan đến pi = | X i | / | X | như một thước đo xác suất, nghĩa là, H (S) = - nΣki = 1pilogpi, trong đó n = Σki = 1 | Xi |. Sau đó, chúng tôi cho thấy rằng chúng tôi có thể sắp xếp dữ liệu đầu vào S (X) theo thời gian O (H (S)) và giải quyết vấn đề đường đi ngắn nhất trong thời gian O (m + H (S)) trong đó m là số cạnh của đồ thị.

@article {2010-JIP-EntropyAsComputationalComplexity-TakaokaNakagawa, tác giả = {Tadao Takaoka và Yuji Nakagawa}, title = {Entropy như Độ phức tạp tính toán}, tạp chí = jip, volume = {18}, trang = { = {2010}, url = { http://dx.doi.org/10.2197/ipsjjip.18.227 }, doi = {10.2197 / ipsjjip.18.227}, dấu thời gian = {Thứ tư, ngày 14 tháng 9 năm 2011 13:30:51 +0200 }, biburl = { http://dblp.uni-trier.de/rec/bib/journals/jip/TakaokaN10 }, bibsource = {thư mục khoa học máy tính dblp, http://dblp.org}, trừu tượng = {Nếu trường hợp vấn đề đã cho được giải quyết một phần, chúng tôi muốn giảm thiểu nỗ lực để giải quyết vấn đề bằng cách sử dụng thông tin đó. Trong bài báo này, chúng tôi giới thiệu thước đo entropy, H (S), về tính không chắc chắn của dữ liệu đầu vào được giải quyết một phần S (X) = (X1, .., Xk), trong đó X là toàn bộ tập dữ liệu và mỗi Xi đã có giải quyết. Chúng tôi đề xuất một thuật toán chung hợp nhất nhiều lần của Xi và kết thúc khi k trở thành 1. Chúng tôi sử dụng biện pháp entropy để phân tích ba vấn đề mẫu, sắp xếp, đường đi ngắn nhất và cây bao trùm tối thiểu. Để sắp xếp Xi là một bước tăng dần và đối với các cây bao trùm tối thiểu, Xi được hiểu là một cây bao trùm tối thiểu thu được một phần cho một sơ đồ con. Đối với các đường dẫn ngắn nhất, Xi là một phần tuần hoàn trong biểu đồ đã cho. Khi k nhỏ, đồ thị có thể được coi là gần như chu kỳ. Các biện pháp entropy, H (S), được định nghĩa bằng cách liên quan đến pi = Xi¦ / X¦ là thước đo xác suất, nghĩa là, H (S) = -n (p1 log p1 + .. + pk log pk), trong đó n = ¦X1¦ +. . . + ¦Xk¦. Chúng tôi cho thấy rằng chúng tôi có thể sắp xếp dữ liệu đầu vào S (X) theo thời gian O (H (S)) và chúng tôi có thể hoàn thành cây kéo dài chi phí tối thiểu trong thời gian O (m + H (S)), trong đó m trong số của các cạnh. Sau đó, chúng tôi giải quyết vấn đề đường đi ngắn nhất trong thời gian O (m + H (S)). Cuối cùng, chúng tôi xác định entropy kép trong quá trình phân vùng, theo đó chúng tôi đưa ra giới hạn thời gian cho một quicksort chung và vấn đề đường đi ngắn nhất cho một loại đồ thị gần như chu kỳ khác.} Trong đó m tính theo số cạnh. Sau đó, chúng tôi giải quyết vấn đề đường đi ngắn nhất trong thời gian O (m + H (S)). Cuối cùng, chúng tôi xác định entropy kép trong quá trình phân vùng, theo đó chúng tôi đưa ra giới hạn thời gian cho một quicksort chung và vấn đề đường đi ngắn nhất cho một loại đồ thị gần như chu kỳ khác.} Trong đó m tính theo số cạnh. Sau đó, chúng tôi giải quyết vấn đề đường đi ngắn nhất trong thời gian O (m + H (S)). Cuối cùng, chúng tôi xác định entropy kép trong quá trình phân vùng, theo đó chúng tôi đưa ra giới hạn thời gian cho một quicksort chung và vấn đề đường đi ngắn nhất cho một loại đồ thị gần như chu kỳ khác.}
}

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.