Tiết kiệm khi khởi tạo mảng

Gần đây tôi đã đọc rằng có thể có các mảng không cần khởi tạo, nghĩa là có thể sử dụng chúng mà không phải mất thời gian cố gắng đặt từng thành viên về giá trị mặc định. tức là bạn có thể bắt đầu sử dụng mảng như thể nó đã được khởi tạo bởi giá trị mặc định mà không phải khởi tạo nó. (Xin lỗi, tôi không nhớ tôi đã đọc nó ở đâu).

Ví dụ như tại sao điều đó có thể gây ngạc nhiên:

Giả sử bạn đang cố gắng mô hình hóa trường hợp xấu nhất hashtable (cho mỗi lần chèn / xóa / tìm kiếm) của các số nguyên trong phạm vi . $\mathcal{O}(1)$ $[1, n^2]$

Bạn có thể phân bổ một mảng có kích thước bit và sử dụng các bit riêng lẻ để thể hiện sự tồn tại của một số nguyên trong hàm băm. Lưu ý: phân bổ bộ nhớ được coi là thời gian. $n^2$ $\mathcal{O}(1)$

Bây giờ, nếu bạn hoàn toàn không phải khởi tạo mảng này, bất kỳ chuỗi thao tác nói trên hàm băm này bây giờ là trường hợp xấu nhất . $n$ $\mathcal{O}(n)$

Vì vậy, trong thực tế, bạn có một triển khai băm "hoàn hảo", cho một chuỗi hoạt động sử dụng không gian , nhưng chạy trong thời gian ! $n$ $\Theta(n^2)$ $\mathcal{O}(n)$

Thông thường người ta sẽ mong đợi thời gian chạy của bạn ít nhất là tồi tệ như việc sử dụng không gian của bạn!

Lưu ý: Ví dụ trên có thể được sử dụng để triển khai một tập hợp thưa hoặc ma trận thưa thớt, vì vậy nó không chỉ là lợi ích lý thuyết, tôi cho rằng.

Vì vậy, câu hỏi là:

Làm thế nào có thể có một mảng như cấu trúc dữ liệu cho phép chúng ta bỏ qua bước khởi tạo?

data-structures arrays

— Aryabhata
nguồn

@Aryabhata Tài liệu tham khảo bạn đề cập là gì?

— uli

"Sử dụng bộ nhớ" không giống như "đã phân bổ nhưng không bao giờ truy cập bộ nhớ", do đó tôi nghĩ rằng "nghịch lý" thúc đẩy không hoàn toàn tồn tại.

— Raphael

Tôi nghĩ rằng đoạn đầu tiên khá rõ ràng: có một giá trị mặc định, mà không thực sự dành thời gian để điền vào mảng với giá trị mặc định. Câu trả lời, trong trường hợp người khác có thời gian viết nó trước khi tôi làm, thì đây là scholar.google.co.uk/. Có một lời giải thích rất ngắn gọn trên blog của tôi rgrig.blogspot.co.uk/2008/12/array -puheads-Solution.html

— rgrig

@uli: Đây là một câu hỏi hạt giống, tôi thực sự đọc nó một thời gian dài trở lại.

— Aryabhata

@Raphael: Vẫn còn ngạc nhiên khi bạn nghe về một điều như vậy lần đầu tiên. Hầu hết các nghịch lý không phải là :-)

— Aryabhata

Đây là một mẹo rất chung chung, có thể được sử dụng cho các mục đích khác ngoài băm. Dưới đây tôi đưa ra một triển khai (bằng mã giả).

Đặt ba vectơ chưa khởi tạo , và có kích thước mỗi cạnh. Chúng tôi sẽ sử dụng chúng để thực hiện các hoạt động theo yêu cầu của cấu trúc dữ liệu của chúng tôi. Chúng tôi cũng duy trì một biến . Các hoạt động được thực hiện như sau: $A$ $P$ $V$ $n$ $pos$

init:
  pos <- 0

set(i,x):
if not(V[i] < pos and P[V[i]] = i) 
  V[i] <- pos, P[pos] <- i, pos <- pos + 1
A[i] <- x

get(i):
if (V[i] < pos and P[V[i]] = i) 
  return A[i] 
else 
  return empty

Mảng chỉ lưu trữ các giá trị được truyền qua thủ tục . Các mảng và hoạt động như các chứng chỉ có thể cho biết nếu một vị trí nhất định trong đã được khởi tạo. $A$ $set$ $V$ $P$ $A$

Lưu ý rằng tại mọi thời điểm, các phần tử trong nằm trong khoảng từ đến được khởi tạo. Do đó chúng tôi có thể sử dụng một cách an toàn các giá trị như một giấy chứng nhận cho các giá trị khởi tạo trong . Với mỗi vị trí trong được khởi tạo, có một phần tử tương ứng trong vectơ có giá trị bằng . Điều này được chỉ ra bởi . Do đó, nếu chúng ta nhìn vào phần tử tương ứng, và giá trị của nó là $P$ $0$ $pos-1$ $A$ $i$ $A$ $P$ $i$ $V[i]$ $P[V[i]]$ $i$ , chúng tôi biết rằng đã được khởi tạo (vì không bao giờ nói dối, vì tất cả các yếu tố mà chúng tôi đang xem xét đều được khởi tạo). Tương tự, nếu không được khởi tạo, thì có thể trỏ đến một vị trí trong ngoài phạm vi , khi chúng tôi biết chắc chắn rằng nó không được khởi tạo hoặc có thể trỏ đến một vị trí trong phạm vi đó. Nhưng đặc biệt này tương ứng với một vị trí khác trong , và do đó $A[i]$ $P$ $A[i]$ $V[i]$ $P$ $0..pos-1$ $P[j]$ $A$ , vì vậy chúng tôi biết rằng chưa được khởi tạo. $P[j] \neq i$ $A[i]$

Thật dễ dàng để thấy rằng tất cả các hoạt động này được thực hiện trong thời gian liên tục. Ngoài ra, không gian được sử dụng là cho mỗi vectơ và cho biến , do đó tổng . $O(n)$ $O(1)$ $pos$ $O(n)$

— zotachidil
nguồn

P [V [i]]

$P[V[i]]$

i

$i$

A [i]

$A[i]$

Đó là nhưng sau đó pos sẽ nhỏ hơn V [i] bây giờ phải không? Vì nếu không thì sẽ không có cơ hội. Vì có pos cao hơn V [i], điều đó có nghĩa là chúng tôi đã đặt cụ thể giá trị của P tại chỉ số V [i] thành một giá trị cụ thể mà chúng tôi đã chọn, cụ thể là i.

— sói

Lưu ý rằng đây là một ví dụ cổ điển về những điều không thể thực hiện trong (di động) C.

— TLW