Giới hạn về kích thước của NFA nhỏ nhất cho L_k-differ

Hãy xem xét ngôn ngữ $L_{k-distinct}$ bao gồm tất cả các chuỗi $k$ -letter trên $\Sigma$ sao cho không có hai chữ cái nào bằng nhau:

L_{k - d i s t i n c t} := {w = σ_{1} σ_{2} . . . σ_{k} ∣ \forall i \in [k] : σ_{i} \in Σ and \forall j \neq i : σ_{j} \neq σ_{i}}

$L_{k-distinct} :=\{w = \sigma_1\sigma_2...\sigma_k \mid \forall i\in[k]: \sigma_i\in\Sigma ~\text{ and }~ \forall j\ne i: \sigma_j\ne\sigma_i \}$

Ngôn ngữ này là hữu hạn và do đó thường xuyên. Cụ thể, nếu $\left|\Sigma\right|=n$ , sau đó. $\left|L_{k-distinct}\right| = \binom{n}{k} k!$

Máy tự động hữu hạn không xác định nhỏ nhất chấp nhận ngôn ngữ này là gì?

Tôi hiện có các giới hạn trên và dưới lỏng lẻo sau đây:

NFA nhỏ nhất tôi có thể xây dựng có . $4^{k(1+o(1))}\cdot polylog(n)$
Bổ đề sau ngụ ý giới hạn dưới của trạng thái: $2^k$

Đặt $L ⊆ Σ^*$ là ngôn ngữ thông thường. Giả sử có $n$ cặp $P = \{ (x_i, w_i) \mid 1 ≤ i ≤ n \}$ sao cho $x_i\cdot w_j \in L$ khi và chỉ khi $i=j$ . Sau đó, bất kỳ NFA chấp nhận L có ít nhất n trạng thái.

Một ràng buộc thấp hơn (tầm thường) khác là $log$ $n\choose k$ , đó là nhật ký kích thước của DFA nhỏ nhất cho ngôn ngữ.

Tôi cũng quan tâm đến các NFA chỉ chấp nhận một phần cố định ( $0<\epsilon<1$ ) của $L_{k-distinct}$ , nếu kích thước của automaton nhỏ hơn $\epsilon\cdot 4^{k(1+o(1))}\cdot polylog (n)$ .

Chỉnh sửa: Tôi vừa mới bắt đầu một tiền thưởng có lỗi trong văn bản.

Ý tôi là chúng ta có thể giả sử $k=polylog(n)$ trong khi tôi đã viết $k=O(log(n))$ .

Chỉnh sửa2:

Tiền thưởng sẽ kết thúc sớm, vì vậy nếu bất cứ ai quan tâm đến những gì có lẽ là một cách dễ dàng hơn để kiếm được nó, hãy xem xét ngôn ngữ sau:

$L_{(r,k)-distinct} :=\{w : w$ chứa $k$ ký hiệu riêng biệt và không có ký hiệu nào xuất hiện nhiều hơn $r$ lần $\}$ .

(tức là $L_{(1,k)-distinct} = L_{k-distinct}$ ).

Một cấu trúc tương tự như trong các nhận xét mang lại cho có kích thước automaton cho . $O(e^k\cdot 2^{k\cdot log(1+r)}\cdot poly(n))$ $L_{(r,k)-distinct}$

Điều này có thể được cải thiện? Giới hạn dưới tốt nhất chúng ta có thể hiển thị cho ngôn ngữ này là gì?

— RB
nguồn

Bạn có thể mô tả NFA giới hạn trên của bạn?

— mjqxxxx

Tôi chưa thể viết về nó vì chúng tôi vẫn đang làm việc với nó và chưa hoàn thành bằng chứng. Thay vào đó, tôi sẽ mô tả một automaton đơn giản hơn nhiều kích thước

: Hãy

-perfect gia đình băm

. Mỗi hàm băm như vậy là một hàm

O ((2 e)^{k} * 2^{O (l o g (k))} * l o g (n))

$O((2e)^k * 2^{O(log(k))} * log(n))$

(n, k)

$(n,k)$

H

$H$

h : [n] \to [k]

$h: [n] \to [k]$ . Điều này có nghĩa rằng đối với mỗi tập hợp con của

kích thước tối đa là

, tồn tại một hàm

như vậy mà nó ánh xạ mỗi mục tương ứng của nhóm nhỏ đến số khác nhau. Sau khi băm, bảng chữ cái kết quả có

chữ cái, do đó, một autumaton có kích thước

có thể chấp nhận ngôn ngữ

[n]

$[n]$

k

$k$

h \in H

$h\in H$

k

$k$

2^{k}

$2^k$

L_{k - d i s t i n c t}

$L_{k-distinct}$

— RB

Giới hạn dưới cho

chỉ tính số lượng trạng thái mà NFA có thể ở sau chính xác

bước. Tôi không nghĩ rằng tôi nhận thức được bất kỳ phương pháp chứng minh nào mang lại giới hạn tốt hơn đáng kể cho tổng kích thước so với những gì có thể đạt được hơn là chỉ nhìn vào những gì xảy ra sau

bước, đối với một số

. Nhưng ở đây, với mỗi

có một NFA chỉ có thể ở một trong

trạng thái sau chính xác

trạng thái.

(2 - o (1))^{k}

$(2-o(1))^k$

k / 2

$k/2$

t

$t$

t

$t$

t

$t$

(2 + o (1))^{k}

$(2+o(1))^k$

t

$t$

— Noam

Bằng chứng (về yêu cầu trước đây của tôi): Trường hợp khó nhất là

; chọn

các tập hợp ngẫu nhiên khác nhau

(của

ký hiệu bảng chữ cái) có kích thước chính xác từng

và tạo một NFA có trạng thái cho mỗi

với một số đường dẫn đến nó Các ký hiệu

đầu tiên đều khác nhau và được chứa trong

và có đường dẫn chấp nhận từ đó nếu không có

t = k / 2

$t=k/2$

2^{k} \cdot p o l y (k, \log n)

$2^k \cdot poly(k, \log n)$

S_{i}

$S_i$

n

$n$

t

$t$

i

$i$

t

$t$

S_{i}

$S_i$

k - t

$k-t$ tất cả các biểu tượng đều khác nhau và được chứa trong phần bù của

. Một đối số đếm sẽ cho thấy rằng whp (trên sự lựa chọn ngẫu nhiên của

), NFA này thực sự sẽ chấp nhận tất cả các ngôn ngữ mong muốn.

S_{i}

$S_i$

S_{i}

$S_i$

— Noam

Trong lần xây dựng trước, cách đơn giản nhất để xây dựng NFA sẽ có trạng thái cho mỗi tiền tố có thể có độ dài

và cho mỗi hậu tố có thể có độ dài

. Thay vào đó, phần tiền tố và phần hậu tố của NFA có thể được xây dựng đệ quy bằng cách sử dụng cùng một cấu trúc ngẫu nhiên (nhưng hiện tại chỉ trong

và phần bù của nó, tương ứng) và điều này sẽ cho tổng kích thước

j < t

$j < t$

j > k - t

$j > k-t$

S_{i}

$S_i$

(4 + o (1))^{k}

$(4+o(1))^k$

— Noam

Câu trả lời:

Đây không phải là một câu trả lời mà là một phương pháp mà tôi tin rằng sẽ để lại giới hạn thấp hơn được cải thiện. Hãy để chúng tôi cắt vấn đề sau khi chữ cái được đọc. Biểu thị gia đình của bộ yếu tố của bởi và gia đình của yếu tố bộ bởi . Biểu thị các trạng thái có thể đạt được sau khi đọc các phần tử của (theo bất kỳ thứ tự nào) bởi và các trạng thái mà trạng thái chấp nhận có thể đạt được sau khi đọc các phần tử của (theo bất kỳ thứ tự nào) của $a$ $a$ $[n]$ $\mathcal A$ $b=k-a$ $[n]$ $\mathcal B$ $A$ $S_A$ $B$ $T_B$ . Chúng tôi cần điều đó khi và chỉ khi . Điều này đã đưa ra một giới hạn thấp hơn cho số lượng trạng thái cần thiết và tôi nghĩ rằng nó có thể mang lại một cái gì đó không tầm thường. $S_A\cap T_B\ne \emptyset$ $A\cap B=\emptyset$

Vấn đề này về cơ bản yêu cầu một giới hạn thấp hơn về số lượng đỉnh của một siêu đồ thị có biểu đồ đường thẳng (một phần) đã biết. Các vấn đề tương tự đã được nghiên cứu, ví dụ, bởi Bollobas và có một số phương pháp chứng minh đã biết có thể hữu ích.

Cập nhật 2014/03/24: Trong thực tế nếu hypergraph trên có thể được thực hiện trên đỉnh, sau đó chúng tôi cũng có được một giao thức phức tạp truyền không xác định chiều dài cho bộ disjointness với đầu vào bộ kích thước và (trong thực tế hai vấn đề là tương đương). Các nút cổ chai là tất nhiên khi , cho điều này tôi chỉ có thể tìm thấy những điều sau đây trong Eyal và Noam của cuốn sách: $s$ $\log s$ $a$ $b$ $a=b=k/2$ được chứng minh bằng lập luận xác suất chuẩn. Thật không may, tôi không thể (chưa) tìm thấy giới hạn dưới đủ tốt cho vấn đề này nhưng giả sử ở trên là sắc nét, nó sẽ đưa ra giới hạn thấp hơnthống nhất hai giới hạn dưới mà bạn đã đề cập. $N^1(DISJ_a)\le \log \big(2^k \log_e {n\choose a}\big)$ $\Omega(2^k\log n)$

— động vật
nguồn

Cảm ơn @domotorp cho câu trả lời của bạn. Điều này có vẻ rất giống với các bằng chứng về Bổ đề Tôi đã sử dụng cho thấp hơn bị ràng buộc trong câu hỏi ban đầu, nhưng không có quy định cụ thể thực tế

's và

' s, và do đó không phải là một ràng buộc đếm được. Nhận xét của bạn về câu hỏi trên cho thấy rằng giới hạn

không thể được cải thiện bằng phương pháp đó, bạn có nghĩ rằng điều này có thể làm tốt hơn không?

x_{i}

$x_i$

y_{i}

$y_i$

2^{k}

$2^k$

— RB

Toàn bộ ý kiến của tôi ở trên là những kỹ thuật này không thể đưa ra giới hạn dưới ở trên

. Đây thực sự là những gì làm cho vấn đề này thú vị với tôi.

(2 + o (1))^{k}

$(2+o(1))^k$

— Noam

@N foam: Đặt k = 2, a = b = 1. Sau đó, chúng tôi nhận được một

giới hạn thấp hơn vì mỗi

phải khác nhau.

\log n

$\log n$

S_{A}

$S_A$

— domotorp

@domotorp:

ẩn hệ số

: Dưới đây là phân tích cho trường hợp xấu nhất trong đó

: Bắt đầu với

và

cố định và chọn ngẫu nhiên một tập con

của các

chữ sau đó chúng ta có

o (1)

$o(1)$

O (k \log n)

$O(k\log n)$

a = b = k / 2

$a=b=k/2$

A

$A$

B

$B$

S

$S$

n

$n$

. Bây giờ chọn

bộ như vậy một cách ngẫu nhiên thì xác suất cho ít nhất một trong số chúng xảy ra là

. Nếu chúng ta chọn

P r [A \subseteq S a n d B \subseteq S^{c}] = 2^{- k}

$Pr[A \subseteq S \:and\: B \subseteq S^c]=2^{-k}$

r 2^{k}

$r2^k$

1 - e x p (- r)

$1-exp(-r)$

sau đó chúng ta nhận được rằng đây là vì vậy TẤT CẢ các tập hợp khác nhau

và

(có kích thước

). Tổng số

như vậytrong công trình này là

r = O (\log (\binom{n}{k})) = O (k \log n)

$r = O(\log {n \choose k}) = O(k \log n)$

A

$A$

B

$B$

k / 2

$k/2$

S

$S$

O (2^{k} k \log n)

$O(2^k k \log n)$

— Noam

@Noam: Tôi xin lỗi nhưng tôi chưa bao giờ thấy một

ẩn trong một

, đặc biệt là vấn đề cũng là IMHO thú vị cho

. Nhưng bạn nói đúng rằng RB đã hỏi về

\log n

$\log n$

o (1)

$o(1)$

k << \log n

$k<<\log n$

k = p o l y l o g n

$k=polylog n$

— domotorp

Một số công việc đang tiến hành:

Tôi đang cố gắng chứng minh giới hạn dưới . Đây là một câu hỏi mà tôi khá chắc chắn sẽ đưa ra giới hạn thấp hơn như vậy: tìm tối thiểu sao cho tồn tại hàm rằng bảo tồn disjointness, tức là khi và chỉ khi $4^k$ $t$ $f:\{S \subseteq [n], |S|=k/2 \} \rightarrow \{0,1\}^t$ $S_1 \cap S_2 = \emptyset$ . Tôi khá chắc chắn rằng giới hạn dưới của sẽ gần như ngay lập tức ngụ ý giới hạn dưới cho vấn đề của chúng tôi. xấp xỉ tương ứng với tập hợp các nút NFA có thể nhận được sau khi đọc đầu tiên biểu tượng của đầu vào, khi tập các biểu tượng là . $f(S_1) \cap f(S_2) = \emptyset$ $t \ge 2k$ $2^{2k}=4k$ $f(S)$ $k/2$ $k/2$ $S$

Tôi nghĩ rằng giải pháp cho câu hỏi này có thể đã được biết, trong tài liệu về độ phức tạp trong giao tiếp (đặc biệt là trong các bài viết liên quan đến vấn đề rời rạc; có thể một số đối số xếp hạng ma trận sẽ giúp ích) hoặc trong tài liệu về mã hóa (ví dụ như thế này ).

— bánh bao mobius
nguồn

(2 + o (1))^{n}

$(2+o(1))^n$

— Noam