Giới hạn về kích thước của NFA nhỏ nhất cho L_k-differ


18

Hãy xem xét ngôn ngữ Lkdistinct bao gồm tất cả các chuỗi k -letter trên Σ sao cho không có hai chữ cái nào bằng nhau:

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

Ngôn ngữ này là hữu hạn và do đó thường xuyên. Cụ thể, nếu |Σ|=n , sau đó.|Lkdistinct|=(nk)k!

Máy tự động hữu hạn không xác định nhỏ nhất chấp nhận ngôn ngữ này là gì?

Tôi hiện có các giới hạn trên và dưới lỏng lẻo sau đây:

  • NFA nhỏ nhất tôi có thể xây dựng có .4k(1+o(1))polylog(n)

  • Bổ đề sau ngụ ý giới hạn dưới của trạng thái:2k

Đặt LΣ là ngôn ngữ thông thường. Giả sử có n cặp P={(xi,wi)1in} sao cho xiwjL khi và chỉ khi i=j . Sau đó, bất kỳ NFA chấp nhận L có ít nhất n trạng thái.

  • Một ràng buộc thấp hơn (tầm thường) khác là ( nlog(nk) , đó là nhật ký kích thước của DFA nhỏ nhất cho ngôn ngữ.

Tôi cũng quan tâm đến các NFA chỉ chấp nhận một phần cố định ( 0<ϵ<1 ) của Lkdistinct , nếu kích thước của automaton nhỏ hơn ϵ4k(1+o(1))polylog(n) .


Chỉnh sửa: Tôi vừa mới bắt đầu một tiền thưởng có lỗi trong văn bản.

Ý tôi là chúng ta có thể giả sử k=polylog(n) trong khi tôi đã viết k=O(log(n)) .

Chỉnh sửa2:

Tiền thưởng sẽ kết thúc sớm, vì vậy nếu bất cứ ai quan tâm đến những gì có lẽ là một cách dễ dàng hơn để kiếm được nó, hãy xem xét ngôn ngữ sau:

L(r,k)distinct:={w:w chứa k ký hiệu riêng biệt và không có ký hiệu nào xuất hiện nhiều hơn r lần } .

(tức là L(1,k)distinct=Lkdistinct ).

Một cấu trúc tương tự như trong các nhận xét mang lại cho có kích thước automaton cho .O(ek2klog(1+r)poly(n))L(r,k)distinct

Điều này có thể được cải thiện? Giới hạn dưới tốt nhất chúng ta có thể hiển thị cho ngôn ngữ này là gì?


2
Bạn có thể mô tả NFA giới hạn trên của bạn?
mjqxxxx

Tôi chưa thể viết về nó vì chúng tôi vẫn đang làm việc với nó và chưa hoàn thành bằng chứng. Thay vào đó, tôi sẽ mô tả một automaton đơn giản hơn nhiều kích thước : Hãy ( n , k ) -perfect gia đình băm H . Mỗi hàm băm như vậy là một hàm h : [ n ] [ k ]O((2e)k2O(log(k))log(n))(n,k)Hh:[n][k]. Điều này có nghĩa rằng đối với mỗi tập hợp con của kích thước tối đa là k , tồn tại một hàm h H như vậy mà nó ánh xạ mỗi mục tương ứng của nhóm nhỏ đến số khác nhau. Sau khi băm, bảng chữ cái kết quả có k chữ cái, do đó, một autumaton có kích thước 2 k có thể chấp nhận ngôn ngữ L k - d i s t i n c t t . [n]khHk2kLkdistinct
RB

4
Giới hạn dưới cho chỉ tính số lượng trạng thái mà NFA có thể ở sau chính xác k / 2 bước. Tôi không nghĩ rằng tôi nhận thức được bất kỳ phương pháp chứng minh nào mang lại giới hạn tốt hơn đáng kể cho tổng kích thước so với những gì có thể đạt được hơn là chỉ nhìn vào những gì xảy ra sau t bước, đối với một số t . Nhưng ở đây, với mỗi t có một NFA chỉ có thể ở một trong ( 2 + o ( 1 ) ) k trạng thái sau chính xác t trạng thái.(2o(1))kk/2ttt(2+o(1))kt
Noam

3
Bằng chứng (về yêu cầu trước đây của tôi): Trường hợp khó nhất là ; chọn 2 kp o l y ( k , log n ) các tập hợp ngẫu nhiên khác nhau S i (của n ký hiệu bảng chữ cái) có kích thước chính xác từng t và tạo một NFA có trạng thái cho mỗi i với một số đường dẫn đến nó Các ký hiệu t đầu tiên đều khác nhau và được chứa trong S i và có đường dẫn chấp nhận từ đó nếu không có k - t saut=k/22kpoly(k,logn)SintitSikttất cả các biểu tượng đều khác nhau và được chứa trong phần bù của . Một đối số đếm sẽ cho thấy rằng whp (trên sự lựa chọn ngẫu nhiên của S i ), NFA này thực sự sẽ chấp nhận tất cả các ngôn ngữ mong muốn. SiSi
Noam

3
Trong lần xây dựng trước, cách đơn giản nhất để xây dựng NFA sẽ có trạng thái cho mỗi tiền tố có thể có độ dài và cho mỗi hậu tố có thể có độ dài j > k - t . Thay vào đó, phần tiền tố và phần hậu tố của NFA có thể được xây dựng đệ quy bằng cách sử dụng cùng một cấu trúc ngẫu nhiên (nhưng hiện tại chỉ trong S i và phần bù của nó, tương ứng) và điều này sẽ cho tổng kích thước ( 4 + o ( 1 ) ) k . j<tj>ktSi(4+o(1))k
Noam

Câu trả lời:


2

Đây không phải là một câu trả lời mà là một phương pháp mà tôi tin rằng sẽ để lại giới hạn thấp hơn được cải thiện. Hãy để chúng tôi cắt vấn đề sau khi chữ cái được đọc. Biểu thị gia đình của một bộ yếu tố của [ n ] bởi Một và gia đình của b = k - một yếu tố bộ [ n ] bởi B . Biểu thị các trạng thái có thể đạt được sau khi đọc các phần tử của A (theo bất kỳ thứ tự nào) bởi S A và các trạng thái mà trạng thái chấp nhận có thể đạt được sau khi đọc các phần tử của B (theo bất kỳ thứ tự nào) của T Baa[n]Ab=ka[n]BASABTB. Chúng tôi cần điều đó khi và chỉ khi A B = . Điều này đã đưa ra một giới hạn thấp hơn cho số lượng trạng thái cần thiết và tôi nghĩ rằng nó có thể mang lại một cái gì đó không tầm thường.SATBAB=

Vấn đề này về cơ bản yêu cầu một giới hạn thấp hơn về số lượng đỉnh của một siêu đồ thị có biểu đồ đường thẳng (một phần) đã biết. Các vấn đề tương tự đã được nghiên cứu, ví dụ, bởi Bollobas và có một số phương pháp chứng minh đã biết có thể hữu ích.

Cập nhật 2014/03/24: Trong thực tế nếu hypergraph trên có thể được thực hiện trên đỉnh, sau đó chúng tôi cũng có được một giao thức phức tạp truyền không xác định chiều dài log s cho bộ disjointness với đầu vào bộ kích thước mộtb (trong thực tế hai vấn đề là tương đương). Các nút cổ chai là tất nhiên khi một = b = k / 2 , cho điều này tôi chỉ có thể tìm thấy những điều sau đây trong Eyal và Noam của cuốn sách: N 1 ( D Tôi S J một ) log ( 2 k log e (slogsaba=b=k/2được chứng minh bằng lập luận xác suất chuẩn. Thật không may, tôi không thể (chưa) tìm thấy giới hạn dưới đủ tốt cho vấn đề này nhưng giả sử ở trên là sắc nét, nó sẽ đưa ra giới hạn thấp hơnΩ(2klogn) đểthống nhất hai giới hạn dưới mà bạn đã đề cập.N1(DISJa)log(2kloge(na))Ω(2klogn)


1
Cảm ơn @domotorp cho câu trả lời của bạn. Điều này có vẻ rất giống với các bằng chứng về Bổ đề Tôi đã sử dụng cho thấp hơn bị ràng buộc trong câu hỏi ban đầu, nhưng không có quy định cụ thể thực tế 's và y i ' s, và do đó không phải là một ràng buộc đếm được. Nhận xét của bạn về câu hỏi trên cho thấy rằng giới hạn 2 k không thể được cải thiện bằng phương pháp đó, bạn có nghĩ rằng điều này có thể làm tốt hơn không? xiyi2k
RB

3
Toàn bộ ý kiến ​​của tôi ở trên là những kỹ thuật này không thể đưa ra giới hạn dưới ở trên . Đây thực sự là những gì làm cho vấn đề này thú vị với tôi. (2+o(1))k
Noam

@N foam: Đặt k = 2, a = b = 1. Sau đó, chúng tôi nhận được một giới hạn thấp hơn vì mỗi S A phải khác nhau. lognSA
domotorp

1
@domotorp: ẩn hệ số O ( k log n ) : Dưới đây là phân tích cho trường hợp xấu nhất trong đó a = b = k / 2 : Bắt đầu với AB cố định và chọn ngẫu nhiên một tập con S của các n chữ sau đó chúng ta có P r [ Một So(1)O(klogn)a=b=k/2ABSn . Bây giờ chọn r 2 k bộ như vậy một cách ngẫu nhiên thì xác suất cho ít nhất một trong số chúng xảy ra là 1 - e x p ( - r ) . Nếu chúng ta chọn r = O ( log ( nPr[ASandBSc]=2kr2k1exp(r)sau đó chúng ta nhận được rằng đây là vì vậy TẤT CẢ các tập hợp khác nhauAB(có kích thướck/2). Tổng sốSnhư vậytrong công trình này làO(2kklogn). r=O(log(nk))=O(klogn)ABk/2SO(2kklogn)
Noam

2
@Noam: Tôi xin lỗi nhưng tôi chưa bao giờ thấy một ẩn trong một o ( 1 ) , đặc biệt là vấn đề cũng là IMHO thú vị cho k < < log n . Nhưng bạn nói đúng rằng RB đã hỏi về k = p o l y l o g n . logno(1)k<<lognk=polylogn
domotorp

0

Một số công việc đang tiến hành:

Tôi đang cố gắng chứng minh giới hạn dưới . Đây là một câu hỏi mà tôi khá chắc chắn sẽ đưa ra giới hạn thấp hơn như vậy: tìm t tối thiểu sao cho tồn tại hàm f : { S [ n ] , | S | = K / 2 } { 0 , 1 } t rằng bảo tồn disjointness, tức là S 1S 2 = khi và chỉ khi f ( S 1 ) f (4ktf:{S[n],|S|=k/2}{0,1}tS1S2= . Tôi khá chắc chắn rằng giới hạn dưới của t 2 k sẽ gần như ngay lập tức ngụ ý giới hạn dưới 2 2 k = 4 k cho vấn đề của chúng tôi. f ( S ) xấp xỉ tương ứng với tập hợp các nút NFA có thể nhận được sau khi đọc đầu tiên k / 2 biểu tượng của đầu vào, khi tập các k / 2 biểu tượng là S .f(S1)f(S2)=t2k22k=4kf(S)k/2k/2S

Tôi nghĩ rằng giải pháp cho câu hỏi này có thể đã được biết, trong tài liệu về độ phức tạp trong giao tiếp (đặc biệt là trong các bài viết liên quan đến vấn đề rời rạc; có thể một số đối số xếp hạng ma trận sẽ giúp ích) hoặc trong tài liệu về mã hóa (ví dụ như thế này ).


2
(2+o(1))n
Noam
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.