Có thể quyết định nếu một ngôn ngữ được mô tả bởi số lần xuất hiện là thường xuyên?

Được biết, ngôn ngữ của các từ chứa số 0 và 1 bằng nhau là không thường xuyên, trong khi ngôn ngữ của các từ chứa số 001 và 100 bằng nhau là thường xuyên ( xem tại đây ).

Cho hai từ , có thể quyết định được không nếu ngôn ngữ của các từ có số lượng bằng nhau của và là bình thường? $w_1,w_2$ $w_1$ $w_2$

regular-languages undecidability

— sdcvvc
nguồn

Bạn có thể đưa ra các ví dụ khác về các ngôn ngữ thông thường được xác định như vậy, ngoài và , hoặc và không? Điều gì về một ví dụ trên bảng chữ cái 3 ký hiệu?

1i0 $1^i0$

01i $01^i$

0i1 $0^i1$

10i $10^i$

— babou

Nếu là một từ phụ nghiêm ngặt của , thì có khả năng lớn là ngôn ngữ trống, do đó, thường xuyên. Tôi không biết các ví dụ khác.

w1 $w_1$

w2 $w_2$

— sdcvvc

Tôi nghi ngờ rằng các ví dụ trên là những ví dụ duy nhất, điều này sẽ khiến vấn đề trở nên có thể quyết định được. Nếu bạn chỉ định hai chuỗi con, tôi sẽ đoán đó là CF ... tùy thuộc vào những gì bạn có thể chỉ định liên quan đến các sự cố. Bạn không thực hiện đủ chính xác những gì bạn có nghĩa là "được mô tả bằng số lần xuất hiện".

— babou

Các câu hỏi là IMO đủ chính xác.

— sdcvvc

các giải pháp cho đến nay đối với các trường hợp đặc biệt dường như xoay quanh ý tưởng rằng sự xuất hiện của các chuỗi con của

chỉ đảm bảo các lần xuất hiện duy nhất của can thiệp

. vì vậy bằng cách nào đó giả sử các câu trả lời hiện tại là chính xác [chưa rõ ràng với tôi] có vẻ như có một mối quan hệ nào đó giữa

đảm bảo ở giữa quá trình quét chuỗi mà người ta có thể ở hai trạng thái "bằng" hoặc "không bằng nhau ", Nhưng chỉ tắt bởi một số hữu hạn tối đa cho trường hợp" không bằng nhau ". w1 $w_1$

w2 $w_2$

w1 $w_1$

w2 $w_2$

— vzn

Cho hai từ , , có thể quyết định được không nếu ngôn ngữ của các từ có số lượng bằng nhau của và là thông thường? $w_1$ $w_2$ $L$ $w_1$ $w_2$

Đầu tiên một số định nghĩa:
Chúng có thể được đưa ra ngắn gọn hơn, và các ký hiệu có thể được cải thiện nếu chúng được sử dụng trong các bằng chứng. Đây chỉ là một dự thảo đầu tiên.

Cho hai từ và , chúng ta nói rằng: $w_1$ $w_2$

luôn luôn xảy ravới , lưu ý , khi và chỉ khi $w_1$ $w_2$ $w_1\triangleleft w_2$
1. với mọi chuỗi sao cho với $s$ $s=xw_2y$ và có phân hủy khác . Lưu ý: Điều kiện và $\mid x\mid,\, \mid y\mid\ \geq \mid w_1\mid +\mid w_2\mid$ $|x|_0,|x|_1|,|y|_0,|y|_1| \geq 1$ $s=x'w_1y'$
  $x$ $y$ mỗi chứa ít nhất một 0 và 1 là yêu cầu của một trường hợp bệnh lý (được tìm thấy bởi @sdcvvc): , và , và các biến thể của nó đối xứng. $w_1=1^i0$ $w_2=v1^{i+j}$ $y\in1^*$
2. có một chuỗi với $s=xw_2y$ ví dụ rằng có ít nhất một phân hủy $\mid x\mid,\, \mid y\mid\ \geq \mid w_1\mid +\mid w_2\mid$ $s=x'w_1y'$
luôn cooccursvới , lưu ý $w_1$ $w_2$ , iff mỗi luôn xảy ra với nhau, $w_1\triangleleft \triangleright\,w_2$
và xảy ra một cách độc lập, ghi nhận $w_1$ $w_2$ , không ai luôn luôn xảy ra với người khác, $w_1\triangleright \triangleleft\,w_2$
luôn xảy ra lần hoặc nhiềuhơn , lưu ý , khi và chỉ khi đối với bất kỳ chuỗi mà với có phân tách khác $w_1$ $m$ $w_2$ $w_1\triangleleft_m w_2$ $s$ $s=xw_2y$ $\mid x\mid,\ \mid y\mid|\ \geq \mid w_1\mid +\mid w_2\mid$ $m$ $s=x_iw_1y_i$ cho mà ngụ ý . $i\in[1,m]$ $i\neq j$ $x_i\neq x_j$

Các định nghĩa này được xây dựng để chúng ta có thể bỏ qua những gì xảy ra ở cuối chuỗi nơi và được cho là xảy ra. Các hiệu ứng biên ở cuối chuỗi phải được phân tích riêng, nhưng chúng đại diện cho một số trường hợp hữu hạn (thực sự tôi nghĩ rằng tôi đã quên một hoặc hai trường hợp phụ ranh giới như vậy trong phân tích đầu tiên của tôi dưới đây, nhưng nó không thực sự quan trọng). Các định nghĩa tương thích với sự chồng chéo của sự xuất hiện. $w_1$ $w_2$

Có 4 trường hợp chính cần xem xét (bỏ qua biểu tượng giữa và ): $w_1$ $w_2$

Cả hai từ nhất thiết phải đi cùng nhau, ngoại trừ có thể ở cuối chuỗi. Điều này chỉ liên quan đến các cặp mẫu và hoặc và . Điều này dễ dàng được nhận ra bởi mộtmáy tự động hữu hạn, chỉ kiểm tra các sự cố đơn độc ở cả hai đầu của chuỗi được nhận ra, để đảm bảo có sự xuất hiện đơn độc ở cả hai đầu hoặc ở cả hai đầu. Ngoài ra còn có trường hợp suy biến khi : thì ngôn ngữ L rõ ràng là thông thường. $w_1\triangleleft \triangleright\,w_2$
$1^i0$ $01^i$ $0^i1$ $10^i$ $w_1=w_2$
, nhưng không phải Một trong những 2 từ không thể xảy ra nếu không có sự khác, nhưng ngược lại là không đúng sự thật (ngoại trừ có lẽ ở hai đầu của chuỗi). Điều này xảy ra khi: $w_1\triangleleft w_2$ $w_2\triangleleft w_1$
- là một chuỗi con của : sau đó một máy tự động hữu hạn chỉ có thể kiểm tra xem không xảy ra bên ngoài một thể hiện của . $w_1$ $w_2$ $w_1$ $w_2$
- và đối với một số từ , : sau đó một tấm séc automaton hữu hạn như trong trường hợp trước đó không xảy ra tách ra từ . Tuy nhiên, automaton cho phép đếm thêm một thể hiện của sẽ cho phép chấp nhận nếu $w_1=1^i0$ $w_2=v1^j$ $v\in\{0,1\}^*$ $v\neq01^i$ $w_1$ $w_2$ $w_1$ $w_2$ là một hậu tố của chuỗi. Có ba trường hợp đối xứng khác (đối xứng 1-0 và đối xứng trái phải).
$w_1\triangleleft_2 w_2$
One of the 2 words occurs twice in the other. That can be recognized by an a finite automation that checks that the smaller word never occurs in the string. The is also a slightly more complex variant that combines the two variations of case 2. In this case the automaton checks that the smaller string $1^i0$ never occurs, except possibly as part of $v$ in the larger one $v1^j$ coming as a suffix of the string (and 3 other cases by symetry).
2 từ có thể xảy ra độc lập với nhau. Chúng tôi xây dựng một máy tuần tự tổng quát (GSM)tạo ra khi nó nhận ra sự xuất hiện của và khi nhận ra sự xuất hiện của và quên mọi thứ khác. Ngôn ngữ chỉ thông thường nếu ngôn ngữ là chính quy. Nhưng $w_1\triangleright \triangleleft\,w_2$
$G$ $a$ $w_1$ $b$ $w_2$ $L$ $G(L)$ mà rõ ràng là bối cảnh tự do và không thường xuyên. Do đó không thường xuyên. Thật ra ta có . Vì các ngôn ngữ thông thường và ngôn ngữ không ngữ cảnh được đóng trong ánh xạ GSM và ánh xạ GSM nghịch đảo, chúng tôi cũng biết rằng có ngữ cảnh. $G(L)=\{w\in\{a,b\}^*\mid\ \mid w\mid_a=\mid w\mid_b\}$ $L$
$L=G^{-1}(G(L))$ $L$

Một cách để tổ chức một bằng chứng chính thức có thể là như sau. Đầu tiên hãy xây dựng một thiết bị nhận dạng ngôn ngữ. Trên thực tế, nó có thể được thực hiện với máy 1 bộ đếm, nhưng sẽ dễ dàng hơn khi có hai biểu tượng ngăn xếp để tránh trùng lặp điều khiển hữu hạn. Sau đó, đối với các trường hợp cần là FA, cho thấy bộ đếm có thể được giới hạn bởi một hằng số chỉ phụ thuộc vào hai từ. Đối với các trường hợp khác cho thấy rằng bộ đếm có thể đạt được bất kỳ giá trị tùy ý. Tất nhiên, các tổ chức PDA nên được tổ chức sao cho các bằng chứng đủ dễ thực hiện.

Representing the FA as a 2-stack-symbols PDA is probably the simplest representation for it. In the non-regular case, the finite control part of the PDA is the same as that of the GSM in the proof sketch above. Instead of outputting $a$ 's and $b$ 's like the GSM, the PDA counts the difference in number with the stack.

— babou
nguồn

I had a question about context-freeness in the case of three words. I deleted it when I realised it could be analyzed similarly. I had first thought that proving non-CFness would make an original exercise, but the GSM ruins it.

— babou

It is not clear what do you mean by "occur independently of each other", "come necessarily together" etc. Please write formal definitions instead, and prove that they cover all cases.

— sdcvvc

I am not sure what you are asking, and what level of formalization you need, for what purpose. I realized that analyzing by hand possible relations of the two words is not garanteed to be correct, and does not matter anyway. What matters is whether an occurence of one word can exist without creating at the same time an occurence (or several) of the other word. The details do not matter as it will always be localized and thus manageable finitely. The two ends do not matter either as tey are localized too. Even overlaps of occurrences do not matter since they can only be finitely many in 1 place

— babou

I asked you about precise definitions of the terms mentioned in the comment. Thank you for writing them. Was I supposed to guess them previously? Anyway, you seem to claim that

0i1◃▹10i $0^i 1 \triangleleft \triangleright 1 0^i$ . This does not satisfy condition 1. of the definition of "

w1 $w_1$ always occurs with

$w_2$ ", since there is no occurrence of

$1 0^i$ in

$s=0^M 0^i 1 1^M$ .

— sdcvvc

Sorry, I did not mean to make you guess. It only took me time to understand what exactly you wanted. My failing only. Regarding your counter example, you are correct. But for me it only means that I have to be a little bit more careful about telomeres, in the definition of the relations. I defined them too quickly, but

$0^M$ or

$1^M$ do not convey much information in this context. This is really a boundary pathological example within a pathological case, that actually cannot occur when more than 2 symbols are used. I just do not believe it changes anything.

— babou