Có thể quyết định nếu một ngôn ngữ được mô tả bởi số lần xuất hiện là thường xuyên?


14

Được biết, ngôn ngữ của các từ chứa số 0 và 1 bằng nhau là không thường xuyên, trong khi ngôn ngữ của các từ chứa số 001 và 100 bằng nhau là thường xuyên ( xem tại đây ).

Cho hai từ , có thể quyết định được không nếu ngôn ngữ của các từ có số lượng bằng nhau của và là bình thường?w 1 , w 2 w 1 w 2w1,w2w1w2


Bạn có thể đưa ra các ví dụ khác về các ngôn ngữ thông thường được xác định như vậy, ngoài và , hoặc và không? Điều gì về một ví dụ trên bảng chữ cái 3 ký hiệu? 1 tôi01i001i01i0i10i110i10i
babou

Nếu là một từ phụ nghiêm ngặt của , thì có khả năng lớn là ngôn ngữ trống, do đó, thường xuyên. Tôi không biết các ví dụ khác. w 1 w 2w1w2
sdcvvc

Tôi nghi ngờ rằng các ví dụ trên là những ví dụ duy nhất, điều này sẽ khiến vấn đề trở nên có thể quyết định được. Nếu bạn chỉ định hai chuỗi con, tôi sẽ đoán đó là CF ... tùy thuộc vào những gì bạn có thể chỉ định liên quan đến các sự cố. Bạn không thực hiện đủ chính xác những gì bạn có nghĩa là "được mô tả bằng số lần xuất hiện".
babou

Các câu hỏi là IMO đủ chính xác.
sdcvvc

1
các giải pháp cho đến nay đối với các trường hợp đặc biệt dường như xoay quanh ý tưởng rằng sự xuất hiện của các chuỗi con của w 1 chỉ đảm bảo các lần xuất hiện duy nhất của can thiệp w 2 . vì vậy bằng cách nào đó giả sử các câu trả lời hiện tại là chính xác [chưa rõ ràng với tôi] có vẻ như có một mối quan hệ nào đó giữa w 1 , w 2 đảm bảo ở giữa quá trình quét chuỗi mà người ta có thể ở hai trạng thái "bằng" hoặc "không bằng nhau ", Nhưng chỉ tắt bởi một số hữu hạn tối đa cho trường hợp" không bằng nhau ". w1w2w1w2
vzn

Câu trả lời:


3

Cho hai từ w 1 , w 2 , có thể quyết định được không nếu ngôn ngữ L của các từ có số lượng bằng nhau của w 1w 2 là thông thường?w1w2Lw1w2

Đầu tiên một số định nghĩa:
Chúng có thể được đưa ra ngắn gọn hơn, và các ký hiệu có thể được cải thiện nếu chúng được sử dụng trong các bằng chứng. Đây chỉ là một dự thảo đầu tiên.

Cho hai từ w 1w 2 , chúng ta nói rằng: w1w2

  • w 1 luôn luôn xảy ravới w 2 , lưu ý w 1w 2 , khi và chỉ khi w1 w2w1w2

    1. với mọi chuỗi s sao cho s = x w 2 y với x ,ss=xw2y| Y | | w 1 | + | w 2 |  | x | 0 , | x | 1 | , | y | 0 , | y | 1 | 1 có phân hủy khác s = x ' w 1 y ' . Lưu ý: Điều kiện x yx,y w1+w2|x|0,|x|1|,|y|0,|y|1|1s=xw1y
      xymỗi chứa ít nhất một 0 và 1 là yêu cầu của một trường hợp bệnh lý (được tìm thấy bởi @sdcvvc): w 1 = 1 i 0 , w 2 = v 1 i + jy 1 * , và các biến thể của nó đối xứng.w1=1i0w2=v1i+jy1
    2. có một chuỗi s = x w 2 y với x ,s=xw2y| Y | | w 1 | + | w 2 |  ví dụ rằng có ít nhất một phân hủy s = x ' w 1 y 'x,y w1+w2s=xw1y
  • w 1 luôn cooccursvới w 2 , lưu ý w 1w1 w2w 2 , iff mỗi luôn xảy ra với nhau,w1w2

  • w 1 w 2 xảy ra một cách độc lập, ghi nhận w 1w1w2 w 2 , không ai luôn luôn xảy ra với người khác,w1w2

  • w 1 luôn xảy ra m lần hoặc nhiềuhơn w 2 , lưu ý w 1 m w 2 , khi và chỉ khi đối với bất kỳ chuỗi s s = x w 2 y với | x | , | y | | | w 1 | + | w 2 | m phân tách khác s = x i w 1 y iw1 mw2w1mw2ss=xw2y  x, y| w1+w2ms=xiw1yicho i [ 1 , m ]i j ngụ ý x ix j .i[1,m]ijxixj

Các định nghĩa này được xây dựng để chúng ta có thể bỏ qua những gì xảy ra ở cuối chuỗi nơi w 1w 2 được cho là xảy ra. Các hiệu ứng biên ở cuối chuỗi phải được phân tích riêng, nhưng chúng đại diện cho một số trường hợp hữu hạn (thực sự tôi nghĩ rằng tôi đã quên một hoặc hai trường hợp phụ ranh giới như vậy trong phân tích đầu tiên của tôi dưới đây, nhưng nó không thực sự quan trọng). Các định nghĩa tương thích với sự chồng chéo của sự xuất hiện.w1w2

Có 4 trường hợp chính cần xem xét (bỏ qua biểu tượng giữa w 1w 2 ):w1w2

  1. w 1w 2 Cả hai từ nhất thiết phải đi cùng nhau, ngoại trừ có thể ở cuối chuỗi. Điều này chỉ liên quan đến các cặp mẫu 1 i 0 01 i hoặc 0 i 1 10 i . Điều này dễ dàng được nhận ra bởi mộtmáy tự động hữu hạn, chỉ kiểm tra các sự cố đơn độc ở cả hai đầu của chuỗi được nhận ra, để đảm bảo có sự xuất hiện đơn độc ở cả hai đầu hoặc ở cả hai đầu. Ngoài ra còn có trường hợp suy biến khi w 1 = w 2 : thì ngôn ngữ L rõ ràng là thông thường.w1w2
    1i001i0i110iw1=w2

  2. w 1w 2 , nhưng không phải w 2w 1 Một trong những 2 từ không thể xảy ra nếu không có sự khác, nhưng ngược lại là không đúng sự thật (ngoại trừ có lẽ ở hai đầu của chuỗi). Điều này xảy ra khi:w1w2w2w1

    • w 1 là một chuỗi con của w 2 : sau đó một máy tự động hữu hạn chỉ có thể kiểm tra xem w 1 không xảy ra bên ngoài một thể hiện của w 2 .w1w2w1w2

    • w 1 = 1 i 0 w 2 = v 1 j đối với một số từ v { 0 , 1 } * , v 01 i : sau đó một tấm séc automaton hữu hạn như trong trường hợp trước đó w 1 không xảy ra tách ra từ w 2 . Tuy nhiên, automaton cho phép đếm thêm một thể hiện của w 1 sẽ cho phép chấp nhận nếu w 2w1=1i0w2=v1jv{0,1}v01iw1w2w1w2là một hậu tố của chuỗi. Có ba trường hợp đối xứng khác (đối xứng 1-0 và đối xứng trái phải).

  3. w12w2w12w2
    One of the 2 words occurs twice in the other. That can be recognized by an a finite automation that checks that the smaller word never occurs in the string. The is also a slightly more complex variant that combines the two variations of case 2. In this case the automaton checks that the smaller string 1i01i0 never occurs, except possibly as part of vv in the larger one v1jv1j coming as a suffix of the string (and 3 other cases by symetry).

  4. w1w 2 2 từ có thể xảy ra độc lập với nhau. Chúng tôi xây dựng một máy G tuần tự tổng quát (GSM)tạo ra a khi nó nhận ra sự xuất hiện của w 1 b khi nhận ra sự xuất hiện của w 2 và quên mọi thứ khác. Ngôn ngữ L chỉ thông thường nếu ngôn ngữ G ( L ) là chính quy. Nhưng G ( L ) = { w { một , b } * | | w | mộtw1w2
    Gaw1bw2LG(L) = | W | b } mà rõ ràng là bối cảnh tự do và không thường xuyên. Do đó L không thường xuyên. Thật ra ta có L = G - 1 ( G ( L ) ) . Vì các ngôn ngữ thông thường và ngôn ngữ không ngữ cảnh được đóng trong ánh xạ GSM và ánh xạ GSM nghịch đảo, chúng tôi cũng biết rằng L không có ngữ cảnh.G(L)={w{a,b} wa=wb}L
    L=G1(G(L))L

Một cách để tổ chức một bằng chứng chính thức có thể là như sau. Đầu tiên hãy xây dựng một thiết bị nhận dạng ngôn ngữ. Trên thực tế, nó có thể được thực hiện với máy 1 bộ đếm, nhưng sẽ dễ dàng hơn khi có hai biểu tượng ngăn xếp để tránh trùng lặp điều khiển hữu hạn. Sau đó, đối với các trường hợp cần là FA, cho thấy bộ đếm có thể được giới hạn bởi một hằng số chỉ phụ thuộc vào hai từ. Đối với các trường hợp khác cho thấy rằng bộ đếm có thể đạt được bất kỳ giá trị tùy ý. Tất nhiên, các tổ chức PDA nên được tổ chức sao cho các bằng chứng đủ dễ thực hiện.

Representing the FA as a 2-stack-symbols PDA is probably the simplest representation for it. In the non-regular case, the finite control part of the PDA is the same as that of the GSM in the proof sketch above. Instead of outputting aa's and bb's like the GSM, the PDA counts the difference in number with the stack.


I had a question about context-freeness in the case of three words. I deleted it when I realised it could be analyzed similarly. I had first thought that proving non-CFness would make an original exercise, but the GSM ruins it.
babou

2
It is not clear what do you mean by "occur independently of each other", "come necessarily together" etc. Please write formal definitions instead, and prove that they cover all cases.
sdcvvc

1
I am not sure what you are asking, and what level of formalization you need, for what purpose. I realized that analyzing by hand possible relations of the two words is not garanteed to be correct, and does not matter anyway. What matters is whether an occurence of one word can exist without creating at the same time an occurence (or several) of the other word. The details do not matter as it will always be localized and thus manageable finitely. The two ends do not matter either as tey are localized too. Even overlaps of occurrences do not matter since they can only be finitely many in 1 place
babou

1
I asked you about precise definitions of the terms mentioned in the comment. Thank you for writing them. Was I supposed to guess them previously? Anyway, you seem to claim that 0i110i0i110i. This does not satisfy condition 1. of the definition of "w1w1 always occurs with w2", since there is no occurrence of 10i in s=0M0i11M.
sdcvvc

Sorry, I did not mean to make you guess. It only took me time to understand what exactly you wanted. My failing only. Regarding your counter example, you are correct. But for me it only means that I have to be a little bit more careful about telomeres, in the definition of the relations. I defined them too quickly, but 0M or 1M do not convey much information in this context. This is really a boundary pathological example within a pathological case, that actually cannot occur when more than 2 symbols are used. I just do not believe it changes anything.
babou
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.