Bằng chứng về bổ đề bơm cho các ngôn ngữ không ngữ cảnh bằng cách sử dụng tự động đẩy xuống


21

Các Bổ đề bơm cho các ngôn ngữ thông thường có thể được chứng minh bằng cách xem xét một automaton hữu hạn nhà nước công nhận ngôn ngữ học, chọn một chuỗi với một lớn hơn chiều dài hơn con số của tiểu bang, và áp dụng các nguyên tắc chuồng bồ câu. Các Bổ đề bơm cho các ngôn ngữ bối cảnh tự do (cũng như Bổ đề Ogden của đó là hơi tổng quát), tuy nhiên, được chứng minh bằng cách xem xét một ngữ pháp ngữ cảnh tự do của ngôn ngữ học, chọn một chuỗi đủ dài, và nhìn vào cây phân tích cú pháp.

Với sự giống nhau của hai bổ đề bơm, bạn sẽ hy vọng rằng không có ngữ cảnh cũng có thể được chứng minh theo cách tương tự như thông thường bằng cách xem xét một máy tự động đẩy xuống nhận ra ngôn ngữ, thay vì ngữ pháp. Tuy nhiên, tôi đã không tìm thấy bất kỳ tài liệu tham khảo nào cho một bằng chứng như vậy.

Do đó, câu hỏi của tôi: có bằng chứng về bổ đề bơm cho các ngôn ngữ không ngữ cảnh chỉ liên quan đến automata đẩy xuống và không phải ngữ pháp không?

Câu trả lời:


16

Tôi nghĩ về vấn đề này một lần nữa, và tôi nghĩ rằng tôi có một bằng chứng đầy đủ. Đó là một chút khó khăn hơn những gì tôi dự đoán. Bình luận rất được hoan nghênh! Cập nhật: Tôi đã gửi bằng chứng này trên arXiv, trong trường hợp điều này hữu ích với ai đó: http://arxiv.org/abs/1207.2819

Đặt L là ngôn ngữ không ngữ cảnh trên bảng chữ cái Σ . Đặt A là một máy tự động đẩy xuống nhận ra L , với bảng chữ cái ngăn xếp Γ . Chúng tôi biểu thị bởi |A|số lượng trạng thái của A . Không mất tính tổng quát, chúng ta có thể giả sử rằng các chuyển tiếp của A pop là biểu tượng trên cùng của ngăn xếp và không đẩy biểu tượng nào trên ngăn xếp hoặc đẩy vào ngăn xếp biểu tượng trên cùng trước đó và một số biểu tượng khác.

Chúng tôi xác địnhvà chiều dài bơm và sẽ hiển thị rằng tất cả sao cho có sự phân rã dạng sao cho , và .p = | Một | ( | Gamma | + 1 ) p 'p=|A|2|Γ|p=|A|(|Γ|+1)p| w | > p w = u v x y z | v x y | p | v y | 1 n 0 , u v n xwL|w|>pw=uvxyz|vxy|p|vy|1n0,uvnxynzL

Đặt sao cho . Đặt là đường dẫn chấp nhận có độ dài tối thiểu cho (được biểu diễn dưới dạng chuỗi chuyển tiếp của ), chúng tôi biểu thị độ dài của nó bằng. Chúng ta có thể định nghĩa, cho, kích thước của ngăn xếp tại vị trí của đường dẫn chấp nhận. Với tất cả , chúng tôi xác định -level trên là một bộ gồm ba chỉ số với sao cho:| w | > p π w A | pi |wL|w|>pπwA|π|s i i N > 0 N pi i , j , k 0 i < j < k p0i<|π|siiN>0Nπi,j,k0i<j<kp

  1. si=sk,sj=si+N
  2. với mọi sao cho ,i n j s is ns jninjsisnsj
  3. với mọi sao cho , .j n k s ks ns knjnksksnsk

(Để biết ví dụ về điều này, hãy xem hình ảnh cho trường hợp 2 dưới đây minh họa một chữ -level.)N

Chúng tôi xác định cấp của là tối đa sao cho có -level. Định nghĩa này được thúc đẩy bởi thuộc tính sau: nếu kích thước của ngăn xếp trên một đường dẫn trở nên lớn hơn mức của nó , thì các ký hiệu ngăn xếp sâu hơn mức sẽ không bao giờ được bật lên. Bây giờ chúng ta sẽ phân biệt hai trường hợp: hoặc , trong trường hợp đó chúng ta biết rằng cùng một cấu hình cho trạng thái tự động và các ký hiệu trên cùng của ngăn xếp được gặp hai lần trong bước đầu tiên của hoặcπ NlπNππ l l l < p l p + 1 π l p v yNπlll<plp+1πlpvà phải có một vị trí xếp chồng và không xếp chồng có thể được lặp lại một số lần tùy ý, từ đó chúng ta xây dựng và .vy

Trường hợp 1. . Chúng tôi định nghĩa các cấu hình của là các cặp trạng thái của và một chuỗi các ký hiệu ngăn xếp (trong đó các ngăn có kích thước nhỏ hơn được biểu thị bằng cách đệm chúng thành bằng một ký hiệu trống đặc biệt, đó là lý do tại sao chúng tôi sử dụng khi xác định ). Theo định nghĩa, có cấu hình như vậy, nhỏ hơn . Do đó, trong bước đầu tiên của , cùng một cấu hình được gặp hai lần ở hai vị trí khác nhau, giả sử . Biểu thị bởi Một Một l l l | Γ | + 1 p | Một | ( | Γ | + 1 ) l pl<pAAlll|Γ|+1p|A|(|Γ|+1)lpπ i < j i jp+1πi<ji^ (resp. ) vị trí của chữ cái cuối cùng của được đọc ở bước (resp. ) của . Chúng tôi có . Do đó, chúng ta có thể tính hệ số với , , , . (Theo chúng tôi biểu thị các chữ cái của từ bao gồm độc quyền .) Bằng cách xây dựng, .j^i j π ij w = u v x y z y z = ε u = wwijπi^j^w=uvxyzyz=ϵ v= w ij x= w j| w | w x y wxy | vxy | pu=w0i^v=wi^j^x=wj^|w|wxywxy|vxy|p

Chúng tôi cũng phải chỉ ra rằng , nhưng điều này xuất phát từ quan sát của chúng tôi ở trên: các biểu tượng ngăn xếp sâu hơn không bao giờ được bật lên, vì vậy không có cách nào để phân biệt các cấu hình bằng với định nghĩa của chúng tôi và đường dẫn chấp nhận cho được xây dựng từ bằng cách lặp lại các bước giữa và , lần.l u v n x w i j nn0,uvnxynz=uvnxLluvnxwijn

Cuối cùng, chúng ta cũng có , vì nếu , thì vì chúng ta có cùng cấu hình ở các bước và trong , sẽ là một con đường chấp nhận cho , mâu thuẫn với mức tối thiểu của .v = ε i j π π ' = π 0 i π j | pi | w π|v|>0v=ϵijππ=π0iπj|π|wπ

(Lưu ý rằng trường hợp này số tiền để áp dụng Bổ đề bơm cho các ngôn ngữ thường xuyên bởi thể xác định rõ topmost những biểu tượng chồng ở bang automaton, đó là đầy đủ vì là đủ nhỏ để đảm bảo rằng lớn hơn số tiểu bang của automaton này Bí quyết chính là chúng ta phải điều chỉnh cho -transitions.)l | w | εll|w|ϵ

Trường hợp 2. . Đặt là -level. Đối với bất kỳ kích thước ngăn xếp , , chúng tôi liên kết lần đẩy cuối cùngpop đầu tiên . Theo định nghĩa, và . Dưới đây là một minh họa của công trình này. Để đơn giản hóa bản vẽ, tôi bỏ qua sự phân biệt giữa các vị trí đường dẫn và vị trí từ mà chúng ta sẽ phải làm sau này. i , j , klpi,j,k h s ih s j lp ( h )phsihsj fp ( h ) = min ( { y j | s y = h } ) i lp ( hlp(h)=max({yj|sy=h}) fp(h)=min({yj|sy=h})j fp ( h ) kilp(h)jjfp(h)k

Minh họa xây dựng cho trường hợp 2. Để đơn giản hóa bản vẽ, sự phân biệt giữa các vị trí đường dẫn và vị trí từ được sử dụng.

Chúng ta nói rằng trạng thái đầy đủ của kích thước ngăn xếp là bộ ba được hình thành bởi:h

  1. trạng thái tự động ở vị trílp(h)
  2. biểu tượng ngăn xếp trên cùng ở vị trílp(h)
  3. trạng thái tự động ở vị trífp(h)

Có trạng thái đầy đủ có thể và kích thước ngăn xếp giữa và , do đó, theo nguyên tắc pidgeonhole, tồn tại hai kích thước ngăn xếp với sao cho các trạng thái đầy đủ tại và là như nhau. Giống như trong trường hợp 1, chúng tôi xác định bởi , , và vị trí của các chữ cái cuối cùng của đọc tại các vị trí tương ứng trong . Chúng tôi tính hệ số trong đóp + 1 s i s j g , h s ig < h s j g h ^ lp ( g ) g ) v = w ^ lppp+1sisjg,hsig<hsjghlp(^g) ^ fp ( h) ^ fp ( g)wπw=uvxyzu=w0 ^ lp (lp(^h)fp(^h)fp(^g)wπw=uvxyzu=w0lp(^g), , , và .x=w ^ lp) ^ fp ( g)z=w ^ fp ( g)| w|v=wlp(^g)lp(^h) ( h y= w ^ fpx=wlp(^h)fp(^h)y=wfp(^h)fp(^g)z=wfp(^g)|w|

Hệ số này đảm bảo rằng (vì theo định nghĩa của chúng tôi về các cấp độ).k p|vxy|pkp

Chúng tôi cũng phải chứng minh rằng . Để làm như vậy, hãy quan sát rằng mỗi lần chúng ta lặp lại , chúng ta bắt đầu từ cùng một trạng thái và cùng một đỉnh ngăn xếp và chúng ta không bật xuống dưới vị trí hiện tại của chúng ta trong ngăn xếp (nếu không chúng ta sẽ phải đẩy lại ở vị trí hiện tại, vi phạm tối đa của ), vì vậy chúng ta có thể đi theo cùng một đường dẫn trong và đẩy cùng một chuỗi ký hiệu trên ngăn xếp. Theo mức tối đa của và mức tối thiểu của , trong khi đọc , chúng tôi không bật bên dưới vị trí hiện tại của chúng tôi trong ngăn xếp, do đó, đường dẫn đi theo trong máy tự động là như nhau bất kể số lượng lần chúng tôi lặp lạiv lp (n0,uvnxynzLvA lp ( h ) fp ( h ) xlp(g)Alp(h)fp(h)xv. Bây giờ, nếu chúng ta lặp lại nhiều lần như chúng ta lặp lại , vì chúng ta bắt đầu từ cùng một trạng thái, vì chúng ta đã đẩy chuỗi ký hiệu tương tự trên ngăn xếp với lặp lại của và vì chúng ta không bật nhiều hơn những gì có được xếp chồng lên nhau theo mức tối thiểu của , chúng ta có thể đi theo cùng một đường dẫn trong và bật cùng một chuỗi ký hiệu từ ngăn xếp. Do đó, một đường dẫn chấp nhận từ có thể được xây dựng từ đường dẫn chấp nhận cho .v v v fp ( g ) A u v n x y n z wwvvvfp(g)Auvnxynzw

Cuối cùng, chúng ta cũng có , vì giống như trong trường hợp 1, nếu và , chúng ta có thể xây dựng một đường dẫn chấp nhận ngắn hơn cho bằng cách xóa và .v = ϵ y = ϵ w π lp ( g ) lp ( h ) π fp ( h ) fp ( g )|vy|>1v=ϵy=ϵwπlp(g)lp(h)πfp(h)fp(g)

Do đó, chúng tôi có một yếu tố thích hợp trong cả hai trường hợp và kết quả đã được chứng minh.

(Tín dụng đến Marc Jeanmougin vì đã giúp tôi với bằng chứng này.)


7

Vâng, nó là có thể. Chúng ta có thể sử dụng khái niệm cấu hình bề mặt; họ đã được Cook giới thiệu một thời gian dài trở lại. Với điều này, khá dễ dàng để có được một phiên bản bơm bổ đề ra.

Đối với cấu hình bề mặt, hầu như bất kỳ giấy nào trên LogCFL đều phải mang định nghĩa của nó. Đây là một bài báo gần đây và đây là một luận án

Có lẽ ai đó mạnh mẽ hơn có thể đánh vần các chi tiết!


Cảm ơn đã trả lời! Vâng, thật tự nhiên khi nhìn vào sự kết hợp giữa trạng thái tự động và biểu tượng ngăn xếp trên cùng. Mặc dù vậy, tôi vẫn đang suy nghĩ về vấn đề này và tôi không thể tìm ra chi tiết ... Trợ giúp được đánh giá cao. :-)
a3nm

3

Để hoàn thiện một tài liệu tham khảo cho một bằng chứng theo hướng này.

A.Ehrenfeucht, HJHoooltoom, G.Rozenberg: Hệ thống cặp phối hợp. I: Từ Dyck và bơm cổ điển RAIRO, Inf. Théor. Táo. 20, 405-424 (1986)

Trừu tượng. Khái niệm về một hệ thống cặp phối hợp [...] tương ứng rất chặt chẽ với (là một công thức khác của) khái niệm về một máy tự động đẩy xuống. Trong bài báo này, chúng tôi [...] điều tra khả năng có được các thuộc tính bơm của các ngôn ngữ không ngữ cảnh thông qua việc phân tích các tính toán trong các hệ thống cp. Để làm điều này, chúng tôi phân tích cấu trúc tổ hợp của các từ Dyck. Các thuộc tính của các từ Dyck mà chúng tôi điều tra xuất phát từ phân tích kết hợp các tính toán trong các hệ thống cp. Chúng tôi chứng minh làm thế nào sự tương ứng này có thể được sử dụng để chứng minh bổ đề bơm cổ điển.


1

Khi thảo luận về vấn đề này với Géraud Sénizergues, anh ấy đã chỉ cho tôi bài viết này của Sakarovitch đã chứng minh kết quả này. Bằng chứng dường như bắt nguồn từ bài báo này của Ogden.

Tài liệu tham khảo:

  • Sakarovitch, Jacques. Sur une ownété d'itération des langages algébriques détereptes. (Tiếng Pháp. Tóm tắt tiếng Anh). Môn Toán. Lý thuyết hệ thống 14 (1981), số 3, 247 Từ288.
  • William F. Ogden. 1969. Định lý xen kẽ cho các ngôn ngữ ngăn xếp. Trong Kỷ yếu của hội nghị chuyên đề ACM hàng năm đầu tiên về Lý thuyết điện toán (STOC '69).
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.