Làm thế nào để chứng minh rằng một ngôn ngữ là không có ngữ cảnh?

26

Có nhiều kỹ thuật để chứng minh rằng một ngôn ngữ không có ngữ cảnh, nhưng làm cách nào để chứng minh rằng một ngôn ngữ không có ngữ cảnh?

Có những kỹ thuật nào để chứng minh điều này? Rõ ràng, một cách là thể hiện một ngữ pháp không ngữ cảnh cho ngôn ngữ. Có bất kỳ kỹ thuật hệ thống nào để tìm một ngữ pháp không ngữ cảnh cho một ngôn ngữ nhất định không?

Đối với các ngôn ngữ thông thường, có nhiều cách có hệ thống để rút ra một máy tự động ngữ pháp / trạng thái hữu hạn thông thường: ví dụ, định lý Myhill-Nerode cung cấp một cách. Có bất kỳ kỹ thuật tương ứng cho các ngôn ngữ không ngữ cảnh?

Động lực của tôi ở đây là (hy vọng) xây dựng một câu hỏi tham khảo có chứa một danh sách các kỹ thuật thường hữu ích, khi cố gắng chứng minh rằng một ngôn ngữ nhất định là không có ngữ cảnh. Vì chúng tôi có nhiều câu hỏi ở đây là những trường hợp đặc biệt về vấn đề này, sẽ thật tuyệt nếu chúng tôi có thể ghi lại cách tiếp cận chung hoặc các kỹ thuật chung mà người ta có thể sử dụng khi gặp phải vấn đề này.

— DW
nguồn

Cho phép tôi để lại ghi chú thông thường của mình: khi cung cấp ngữ pháp không ngữ cảnh cho ngôn ngữ trong tay, bạn cần một bằng chứng chính xác có thể khiến cách tiếp cận trở nên khó sử dụng.

— Raphael

Để làm cho câu hỏi này trở thành một câu hỏi tham khảo thích hợp, chúng ta có thể đưa ra các trình kết xuất vấn đề, bạn có thể thêm câu trả lời về việc đưa ra các ngữ pháp và automata, có thể với một ví dụ không? Cảm ơn!

— Raphael

Cho đến khi tài liệu được chuyển đến đây, lưu ý rằng Rick Decker và babou đã thu thập một số thành ngữ không ngữ cảnh điển hình tại một câu hỏi trùng lặp .

— Raphael

13

Một cách tiếp cận thực tế mà trong nhiều ví dụ hoạt động [nhưng không phải lúc nào cũng vậy, tôi biết] đang cố gắng tìm cấu trúc lồng nhau của các chuỗi trong ngôn ngữ. "Các phụ thuộc lồng nhau" phải được tạo ra cùng một lúc trong các phần khác nhau của chuỗi.

Ngoài ra chúng tôi có hộp công cụ cơ bản :

ghép nối: $S\to S_1S_2$ nếu bạn có thể chia ngôn ngữ thành hai phần liên tiếp sử dụng sản phẩm này
liên kết: $S\to S_1 \mid S_2$ chia thành các phần rời rạc
lặp: $S\to S_1S \mid \varepsilon$

ví dụ 1

Dưới đây là một ví dụ cho việc làm tổ (cảm ơn Raphael).

$L=\{b^ka^l(bc)^ma^nb^o \mid k,l,m,n,o\in {\Bbb N},k\neq o,2l=n,m\ge 2 \}$

Thay $n$ bằng $2l$ . Bây giờ chúng ta có thể thả $n$ trong điều kiện.

Thay $k \neq o$ bằng $k > o \text{ or } k < o$ (nhầm lẫn? $o$ là 'oh' chứ không phải 'zero'). Áp dụng các công cụ cho công đoàn. Chúng tôi làm việc với $k > o$ ở đây. Ngoài ra $k>o$ iff $k=s+o$ và $s>0$ trong đó $s$ là một biến mới. Thay $k$ bằng $s+o$ .

$L_1 =\{b^{s+o}a^l(bc)^ma^{2l}b^o \mid l,m,o,s\in {\Bbb N},s>0,m\ge 2 \}$

Một số cách viết đơn giản.

$L_1 =\{bb^sb^o a^l bcbc(bc)^m (aa)^{l}b^o \mid l,m,o,s\in {\Bbb N} \}$

Bây giờ chúng ta thấy cấu trúc lồng nhau, và bắt đầu xây dựng một ngữ pháp.

, , (xem: nối và lặp đi lặp lại ở đây) $S_1 \to TV$ $T\to bU$ $U\to bU \mid \varepsilon$

(chúng tôi tạo ra 's trên cả hai mặt) $V \to bVb \mid W$ $o$ $b$

$W \to aWaa\mid X$

, , $X\to YZ$ $Y\to bcbc$ $Z\to bcZ\mid \varepsilon$

Ví dụ 2

$K =\{ a^kb^lc^m \mid l=m+k\}$

Một viết lại "rõ ràng" đầu tiên.

$K =\{ a^kb^{m+k}c^m \mid m,k\ge 0\} = \{ a^kb^mb^kc^m \mid m,k\ge 0\}$

Trong ngôn ngữ học, điều này được gọi là "sự phụ thuộc nối tiếp chéo": sự xen kẽ (thường) biểu thị mạnh mẽ cho việc không bối cảnh. Tất nhiên và chúng ta được lưu. $k,m,k,m$ $m+k=k+m$

$K =\{ a^kb^{k+m}c^m \mid m,k\ge 0\} = \{ a^kb^kb^mc^m \mid m,k\ge 0\}$

với tác phẩm , , $S\to XY$ $X\to aXb\mid \varepsilon$ $Y\to bYc\mid \varepsilon$

Tương tự như vậy $K'= \{ a^kb^lc^m \mid m=k+l\} = \{ a^kb^lc^lc^k \mid k,l\ge 0\}$

với tác phẩm , $S\to aSc \mid X$ $X\to bXc\mid \varepsilon$

Nhận xét cuối cùng: những kỹ thuật này giúp bạn đưa ra một ngữ pháp không có ngữ cảnh ứng viên, hy vọng sẽ nhận ra ngôn ngữ của bạn. Một bằng chứng chính xác vẫn có thể cần thiết, để đảm bảo rằng ngữ pháp thực sự hoạt động để nhận ra ngôn ngữ của bạn (không hơn, và không kém).

— Hendrik Jan
nguồn

11

Có một đặc điểm của CFL có thể được sử dụng, đó là định lý Chomsky-Schützenberger .

Ngôn ngữ Dyck

Đặt một bảng chữ cái. Chúng tôi xác định Dyck -language của bởi bối cảnh tự do văn phạm với do $T$ $D_T \subseteq (T \cup \hat{T})^*$ $T$ $G = (\{S\}, T \cup \hat{T}, \delta, S)$ $\delta$

. $\qquad\displaystyle S \to aS\hat{a}S \mid \varepsilon, \quad a \in T$

Định lý Chomsky-Schützenberger

là bối cảnh được miễn nếu và chỉ nếu có $L \subseteq \Sigma^*$

an alphabet $T$ ,

a regular language $R \subseteq (T \cup \hat{T})^*$ and

homomorphism $\psi : (T \cup \hat{T}) \to \Sigma^*$

so that

$\qquad \displaystyle L = \psi(D_T \cap R)$ .

Note that the homomorphism is extended to words (symbol by symbol) and then to languages (word by word).

Example

Consider $L = \{ a^n b^n c^m \mid n,m \in \mathbb{N}$ . With

$T = \{ [, \langle\}$ (and, canonically, $\hat{T} = \{ ], \rangle\}$ ),
$R = \mathcal{L}([^* ]^*\langle^* \rangle^*)$ and
$\psi(x) = \begin{cases} a, &x = [ \\ b, &x =\ ] \\ \varepsilon, &x = \langle \\ c, &x =\ \rangle \end{cases}$

the theorem implies that $L$ is context-free, in particular since

$\qquad\displaystyle D_T \cap R = \{[^n ]^n \langle^m \rangle^m \mid n,m \in \mathbb{N}\}$

Ví dụ 2

$L = \{ b^k a^l (bc)^m a^n b^o \mid k,l,m,n,o \in \mathbb{N}, k \neq o, 2l = n, m \geq 2 \}$ is context-free.

Here, we need one type of parentheses for $a$ , one for $bc$ , one for $b$ , and another used to model the $b$ that cause $k \neq o$ . We use

$T = \{ [, \langle, \vdash, < \}$ ,
$R = \mathcal{L}(<^+>^+\vdash^* [^* \langle\langle^+ \rangle^+\rangle ]^* \dashv^*) \cup \mathcal{L}(\vdash^* [^* \langle\langle^+ \rangle^+\rangle ]^* \dashv^*<^+>^+)$ and
$\psi(x) = \begin{cases} b, &x \in \{\vdash, \dashv, <\} \\ a, &x = [ \\ aa, &x =\ ] \\ bc, &x = \langle \\ \varepsilon, &\text{else} \end{cases}$

and apply the theorem. In order to see that $L = \psi(D_T \cap R)$ , we don't need more than the fact that matching symbols (e.g. $[$ and $]$ ) have to occur equally often in any $w \in D_T$ . Adding this contraint to the regular expressions we defined $R$ by, we get

$\qquad \begin{align*} D_T \cap R = &\{<^p>^p \vdash^o [^l \langle^m \rangle^m ]^l \dashv^o \mid p \geq 1, o \geq 0, l \geq 0, m \geq 2\} \\ &\cup\ \{\dots\} \end{align*}$

and therewith

$\qquad\begin{align*} \psi(D_T \cap R) &= \{ b^{p+o} a^l (bc)^m a^{2l} b^o \mid p \geq 1, o \geq 0, l \geq 0, m \geq 2 \} \\ &\quad \cup\ \{ \dots \} \\ &= \{ b^k a^l (bc)^m a^n b^o \mid k,l,m,n,o \in \mathbb{N}, k > o, 2l = n, m \geq 2 \} \\&\quad \cup\ \{ \dots \} \\ &= L \;. \end{align*}$

To grammars and automata

If we want to have an automaton or grammar in the end, we have some more work ahead of us.

Towards an automaton, construct the NPDA for $D_T$ and an NFA for $R$ . The former is standard and we have algorithms for the latter, provided the language is given in a suitable representation (see also here). Intersection both is another standard construction and $\psi$ can be applied to every transition individually.
Towards a grammar, build one for $R$ (again, should be standard), take the one for $D_T$ and intersect them. Then apply $\psi$ to the rule set (symbol for symbol).

Arguably, this is easy since algorithmic; the complexity lies in finding suitable $T$ , $R$ and $\psi$ . I don't know if this approach is (often) simpler than constructing PDA/grammars directly but it may allow to focus on the important features of the language at hand. Try for yourself!

— Raphael
nguồn

It is undecidable whether any given language is context-free.

— reinierpost