Làm thế nào để chứng minh rằng một ngữ pháp là không rõ ràng?

25

Vấn đề của tôi là làm thế nào tôi có thể chứng minh rằng một ngữ pháp không rõ ràng? Tôi có ngữ pháp sau:

S \to s t a t e m e n t ∣ if e x p r e s s i o n then S ∣ if e x p r e s s i o n then S else S

$S → statement ∣ \mbox{if } expression \mbox{ then } S ∣ \mbox{if } expression \mbox{ then } S \mbox{ else } S$

và làm cho nó thành một ngữ pháp rõ ràng, tôi nghĩ rằng nó chính xác:

$S → S_1 ∣ S_2$
$S_1 → \mbox{if } expression \mbox{ then } S ∣ \mbox{if } expression \mbox{ then } S_2 \mbox{ else } S_1$
$S_2 → \mbox{if } expression \mbox{ then } S_2 \mbox{ else } S_2 ∣ statement$

Tôi biết rằng một ngữ pháp rõ ràng có một cây phân tích cho mỗi thuật ngữ.

— người dùng1594
nguồn

20

Có (ít nhất) một cách để chứng minh unambiguity của một văn phạm $G = (N,T,\delta,S)$ cho ngôn ngữ $L$ . Nó bao gồm hai bước:

Chứng minh $L \subseteq \mathcal{L}(G)$ .
Chứng minh $[z^n]S_G(z) = |L_n|$ .

Bước đầu tiên khá rõ ràng: cho thấy rằng ngữ pháp tạo ra (ít nhất) các từ bạn muốn, đó là tính chính xác.

Bước thứ hai cho thấy có nhiều cây cú pháp cho các từ có độ dài vì có các từ có độ dài - với 1. điều này hàm ý không rõ ràng. Nó sử dụng hàm cấu trúc của , quay trở lại Chomsky và Schützenberger [1], cụ thể là $G$ $n$ $L$ $n$ $G$

$\qquad \displaystyle S_G(z) = \sum_{n=0}^\infty t_nz^n$

với số lượng cây cú pháp có cho các từ có độ dài . Tất nhiên bạn cần phải có để làm việc này $t_n = [z^n]S_G(z)$ $G$ $n$ $|L_n|$

Điều tuyệt vời là (thường) dễ dàng có được cho các ngôn ngữ không ngữ cảnh, mặc dù việc tìm một dạng đóng cho có thể khó khăn. Biến đổi thành một hệ phương trình của các hàm với một biến trên nonterminal: $S_G$ $t_n$ $G$

$\qquad \displaystyle \left[ A(z) = \sum\limits_{(A, a_0 \dots a_k) \in \delta} \ \prod\limits_{i=0}^{k} \ \tau(a_i)\ : A \in N \right] \text{ with } \tau(a) = \begin{cases} a(z) &, a \in N \\ z &, a \in T \\ \end{cases}.$

Điều này có thể trông đáng ngại nhưng thực sự chỉ là một chuyển đổi cú pháp như sẽ trở nên rõ ràng trong ví dụ. Ý tưởng là tạo ra những biểu tượng thiết bị đầu cuối được tính theo số mũ của và vì hệ thống có dạng tương tự như , xảy ra thường xuyên trong tổng như thiết bị đầu cuối có thể được tạo ra bởi . Kiểm tra Kuich [2] để biết chi tiết. $z$ $G$ $z^n$ $n$ $G$

Giải hệ phương trình này (đại số máy tính!) Thu được ; bây giờ bạn "chỉ" phải kéo hệ số (ở dạng đóng, chung). Các TCS Cheat Sheet và đại số máy tính thường có thể làm như vậy. $S(z) = S_G(z)$

Thí dụ

Hãy xem xét ngữ pháp đơn giản với các quy tắc $G$

. $\qquad \displaystyle S \to aSa \mid bSb \mid \varepsilon$

Rõ ràng là (bước 1, chứng minh bằng quy nạp). Có $\mathcal{L}(G) = \{ww^R \mid w \in \{a,b\}^*\}$ palindromes có độ dàinếuchẵn,nếu không. $2^{\frac{n}{2}}$ $n$ $n$ $0$

Thiết lập hệ số phương trình mang lại

$\qquad \displaystyle S(z) = 2z^2S(z) + 1$

giải pháp của ai

. $\qquad \displaystyle S_G(z) = \frac{1}{1-2z^2}$

Các hệ số của trùng với số lượng palindromes, do đó không rõ ràng. $S_G$ $G$

Lý thuyết đại số về ngôn ngữ không ngữ cảnh của Chomsky, Schützenberger (1963)
Về entropy của các ngôn ngữ không ngữ cảnh của Kuich (1970)

— Raphael
nguồn

3

Như bạn đã biết @Raphael, sự mơ hồ là không thể quyết định, do đó, ít nhất một trong các bước của bạn không thể được cơ giới hóa. Bất cứ ý tưởng nào? Lấy một hình thức đóng cho

?

t_{n}

$t_n$

— Martin Berger

2

Hệ thống phương trình có thể không thể giải được bằng thuật toán nếu mức độ quá cao và việc kéo các hệ số chính xác ra khỏi các hàm tạo có thể rất khó. Tuy nhiên, trong "thực hành", người ta thường xử lý các ngữ pháp có "độ" nhỏ - lưu ý rằng, dạng bình thường của Chomsky dẫn đến các hệ phương trình ở mức độ nhỏ - và có các phương pháp để có ít nhất

-asymptotics cho các hệ số ; điều này có thể đủ để thiết lập sự mơ hồ. Lưu ý rằng để chứng minh sự rõ ràng, hiển thị

\sim

$\sim$

mà không kéo hệ số là đủ; việc chứng minh danh tính này có thể khó khăn, mặc dù.

S_{L} (z) = S_{G} (z)

$S_L(z) = S_G(z)$

— Raphael

Cảm ơn bạn @Raphael. Bạn có biết bất kỳ văn bản nào phát triển chi tiết về mức độ không ổn định xuất hiện ngay cả khi người ta sử dụng ví dụ như hình thức bình thường của Chomsky không? (Tôi không thể nắm giữ Kuich.)

— Martin Berger

@MartinBerger Tôi vừa khám phá lại nhận xét của bạn trong danh sách việc cần làm của tôi; xin lỗi vì sự im lặng dài Có ba bước mà (tôi nghĩ) không tính toán nói chung: 1) Xác định

. 2) Tính toán

. 3) Xác định

. Cụ thể, đại diện nào của

để sử dụng cho 2)?

S_{G}

$S_G$

| L_{n} |

$|L_n|$

[z^{n}] S_{g} (z)

$[z^n]S_g(z)$

L

$L$

— Raphael

Tại sao đại diện của

là một vấn đề? Ví dụ, chúng ta có thể sử dụng bất kỳ cách nào để thể hiện CFG cho trình biên dịch. Có lẽ bạn có nghĩa là làm thế nào để đại diện cho

L

$L$

?

L_{n}

$L_n$

— Martin Berger

6

Đây là một câu hỏi hay, nhưng một số Googling sẽ nói với bạn rằng không có phương pháp chung nào để quyết định sự mơ hồ , vì vậy bạn cần làm cho câu hỏi của mình cụ thể hơn.

— phục hồi
nguồn

2

OP yêu cầu các kỹ thuật chứng minh, không phải thuật toán.

— Raphael

Tôi cũng nghĩ thế; nó có thể được đề cập trong câu hỏi

— rebierpost

1

Google không phải là một lời tiên tri của sự thật, bởi vì kiến thức không dân chủ và kết quả của Google là như vậy. Tôi sẽ không dựa vào Google trong trường hợp này, bởi vì mọi người thường sao chép con mèo này từ con khác mà không kiểm tra tính chính xác của những gì chúng sao chép. Nếu không đưa ra một bằng chứng, họ có thể sai.

— SasQ

5

@SasQ: Bạn đọc những lời của tôi quá đúng theo nghĩa đen. Những gì Google cung cấp cho tôi là các URL đến các nguyên tử giải thích mọi thứ.

— reinierpost

4

Đối với một số ngữ pháp, một bằng chứng bằng cảm ứng (trên độ dài từ) là có thể.

Ví dụ, hãy xem xét một ngữ pháp trên được đưa ra bởi các quy tắc sau: $G$ $\Sigma = \{a,b\}$

$\qquad \displaystyle S \to aSa \mid bSb \mid \varepsilon$

Tất cả các từ có độ dài trong - chỉ có - chỉ có một trái nguồn gốc. $\leq 1$ $L(G)$ $\varepsilon$

Giả sử rằng tất cả các từ có độ dài đối với một số chỉ có một dẫn xuất trái. $\leq n$ $n \in \mathbb{N}$

Bây giờ xem xét tùy ý đối với một số $w = w_1 w' w_n \in L(G) \cap \Sigma^n$ . Rõ ràng, . Nếu , chúng ta biết rằng quy tắc đầu tiên trong mọi đạo hàm trái phải là ; nếu , nó phải là $n > 0$ $w_1 \in \Sigma$ $w_1 = a$ $S \to aSa$ $w_1 = b$ $S \to bSb$ . Điều này bao gồm tất cả các trường hợp. Bằng cách giả thuyết cảm ứng, chúng ta biết rằng có đúng một trái nguồn gốc cho . Kết hợp lại, chúng tôi kết luận rằng có chính xác một đạo hàm trái cho . $w'$ $w$

Điều này trở nên khó khăn hơn nếu

có nhiều thiết bị đầu cuối,
ngữ pháp không tuyến tính và / hoặc
ngữ pháp là đệ quy trái.

Nó có thể giúp củng cố yêu cầu đối với tất cả các hình thức cảm tính (nếu ngữ pháp không có các thiết bị đầu cuối không sinh sản) và "gốc" không đầu cuối.

Tôi nghĩ rằng việc chuyển đổi sang hình thức bình thường Greibach duy trì sự mơ hồ (un), để áp dụng bước này trước tiên có thể xử lý đệ quy trái độc đáo.

Điều quan trọng là xác định một tính năng của mỗi từ sửa chữa (ít nhất) một bước phái sinh. Phần còn lại theo quy nạp.

— Raphael
nguồn

3

Về cơ bản, đó là một vấn đề thế hệ trẻ em. Bắt đầu với biểu thức đầu tiên và tạo ra các phần tử con .... Tiếp tục thực hiện đệ quy (DFS) và sau một vài lần lặp lại, hãy xem liệu bạn có thể tạo cùng một biểu thức mở rộng từ hai đứa trẻ khác nhau không. Nếu bạn có thể làm điều đó, nó mơ hồ. Không có cách nào để xác định thời gian chạy của thuật toán này. Giả sử nó an toàn, sau khi có thể tạo ra 30 cấp độ cho trẻ em :) (Tất nhiên là nó có thể đánh bom vào ngày 31)

— Karthik Kumar Viswanathan
nguồn

1

OP yêu cầu các kỹ thuật chứng minh, không phải thuật toán.

— Raphael

2

đó không thể là một cách để chứng minh liệu một ngữ pháp có mơ hồ hay không. Như một vấn đề thực tế khi vụ đánh bom đó xảy ra là không thể giải quyết được.

— Sнаđошƒаӽ