上下文无关语法和上下文无关语言中的歧义

先决条件 - 下推自动机和上下文无关语言。

假设我们有一个带有产生式规则的上下文无关文法 G：S->aSb|bSa|SS|ℇ

最左推导 (LMD) 和推导树：从起始符号 S 到字符串的最左推导是通过用相应产生式规则的 RHS 替换最左边的非终结符号来完成的。例如：从上面的语法 G 中最左边的字符串abab 的推导是这样完成的：

S => aSb => abSab => abab

使用生产规则替换带下划线的符号。

派生树：它说明如何使用 S 的生产规则派生字符串，如图 1 所示。

上下文无关语法和上下文无关语言中的歧义

图1

最右推导 (RMD)：从起始符号 S 对字符串的最右推导是通过用相应产生式规则的 RHS 替换最右边的非终结符号来完成的。例如：从上面的语法 G 中最右边的字符串abab 的推导是这样完成的：

S => SS => SaSb => Sab => aSbab => abab

使用生产规则替换带下划线的符号。使用最右边推导的 abab 推导树如图 2 所示。

上下文无关语法和上下文无关语言中的歧义2

图 2

推导可以是 LMD 或 RMD，也可以是两者，或者都不是。例如：

S => aSb => abSab => abab is LMD as well as RMD

but S => SS => SaSb => Sab => aSbab => abab is RMD but not LMD.

模糊上下文无关语法：如果由语法生成的字符串存在多个 LMD 或多个 RMD，则上下文无关语法称为歧义。歧义语法中的字符串也会有不止一个派生树。上面描述的语法是模棱两可的，因为有两个派生树（图 1 和图 2）。字符串abab 可以有多个 RMD，它们是：

S => SS => SaSb => Sab => aSbab => abab

S => aSb => abSab => abab

歧义上下文无关语言：如果没有明确的语法来定义该语言，则上下文无关语言称为歧义，并且它也称为固有歧义上下文无关语言。

笔记：

问题：考虑以下关于上下文无关文法的陈述

G = {S->SS, S->ab, S->ba, S->ℇ}

下面哪个组合表达了关于 G 的所有真实陈述？

解决方案：字符串abab 有不同的 LMD，可以是

S => SS => SSS => abSS => ababS => abab

S => SS => abS => abab

所以语法是模棱两可的。所以陈述 I 是真的。

语句 II 指出语法 G 生成所有具有相同数量的 a 和 b 的字符串，但它不能生成 aabb 字符串。所以陈述二是不正确的。

陈述 III 也是正确的，因为它可以被确定性 PDA 接受。所以正确的选项是（B）。

问题：下列哪一项陈述是错误的？

解决方案： （A）是正确的，因为对于模棱两可的 CFL，与之对应的所有 CFG 都是模棱两可的。

(B) 也是正确的，因为明确的 CFG 对于它生成的每个语言字符串都有一个唯一的解析树。

(D) 也是正确的，因为有限的字符串集总是规则的。

所以选项（C）是正确的选项。