Python 之父考虑重构 Python 解释器

python| 2019-07-29

7 月 22 日，Python 之父 Guido 在 Medium 上发表了他的第一篇博文《PEG Parser》。

在该文中，Guido 说他正在考虑使用 PEG Parser 代替现有的类 LL(1) Parser（名为pgen），来重构 Python 解释器。原因是现在的 pgen 限制了 Python 语法的自由度，使得一些语法难以实现，也让当前的语法树不够整洁，一定程度上影响了语法树的表意，不能最好地体现设计者的意图。

那 PEG Parser 和现有的 LL(1) Parser 有什么区别呢？可以这样简单地理解，PEG 语法解释器在解析语法的时候，会一次性加载全部代码，所以解释器可以根据任意位置的符号来判断语法的语义。而目前的 LL(1) Parse 解析语法的时候只会向前检测一个符号，来猜测语义，导致部分语法有二义性的表现，进而限制了Python语言的语法定义方式。当然，一次性加载全部代码，也意味着 PEG Parser 需要更大的内存来运行。

说当前解释器限制了 Python 的语法实现，很多同学可能没有明显的感受，所以 Guido 又举了一个例子：在 Python3.8 之前，下面这段代码都是可以正常运行的，而不像大家直观感受的第二行代码应该报错。

图0：Python 之父考虑重构 Python 解释器