INT201 形式语言与自动机笔记(下)

L6 Context-Free Languages 上下文无关语言

Context-Free Grammar (CFG)

是一组用于生成字符串模式的递归规则。上下文无关的语法可以描述所有的常规语言,但它们不能描述所有可能的语言。

e.g

INT201 形式语言与自动机笔记(下)_第1张图片

遵循这些规则,我们可以生成一种语言:

上下文无关文法 Context Free Grammar

INT201 形式语言与自动机笔记(下)_第2张图片

INT201 形式语言与自动机笔记(下)_第3张图片

上下文无关的语法是一个4元组G = (V, Σ, R, S),其中

1. V是一个有限集合,它的元素叫做 Variable,
2. Σ是一个有限集合,它的元素称为 Terminal,
3. V∩Σ =∅,
4. S是V的一个元素;它被称为start variable,
5. R是一个有限集合,它的元素称为rules。每条rule 的形式是A→w,其中A∈V, w∈(V∪Σ)*

e.g1

INT201 形式语言与自动机笔记(下)_第4张图片

e.g2

INT201 形式语言与自动机笔记(下)_第5张图片

e.g3

INT201 形式语言与自动机笔记(下)_第6张图片

e.g4

INT201 形式语言与自动机笔记(下)_第7张图片

 正则语言属于上下文无关语言

INT201 形式语言与自动机笔记(下)_第8张图片

 语法分析树

INT201 形式语言与自动机笔记(下)_第9张图片

e.g1

INT201 形式语言与自动机笔记(下)_第10张图片

边缘/结果

INT201 形式语言与自动机笔记(下)_第11张图片

Derivation派生/推导

INT201 形式语言与自动机笔记(下)_第12张图片

INT201 形式语言与自动机笔记(下)_第13张图片

INT201 形式语言与自动机笔记(下)_第14张图片

INT201 形式语言与自动机笔记(下)_第15张图片

 e.g1

INT201 形式语言与自动机笔记(下)_第16张图片

INT201 形式语言与自动机笔记(下)_第17张图片

INT201 形式语言与自动机笔记(下)_第18张图片

e.g2

INT201 形式语言与自动机笔记(下)_第19张图片

e.g3

INT201 形式语言与自动机笔记(下)_第20张图片

歧义性 ambiguity

INT201 形式语言与自动机笔记(下)_第21张图片

e.g1

INT201 形式语言与自动机笔记(下)_第22张图片

用CFG获取字符串和语言

INT201 形式语言与自动机笔记(下)_第23张图片

INT201 形式语言与自动机笔记(下)_第24张图片

CFG的语言

定义

INT201 形式语言与自动机笔记(下)_第25张图片

例1(?)

INT201 形式语言与自动机笔记(下)_第26张图片

例2(?)

Palindrome 回文

INT201 形式语言与自动机笔记(下)_第27张图片

例3

INT201 形式语言与自动机笔记(下)_第28张图片

正则语言是上下文无关的

以Σ为字母表,以L≥Σ *为Regular语言。那么L是一种无关上下文的语言(所有Regular语言都是无关上下文的)。

例1(?)

INT201 形式语言与自动机笔记(下)_第29张图片

例2(?)

Chomsky Normal Form (CNF) 乔姆斯基范式

定义

每一个上下文无关语法G = (V, Σ, R, S) 都是乔姆斯基范式,如果R中的每个规则都有以下三种形式之一:

•A→BC,其中A、B、C是V的元素,B≠S, C≠S。
•a→x,其中a是V的元素,a是Σ的元素。
•S→ε,其中S为起始变量

INT201 形式语言与自动机笔记(下)_第30张图片

原因

更容易使用

INT201 形式语言与自动机笔记(下)_第31张图片

理论

让Σ成为一个字母,让L \displaystyle \subseteq Σ *成为一个无上下文的语言。存在一种乔姆斯基范式的上下文无关语法,其语言为L(每个CFL都可以用CNF中的一个CFG来描述)。

证明

给定CFG G = (V, Σ, R, S),逐一替换所有非“乔姆斯基”规则。

•启动变量(RHS规则不允许) 也就是在规则的末尾,不能再出现开始变量。也就是说,规则的右侧不能再包含起始符号。
•ε-规则(当A不是启动变量时不允许A→ε)
•所有其他违规行为(A→B、A→aBc、A→BCDE)

把CFG转化成CNF

步骤

步骤1。从规则的右侧删除start变量。

INT201 形式语言与自动机笔记(下)_第32张图片

步骤2。去掉 ε-rules A→ε,其中A∈V−{S}

INT201 形式语言与自动机笔记(下)_第33张图片

当删除A→ε-rules 时,插入所有新的替换:

INT201 形式语言与自动机笔记(下)_第34张图片

步骤3。移除单位规则A→B,其中A∈V。

INT201 形式语言与自动机笔记(下)_第35张图片

步骤4。消除所有右边有两个以上符号的规则。

INT201 形式语言与自动机笔记(下)_第36张图片

第5步。消除所有形式为A→ab的规则,其中A和b不都是变量。

INT201 形式语言与自动机笔记(下)_第37张图片

Closure property of CFG

理论1:

如果1and2是上下文无关的语言,那么它们的联合1∪2也是上下文无关的。

INT201 形式语言与自动机笔记(下)_第38张图片

理论2:

如果1and2是无关上下文的语言,它们的联合1°2也是无关上下文的。(?)

INT201 形式语言与自动机笔记(下)_第39张图片

理论3: 

如果1 is是与上下文无关的语言,它们的Kleene闭包* 1也是与上下文无关的。(?)

INT201 形式语言与自动机笔记(下)_第40张图片

Syntactic parsing 语法解析(optional)

用上下文无关语法解析自然语言

例1

INT201 形式语言与自动机笔记(下)_第41张图片

INT201 形式语言与自动机笔记(下)_第42张图片

INT201 形式语言与自动机笔记(下)_第43张图片

INT201 形式语言与自动机笔记(下)_第44张图片

Pushdown Automata下推自动机

INT201 形式语言与自动机笔记(下)_第45张图片

下推自动机可以接受的语言类别正是上下文无关的语言类别(有限自动机适用于常规语言)。

成分:tape, stack, state control

tape, tape head, stack, stack head, state control

PDA和NFA唯一的区别就是多了stack

INT201 形式语言与自动机笔记(下)_第46张图片

PDA Definition

1.六元组

INT201 形式语言与自动机笔记(下)_第47张图片

7元组

INT201 形式语言与自动机笔记(下)_第48张图片

INT201 形式语言与自动机笔记(下)_第49张图片

e.g1 六元组

INT201 形式语言与自动机笔记(下)_第50张图片

 $是压箱底的,平时不用

 e.g2

INT201 形式语言与自动机笔记(下)_第51张图片

e.g3 7元组

INT201 形式语言与自动机笔记(下)_第52张图片

瞬时描述

INT201 形式语言与自动机笔记(下)_第53张图片

INT201 形式语言与自动机笔记(下)_第54张图片

PDA接受的语言

INT201 形式语言与自动机笔记(下)_第55张图片

INT201 形式语言与自动机笔记(下)_第56张图片

e.g1

INT201 形式语言与自动机笔记(下)_第57张图片

INT201 形式语言与自动机笔记(下)_第58张图片

CFL构造PDA

INT201 形式语言与自动机笔记(下)_第59张图片

INT201 形式语言与自动机笔记(下)_第60张图片

e.g1

INT201 形式语言与自动机笔记(下)_第61张图片

e.g2

INT201 形式语言与自动机笔记(下)_第62张图片

e.g3 

INT201 形式语言与自动机笔记(下)_第63张图片

确定性下推自动机 DPDA

INT201 形式语言与自动机笔记(下)_第64张图片

INT201 形式语言与自动机笔记(下)_第65张图片

例12中,q0是把前半部分压进去,q1是做前后部分的匹配,q2是可接受状态

e.g1

INT201 形式语言与自动机笔记(下)_第66张图片

DPDA能识别RL

INT201 形式语言与自动机笔记(下)_第67张图片

INT201 形式语言与自动机笔记(下)_第68张图片

INT201 形式语言与自动机笔记(下)_第69张图片

Lec 9 Turing Machine and Variants

Properties of Turing Machine

INT201 形式语言与自动机笔记(下)_第70张图片

INT201 形式语言与自动机笔记(下)_第71张图片

TM Configuration 格局

INT201 形式语言与自动机笔记(下)_第72张图片

TM Transitions

TM Computation

Yields产生

INT201 形式语言与自动机笔记(下)_第73张图片

可识别 

INT201 形式语言与自动机笔记(下)_第74张图片

 可判定(可计算)

INT201 形式语言与自动机笔记(下)_第75张图片

e.g1

INT201 形式语言与自动机笔记(下)_第76张图片

INT201 形式语言与自动机笔记(下)_第77张图片

INT201 形式语言与自动机笔记(下)_第78张图片

e.g2

INT201 形式语言与自动机笔记(下)_第79张图片

Language accepted by TM

Decider

Multi-tape TM 多带图灵机

INT201 形式语言与自动机笔记(下)_第80张图片

Multi-tape TM equivalent to 1-tape TM  

单带图灵机和多带实际上是等价的,只是提速和简化了

INT201 形式语言与自动机笔记(下)_第81张图片

INT201 形式语言与自动机笔记(下)_第82张图片

INT201 形式语言与自动机笔记(下)_第83张图片

Nondeterministic TM (NTM)

INT201 形式语言与自动机笔记(下)_第84张图片

 e.g1

INT201 形式语言与自动机笔记(下)_第85张图片

NTM equivalent to TM

因为等价性,以后尽可能用高级工具,多带NTM

INT201 形式语言与自动机笔记(下)_第86张图片

INT201 形式语言与自动机笔记(下)_第87张图片

INT201 形式语言与自动机笔记(下)_第88张图片

 INT201 形式语言与自动机笔记(下)_第89张图片

 在有穷的时间内吧所有的分支都走完

INT201 形式语言与自动机笔记(下)_第90张图片

INT201 形式语言与自动机笔记(下)_第91张图片

Address

Simulating NTM by DTM

Encoding

Encoding of Graph

TM to decide the connectedness of a Graph

Lec 10 Recognizable/Decidable Languages

set

Countable set

Uncountable set 

                             

Cantor’s Diagonalization Method康托的对角化方法

对角线法(zig-zag)                                                                                                                           补充:区间,实数,无理数都是不可数集                           

Church-Turing Thesis

任何在算法上可计算的问题同样可由图灵机计算,或者说,每个有效计算都可以由一台图灵机完成

存在不可图灵识别(non Turing-recognizable)的语言

推论1:图灵机的数量是可数的(因为这些二进制数字和特殊符号是可数的)

命题2:语言的数量是不可数的

由此,我们再次得出一个推论:图灵不可识别的语言是存在的

Decidability 可判定性

INT201 形式语言与自动机笔记(下)_第92张图片

Acceptance problem for computation model

INT201 形式语言与自动机笔记(下)_第93张图片

Acceptance problem for Language LDFA

Acceptance problem for Language LNFA

Acceptance problem for Language LCFG

INT201 形式语言与自动机笔记(下)_第94张图片

INT201 形式语言与自动机笔记(下)_第95张图片

一个空的CFG是可判定的

The Language LTM is Turing-recognizable

INT201 形式语言与自动机笔记(下)_第96张图片

The Language LTM is undecidable

我们不知道通用图灵机是否会停止工作。与我们之前看到的所有机器不同,TM可能永远运行下去。

Instance of non Turing-recognizable languages 关于非图灵识别语言的实例

Universal Turing Machine 通用图灵机

存在一个TM U,它接受一个图灵机描述和输入磁带,并在输入磁带上模拟给定图灵机的一个步骤。(如下图)其中:TM U的输入格式为:,其中M是对指定TM的描述,w是(转换后)的输入。

Examples of decidable languages

对问题的相关语言无法被一个图灵机识别,因为该图灵机无法对该语言所有输入都能做到停机判断(存在输入导致图灵机无法停机)

Existence of undecidable language and non-Turing recognizable language

不可识别问题:问题的相关语言不能被TM识别 其中注意:一个不可判定语言是可以被识别的

Lec 11 Reducibility and Undecidable Languages

Ruducibility 规约性

INT201 形式语言与自动机笔记(下)_第97张图片

INT201 形式语言与自动机笔记(下)_第98张图片

Mapping Reduction

INT201 形式语言与自动机笔记(下)_第99张图片

INT201 形式语言与自动机笔记(下)_第100张图片

INT201 形式语言与自动机笔记(下)_第101张图片

The Halting Problem and other undecidable languages

Halting problem for TMs is undecidable

INT201 形式语言与自动机笔记(下)_第102张图片

Emptiness of TMs is undecidable

INT201 形式语言与自动机笔记(下)_第103张图片

Rice’s Theorem

Non-trivial Properties

INT201 形式语言与自动机笔记(下)_第104张图片

Rice’s Theorem

INT201 形式语言与自动机笔记(下)_第105张图片

Applications

Non-Applications

你可能感兴趣的:(课程笔记,笔记)