您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 工业自动化 > 编译原理复习提纲整理
说明1.这份资料的最初来源是王金伟老师给大家发的复习提纲,我在下面会给大家附一份原版,后面的21面资料是在那个的基础上整理和细化得到的。最初做这份资料的目的是我本人作为班长为了帮助我们班的同学顺利通过考试而整理的。听王老师说有想法留给学弟学妹们用,我放假后又对一些内容进行了修正和改进,得到了大家看到的这个版本2.这份资料加入了很多我个人的理解。与原提纲相比,我增删了一些内容,并对某些内容进行了调序与合并。3.这份资料融入了老师平时上课的PPT以及最后复习课给的PPT,更重要的是我个人的理解和猜测。大家或许都有感受,觉得编译原理书上或者PPT上说的句子根本看不懂。针对这个问题,我把很多晦涩难懂的形式化的算法通过我的理解后用比较形象易懂的话表述了出来,表述得可能并不科学严谨,但我的目的是为了能帮助大家做题和考试4.里面的每一个考点我都在最后用括号加了注释,方便不同起点不同准备时间的同学进行选择,这里简单说明“了解”:代表这一部分的内容被老师列在提纲内,但其实并不太影响大家对大题的计算;并且据我的分析也并不太可能出小题所以时间很紧的同学可以略看就好,当然看看还是有好处的。“小题”一类的字样代表这一块的知识点值得出填空选择,大家有时间应该理解性的记忆下来(在2012年的期末考试上,选择为1分*10题;填空为1分*10题,判断改错为2分*5题,小题总计30分)“简答”:老师在最后复习课上说过编译原理是有简答题的,简答不同于计算,很可能是让你默写一些步骤。所以这一块内容大家需要背诵,即使不理解也要背下来(在2012年的期末考试上,简答题的分值为5分*4题=20分“铺垫”“大题步骤”等代表这一块的内容对于综合大题的做题是必须了解的,或者其实就是做大题的分解步骤,这些块的内容是所有人必须看懂并且记下来的“实际大题”:总共列出的有4道,应该每年考察的都会是这4中题型,每一道的分值都在12~15分左右,是所有人想通过考试所必须攻克的。这里通常我会标出他需要用到之前的哪些哪些知识点(2012年期末考试4道题的总分值为50分)5.如果大家想去打印,最好在装有office2007及以上的机器上打印,否则有些符号可能会显示不出来。建议大家去生活广场找机器打,不要去景元鸿6.由于时间仓促,这份资料做的并不完善和严谨,难免有错漏之处,希望大家谅解。大家可以一边看我的这份资料,一边看老师最后给的两套PPT,课本来不及就别看了。真心希望这份资料能对大家有用,祝大家都考得好。PS最后说一句,我们去年编译原理考得好的人挺多的,其实也不是很难,没有人挂!本人惭愧,只有89,考得比我好的多太多了。总结原因是把时间花在了研究大题上面,小题的很多知识点都没有背熟,随便错了几个小题就基本和90无缘了。10计1王成正2012/7/9(老师给的提纲原版)一、概述1.编译方式与解释方式区别:是否生成目标代码2.编译程序总框架二、词法分析1.状态转换图的功能:识别(接受)一定的符号串(单词)2.状态转换图的程序实现的思路:为每个状态结点都编写一个子程序3.字母表的概念:一般用∑表示4.闭包的概念:闭包V*中的每个字都是由V中的字经过若干次连接而成的5.正则闭包V+的概念:是V上所有符号串的集合6.∑*定义:表示∑上所有字的全体,空字ε也包括在其中7.∑+空字ε不包含,非ε8.ε,{},{ε}之间的区别9.ε所对应的正规集为{ε}10.正规式与正规集的定义:知道如何用正规式表示一个正规集11.简述NFA和DFA的定义与区别12.若M的某些结点既是初态结点又是终态结点,或者存在一条从某初态结点到某个终态结点的ε通路,那么空字ε可为M所识别13.正规式与优先自动机的等价性14.定理2.对于∑上的每一个正规式V,存在一个∑上的DFAM,使得L(M)=L(V)15.DFAM的化简的概念和方法:终态和非终态是可区别的,因为终态可以读出空字ε,而非终态不能读出空字ε16.课后作业一个例题17.构造一个DFA,它接受∑={x,y}上所有倒数第二个字符为y的字符串三、语法分析(1)基本定义1.上下文无关文法的定义2.句型、句子的概念3.文法和语言的对应关系,给出文法构造语言,文法G产生的句子的全体是该文法的语言4.语法分析树与二义性:判断文法的二义性方法:如果一个文法含有二义性的句子(对应两棵不同的语法树),则称该文法是二义性文法5.3型文法是正规文法、正则文法、线性文法6.2型文法也称为称为上下文无关文法7.若一个文法是递归的,则由它产生的语言的句子个数是无限的(2)自上而下8.文法左递归的定义9.消除文法的左递归的方法:直接左递归10.消除回溯的方法:提取公共左因子11.递归下降分析法的概念,应满足什么条件?12.递归下降法对文法的每个非终结符构造一个相应的子程序13.预测分析法:给文法构造预测分析表:消除左递归、消除回溯、First集、Follow集。举例子时,便成S→a|aS|(T)(3)自下而上14.短语、直接短语的概念15.句柄的概念(一个句型的最左直接短语)16.规范归约(最左)、规范推导(最右)、规范句型17.规范归约的关键问题是寻找句柄18.在规范归约中,可归约串必出现在栈顶19.算符文法、算符优先文法的概念,如何判断20.构造算符优先关系表、Fisrtvt、lastvt集合,可不考虑#号21.素短语:算符优先归约的关键问题是寻找最左素短语22.算符优先法尤其适用于表达式的分析23.给出文法G(P)X→jYjY→kZ|iZ→Yid24.该文法是否为算符优先文法?请根据FIRSTVT、LASTVT集合构造算符优先关系表说明之(12分)25.优先函数的优点:便于比较,节省空间26.优先函数的构造方法27.欲构造行之有效的自上而下分析器,则必须消除文法中含有的左递归28.LR分析法属于自底向上分析方法29.从文法出发构造LR(0)分析表的步骤四、语义分析1.综合属性和继承属性概念五、中间代码生成1.中间代码是一种面向语法,易于翻译成目标代码的代码2.后缀式(逆波兰式)的概念3.逆波兰式中各运算法出现的顺序与实际运算顺序一致4.后缀式与抽象语法树(表达式树)的关系5.DAG的含义6.四元式表示方法,联系时通过临时变量,可以翻译各种语句7.将赋值语句表示成后缀式和四元式六、代码优化1.简述代码优化的原则与优化的级别,并列举三种常用的优化技术2.基本块、流图的概念,如何画、节点对应基本块3.局部优化的方法,DAG是对基本块进行优化的有效工具4.P285中间注意5.不变运算的代码外提的条件6.循环优化中的强度削弱的含义七、目标代码生成1.编译程序生成的目标程序种类一:概述1.编译方式与解释方式区别(小题)在于是否生成目标代码,编译方式生成了目标代码。2.编译程序总框架(简答题,背!)二:词法分析1.状态转换图的功能:(较重要铺垫)识别(接受)一定的符号串(单词)上图是一个很简单的状态转换图。上图代表:状态0通过X弧可以转换到状态1,通过Y弧可以转换到状态22.字母表的概念:(较重要铺垫)一个由有限元素组成的集合,每个元素称为一个符号或一个字,一般用∑表示一个字母表例:∑={a,b,c}元素:a,b,c字母表中的字可拼接在一起构成一个序列,如aa,ab,bc,bbc等,符号的顺序不同所代表的序列也不同。不包含任何字符的序列称为空字,用ε来表示另外有几个概念必须先了解:字(符号串)的连接设x和y是两个字(符号串),则定义xy为他们的连接例:ab和ba连接是abba注:(1)ε(空字)是连结运算的恒等元素εx=xε=x(2)字(符号串)的n次连接xn=xxx…x规定x0=εx1=x,x2=xx,x3=xxx集合的(连接)积设U和V是两个“字(符号串)的集合”,则定义UV为他们的(连接)积UV={xy|x∈U且y∈V}例:设U={a,ab},V={b,ba},则UV={ab,aba,abb,abba}集合V的n次(连接)积记为:Vn=VVV…Vn个规定V0={ε}例:设V={a,b},那么V0={ε}V1={a,b}V2=VV={aa,ab,ba,bb}V3=VVV=V2V={aaa,aba,baa,bba,aab,abb,bab,bbb}3.闭包的概念:(较重要铺垫)设V是一个字(符号串)的集合,则V的闭包定义为V*,V*=V0∪V1∪V2∪…注:闭包V*中的每个字都是由V中的字经过有限次连接而成的正则闭包V+的定义为V+=VV*闭包与正则闭包的差别在于,闭包里是含有ε的,因为闭包里有集合V0,而正则闭包由于在闭包的基础上又连接了一个V,所以正则闭包里是没有空字ε的。∑*定义:表示∑上所有字的全体,空字ε也包括在其中∑+表示∑上所有字的全体,但不包括ε4.ε,{},{ε}之间的区别(小题)ε空字:表不包含任示何字符的序列称{}:表示一个空集{ε}:表示含有空字ε的集合5.正规式与正规集的定义:(较重要铺垫)我们可以把具有相同特征的字放在一起组成一个集合,即所谓的正规集然后使用一种形式化的方法来表示正规集,即所谓的正规式正规式是描述单词结构的一种形式;正规集是该类单词的全集。举例对于下面的例子,大家应该好好思考一下后面4个的含义,对做大题是很有帮助的。做大题时,题目通常会给你一个实际问题,你需要先把他要实现的功能抽象成一个正规集,再用正规式表达出来,才能继续做后面的步骤。ε所对应的正规集为{ε}6.简述有限自动机NFA和DFA的定义与区别(重要铺垫)NFA代表非确定的有限自动机;DFA代表确定的有限自动机所谓的有限自动机,大家一定觉得这个概念坑爹死了。其实他并不代表任何实体的机器,只是一种数学模型而已。就像函数、数列是一种数学模型一样。函数通过函数表达式实现他的功能:你给他一个自变量,他能根据表达式求出因变量的值。而有限自动机是通过状态转换图来实现功能,你给他一个初始状态和一个输入符号,他能根据你输入的这个符号将原状态转换到另一个状态,用他来模拟计算机的识别功能。下面简单介绍一下DFA(确定的有限自动机)的五元式表示法:(重要)定义:一个确定有限自动机(DFA)M是一个五元式:M=(S,∑,f,s0,F),其中1)S是一个有限的状态集合,它的每个元素我们称为一个状态2)∑是一个有穷的输入符号的字母表,它的每个元素我们称为一个输入字符3)f是从S×∑→S的单值部分映射4)s0是S的一个元素,为初始状态,它是唯一的5)状态集合F是终止状态的集合,它是S的子集(可空)一个非确定有限自动机(NFA)M是一个五元式M=(S,∑,f,S0,F),其中⑴S是一个有限的状态集合,它的每个元素我们称为一个状态⑵∑是一个有限的输入符号的字母表,它的每个元素我们称为一个输入字符⑶f是从S×∑*→2S的部分映射,其中,2S表示S的幂集合(所有S的子集组成的集合)(f是非单值的M是非确定)⑷状态集合S0是初始状态集合,它是S的子集⑸状态集合F是终止状态的集合,它是S的子集注:DFA和NFA的区别在于(3)和(4),其他几点都差不多,这是有可能出简答题的,大家要记住他们的区别和联系7.DFA的识别功能(小题)对于∑*中任何字α,如果存在一条从初态结点到某个终态结点的道路,这条路上所有的标识符连成的字等于α,则α可被DFAM所识别(接受,读出)若M的某些结点既是初态结点又是终态结点,或者存在一条从某初态结点到某个终态结点的ε通路,那么空字ε可为M所识别8.状态转换图的分裂规则(大题步骤)例子:(这里Y有两个圈圈代表他是最终状态的点)划到最后要求每条弧上都只有一个字母或者数字9.ε_CLOSURE(I)和Ia=ε_CLOSURE(J)的构造方法(大题步骤)这里先需要了解几个定义我们假设有某个状态集I,这个集合中含有不同的状态。定义1状态集I的a弧转换:move(I,a)是一个状态集,是从I中的状态出发经过一条a弧到达的状态的全体。定义2状态集I的ε(空字)闭包:ε_CLOSURE(I)是一个状态集,由两部分组成:状态集I中的所有原状态。从I中的状态出发经过任意条ε弧,所能到达的状态的全体。定义3Ia=ε_CLO
本文标题:编译原理复习提纲整理
链接地址:https://www.777doc.com/doc-5324972 .html