[其他] 程序员有必要学习程序编译原理吗，不服来辩！ [复制链接]

论坛徽章:: 0

51楼 [报告]

发表于 2015-07-15 21:24 |只看该作者

汇编的功能都是弱化了的，编程方面，Windows 32汇编越来越吃力，一个是编译器，我有幸目睹罗云彬前辈的《Windows 32位汇编语言程序设计》，其中虽然说Windows 32汇编任有潜力，我想看过的读者，应该是会有更加时刻的认识，汇编前景不容乐观。但是就《JSP 基础开发与案例开发详解》中说到的那样，不了解底层，就只是码代码，而了解底层的执行，才谈得上开发，编程。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ctrigger

白手起家

论坛徽章:: 0

52楼 [报告]

发表于 2015-07-16 09:56 |只看该作者

对于99.9999%的码农来说，学编译原理吊用没有～
对于 0.0001%的程序员有用，因为他们是宗师级人物～～～

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

icawu

白手起家

论坛徽章:: 0

53楼 [报告]

发表于 2015-07-16 13:01 |只看该作者

CPU体系结构，汇编，C语言和操作系统，永远都是编程大师们的护身法宝，就如同少林寺的《易筋经》，是最上乘的武功；学会了《易筋经》，你将无所不能，任你创造武功；学会了编“易筋经”，大师们可以任意开发操作系统，编译器，甚至是开发一种新的程序设计语言 ——引用来自佚名

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

nail78

白手起家

论坛徽章:: 4

54楼 [报告]

发表于 2015-07-16 14:09 |只看该作者

1、程序员应该学习编译原理吗？有什么作用，说出你的观点。
   应该学,特别是和底层比较近语言.至少知道怎么编译,即使没有IDE或tools,自己也能写编译文件,不至于没工具了,自己都编译不了了.
2、你是否研究过自己所使用的编译器？
   主用的gcc/g++,xlc,xlc_r,这几个都了解.
3、是否清楚程序编译的整个过程？
   扫描程序,语法分析,语义分析,优化程序,代码生成,目标代码.
   扫描程序（scanner）：在这个阶段编译器实际阅读源程序（通常以分析程序字符流的形式表示）。扫描程序执行词法分析注释树符号表（Lexical analysis ）：它将字符序列收集到称作记号错误处（token ）的有意义单元中，记号同自然语言，如英源代码理器语中的字词相似。因此可以认为扫描程序执行与优化程序拼写相似的任务。中间代码例如在下面的代码行（它可以是C程序的一部分）中：代码生成器 a [index] = 4 + 2 这个代码包括了1 2个非空字符，但只有 8个目标代码记号：a 标识符目标代码优化程序 [ 左括号 i n d e x 标识符 ] 右括号 = 赋值目标代码 4 数字编译器的阶段 + 加号 2 数字每一个记号均由一个或多个字符组成，在进一步处理之前它已被收集在一个单元中。扫描程序还可完成与识别记号一起执行的其他操作。例如，它可将标识符输入到符号表中，将文字（litral）输入到文字表中（文字包括诸如3 . 1415926535的数字常量，以及诸如“Hello,world ! ”的引用字符串）。
语法分析

语法分析（parser ）：语法分析程序从扫描程序中获取记号形式的源代码，并完成定义程序结构的语法分析（syntax analysis ），这与自然语言中句子的语法分析类似。语法分析定义了程序的结构元素及其关系。通常将语法分析的结果表示为分析树（parse tree）或语法树（syntax tree）。例如，还是那行C代码，它表示一个称为表达式的结构元素，该表达式是一个由左边为下标表达式、右边为整型表达式的赋值表达式组成。这个结构可按下面的形式表示为一个分析树：请注意，分析树的内部节点均由其表示的结构名标示出，而分析树的叶子则表示输入中的记号序列（结构名以不同字体表示以示与记号的区别）。分析树对于显示程序的语法或程序元素很有帮助，但是对于表示该结构却显得力不从心了。分析程序更趋向于生成语法树，语法树是分析树中所含信息的浓缩（有时因为语法树表示从分析树中的进一步抽取，所以也被称为抽象的语法树（abstract syntax tree ））。下面是一个C赋值语句的抽象语法树的例子：请注意，在语法树中，许多节点（包括记号节点在内）已经消失。例如，如果知道表达式是一个下标运算，则不再需要用括号“[”和“]”来表示该操作是在原始输入中。
语义分析

语义分析（semantic analyzer ）：程序的语义就是它的“意思”，它与语法或结构不同。程序的语义确定程序的运行，但是大多数的程序设计语言都具有在执行之前被确定而不易由语法表示和由分析程序分析的特征。这些特征被称作静态语义（static semantic），而语义分析程序的任务就是分析这样的语义（程序的“动态”语义具有只有在程序执行时才能确定的特性，由于编译器不能执行程序，所以它不能由编译器来确定）。一般的程序设计语言的典型静态语义包括声明和类型检查。由语义分析程序计算的额外信息（诸如数据类型）被称为属性（attribute），它们通常是作为注释或“装饰”增加到树中（还可将属性添加到符号表中）。在正运行的C表达式 a [index] = 4 + 2 中，该行分析之前收集的典型类型信息可能是：a是一个整型值的数组，它带有来自整型子范围的下标；index则是一个整型变量。接着，语义分析程序将用所有的子表达式类型来标注语法树，并检查赋值是否使这些类型有意义了，如若没有，则声明一个类型匹配错误。在上例中，所有的类型均有意义，有关语法树的语义分析结果可用以下注释了的树来表示。
优化程序

优化程序（source code optimizer）：编译器通常包括许多代码改进或优化步骤。绝大多数最早的优化步骤是在语义分析之后完成的，而此时代码改进可能只依赖于源代码。这种可能性是通过将这一操作提供为编译过程中的单独阶段指出的。每个编译器不论在已完成的优化种类方面还是在优化阶段的定位中都有很大的差异。在上例中，我们包括了一个源代码层次的优化机会，也就是：表达式4 + 2可由编译器计算先得到结果6 （这种优化称为常量合并（constant folding ））。当然，还会有更复杂的情况。还是在上例中，通过将根节点右面的子树合并为它的常量值，这个优化就可以直接在（注释）语法树上完成：尽管许多优化可以直接在树上完成，但是在很多情况下，优化接近于汇编代码线性化形式的树更为简便。这样节点的变形有许多，但是三元式代码（three-address code ）（之所以这样称呼是因为它在存储器中包含了3个（或3个以上）位置的地址）却是标准选择。另一个常见的选择是P -代码（P - code ），它常用于Pascal编译器中。在前面的例子中，原先的C表达式的三元式代码应是：t = 4 + 2 a [ index] = t （请注意，这里利用了一个额外的临时变量t 存放加法的中间值）。这样，优化程序就将这个代码改进为两步。首先计算加法的结果：t = 6 a [index] = t 接着，将t替换为该值以得到三元语句 a [index] = 6 ，指出源代码优化程序可能通过将其输出称为中间代码（intermediate code ）来使用三元式代码。中间代码一直是指一种位于源代码和目标代码（例如三元式代码或类似的线性表示）之间的代码表示形式。但是，我们可以更概括地认为它是编译器使用的源代码的任何一个内部表示。此时，也可将语法树称作中间代码，源代码优化程序则确实能继续在其输出中使用这个表示。有时，这个中间代码也称作中间表示（intermediate representation,IR）。
代码生成

代码生成（code generator）：代码生成器得到中间代码（IR），并生成目标机器的代码。正是在编译的这个阶段中，目标机器的特性成为了主要因素。当它存在于目标机器时，使用指令不仅是必须的而且数据的形式表示也起着重要的作用。例如，整型数据类型的变量和浮点数据类型的变量在存储器中所占的字节数或字数也很重要。在上面的示例中，现在必须决定怎样存储整型数来为数组索引生成代码。例如，下面是所给表达式的一个可能的样本代码序列（在假设的汇编语言中）：
M O V R0,index ;;
value of index -> R0 M U L R0,2 ;;
double value in R0 M O V R1,&a ;;
address of a -> R1 A D D R1,R0 ;;
add R0 to R1 M O V *R1,6 ;;
constant 6 -> address in R1
在以上代码中，为编址模式使用了一个类似C的协定，因此& a是a的地址（也就是数组的基地址），* R1则意味着间接寄存器地址（因此最后一条指令将值6存放在R1包含的地址中）。这个代码还假设机器执行字节编址，并且整型数占据存储器的两个字节（所以在第2条指令中用2作为乘数）。
目标代码

目标代码（target code optimizer ）：在这个阶段中，编译器尝试着改进由代码生成器生成的目标代码。这种改进包括选择编址模式以提高性能、将速度慢的指令更换成速度快的，以及删除多余的操作。在上面给出的样本目标代码中，还可以做许多更改：在第2条指令中，利用移位指令替代乘法（通常地，乘法很费时间），还可以使用更有效的编址模式（例如用索引地址来执行数组存储）。使用了这两种优化后，目标代码就变成：
MOV R0,index ;;
value of index -> R0 SHL R0 ;;
double value in R0 MOV &a[R0],6 ;;
constant 6 -> address a + R0

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

liyanfasd

白手起家

论坛徽章:: 0

55楼 [报告]

发表于 2015-07-16 16:06 |只看该作者

知其然，知其所以然。深知编译原理，写的出高效紧凑代码，快速定位错误位置并知其原因。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zjw0722

白手起家

论坛徽章:: 1

56楼 [报告]

发表于 2015-07-16 23:30 |只看该作者

为了将一个程序从一种语言翻译成另一种语言，编译器必须首先把程序的各种成分拆开，并搞清其结构和含义，然后再用另一种方式把这些成分组合起来。编译器的前端执行分析，后端进行合成。
其实，把汇编语言翻译成机器码的汇编器，所做的不过是把每一个汇编符号翻译成固定的二进制编码表示而已。
这就是编译原理所讲的全部内容了。