现在学习 CSAPP 对我的工作有帮助吗?
在学习之前,我其实也有同样的疑问。大致看了一遍书,还做了一份笔记之后,对这个问题也有了一些自己的感受。
思考这个问题的过程,让我想起了刘润老师的一本书《底层逻辑》。是的,这个问题最好的回答就是“从底层逻辑开始”。接下来我就从 Why / What / How 三个角度来聊聊我的理解和学习收获。
1. Why
大家平时工作中使用的都是 Java,C#,JavaScript 等这类高级编程语言。而且我们在工作中也不需要使用汇编这类的低级语言。
那么我们现在为什么要去学习“程序的机器级别表示”呢?
我在看到码农翻身的一篇文章后对这个问题恍然大悟。文章中提到 Stack Overflow 的创始人 Joel Spolsky 一个理论:抽象泄漏法则。
以编程语言为例,这就是一个不断向上抽象的产物。
从机器语言开始到汇编语言,然后到 c/c++ 高级语言,再到 Java,C#,JavaScript 等高级编程语言,总是在不断地抽象。
Joel Spolsky 说:
All non-trivial abstractions, to some degree, are leaky.(所有非琐碎的抽象,在某种程度上,都是泄露的。)
比如在高级语言中,会将 string 抽象成像 int 一样来使用。我们可以使用加号将两个字符串串联,就像这样: "foo" + "bar"。
当我们这么使用的时候,可能会有资深的程序员告诉大家,串联字符串时最好使用 StringBuilder 类。我们会记住这个用法,但是不一定能理解为什么。
这其实就是抽象的泄露。
在低级别语言中其实并没有字符串这个类型,只有char *,字符串就是一个 char 的数组。
理解到这一层,再回头看看 StringBuilder 类,就会知道底层的原理,就是一个数组。
所以 Joel Spolsky 说:
the abstractions save us time working, but they don’t save us time learning. (抽象可以节省我们的工作时间,但不能节省我们的学习时间。)
*Joel Spolsky 原文:[The Law of Leaky Abstractions]
https://www.joelonsoftware.com/2002/11/11/the-law-of-leaky-abstractions/
前端开发的朋友第一次遇到闭包问题,可能都是从一段 for 循环不能正常执行开始。
for (var i = 0; i < greetings.length; i++) {
...
}
我们会发现将 var 写成 let 就可以正常工作了。
闭包到底是什么原因导致的?
当我们知道了函数栈帧和堆的概念之后,再去找找相应的专业文章,就能够从原理上理解闭包这个概念。
*这里推荐一下我翻译的一篇文章:[JavaScript 闭包在 Heap 中的表示]
https://zhuanlan.zhihu.com/p/468527405
当我们清楚了函数栈帧的概念,知道了每次函数调用都有自己的栈帧,知道了栈帧里面保存了局部变量。
这时候再回过头来理解递归,其实就是基于栈帧这个概念,生成一条栈帧链,实现的从大到小,从整体到局部一个推导过程。
递归是计算机基于自己的运算特性(栈帧),形成了自己独特地处理问题的方式,这种方式有别于人类的正常思维。作为程序员,我们需要理解并按照这种方式编写自己的代码。
*阶乘递归实现的状态机
什么是 “程序的机器级别表示” ?我们可以理解为汇编语言。
在了解汇编语言之前,我们还需要从程序的视角对一些硬件有大致的认识。什么是内存?什么是寄存器?什么是程序计数器?……
产生这些疑问,其实也是因为汇编也是一种抽象,是机器语言的抽象。
我们当然可以跳过这部分知识。但是如果能了解这些知识,的确可以帮助我们学习。
从书中的内容,我整理出下面这几部分内容,可以帮助大家快速理解这些概念。
从程序的角度看,内存是什么?
内存的布局
寄存器
*内存的布局
理解了这些知识点后,如何理解什么是汇编语言呢?
这里我还想推荐一本书——《编码》,顺便也介绍一种选择书籍的好办法,概括起来就三个字:白,浅,透。
对新手来说,一听就明白。对专业人士来说,讲解的方式浅显易懂。对高手来说,道理讲得很透彻。
如何学习汇编语言呢?
要知道我们学习的目的不是为了能够编写汇编代码,而是能够看懂。所以学习起来相对简单。
我将第三章的内容分成了三部分。
首先,第一部分我们需要学习基本的指令形式,就像学习编程语言时我们需要先学基本语法一样。
指令1 - MOV
指令2 - LEA
指令3 - 算术和逻辑
指令4 - PUSH 和 POP
指令5 - CALL 和 RET
*POP 指令的执行
然后,第二部分在学习函数相关的知识,这一部分我们可以学到栈和栈帧的概念。
程序运行时的栈
栈帧的布局
*栈帧的布局
最后,掌握一下条件分支的知识,看看条件分支是如何实现编程语言中 `if` 和 循环语句的,也能够明白递归到底是怎么回事。
条件码寄存器
条件分支
循环
递归
*递归运行时栈的情况
汇编语言作为一门低级语言,相比其他高级语言来说语法非常简洁,如果只要做到能够看懂,并不用花费太长时间。
学习“程序的机器级别表示”,看上去我们一直在研究汇编语言。然而这仅仅是个开始,从这里起步,在接下来的章节中我们可以看到操作系统的其他特性,比如虚拟、并发、持久化等等知识。
最后说一件最近工作中遇到的问题。我在前端使用 ajax 请求数据,接下去的事情需要等待这些数据到达后才能继续。
当时心中出现了好多问题:JavaScript 作为一个单线程语言,是如何实现 ajax 的异步调用的?这些跟线程有关系吗?有没有方法保证异步调用的顺序执行?
回过头来细想,能提出这些问题,都是因为我当时看过了操作系统是如何处理并发的,如何处理线程的。这些问题自然地出现在我的思考过程中。
顺着这个思路,很顺利地找到了 JavaScript 中异步编程的方法 promise,async、await。
*这里推荐一下我翻译的一篇文章:可视化的 JavaScript Promises & Async/Await (https://zhuanlan.zhihu.com/p/467601693)
其实,在很多高级的编程语言中都有异步编程。比如 JavaScript 中的 promise,async、await;C# 中的 async、await、Task 等等。
我个人的体验是这样的,如果只是为了掌握语言的特性,学习异步编程很有可能会学得雨里雾里。但是,当我们知道了操作系统是如何处理并发的,如何处理线程的,这些知识都将会帮助我们更加深刻地理解编程语言中的异步问题。
最后,还是回到文章开头那句话 —— 一切都从底层逻辑开始。
关于作者:丁亭立,微信公众号“dingtingli-pub”作者。如果你对这份笔记感兴趣,可以关注公众号“dingtingli-pub”,我会每周更新。所有笔记的初稿也已经发布在 github 上,大家可以直接访问:https://github.com/dingtingli/csapp-learning
RECOMMEND
推荐阅读
01
《深入理解计算机系统(原书第3版)》
作者:[美] 兰德尔 E.布莱恩特(Randal E. Bryant)
大卫 R. 奥哈拉伦(David R. O'Hallaron)
译者:龚奕利、贺莲
推荐理由
本书是一本将计算机软件和硬件理论结合讲述的经典教程,内容覆盖计算机导论、体系结构和处理器设计等多门课程。卡内基-梅隆大学、北京大学、上海交大等国内外众多知名高校选用指定教材。本书的最大优点是为程序员描述计算机系统的实现细节,通过描述程序是如何映射到系统上,以及程序是如何执行的,使读者更好地理解程序的行为,以及造成效率低下的原因
02
《计算机系统解密:从理解计算机到编写高效代码》
作者:[美]乔纳森·E.斯坦哈特(Jonathan E. Steinhart )
译者:张开元、张淼
推荐阅读
计算机程序硬件软件从底层实现到高层展现原理讲解,对底层知识的多个主题进行了公平的覆盖。
计算机编程不是抽象的,程序是在机器上运行的。了解计算机如何工作以及程序如何在计算机上运行是成为一名更好的程序员的必要条件。在本书中,资深工程师Jonathan E. Steinhart深入探讨了计算机背后的基础概念,比如计算机硬件,软件在硬件上的行为,如何编写高效的程序,计算机安全基础知识,以及在编写代码时需要考虑的现实问题。本书对底层知识的多个主题进行了公平的覆盖——介绍有助于提高整个系统质量的许多领域的知识(包括计算机硬件、组合逻辑、时序逻辑、计算机体系结构、计算机组成原理、操作系统、系统程序设计等)。
Java核心技术大会2022|李三红老师的专场分享回放现已上传至B站【Java核心技术站】。
https://www.bilibili.com/video/BV1Xr4y1M7nk
(长按复制至浏览器打开)
嘉宾分享PPT请点击下方链接获取
更多精彩回顾
书单 |今天,Java27岁了!
新书 | 红蓝攻防:构建实战化网络安全防御体系
书讯 |7月书讯 | 12本新书如期而至!
新书 | 分布式算法精髓
点击阅读全文看大会回放