编程语言Lab

数值程序分析

原文来自微信公众号“编程语言Lab”：数值程序分析
搜索关注“编程语言Lab”公众号（HW-PLLab）获取编程语言更多技术内容！
欢迎加入编程语言社区 SIG-程序分析，了解更多程序分析相关的技术内容。
加入方式：添加文末小助手微信，备注“加入 SIG-程序分析”。

作者 | 陈立前
整理 | 纪妙

作者简介

陈立前，国防科技大学计算机学院副教授，主要从事程序分析与验证、抽象解释相关研究。在 ACM/IEEE Transactions、POPL、FSE 等期刊会议上发表论文多篇，获 ACM SIGSOFT 杰出论文奖（FSE 2020），出版教材译著 3 部。研究成果获省部级科技进步一等奖 1 项、二等奖 1 项。部分成果已在航天、国防等领域重大工程中应用。

视频回顾

SIG-程序分析技术沙龙回顾｜数值程序分析

# 研究背景 #

很多软件的代码里面都包含了大量的数值运算，如科学计算、金融、机器学习、物理模拟、统计分析等领域的软件。在嵌入式控制软件中，往往也会包含大量数值运算，而嵌入式控制软件在很多安全攸关的领域被大量使用，比如说在航天航空领域 GNC、姿轨控等相关的一些功能实现中都会用到数值运算。

这些软件数值运算中，用到的数值不像我们传统理解数学意义下的数，如实数和整数，而都是浮点数和机器整数。此外，在嵌入式软件设计中，往往会在事先设计时，把存储区域做一些划分，用来存一些数据，编写程序来操作这些存储区域时，会使用一些指针指向这些区域，然后使用指针算术访问数据。因此，这些软件中除了传统的数值运算，还涉及到一些指针算术的运算，当然我们可以把指针算术也看作是整数运算。

# 数值运算举例 - 求平均数

举一个简单的求两个数平均数的例子，可能大家第一印象会按照数学的模式去写，先做加法，然后再除以二，这样很容易就求得了两个数的平均数。这种在数学上大家肯定觉得没什么问题，但是如果在机器里面写成程序实现，这时候先做加法的话，x+y 很容易会出现浮点的上溢。而对于这种情况，如果把求平均数表达式稍微变一变，把参数先除以二，然后再做加法，你就会发现基本上就不会导致浮点上溢。

# 数值相关常见错误

正是因为这种数学上的运算，跟我们在机器里面的浮点数和整数的运算存在差异，有很多实数上的性质，对于浮点运算并不成立。那么，大家写程序的时候，可能很容易会导致一些数值相关的错误。有很多很常见的程序错误与此相关，比如说除零错、数组越界，浮点上溢、整数上溢等，还比如指针算术导致的非法指针访问。另外，程序中有大量的数值运算的话，还可能会导致一些计算精度的缺陷。

除零错、数组越界、浮点上溢、整数上溢等
指针算术导致的非法指针访问等
函数输入不在定义域内
计算精度缺陷

历史上出现的一些重大事件，比如像爱国者导弹防御系统拦截失败，阿丽亚娜 5 号火箭爆炸，openSSL 心脏滴血等，本质上都是跟数值相关的。有些是因为数值的溢出，有些是因为一些误差的累计，有些是因为缺少边界的检查，等等。

# 数值程序分析的思路

那么，我们应该如何检测这种错误呢？即通过 数值程序分析 来检测。

当程序写好了之后，我们可以通过程序分析的方法来检测这些错误。检测数值相关的错误的时候，最基础的一步是首先要生成不变式，有了不变式之后，我们再来分析这个程序里面的一些性质，检查一些性质是不是成立的，检测数值相关的缺陷，缺陷检测出来之后，我们还可以考虑缺陷修复。我们可以沿着这条途径来检测和修复数值相关的缺陷。

# 不变式生成

不变式生成 是数值程序分析中最基础的关键技术之一。不变式生成实际上是一个非常经典的课题，关注如何在每一个程序点处自动生成变量之间的不变式。我们关注的是 数值不变式，如下图红色标注的注释，就是不变式。有了不变式后，我们就可以去分析这个程序会不会出现一些数值相关的缺陷。

打个比方，对于上图这个非常简单的就一个变量和一个循环的程序。假设我们现在关注程序点 3 处的加法操作，若 x 是整型变量，加 1 会不会出现整数上溢呢？

这个问题实际上是跟 x 的类型有关，如果 x 是 char 类型，也就是 8 位类型的话，我们知道前面的不变式是 [0,255]，如果再加上 1，可能就会出现整数的上溢；当然如果 x 是 16 位的或者是 32 位的整型，那么这个加法操作就不会出现整数上溢问题。

因此，我们需要先拿到不变式，之后就可以检查程序语句是否满足数值的一些性质，或者说是否存在数值相关的一些缺陷。这是数值程序分析里面一个非常关键的技术。

业界有很多的方法来生成不变式，简单分为以下几类，比如最传统的 基于抽象解释 的，也可以用 基于约束求解 的方法来生成，最近几年也有用 机器学习 的方法来生成不变式，当然还有一些用动态的方法来生成一些 likely 不变式。

基于抽象解释
基于约束求解
基于学习
基于动态方法

今天这个报告，我主要介绍 基于抽象解释的不变式的生成，以及它在数值程序分析中的应用。

# 抽象解释 #

接下来，我先介绍一下抽象解释相关的理论。

# 抽象 & 近似

抽象解释是 1977 年提出来的 ¹，它最开始是用来对程序的语义进行 抽象（或近似） 的一种统一的框架。

这里的定义涉及到两个关键词，一个叫抽象，一个叫近似。我们应该怎么理解这两个词呢？接下来我会通过直观的例子来解释，希望能帮助大家理解。

首先，是对于 “近似” 的理解。比如说当我们用一个刻度尺去量一个物体的长度的时候，其实我们不能量出这个物体的精确的长度，但是我们人眼可以看到它大概是 3.4cm 左右，那么这个值实际上是一种近似。

接着，我们来看对 “抽象” (Abstraction) 的理解。比如说我们现在碰到这样一个问题，两个大数加起来之后再乘以一个大数的话，那么这个结果到底是正的还是负的呢？我们会首先想到先计算加法的结果，实际上这是一个比较大的值，然后再做乘法。如果用笔纸去算的话，那么需要费些时间才能把最终的值给算出来，并最后发现它是个正数。整个过程的计算代价还是比较大的。其实我们可以发现：如果两个数都是正数，那么两个正数相加的话，依然是个正数，然后再乘以另外一个正数，那么它的结果肯定也是个正数。这是一些简单的运算规则，但是根据这些规则计算的话，计算代价是非常低的。将每个数抽象为正负表示，这其实就是一种抽象的思想。通过抽象，我们把一些跟关注的问题本身无关的东西忽略掉。比如我们只关心这个结果是正的还是负的，而对它本身具体是什么值，我们并不关心，所以这个时候我们就可以把这个具体的值忽略掉，而只关心它的正负性，从而可以快速判定结果的正负。这就是抽象思想的体现。

抽象解释，为静态分析的设计提供了一个通用的框架，还可以用来自动生成程序的不变式。简单来讲，具体世界的状态比较多，它的取值的可能性也比较多，而中间的一些计算也比较繁琐或者代价比较大。那么我们就希望能通过一种抽象的方法，把它转到到一个抽象的空间里面来，使得在这个抽象的空间里面它的状态比较少，计算的代价也比较小，这样的话我们就能快速分析得到这个程序的一些性质。

# 伽罗瓦（Galois）连接

抽象解释里面最核心的一个概念叫做 伽罗瓦（Galois）连接：

$\leq) \xrightleftharpoons[\alpha]{\gamma} (A, \sqsubseteq)$

定义如下：

对于给定的两个偏序集 $\leq)$ 和 $\sqsubseteq)$ （ $C$ 是 Concrete， $A$ 是 Abstract），如果存在函数对 $\alpha:C \rightarrow A$ 和 $\gamma:A \rightarrow C$ 满足如下性质的话，那么我们认为这个函数对 $(\alpha, \gamma)$ 是具体域 $C$ 和抽象域 $A$ 之间的 伽罗瓦连接。

$\forall a \in A, c \in C : \alpha(c) \sqsubseteq a \Leftrightarrow c \leq \gamma(a)$

该性质可以如此理解，假设把具体世界里的一个元素 $c$ 抽象化之后得到 $\alpha(c)$ 。 $\alpha(c)$ 比抽象域里另一元素 $a$ 要小，当且仅当将抽象元素 $a$ 映射回具体世界里面得到 $\gamma(a)$ 时， $c$ 应比 $\gamma(a)$ 要小。这里所说的 “小”，对应的是一个序关系。

满足了这个性质后， $\alpha$ 和 $\gamma$ 就构成一个伽罗瓦连接。我们把 $\alpha$ 叫作从具体世界到抽象世界的抽象化函数，把 $\gamma$ 叫作从抽象世界到具体世界的具体化函数。我们把左边这个叫做具体域，右边叫做抽象域。

区间抽象域的 Galois 连接

举个栗子

接下来，我们通过一个简单且经典的抽象域 —— 区间抽象域，来给大家介绍抽象域的相关概念。

假设我们的具体域是一个整数集合 $Z$ 上的幂集 $\mathcal{P}(\mathbb{Z})$ ，那么它对应的序关系就是集合包含关系。

$(\mathcal{P}(\mathbb{Z}), \subseteq) \xrightleftharpoons[\alpha]{\gamma} (I, \sqsubseteq)$

我们会把这个幂集映射到区间抽象域上面的一个区间集合，这个抽象域的序关系是区间上的包含关系。即，如果区间较小的话，那么它的下界要大一点，上界要小一点。同时，我们对区间做了一些扩展，比如它的下界可以取到负无穷大，上界可以取到正无穷大。

$\stackrel{\text { def }}{=}(\mathbb{Z} \cup\{-\infty\}) \times(\mathbb{Z} \cup\{+\infty\})$

接下来我们来看 $\alpha$ 和 $\gamma$ 怎么定义。对于具体域上的一个元素，这个元素肯定是这个幂集里面的一个元素，即整数集合 $\mathcal{Z}$ 的一个子集，我们把这个整数子集记作 $X$ ，那么 $\alpha(X)$ 会把它映射成一个区间，取这个集合 $X$ 里面最小的整数值作为区间的下界，最大的整数值作为区间的上界，这就是抽象化函数 $\alpha$ 的定义。

$\alpha(X) \stackrel{\text { def }}{=}[\min X, \max X]$

同样的反过来，如果给定一个抽象元素，比如说一个区间 $[a, b]$ ，我们怎么把它映射回具体域的元素（即一个集合）呢？这个整数集合会包含所有大于等于 $a$ 且小于等于 $b$ 的整数。

$\gamma([a, b]) \stackrel{\text { def }}{=}\{x \in \mathbb{Z} \mid a \leq x \leq b\}$

给一个整数的集合 ${0,1,2,5\}$ ，我们将其映射到区间抽象域，把它抽象化之后，按照定义，我们会得到区间 $[0, 5]$ 。 $[0, 5]$ 这个区间实际上是整数集合 ${0,1,2,5\}$ 一个可靠的 上近似，并且是一个最佳的抽象，也就是说你找不到另外一个比 $[0, 5]$ 要小的，同时还包含 ${0,1,2,5\}$ 这个集合的区间。

$\qquad \text{[0,5]是{0,1,2,5}的可靠且最佳抽象}$

反过来，如果把抽象元素 $[0, 5]$ 映射到具体世界里面，我们需要定义一个 $\gamma$ 函数。我们知道具体世界里对应的是一个整数集合，把 $[0, 5]$ 映射回来的话，只要在 $[a, b]$ 中的整数都需要在这个集合中，那么结果就是 ${0,1,2,3,4,5\}$ 。我们再与原来最开始的具体元素 ${0,1,2,5\}$ 进行比较，你会发现先做抽象，然后再映射回具体世界里，包含的元素会更多，比如说 ${3,4\}$ 包含进去了。

$\gamma([0, 5]) = \{0,1,2,3,4,5\} \qquad \text{把{0,1,2,5}抽象成[0,5]存在精度损失}$

对应到这个程序分析场景，可以理解成这是一种精度的损失。为什么会存在这种情况呢？因为在具体世界里面，我们知道 ${3,4\}$ 不在程序状态 ${0,1,2,5\}$ 里，但是做了抽象之后虽然能确定 ${6\}$ 不在程序状态中，但是不能排除 ${3,4\}$ 在程序状态中。

这个对应到程序分析里面对应的就是精度的损失。

# 抽象域设计

整个抽象解释框架，实际上自 1977 年提出来以后发展至今已经比较成熟了，在碰到特定应用场景时，我们需要在这个框架下设计一些新的抽象域。设计新的抽象域时主要考虑两个方面:

域元素：对 程序状态 进行抽象
表示方法: 约束形式等，e.g.，区间: $a <= x <= b$
域操作：对程序 语义动作 进行抽象
- 交 (assume 语句)
- 控制流接合 (if-then-else-endif)
- 投影（非确定赋值，过程间分析）
- 迁移函数
  - 赋值迁移语句 (赋值语句)
  - 测试迁移语句 (if 语句)
- 加宽（循环）

一是我们要考虑应如何表示域里的元素。我们需要用域元素来对程序的状态进行描述。最经典的就是用一类约束来表示，比如刚才介绍的区间，我们用的就是变量的上下界的这种形式来对这个程序的状态进行描述。当然也有复杂点的描述方式，比如多面体抽象域用的是线性不等式约束。

另一方面，除了域元素的表示，我们还需要考虑如何处理程序中的语义动作，比如说赋值语句、if 语句等等。对于这些语句，我们需要在抽象域里面有对应的一个操作来对它进行处理。比如说，设计抽象域的时候，我们需要设计 meet 操作、join 操作。join 指集合或者控制流汇合。简单来讲，就是在 if-then-else-endif 这个地方，我们两个分支汇合处（即 endif 处）需要一个 join 操作来把程序状态合并起来。程序里面有赋值语句，所以我们对赋值语句需要设计一个抽象迁移函数。对于条件测试语句的话也是类似的。而对于程序里的循环，我们需要设计加宽的操作来保证程序分析过程中不动点迭代计算可终止。

# 数值抽象域

数值抽象域是一类非常重要的抽象域，它的主要用途是来刻画程序变量之间的数值关系，即 数值不变式。有了这个数值不变式，我们就可以来检查数值相关的一些性质或者缺陷。目前已存在 40 种以上的抽象域。经典的抽象域可以简答划分成两类：

非关系型的抽象域：例如符号域。就像我们一开始介绍 “抽象” 这一概念的时候，我们只关心这个变量到底是正的还是负的。除此之外，还有刚才讲到的区间的抽象域，还有同余域
关系型抽象域：包括线性等式域、线性不等式抽象域（多面体域）、八边形域等。八边形域描述约束表示时，系数只能是 + 1,-1 或者是 0，且一条约束只能刻画两个变量之间的一个关系。

在我们使用抽象域来进行程序分析时，一般会采用 over-approximation（上近似），也就是说要把程序状态都包在里面，以防有所遗漏。我们来直观解释下，比如对于下面这个图，每一个蓝色的小十字叉代表了这个程序的一个具体状态，那用我们刚才列举的这些抽象域去包住程序状态时，在几何上就需要把这些蓝色的十字叉给包进来。如果我们用多面体抽象域，那么对应的二维形状就是一个多边形。我们用图中这个深绿色的多边形就可以把所有十字叉都包进来。假设图中外侧的红色的地方表示这个程序会出错，比如说会出现数组越界、除零、整数上溢等之类的错误。我们会发现这个程序的所有的状态都被这个多边形包住了，而且这个多边形跟这个红色的区域并没有相交，那也就是说，我们用多面体抽象域证明了在这个程序点处这个程序是不会出错的。

接下来，我们换成区间抽象域，区间抽象域对应地在平面上就是个矩形。这个时候，我们会发现绿色矩形和红色区域有交集。那么，程序分析时，我们拿到区间分析的结果就会报警，说这个程序状态在这个程序点处可能会有错误。然而，实际上我们会发现在这个相交的区域里面，并没有包括真正的具体程序状态，也就说蓝色的十字叉并没有出现在红绿相交区域里。换而言之，用区间分析得到的这个报警，是一个误报，是虚假报警，而实际上程序是不会出错的。因此，用（上近似）抽象解释做程序分析时，没有漏报，但是可能会存在误报。

已有数值抽象域，大部分采用约束的 conjunction（合取） 作为约束表示，都只能表达几何上凸的形态，存在凸性局限性（会导致误报），不能表达析取性质。但是程序中会有很多的析取的行为。比如，if 本身其实就是一个 disjunction，所以我们用已有的数值抽象域去分析程序的时候，会有很多因为凸性的局限性导致出现一些误报。

针对凸性局限性，我们设计并实现了一些非凸的数值抽象域，来提高抽象域对析取的表达能力。所谓非凸，如下图右侧所示，在把一个个表示具体状态的十字叉包住时，我们会发现非凸抽象域的区域比左侧用的多面体会小很多，至少我们可以知道原点没有出现在程序状态里。然后，我们用这个非凸抽象域去分析程序的时候，因为域元素包含的面积或体积更小了，分析就更加精确，误报更少。

这方面工作的主要技术思想是，我们把原来采用的传统线性不等式，变拓展成了带区间系数的线性不等式，或者把原来只关注 $x$ ， $y$ 这些变量间关系拓展为关注 $x$ 、 $∣ x ∣$ 、 $y$ 、 $∣ y ∣$ 之间的关系，即我们利用这种绝对值函数来描述一些非凸的程序行为。

举个栗子

举个简单的例子来讲，传统八边形抽象域域元素采用的约束形式是 $\pm x \pm y \leq c$ ，即它只能描述两个变量 $x$ 和 $y$ 之间的这种受限形式关系，其中变量系数只能是 $+ 1$ ， $- 1$ 或者 $0$ 。那么，我们可以对它简单做一些扩展，比如考虑允许其中一个变量带绝对值的情形，还可以进一步考虑允许两个变量都带绝对值的情形。按照这种方式扩展之后，就只会存在下面所列的这几种可能的约束表示：

八边形约束： $\pm x \pm y \le a$
仅含一个变量的绝对值： $-|x|\pm y \le b,\pm x - |y| \le c$
含两变量的绝对值： $-|x|-|y|\le d$

按照这种思路，用扩展之后的约束形式去描述程序的行为，或者作为抽象域的一个域表示，就可以刻画一些非凸的性质了，而传统的八边形域能刻画的仅是凸的性质。

几何形态：非凸

简单而言，在几何上，“凸” 意味着如果对于上图中一个图形绿色区域内的两个点，其连线上的点也都在这个区域里面，那么这个图形就是一个凸的，这是凸在几何上的性质。我们可以利用绝对值函数描述一个非凸的区域，比如 $-|x|\le 1$ ，即 $\ge 1$ ，所描述的程序状态集合，在几何上就是非凸的。直观上，抽象域元素对应的程序状态的面积越小，那么分析精度就会更高。

# 我们的工作

前面，我们通过一个简单例子来给大家介绍在设计数值抽象域时，如何面向我们需要解决的问题来设计一些新型的或者是适合这个问题的抽象域。其中，关键点是找一种合适的约束表示。

在选择了特定形式约束之后，接下来要考虑的就是，在这个约束形式上，如何设计比较高效的算法来操纵这种约束。比如说怎么实现 join，怎么实现 meet 等等。

我们课题组沿着这个思路，设计实现了一些抽象域，并融到了开源的数值抽象域库 Apron 的主分支里面。Apron 库应该是最早的且开源的数值抽象域库，里面包含了很多经典、常见数值抽象域的实现。我们在设计一些基于抽象解释的程序分析的时候，就可以在 Apron 数值抽象域库中，选择并调用对应的抽象域的接口，来实现自己的分析。

Apron：https://github.com/antoinemine/apron

我们团队的工作融合到开源抽象域库 Apron 主分支

# 数值程序分析 #

# 数值程序分析工具 Numpa

接下来给大家介绍一下，在抽象域设计好后，怎么实现一些程序分析。

我们课题组实现了一个数值程序分析工具 Numpa。下图是 Numpa 的框架示意，这同时也是一个典型的抽象解释工具的框架。很多抽象解释工具基本上也是采用这种框架。

数值程序分析工具 Numpa 框架

步骤说明

如下所示，对于给定的一个某种语言编写的 待分析程序（目前我们的这个工具支持 C 程序）：

先通过编译前端将它的表示 转化为一个中间表示，这个中间表示其实本质上是一个 图的描述，刻画的是一个迁移系统，同时也对应到了待分析程序的语义方程。
接下来是一个抽象解释里面的 不动点迭代求解器，它会不断 调用抽象域库（也就是 Apron）里面的抽象域的一些操作，比如遇到赋值语句，就调用抽象域里面赋值语句对应的赋值迁移函数，控制流汇合（control-flow join）语句，就调用抽象域里对应的 join 操作。
当分析过程迭代稳定之后，即达到不动点之后，工具就会输出数值不变式。

当然，为了处理指针，我们也设计了一个 指向抽象域，以得到每个指针变量的指向信息，包括其基地址信息，以及关于基地址的偏移量的信息。利用这些分析信息，我们可以检查程序缺陷并报警。

工具支持

我们的工具是面向 C 程序的，支持常见的数据类型和语法结构，如整型、浮点型及之间的类型转换，数组（一维/二维数组、指针数组）、静态指针及指针算术，结构体及结构体数组等。当然，也有一些我们目前暂不支持，如函数指针。

同时，我们还考虑了一些特定领域软件的特点，如嵌入式软件中常见的中断分析。

从工具的输出角度，Numpa 支持输出：

数值不变式，即数值变量间的约束关系，以及变量的取值范围
指针变量的指向信息：包括可能指向的基地址集合，以及相对于基地址的偏移量
报警类型：基于不变式信息，Numpa 可以检查一些常见的运行时错误，如未初始化、算术溢出、除零错、数组越界、空指针解引用、死代码、数学函数输入不在定义域内（如负数开平方根）等

举个栗子

如下代码示例，我们会在进入循环后的程序点 4 处，得出指针变量 p 的基地址是数组 A 的名字，其基地址的偏移量与 x 是两倍的关系，并分析得到 x 的值范围是 [0, 99]。

int A[198];
1 x := 0;
2 p := A;
3 while (x <= 99) do
4   *p := 0; // 数组越界！！！
5   x := x + 1;
6   p := p + 2;
         7
done;

这是我们得到的不变式：

$offset_p = 2 x \begin{aligned} &p \in A, \\ &0 \le x \le 99, \text{offset\_p} = 2x \end{aligned}$

在这个程序示例的点 4 处，Numpa 可分析得出 x 的值范围为 [0, 99]，指针变量 p 关于其基地址（数组 A）的偏移量是 x 的两倍，即能取到 198。按照程序的语义，数组访问下标范围在 [0,197] 间才不会出错，而分析得出可能会访问到 198 的下标位置。因此，程序分析工具会报警，认为在程序点 4 处的赋值语句可能导致数组越界。

工具现状

目前，我们一直在维护这个数值程序分析工具，也在航天等领域中的一些实际程序上开展了实验。当然，工具本身还有很大的提升空间。

目前，这个工具面临的主要问题是：

误报相对较多。
且，如果我们用非关系型的抽象域，比如用区间，我们分析的规模能够满足要求，但是精度就会比较差，误报也会比较多；但是，当我们用关系型抽象域的时候，一旦变量过多，尤其采用精度较高的过程间分析方法时，工具的可扩展性就会比较差，因为关系型抽象域的可扩展性跟变量的维度紧密相关。
另外，当我们使用这个工具来分析一些实际的开源软件时，会遇到一些比较复杂的数据结构。比如，对于一些指针形态相关的操作，会增加了内存模型的复杂性，在分析过程中不易处理。

# 结合抽象域与 SMT 的程序分析

为了弥补 抽象解释分析精度不足 的问题，我们一个简单的想法是 利用 SMT 公式来提高分析精度，结合抽象域和 SMT 来开展分析。

抽象域 vs SMT

我们知道，SMT 公式的表达能力比较强，尤其是它能表达析取，当然它的计算代价也比较高。另外一个问题是，用 SMT 来分析程序的时候，如何处理循环？当然，一个简单策略时是循环展开，但是我们不知道循环应该展开多少次才能覆盖全程序行为。目前，在 SMT 上面没有特别合适的加宽算子，使得在抽象解释框架下在 SMT 公式表示的程序状态上开展不动点迭代，难以保证不动点迭代的终止性。

	抽象域	可满足性模理论（SMT）
表达能力（精度）	受限，尤其析取表达能力不足	SMT 公式表达能力强（析取，量词等）
计算代价	低	高
迭代收敛性（处理循环）	加宽/变窄算子	尚无合适的加宽/变窄算子

具体方法

为了将 SMT 和抽象域结合起来开展程序分析，我们借鉴了软件模型检验中 程序分块编码技术，开展块级程序分析 ²。

首先，我们对程序进行了分块。即，每个程序块作为一个单独的迁移函数；
在程序块内采用 SMT 来刻画公式（块内精度比较高）；在程序块间或者遇到循环的时候，将 SMT 公式转化为抽象域表示（循环体会被看做一个程序块，采用 SMT 编码；在循环头处会将 SMT 转化为抽象域表示。从而，在循环头处，我们可以利用抽象域上的加宽操作，来保证不动点迭代的终止性）。

通过上述这种方法，我们可以提高程序分析的精度，但其中用到了一个关键技术：SMT-opt。我们将 SMT 公式转化为抽象域表示时，SMT 公式里面是带析取的，但是抽象域表示中是没有析取的，所以我们需要 符号化抽象技术，将 SMT 公式转换为抽象域表示。

我们可以用类似线性规划的 SMT 规划技术（或者叫 SMT 最优化技术），将一个 SMT 公式转化为一个带模板的抽象域的表示。

如下图示，我们目前用的是 SMT 求解器 Z3 中的 vZ 模块，它可以支持 SMT 规划。但这个方法的计算代价还是挺大的，会影响到程序分析效率。

这一方面最新的研究进展，是姚培森博士等人发表在 OOPSLA 2021 上的工作 ³，提出了一种更高效的符号化抽象技术。

# 数值程序分析应用 #

基于数值程序分析技术，除了利用数值程序分析技术来检查运行时错误，我们还可以做一些应用分析。

# 软件资源使用情况分析

关注的问题

比如分析 程序中资源使用量的上界。程序在运行过程中，会使用到很多类型的软件资源（堆内存、文件句柄、网络套接字、用户自定义资源等）。

资源消耗量上界分析的结果，有助于在资源受限的条件下（如在嵌入式系统中），帮助指导软件的设计、部署、配置；同时，我们也可以利用资源消耗量上界分析技术来检测，未受控资源消耗缺陷等资源使用相关缺陷。实际上，有不少 CWE 跟资源使用相关：

– CWE-400: Uncontrolled Resource Consumption
– CWE-769: File Descriptor Exhaustion
– CWE-774: Allocation of File Descriptors or Handles Without Limits or Throttling
– CWE-775: Missing Release of File Descriptor or Handle after Effective Lifetime

技术途径

我们分析资源消耗量上界的主要思路是 ⁴，把资源使用量上界分析问题转化成数值程序分析问题，如下图所示：

简单来讲，对于给定的待分析程序，

STEP 1：首先，对源程序进行 插桩转换，通过引入一些辅助整型变量来建模资源的消耗情况；
STEP 2：接下来，因为我们关注的其实就是新引入的这些辅助变量的值范围，而程序中有很多代码跟资源使用无关，因此我们可以拿着这些变量去 对程序切片；
STEP 3：最后，基于抽象解释技术来分析 被提取出来的数值程序，可以得到一些描述资源使用量的辅助变量间的数值关系，从而获得资源使用量上界的估计。

# 神经网络架构中的数值缺陷检测

关注的问题

现在也有不少工作用抽象解释来做神经网络的验证，我下面介绍的这个工作其实不是来做神经网络模型层面验证的，而是依然属于程序层面的。

我们用深度学习框架（如 Tensorflow）写的程序中会包含大量数值运算，其中可能存在数值缺陷，从而需要相应的检测技术。

神经网络训练或推断过程中可能会产生数值计算缺陷（“NaN”, “INF”）

技术途径

下面介绍的是我和北大的熊英飞老师、谢涛老师和他们的团队，还有港科大的张成志老师一起合作的一项工作：张量抽象 & 数值抽象 ⁵。

用 Tensorflow 写的程序，会要拿很多的数据来进行训练，而在训练的过程中也执行很多数值运算，其中也会调用很多数值函数。那么，数值运算过程中可能会出现一些如 “NAN” 或 “INF” 值，这些值往后传播可能导致程序缺陷。

我们这项工作大体的思路还是用 抽象解释 来做分析。因为这类程序里面有很多数值运算，所以我们可以做 数值抽象，进而获得程序中变量的值范围。但，因为这类程序里面涉及很多的张量（张量可以简单理解为传统程序里面的数组，或者说高维的数组），我们就需要对这些数组或者张量做一些特殊分析和处理。

我们用的方法是 基于张量划分的张量抽象技术。数值抽象用的是比较简单的抽象域，我们用了区间域和线性等式域，这两个数值抽象域都是经典的抽象域，相对来说也是比较轻量级的数值抽象域，从而得到变量值的范围：

张量抽象（张量划分）
数值抽象（结合区间抽象与线性等式抽象）

我们的方法将张量抽象和数值抽象结合起来，比如，可以得到张量划分后的每一部分的取值范围。

# 总结 #

今天，一方面给大家介绍了用抽象解释怎么来生成数值不变式。因为抽象解释框架本身比较成熟了，其中最重要的就是设计比较适合目标问题的数值抽象域。我们用抽象域来进行程序分析的时候，可能会碰到一些问题，比如说误报比较多。那么怎么来提高分析的精度呢？结合例子，我给大家简单介绍了下我们结合 SMT 和抽象域来提高分析精度的思路。

另一方面，基于数值程序分析，我们可以开展一些应用分析。除了缺陷检测，我们可以基于数值程序分析来分析程序资源的使用量上界（类似于 WCET 分析）。此外，除了传统的程序（如 C 程序），深度学习相关程序代码也包含大量的数值运算，也可能出现一些数值缺陷，那么怎么用抽象解释来检测这一类程序的缺陷呢？除了数值不变式，这类程序还涉及到一些新的结构，如张量，这就需要一些新的抽象技术。

基于抽象解释的数值不变式生成
- 数值抽象域的设计
数值程序分析
- 结合数值抽象域与SMT的块级程序分析
- 软件中资源使用量上界分析
- 神经网络架构中的数值缺陷检测

相关论文推荐

数值程序分析：

Tengbin Wang, Liqian Chen, Taoqing Chen, Guangsheng Fan, Ji Wang. Making Rigorous Linear Programming Practical for Program Analysis. In CP 2021.
Banghu Yin, Liqian Chen, Jiangchao Liu, Ji Wang. Hierarchical Analysis of Loops With Relaxed Abstract Transformers. IEEE Transactions on Reliability. 2020.

数值程序验证：

Pengfei Yang, Jianlin Li, Jiangchao Liu, Cheng-Chao Huang, Renjue Li, Liqian Chen, Xiaowei Huang, Lijun Zhang. Enhancing Robustness Verification for Deep Neural Networks via Symbolic Propagation. Formal Aspects of Computing, 2021.
Banghu Yin, Liqian Chen, Jiangchao Liu, Ji Wang, Patrick Cousot. Verifying Numerical Programs via Iterative Abstract Testing. In SAS 2019.
Jiangchao Liu, Liqian Chen and Xavier Rival. Automatic Verification of Embedded System Code Manipulating Dynamic Structures Stored in Contiguous Regions. IEEE TCAD, 2018.

参考

P. Cousot and R. Cousot. Abstract interpretation: a unified lattice model for static analysis of programs by construction or approximation of fixpoints. In Conference Record of the Fourth Annual ACM SIGPLAN-SIGACT Symposium on Principles of Programming Languages, pages 238–252, Los Angeles, California, 1977. ACM Press, New York, NY. ↩︎
Jiahong Jiang, Liqian Chen, Xueguang Wu and Ji Wang.Block-wise abstract interpretation by combining abstract domains with SMT. In VMCAI 2017. ↩︎
Program Analysis via Efficient Symbolic Abstraction. Peisen Yao, Qingkai Shi, Heqing Huang, and Charles Zhang. The 36th ACM SIGPLAN Conference on Objected Oriented Programming, Systems, Languages, and Applications, OOPSLA 2021. ↩︎
Guangsheng Fan, Taoqing Chen, Banghu Yin, Liqian Chen, Tengbin Wang, Ji Wang. Static Bound Analysis of Dynamically Allocated Resources for C Programs. In ISSRE 2021. ↩︎
Yuhao Zhang, Luyao Ren, Liqian Chen, Yingfei Xiong, Shing-Chi Cheung, Tao Xie. Detecting Numerical Bugs in Neural Network Architectures. In FSE 2020. (ACM SIGSOFT Distinguished Paper Award). ↩︎

你可能感兴趣的:(技术文章,程序分析,编程语言社区,技术分享)

店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
metaRTC8.0，一个全新架构的webRTC SDK库 metaRTC webrtc 音视频
概述metaRTC8.0是metaRTC开源以来架构变化最大的一个版本，是metaIPC3.0等高性能的基础。metaRTC8.0是一个全新架构版本，并非在metaRTC7.0版本上简单升级，在QOS/语音对讲/内存占用/视频文件录制读取等方面新增多个模块，在弱网对抗/语音对讲/内存优化等效果上有显著提升。metaRTC8.0在一年多的开发中进行了近200次迭代，metaRTC8.0社区版计划在2
Rust是否会取代C/C++？Rust与C/C++的较量 AI与编程之窗源码编译与开发 rust c语言 c++内存安全并发编程代码安全性能优化
目录引言第一部分：Rust语言的优势内存安全性并发性性能社区和生态系统的成长第二部分：C/C++语言的优势和地位历史积淀和成熟度广泛的库和工具支持性能优化和硬件控制丰富的行业应用社区和行业支持第三部分：挑战和阻碍学习曲线现有代码库的迁移成本生态系统和工具链的完善度社区和人才培养行业应用和推广法规和标准化第四部分：未来趋势和可能性行业趋势教育和人才培养兼容和共存行业标准化企业支持和应用开源社区和生态
我们一起喵喵喵米菲兴哥
2021-4-16星期五晴天今天忙碌了2件事情，车险和接种疫苗。对比平安的车险，电销的保险是优惠不少，还送电子门锁（不含安装费用），等会儿查核电子门锁的价格。今天在公司接种疫苗，上次公司安排到社区接种，有点心虚，没有去。这次安排到公司的，就接种吧。早晚要接种的，这次安排这么好，上班时间接种疫苗，直接干呢。下次的接种时间已经安排好啦。刚开始还感觉有点怕怕，皮肤消毒过后，就只有凉凉的感觉，护士的手一接
自动化测试工程师面试，常问的问题有哪些？自动化测试老司机软件测试测试工程师自动化测试面试职场和发展软件测试 selenium 测试工具 android 测试工程师
自动化测试工程师面试是非常重要的环节，面试官会通过一系列的问题来评估候选人的技能和经验。下面是一些常见的问题，以及如何详细而规范地回答这些问题的建议。1.请介绍一下你的自动化测试经验。回答这个问题时，可以从项目经验、使用的自动化测试工具、编写的测试脚本等方面来介绍自己的经验。重点强调你在自动化测试领域的技能和擅长的领域。2.你在自动化测试中使用的编程语言是什么？为什么选择这种语言？回答这个问题时，
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
爬虫技术抓取网站数据 Bearjumpingcandy 爬虫
爬虫技术是指通过程序自动访问网页并提取数据的技术。一般来说，爬虫技术包含以下几个步骤：确定目标网站：确定需要抓取的网站，并了解其页面结构和数据特点。分析页面结构：分析网页的结构和源代码，找到需要抓取的数据在页面中的位置和标识。编写爬虫程序：使用编程语言（如Python）编写爬虫程序，实现对目标网站的自动访问和数据提取。处理抓取数据：对抓取到的数据进行清洗、去重、整合等处理，以便后续的分析和利用。爬
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Go编程语言前景怎么样？参加培训好就业吗 QFdongdong
Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。不仅可以开发web,可以开发底层，目前知乎就是用golang开发。区块链首选语言就是go,以-太坊，超级账本都是基于go语言，还有go语言版本的btcd.Go的目标是希望提升现有编程语言对程序库等依赖性(dependency)的管理，这些软件元素会被应用程序反复调用。由
UI 自动化的页面对象管理神器 PO-Manager TesterHome
原文由alex发表于TesterHome社区网站，点击原文链接可于作者直接交流。做UI自动化的同学都知道，UI自动化一个难点就是页面元素的变化，让自动化维护成为一个痛点。在此，为了减轻这个痛点，我在基于Page-Object模式的基础上开发了页面对象维护的工具。该工具为vscode的一个插件，可以通过vscode插件市场搜索PO-Manager来下载安装本文中的页面对象库文件基于json.一个元素
由于直接在一个回答中提供完整且多语言的游戏商城代码是不现实的（因为每种语言都有其独特的语法和库），我将为你概述一个游戏商城的核心概念，并提供几种不同编程语言的基本框架或示例代码段。 uthRaman 游戏 python 开发语言
商城系统概述hailiangwang.com游戏商城系统通常包含以下部分：用户系统（登录、注册、用户信息）商品列表（游戏、DLC、虚拟货币等）购物车系统支付系统订单系统2.示例框架（伪代码）首先，我们给出一个伪代码框架，描述商城的核心逻辑。plaintextclassUser:deflogin(username,password):#验证用户登录passdefregister(username,p
陪伴营||报名参加啦～千允
迎新班在七月份时举办了七月营活动，我参加了，通过活动对社区有了更多了解，也跟几个超有缘的同学建立了更紧密的联系，可以说是收获颇丰。所以，我一直期待着迎新班开启新的活动，如果有的话我一定参加。这是出于对“迎新班”这个团队的信任，也是对七月班班的信任和拥护，凡她组织的活动都会让人不虚此行。终于，迎新班•一年陪伴营的活动发布了公告，分为上下两个半学期。越来越像在学校读书的时候了，真是令人无限怀念的时光啊
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
go语言安装快速入门吉祥鸟hu
[TOC]go语言是什么Go是一个开源的编程语言，它能让构造简单、可靠且高效的软件变得容易。Go是从2007年末由RobertGriesemer,RobPike,KenThompson主持开发，后来还加入了IanLanceTaylor,RussCox等人，并最终于2009年11月开源，在2012年早些时候发布了Go1稳定版本。现在Go的开发已经是完全开放的，并且拥有一个活跃的社区如何安装环境笔者这
odoo 开源版/企业版/社区版的对比分析 lijianhua_9712 odoo odoo
odoo的三个版本1开源版开发者odoo限制功能版本优点功能稳定，bug少缺点限制功能，进销存勉强可用2企业版开发者odoo中型企业功能优点功能稳定，bug少缺点授权费用昂贵3社区版开发者社区(1700余名专家）大型企业功能优点功能丰富，社区不受odoo公司控制，社区开发者基本都是资深erp技术专家，增加了大量细致功能缺点存在一些bug为什么用odoo社区版，不用odoo企业版呢1odoo企业版是
真的猛士梭梭柴
鲁迅先生说过：真的猛士，敢于直面惨淡的人生，敢于正视淋漓的鲜血。如今，每天看到媒体上奋战在一线的医生、环卫工人、志愿者、社区工作者……他们的身影或纤瘦柔弱，或高大魁梧，疲惫却坚定！谁不怕牺牲呢？谁没有亲人呢？谁不被疼爱呢？或许，猛士的含义因他们而更加富有内涵。感恩我们的英雄，为他们祈祷，也努力做好自己能做的一切。
mysql 隐秘后门_【技术分享】CVE-2016-5483：利用mysqldump备份可生成后门 Toby Dai mysql 隐秘后门
预估稿费：100RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿前言mysqldump是用来创建MySQL数据库逻辑备份的一个常用工具。它在默认配置下可以生成一个.sql文件，其中包含创建/删除表和插入数据等。在导入转储文件的时候，攻击者可以通过制造恶意表名来实现任意SQL语句查询和shell命令执行的目的。另一个与之相关的漏洞利用场景可以参考。攻击场景攻击者已经能够访问
前端HTML+CSS+JS的入门学习俊昭喜喜里前端 html css
一.HTMLHTML（HyperTextMarkupLanguage）即超文本标记语言，是用于创建网页和网页应用程序的标准标记语言。它不是一种编程语言，而是一种标记语言，通过一系列的元素（elements）来告诉浏览器如何显示网页上的内容，如文本、图片、链接、表格、列表等。HTML文档由一系列的标签（tags）组成，这些标签告诉浏览器如何显示内容。标签通常成对出现，例如和，其中是开始标签，表示一个
《C++语言的设计和演化》读书感悟（一）依晴无旧 C\C++java 开发语言
写了一百多篇技术文章了，我突然想写一下和技术文搭一点关系的语言发展设计的文章，《C++语言的设计和演化》是我无聊翻自己库存电子书找到了，因为当年看这本书是C++之父写的，所以就保存下来，但是当时主要学习C++，这本书更多是C++之父从本身出发，对C++设计和演化的观点和感想，所以当时就被我扔去吃灰了。现在重拾起来，读起来别有风味。开发语言，虽然很多，但是万变不离其宗，学进去了，无非就是数据类型、控
10月21日:god loves me unconditionally 赵月川ZYC
图片发自App今天没有很好的完成功课。但有两次快要完成的瞬间。一次是上午做志愿的时候，去教社区的爷爷奶奶们使用百度网盘以及一些其他的电脑、手机功能，回答他们的一些问题。结束合影的时候，有一个奶奶拉着我的手，让我跟她站在一起，我没有拒绝，但是还是在她松手的瞬间挽上了她的胳膊，因为我觉得我没有那么爱她，更多的是一种尊重和善意，还没有到“爱”的程度，但是她让我想起我的奶奶来，我奶奶很喜欢摸我的手，每次见
笔记：Python顺序结构练习题辞言i 笔记 python
文章目录前言一、什么是顺序结构？二、练习题1.题目2.填空题3.简答题4.编程题总结前言本次笔记旨在帮助读者加深对Python编程语言中顺序结构和选择题的理解。在学习Python编程过程中，掌握程序的基本结构以及条件语句的使用至关重要。通过本次练习题，读者将有机会测试自己对这些概念的掌握程度，并通过实际应用进一步巩固所学知识。本次练习题将涵盖Python中的顺序结构的练习题，旨在帮助读者提高解决问
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，