#苦行僧

《Checking Smart Contracts with Structural Code Embedding》论文笔记

年份： 2020（TSE）
论文下载地址：点击进入
论文代码Github地址：点击进入
论文模型web应用地址：点击进入

论文主要内容：

论文提出了一种自动化学习Solidity编写的智能合约特性的方法（称为：“SMARTEMBED”）。该方法基于词嵌入和向量空间比较。通过将智能合约代码解析成带有代码结构信息的词流，将代码元素（如声明、函数）转换成编码代码语法和语义的数值型向量，然后比较编码代码的向量和已知bug代码之间的相似度，来识别潜在的问题。实验结果表明，论文的方法可以有效识别许多重复的实例。

问题：

现有的一些bug检测工具它们的缺点是：需要人类专家手动来定义某种特定bug模式或规则，以便构建bug检测器和代码模型检查器来检测智能合约。

介绍：

论文是第一个提出通过代码嵌入进行相似性检查，来进行智能合约代码bug检测的，特别是代码嵌入还引入了代码的结构信息。
而论文提出的方法则是基于深度学习技术，可以随着代码或者bug的变化，不断的自动改进bug检查规则以便更有效地检查智能合约。即能够通过使用词嵌入，灵活和自适应地去检测任意的新的bug。该方法主要有两部分要点：
1.代码和bug的模式，包括词汇、语法甚至语义信息能够被自动编码成数值型向量（即词嵌入）。
2.代码bug的检查可以通过智能合约中不同粒度级别的各种代码元素的数值型向量之间的相似性检查来实现。

论文收集了22725份Solidity语言编写的智能合约和17份常见的bug智能合约。

论文主要贡献：

1.为智能合约代码检测提出了一种基于代码嵌入和相似性检测的新方法，能够用于类型合约代码的检测，bug检测和合约验证等多方面。

2.在超过22000份以太坊区块链收集的智能合约代码上进行模型的验证。

3.在代码克隆检测方面，实验结果表明论文的方法能够有效地识别出许多重复的Solidity智能合约代码（克隆比率为90%），并且相比于常见的一些克隆检测工具能够更准确的检测出更多的语义克隆。

4.在bug检测方面，实验结果表明论文的方法在基于其bug数据库上，能够识别出超过1000多个与克隆相关的bugs。

方法：

以下是SMARTEMBED模型的整体框架图：

基于代码embedding和相似性检测，SMARTEMBED针对3个任务：

1.clone detection（克隆检测）
2.bug detection（bug检测）
3.contract validation（合约验证）

对于克隆检测和bug检测，论文的目标是在现有的以太坊区块链上识别代码克隆和代码克隆相关的bug。

而对于这个合约验证，当给定一个新的智能合约代码，SMARTEMBED将会验证其是否包含有与bug数据库中相关的漏洞语句。

首先，收集到的智能合约代码将会通过论文构建的解析器加载和解析后，生成抽象语法树AST。
接着，通过序列化AST来提取一个token流。

然后，通过上图中的Normalizer部分重新组合token流以消除不同智能合约之间的差异（如停用词，常量值，文字）。

再然后，将Normalizer输出的序列输入代码表示子模型，通过模型的训练与构建，每个代码片段都会被嵌入成一个固定长度维度的向量。所有源代码和漏洞代码都会被编码进对应的嵌入矩阵。

最后，在向量空间中使用相似度检测进行克隆检测、bug检测、合约验证。

下面对各部分关键技术进行讲解：

1.Data Collection：
论文通过“EtherScan”（它是一个块浏览器和以太坊分析平台）收集智能合约代码。通过网络爬虫去系统地搜索和下载整个网站上的HTML页面。然后解析HTML，得到一些关键信息（如合约地址、源代码、字节码等）用于进一步的评估。
一共收集了22725份经过验证的智能合约。平均每份智能合约包含：6个单独的合约，27个函数，85个声明，323行代码。
以下是具体的统计信息：

2.Parsing：
AST是程序结构信息的表示，论文使用了一个自定义的Solidity解析器来解析智能合约代码为AST。然后基于AST构建code embedding。
具体地，使用ANTLR和一个自定义的Solidity语法生成XML解析树，作为代码的中间表示（即AST）。下面是一个智能合约即其对应AST的例子：

论文根据树节点的类型，在不同层面（合约层面、函数层面、声明层面）对解析树进行序列化操作。这样做是为了捕获代码的结构化信息（如我们关注点周围的分支、循环条件）。
进一步地，重要的token和identifier names被处理并放入从树序列化得到的code element sequence中，这样明确的数据流信息（通过定义或者使用相同的名字）就被添加到序列中了。

合约级别的tokenization：
通过中序遍历XML解析树，提取出所有的终端token（用的是上图的Solidity代码）：

函数级别的tokenization：
在函数token后面加上合约的签名。结果如下：

声明级别的tokenization：
它合约级别的tokenization和函数级别的tokenization不同，基于terminal tokens，加上更多的结构和语义关系的细节信息。比如，对于上面的代码，在AST中的祖先链和函数签名都可以从XML解析树中得到。通过添加AST中的祖先链，我们的模型可以捕获这种结构化关系；通过添加不同的邻居节点，我们的模型可以捕获关于关注点的上下文信息。

通过上述的解析树进行代码的序列化，可以捕捉多数的结构和语义信息。

3.Normalization：
通过移除一些语义无关的信息来规范化token序列，具体步骤如下：
Stop words：
对于单个字符的变量。使用“SimpleVar”代替它，例如：

Punctuation：
移除一些对代码操作语义没有影响的标记，一些非必要的标点符号，必要的会保留。例如：

Constants：
对于常量类型，我们统一称其为：“StringLiteral”, “DecimalNumber”, “HexNumber” and “HexLiteral” 等。例如：

Camel Case Identifiers：
对于驼峰式的标识符，我们将其作为保留的token，并将其拆分成单独组成的单词，例如：

经过上述的规范化处理后，保留了1.2GB的干净文本，总计119568 tokens。这组成了最后输入训练算法的训练数据集。

4.Code embedding learning：
基于上述规范化的结果，我们将每个可能的代码段（例如声明，函数，合约）分别映射到高维的向量。论文采用了以下2两种embedding算法：
Word2Vec：
它学习词的向量表示，对于预测统一句子中周围的词很有用。然而，传统的Word2Vec并不能捕获到词的形态结构。
FastText：
FastText则尝试解决这一问题。其通过把每个单词作为它的子词的聚合（子词是从这个单词的n-gram得到的），所以使用FastText得出的单词的向量是组成其的所有n-gram的向量的和。

对于这两个算法的实现，论文是采用了python的gensim库（它包含了这两种算法）。对于接下来的实验，采用FastText作为主要的embedding算法。原因有如下2点：
1.根据实验结果，FastText在语法任务上比Word2Vec出色。原因可能是因为FastText考虑了子词的信息，它能够从上下文中捕获更多的语义以及语法信息。
2.FastText可以获得词汇量外的单词的向量（通过组成该单词的char-ngrams的向量求和获得）。

详细的code embedding学习过程描述如下：
Token Embedding：
我们把从规范化得到的token流作为训练语料库。然后使用embedding算法对合约级别、函数级别、声明级别的训练语料库进行训练。
因为在Solidity语法文件中有308个节点类型，所以论文为了压缩和节点类型无关或重叠的含义，设置了词嵌入向量维度大小为其一半：150。
这个token embedding 过程作为构建higher level embedding 的一个预训练阶段。
Higher Level Embedding：
当我们得到了token的基本向量表示后，代码段的higher level embedding（如声明级别。函数级别、合约级别）可以由这些token的基本向量构成。
为了捕获语义特征和代码大小，我们使用求和的方法来组成这个共享的嵌入。对于一个特定的代码段的code embedding由其所有可能的token embedding求和组成。具体定义如下：
给定一段Solidity代码T，对于每个在T中的token w，我们定义这一段代码T的code embedding为：（有点类似NLP中的将一句话所有单词的embedding相加构成这句话的embedding）

5.Embedding Matrix Building：
在上面得到embedding后，我们将这些单个的向量堆叠起来分别构成3个code embedding矩阵（分别对应contract-level、function-level、statement-level）

Contract Embedding Matrix：

c：表示所有论文收集的智能合约的个数，为22725。
d：表示code embedding size，前面设置为150。

所以将Ci作为第i个合约的code embedding，它是一个150维的向量。

Function Embedding Matrix:

f：表示所有论文收集的相关函数的个数，为631261。
d：表示code embedding size，前面设置为150。

同理矩阵每一行的Fi代表第i个函数的code embedding，它是一个150维的向量。

Statement Embedding Matrix：

f：表示所有论文收集的相关声明的个数，为1944513。
d：表示code embedding size，前面设置为150。
同理矩阵每一行的Si代表第i个声明的code embedding，它是一个150维的向量。

6.Similarity Checking：
下面定义相似度检查的方法，它会用于接下来的clone detection, bug detection, contract validation。
给定两个代码段C1和C2，e1和e2为其对应的code embedding。我们定义两个代码段的语义距离如下（即向量欧式距离除它们的模长和）：

则这两个代码段的相似度定义如下：

当两代码段的相似度超过一个预先定义好的阈值时，我们将这两代码段视为克隆对（clone pair）。

7.Clone Detection, Bug Detection, Contract Validation：
基于上述的code embedding我们构建了相似度检查方法。可将其应用于多个任务，
对于clone detection：我们通过计算两智能合约代码的相似度是否超过某一预先定义的阈值来判断其是否clone。
对于bug detection：我们通过计算在我们代码库中的代码和已知的bug代码的相似度是否超过某一预先定义的阈值来判断其是否buggy。
对于contract validation：当开发者输入一个新的智能合约，我们通过计算它和收集到的buggy statements 的相似度，超过某一特定阈值，则新的智能合约中的错误statements会被识别出来。

对于以上3个不同给的任务，这个预先定义的相似度阈值可能不同。

实验部分：

1.Code Embedding Evaluation：
我们知道，如果两个符号在一些方面越相似，那么它们在对应特征维度中的值也应该越相似。我们选取了前100个频率最高的tokens的code embedding，并利用T-SNE算法将其映射到二维平面，如下（相似的单词它们在对应的向量空间中会很相近，也即在下面这个二维平面中会很相近）：

从图中，可以看出哪些具有相似语法和词汇意义的tokens都聚集在了一起。例如+，-，*，/等操作符聚集在了一起。这说明了高维的code embedding能够很好地捕获tokens的共现统计信息和分布式语义。

2.Similarity Checking Evaluation：
为证明论文提出的相似性检查的有效性，我们在3个任务中评估该方法：code
clone detection, bug detection, and contract validation。并且使用Deckard（用于clone detection）、SmartCheck（用于bug detection和contract validation）这两个工具做结果对比。

以下部分，主要围绕以下6个问题展开：

RQ-1: Clone Detection Evaluation：
实验设置：
该部分实验通过相似性检查来评估code clone detection（分别对3个方面进行检测：contract-level， function-level， statement-level）：
Contract-level clone detection：
在上面，我们将每个合约都映射成了一个固定维度的向量，现在我们构建一个相似度矩阵M，维度是22718 x 22718（这里移除了7个解析错误的案例）。其中每个元素Mij对应合约si和sj的相似度得分。如果Mij大于预先定义的相似度阈值，则将它们认为是一个克隆对。

Function-level clone detection：
理论上我们也可以定义一个和上述合约级别中一样的相似度矩阵，但是由于我们函数有631261个，如果要两两计算相似度的话会很耗计算成本。所以我们随机抽取了200个智能合约，然后利用其中的5307个函数。我们由此构建了一个相似度矩阵N，维度是5307 x 631261。其中每个元素Nij对应采样函数fi和fj的相似度得分。如果Nij大于预先定义的相似度阈值，则将它们认为是一个克隆对。

Statement-level clone detection：
和函数级别中一样，考虑到计算量大的问题。利用上述随机抽取的200份合约中的16350个声明，构建了一个相似度矩阵Q，维度是16359 x 1944513。其中每个元素Qij对应采样声明si和sj的相似度得分。如果Qij大于预先定义的相似度阈值，则将它们认为是一个克隆对。

实验结果：
实验部分与代码克隆检测工具Deckard检测的结果进行对比。我们为Deckard和SMARTEMBED设置了相似度阈值为1.0和0.95的两种情况进行测试，结果如下：

从上表中我们可以知道，在智能合约中代码克隆比率是相当高的。
在不同粒度级别和相似度阈值上，SMARTEMBED的代码克隆比率整体上是比Deckard要低的。我们认为SMARTEMBED比Deckard检测克隆代码更为精确，因为SMARTEMBED它的代码编码过程不仅考虑了代码的结构信息，还考虑了代码语义信息。而Deckard只考虑了结构信息。
大多数被SMARTEMBED检测到的克隆代码也被Deckard检测到了。我们统计了两种方法检测到的克隆代码的重叠率，结果如下表：

用Venn图直观地表示它们的重叠率：
contract-level：

function-level：

statement-level：

关于在智能合约中存在如此高的代码克隆比率，我们将原因归结为以下几点：
1.一个主要原因是因为以太坊区块链上的智能合约代码的不可篡改性。当我们升级了当前的代码并重新部署时，旧的代码仍会继续保留在区块链上。我们考虑了当检测到的克隆代码属于同一个创造者时，将不考虑它。即使这样，代码克隆的比率还是很高。

2.ERC20智能合约模版是一个主要的技术标准，它包含有很多函数以及事件的接口。根据实验发现有68.3%的智能合约中包含了ERC20标准，这说明了ERC20也是代码克隆比率较高的原因之一。

代码克隆检测的一些例子：
为了对比SMARTEMBED和Deckard两种检测方法的，我们手动挑出一些能够被SMARTEMBED检测出但是不能被Deckard检测出的克隆案例：

如上两图，这两份代码有着相似的语句，只是添加或修改了部分语句。它们可以认为是语义克隆。因为Deckard是注重于语法结构形式的检测，所以没检测出来。
同时，我们挑选了Deckard能检测出但SMARTEMBED不能检测出的案例，如下：

由上两图可知，虽然这两函数的名字都叫“addCompany”，但是它们使用了不同的数据结构，所以不能被当作语法克隆。由于Deckard忽略了代码中不同标识符的名字，所以才会偶然识别出这种克隆的情况。而SMARTEMBED则是结合了代码嵌入向量来加以区分这些不同标识符的区别。所以说SMARTEMBED相比于Deckard更加精准、有效。

RQ-2: Bug Detection Evaluation：
为了能够快速使用某些函数，开发者们往往会复制一些代码，这可能会引入克隆相关的bug。为了使我们的方法能够更准确地检测出bug，我们在statement-level粒度级别上执行bug检测。

实验设置：
为了检测bug，我们需要收集一些错误语句来构建bug数据库。我们收集了52份已知的属于10种常见类型漏洞的智能合约。然后手动确定这些合约中的漏洞语句（通过查阅论文、网络上的文章、社区讨论确定）。然后整理了一个表如下：

表格中带‘*’号的32个智能合约用于bug detection（包含63个buggy statement，然后通过code embedding处理好后作为我们的bug database，它是一个63x150的矩阵）。其它20个用于contract validation。

我们将会对比由我们的方法报告的bug候选代码行和真实的bug代码行。如果候选bug代码行满足以下3个条件之一，即可被确认（手动确认候选bug代码行是否检测正确）：
1.候选的bug语句和真实的bug语句完全一样，则判定为type-I 类型clone-related bugs。

2.候选的bug代码语句包含了与真实bug代码语法等价的代码片段（带有标识符、文字或类型的变化），则判定为type-II类型clone-related bugs。例如下面两图的例子：

3.候选bug代码语句涉及与真实bug代码语句类似的代码插入、删除。更新语句。则被判定为type-III和type-IV类型clone-related bugs。例如下面两图的例子：

实验结果：
对于不同类型的bug-related bugs，SMARTEMBED的检测结果如下表（相似度阈值设置为0.9）：

从上表我们可得到如下3点信息：
1.大多数由SMARTEMBED识别出的候选bug代码属于type-II类型，这说明开发人员在确实通过复制别处的代码引入了clone-related bugs。

2.SMARTEMBED在识别type-I和类型type-II上能够达到100%的识别准确率。这是因为这两种类型不会引入代码结构的改变，所以能够被轻易识别出来。

3.而在识别type-III/type-IV上则有所下降，，所以为了识别出这种类型的bug，需要降低相似度阈值，但是这同时可能会引入更多的假阳性案例。

下面是对采取不同相似度阈值时，模型的性能表现结果：

从上表我们可得到如下3点信息：
1.相似度阈值越高，模型准确率越高。

2.相似度阈值越低，将会有更多的语句被识别为候选bug语句，及时如此，模型还是保持了一个较高的准确率。

3.而当相似度阈值设置为0.9时，准确率下降为88.7%，这是因为过小的相似度阈值，会引入更多噪声（即更多不准确的候选bug代码语句）。同时也说明了0.9和0.91可能是一个较好的相似度阈值。

下面我们将进行和SmartCheck漏洞检测工具的对比：
由于在所有20k+的智能合约上检测，计算成本比较高，所以我们只使用我们上述Table 5中手动验证好的带有1163个bug语句的合约中运行SmartCheck。为了公平起见，关于SmartCheck工具的bug检测模式我们按上面Table 4中的10种常见bug类型设置。然而SmartCheck只检测出了1163个中的697个，这足以显示出我们提出的模型在检测clone-related bugs上的优势。

bug detection 的一些例子：
我们手动挑选了一些能够被SMARTEMBED检测出的bug而不能被SmartCheck检测出。一些bug，如Tabel 4中的“Honeypots”不能被SmartCheck有效地检测出。例如下面的例子：

因为msg.values是发送给payable public函数的ETH，而this.balance是存储在智能合约中的ETH，所以当调用这个函数时，this.balance将会更新为this.balance+msg.values。所以上图中的第7行的if条件将永远不会成立，除非this.balance初始为0。所以这是一个bug。
所以呢，使用类似SmartCheck这种检测工具去定义这种特殊的bug识别模式需要额外的精力。而使用SMARTEMBED则仅需要将bug代码进行code embedding进行相似性检查。当然我们方法的优势也是建立于良好的对代码结构以及语义信息embedding上的。

总的来说，我们的方法在大量的智能合约中进行clone-related bug detection是非常有效的。

RQ-3: Practical Analysis：
智能合约中代码克隆率高的一个关键问题是：原始代码最好应该在其后续版本的每个副本中得到修复。下面将通过实际的分析去验证SMARTEMBED能否区分修复了bug的语句和原始存在bug的语句。

实验设置：
因为智能合约一旦部署不可篡改，所以当发现一个智能合约中存在bug时，需要重新部署一个修复bug后的新合约。对于每个在我们构建的bug数据库中的buggy智能合约，我们手动调查了合约创建者的历史创建记录，以查看是否存在对某个特定buggy语句修复的修复版本的合约。最后我们发现，在我们构建的bug数据库中的52个buggy智能合约中，有5个智能合约是包含一个修复版本的合约的。同时我们指出了修复的语句，并评估了修复的语句和它对应的buggy语句的相似度。
实验结果：
实验结果如下表（我们计算了修复的语句和它对应的buggy语句的相似度）：

从表中我们可以得出如下2点信息：
1.通过设置相似度阈值为0.9，则所有修复后的智能合约不会被SMARTEMBED检测出bug。即使修复后的版本和原始版本很相似，SMARTEMBED也能够很好地检测出。这是因为SMARTEMBED集中于statement-level的bug检测，任何微小的修复也会使code embedding得到的向量不同，这样一来也就降低了它们之间的相似度。

2.从上表结果可以证明SMARTEMBED能够很好地区分开原始存在bug的语句和修复bug后的语句。

bug及其对应的修复bug后的例子：

从图15的193行代码我们可以知道，这很容易发生溢出的情况。如果_value是一个十分大的数字，则经过这个乘法运算，amount会溢出，然后变成一个十分小的数字。这样一来会造成transfers超过balances[msg.balance]的代币。
而在图16的283行使用了_value.mul()，这可以通过使用安全的数学运算（例如SafeMath）来处理溢出问题。这样，通过修复后的bug语句的改变，可以达到降低它和原始bug语句的相似度的目的。

总的来说，SMARTEMBED能够非常有效地区分开修复bug后的代码和原始bug代码。

RQ-4: Ablation Analysis：
当我们进行bug detection时，SMARTEMBED的一个主要新奇之处是它基于AST解析树序列化来进行结构以及语义信息的提取。例如，前面我们通过在AST解析树中添加祖先链来捕获序列的派生，以及利用函数签名来捕获不同邻居节点的关系。同时我们也在前面通过实验证明了SMARTEMBED在bug detection的准确性。这一部分，为了验证对SMARTEMBED添加的结构以及语义信息的有效性，我们在bug detection任务上进行了消融实验。

实验设置：
为了进行消融实验，我们使用了SMARTEMBED的不完整版本BASICEMBED，它从statement tokenization结果中移除了所有结构以及语义信息，只保留了简单的statement token序列。其他如Normalization等步骤与SMARTEMBED相同，我们我们将为其构建一个新的code embedding模型，然后也同样使用上面表4的bug数据库进行相似度计算。

实验结果：
SMARTEMBED和BASICEMBED的bug detection结果如下表：

从上表我们可以得到如下3点信息：
1.BASICEMBED的整体精度在5%左右，这说明简单地提取语句的token序列不足以进行bug检测任务。

2.对于各相似度阈值，SMARTEMBED的精度大幅度超越BASICEMBED。这说明添加结构以及语义信息能够对模型的整体检测性能带来很大提升。

3。87%由BASICEMBED检测出的bug属于type-I 类型的bug。这是因为没有考虑语句上下文结构信息以及语义信息，BASICEMBED只能简单地检测出一些简单类型的bug语句。

BASICEMBED的bug检测的例子：
如下图：

上面的错误是，原本正确的话，函数DynamicPyramid的名字应为Rubixi（即作为合约的构造函数），即合约的创建者才能调用，不然像这样，任何外部调用者都能调用成为了合约的owner，则合约的代币将会被外部调用者盗取。
然而BASICEMBED指出的bug语句是第5行的代码：owner=msg.sender。这显然是不合理的，像这样没有考虑上下文信息，在和其他合约中的语句进行相似度计算时和容易造成假阳性的识别案例。这就是为什么BASICEMBED的识别精度低的原因。
而使用SMARTEMBED，则会在code embedding 向量中到考虑函数名字：function DunamicPyramid和合约的祖先节点：Rubixi。这样能够有效降低假阳性的案例，检测出更多真实的bug。

总的来说，SMARTEMBED中引入的结构以及语义信息对模型的整体性能带来了很大的好处。

RQ-5: Contract Validation Evaluation：
因为智能合约一旦部署将不能修改，所以在部署前最好确保其正确性。所以这一部分的实验是为了测试SMARTEMBED检测合约中的所有bug的能力，以验证合约的正确性。即使SMARTEMBED不是一个正式的验证工具，但因为我们的方法能够通过添加新的bug到bug数据库，从而很容易地进行扩展以检测合约中是否存在和bug数据库相似的bug。

实验设置：
给定一个待检测的智能合约，我们将为其中的每一条代码语句生成一个150维的向量，并与我们构建的bug数据库中的所有bug进行相似度检查（相似度阈值设置为0.95、0.90、0.85）。
这一部分测试数据我们采用了Table 4中没带‘*’号的20个bug智能合约，和从Zeppelin收集来的20个无bug的智能合约。总共2857条语句，其中45条bug语句。
对比了SMARTEMBED和SmartCheck的bug检测效果。结果如下表：

同时计算了precision，recall，F1-Score，FPR（false positive rate），FNR（false negative rate），结果如下表：

实验结果：
从表9和表10可以得到如下4点信息：
1.对比SMARTEMBED和SmartCheck的结果，SMARTEMBED能够更准确地检测出clone-related bugs。

2.SmartCheck比我们的方法检测出了更多假阳性的案例。为了公平起见，我们对SmartCheck的bug检测模式也是按Table 4 中的bug来设置的。

3.仔细地可以看出，相似度阈值为0.95和0.9时检测出的clone-related bugs数量为：27和36。这可能是因为开发者在克隆代码时，对克隆的代码做了少许修改，所以需要降低一点相似度阈值来检测出它们。

4.当设置相似度阈值为0.85时，假阴性数量下降为0。这意味着所有bug都被SMARTEMBED检测出来了。其他各指标也均优于SmartCheck。

总的来说，我们的模型能够很有效的捕获出类似假阳性的bug。我们将来的研究也将继续丰富我们的bug数据库，并进一步改进code embedding。

RQ-6: Time Cost Analysis：
我们的SMARTEMBED的时间消耗主要在code embedding的训练和向量的相似度计算上，还取决于合约数据库和bug数据库的大小。

实验测试环境：Intel Xeon CPU E5-2640 v4 @2.40GHz。
训练code embedding需要大约一天时间。
我们对 clone detection, bug detection，contract validation三个任务进行时间复杂度的测试。在Deckard和SmartCheck上检测一个智能合约平均用时分别为：79.2ms和416.3ms。而SMARTEMBED：在clone detection任务上只需要0.26ms。在bug detection任务上只需要2.3ms。在contract validation任务上只需要4.7ms。

总的来说，SMARTEMBED在克隆检测以及bug检测的任务中，实用性是很好的。

DISCUSSION部分：

主要讲的是作者联系了一些Solidity开发人员，并发送了一些SMARTEMBED的检测结果给他们，让他们提提意见。部分开发者对SMARTEMBED很感兴趣，部分觉得对他们来说不适用。（具体关于他们对SMARTEMBED的评论意见请参看论文）

根据大部分开发者的建议，作者将SMARTEMBED实现成了一个Web应用工具供外部测试人员使用（有对应一篇论文介绍）。同事SMARTEMBED的源码以及使用到的智能合约数据也开源了在Github上。

还有部分开发者建议将SMARTEMBED作为一个扩展与增强工具发布在Etherscan上。还有部分建议将SMARTEMBED集成在一些IDE中（如Remix，VScode）。
我们将会根据这些建议改善我们的模型。

对有效性的威胁：

1.内部有效性：
对于code embedding 可能会因为代码段大小的不同影响我们方法的检测。目前有很多相关的方法做code embedding（具体看论文有介绍）。所以在未来，我们将对同一任务采取不同的code embedding技术进行测试。

2.数据有效性：
我们从Etherscan中收集了22725份智能合约，但是由于以太坊智能合约数量的飞速发展，我们在未来需要引进更多的数据以扩大我们的代码数据库和bug数据库，来重新训练我们的模型。甚至可能尝试对Solidity字节码进行code embedding。

3.外部有效性：
因为我们只是从SmartCheck基准测试中验证了SMARTEMBED检测到的克隆相关错误。而SmartCheck也会出现检测到假阳性和假阴性的案例，所以也会对结果造成影响。在未来，我们将对现有的一些其他安全分析工具进行大规模测试，并从从业者那获取更多的意见。

总结：

基于code embedding对代码的结构信息以及语义信息进行了嵌入，提出了SMARTEMBED。
使用相似性检查对3个任务进行检测（在超过22000分智能合约上进行）：
1.clone detection
2.bug detection
3.contract validation

并与安全分析工具Deckard, SmartCheck进行了性能的对比。实验表明论文的SMARTEMBED模型在以上3个任务中表现更为出色。并且SMARTEMBED在实际应用中也能达到实时高效的性能。

你可能感兴趣的:(区块链,区块链,智能合约,以太坊)

solidity高阶 -- 继承第十六年盛夏. 智能合约 Solidity 区块链智能合约
Solidity是一种面向区块链的智能合约编程语言，广泛应用于以太坊等区块链平台。继承是Solidity中一个非常重要的特性，它允许开发者通过创建子合约来扩展父合约的功能，从而实现代码的复用和层次化设计。本文将通过具体实例详细介绍Solidity语言中的继承机制。注意：使用继承时请确保代码的正确性，以防丢失个人财产，在这里友情提示您，不要复制来源不明的solidity代码并进行部署。本文为自己梳理
为AI聊天工具添加一个知识系统之73 详细设计之14 正则表达式之1 一水鉴天智能制造人工语言软件智能网络人工智能
本文要点要点今天讨论“当代符号学的正则表达式：StringProcessor”。StringProcessor被视为当代符号学的正则表达式，表达的是思维的纯粹形式（逻辑表示无关，语言表达无关，程序实现无关）。StringProcessor自带投影规则-关注空性中心（符号学立场），它内嵌转换规则-隐藏共性内核（建筑术视角）和外挂映射规则-悬置个性外壳（诠释学观点）。正则表达式的三方智能合约：字母转换
基于联盟链Fabric 2.5.4的通用数据存证项目云梦优选区块链基于Fabric2.X 通用电子存证实战区块链物联网大数据
基于Fabric2.5的数据存证项目是一个结合了区块链技术的数据存证解决方案。Fabric（通常指HyperledgerFabric）是一个企业级的许可型区块链框架，旨在提供一个模块化和可扩展的区块链平台，以满足不同行业的需求。以下是对基于Fabric2.5的数据存证项目的详细分析：一、项目背景随着数字化转型的加速，数据已成为企业和组织的重要资产。然而，数据的真实性、完整性和可追溯性在数字世界中面
【13】地址-比特币区块链的地址 AlieNeny 从零到一开发自己的区块链区块链分布式账本哈希算法
1.比特币区块链的地址这就是一个真实的比特币地址：1A1zP1eP5QGefi2DMPTfTL5SLmv7DivfNa。这是史上第一个比特币地址，据说属于中本聪。比特币地址是完全公开的，如果你想要给某个人发送币，只需要知道他的地址就可以了。实际上，所谓的地址，只不过是将公钥表示成人类可读的形式而已。2.密码学相关算法和概念
【FISCO BCOS】二十三、部署WeBASE-Node-Manager 奈何不吃鱼 FISCO BCOS 区块链 FISCO BCOS Linux 运维 WeBASE
WeBASE-Node-Manager是WeBASE的子组件之一，可以处理前端页面所有web请求，管理各个节点的状态，管理链上所有智能合约，对区块链的数据进行统计、分析，对异常交易的审计，私钥管理等，今天我们来部署WeBASE-Node-Manager。环境：ubuntu22、已搭建单机四节点（节点已启动）、安装并配置java环境、安装并配置mysql环境、已部署节点前置服务（服务已启动）关于以上
Gaea项目的挑战与机遇：去中心化AI平台的未来发展币圈小菜鸟去中心化人工智能区块链
尽管Gaea在去中心化AI领域展示了巨大的潜力，但在实际操作中仍然面临一些挑战。首先，平台的用户参与度至关重要。如果用户参与的资源不足，平台的计算能力和带宽资源将受到限制，从而影响AI项目的运行效率。因此，如何吸引更多用户加入并持续提供闲置带宽资源，是Gaea需要解决的关键问题。此外，平台的安全性也是一个值得关注的问题。去中心化平台通常依赖于智能合约和区块链技术，但这也意味着平台的安全性需要更加严
HSM能为区块链、IoT等新兴技术提供怎样的保护？ Anna_Tong 区块链物联网 iot hsm 数据加密
随着区块链和物联网（IoT）技术的快速发展，数据安全已成为最为关键的挑战之一。在这些技术的应用中，涉及到大量的敏感数据和交易信息，因此如何确保数据的机密性、完整性和真实性，成为了亟待解决的问题。硬件安全模块（HSM）作为一种高度安全的加密服务技术，正日益成为保障区块链和IoT技术安全的核心工具。HSM具体能为区块链和IoT做些什么？它又是如何保护这些技术免受安全威胁的呢？HSM在区块链中的应用：密
如何找回丢失的智能合约（SimpleToken ）地址并清理合约纸鸢666 合约破解案例区块链
简介在以太坊和其他区块链平台上，智能合约的部署和交互非常重要。然而，在实际应用中，开发者有时会遇到一些问题，比如丢失了已经部署的合约地址。在本文中，我们将探讨一个简单的智能合约示例，说明如何找回丢失的合约地址，并清理这些合约以避免资源浪费。1.问题背景假设有一个非常简单的代币工厂合约，任何人都可以通过它轻松创建新的代币合约。这个代币合约会接收以太币并根据以太币数量发行代币。在合约创建后，代币合约部
Python知识点：基于Python工具和技术，如何使用Truffle进行智能合约开发与部署杰哥在此 Python系列 python 智能合约开发语言编程面试
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用Truffle与Python进行智能合约开发与部署Truffle是一个强大的开发框架，它为以太坊智能合约的开发、测试和部署提供了一整套工具。虽然Truffle主要使用JavaScript和Solidity，但是它也可以与Python工具和技术配合使用，以实现更灵活的开发流程。
第112篇区块链上的预言机（Chainlink） wonderBlock 区块链应用区块链以太坊智能合约喂价器
本文环境：操作系统：Windows11家庭版（64位）测试工具：RemixIDE+MetaMask7.7.9合约源码：https://github.com/smartcontractkit/chainlink/tree/develop/contracts参考文档：ConsumingDataFeeds|ChainlinkDocumentation一、预言机（oracles）1.什么是预言机？Orac
【比特币与区块链】比特币的工作原理与区块链技术爱技术的小伙子区块链
比特币与区块链比特币的工作原理与区块链技术引言比特币是世界上第一个成功实施的加密货币，其背后的技术——区块链——为去中心化、透明和安全的数字交易提供了基础支持。本文将探讨比特币的工作原理，并深入剖析其所依赖的区块链技术。什么是比特币？比特币（Bitcoin）是由中本聪（SatoshiNakamoto）于2008年提出并于2009年发布的开源软件。比特币是一种去中心化的数字货币，不依赖于任何中央机构
Chainlink 2022 年秋季黑客松获奖项目介绍 Chainlink资讯 Chainlink 预言机黑客松区块链 web3
Chainlink2022年秋季黑客马拉松已于12月7日结束，从本次黑客马拉松的数据中，可以清楚地看到，Web3创业者们正在以惊人的速度速度创新。本次Chainlink黑客马拉松吸引了来自全球各地团队的10,000多个参赛者报名，最终提交浪超过380个项目，这两项数据均打破了过去的记录。Chainlink提供了30多个小时的开发教程，让新一代的开发者能够开始在区块链和Oracle基础设施之上构建自
跨链多链与非托管交易结合：ANEX协议为区块链资产去中心化管理提供创新解决方人工智能区块链
在当今快速发展的区块链行业中，资产管理面临诸多挑战，如合约资产中心化管理导致的安全隐患、跨链桥中心化带来的资产被盗风险以及不同链间缺乏互通引发的“价值孤岛”问题。这些挑战不仅限制了资产的安全性和流通效率，也对行业的去中心化信任基础构成了严峻考验。为应对这些挑战，ANEX协议应运而生，通过其全球区块链统一账本技术，引领去中心化资产管理迈向新纪元。全球区块链统一账本的定义与优势全球区块链统一账本旨在通
【分享】一个查看无线网络密钥的小方法（查看 WiFi密码，热点密码）| 区块链面试题：区块链技术中，如何保证交易的匿名性和隐私性？| 公钥加密，数字签名，零知识证明追光者♂ 工具技巧解决办法百题千解计划(项目实战案例）网络 wlan 热点密码 WiFi密码区块链面试 WiFi
“你不是我，你不会懂。”作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！感谢大家点赞收藏⭐留言！！！目录一、基础回顾步骤1、win+R:cmd，进入Dos命令窗口
成为 Web3 开发者：why and how
作者丨Pignard首先介绍一下什么是Web3。2014年，以太坊联合创始人GavinWood首次提出“Web3”的概念，给互联网需要过多信任的问题提供了一种解决方案。不可否认，中心化网络已经帮助数十亿人融入了互联网，并在其上创建了稳定、可靠的基础设施。但与此同时，少数中心化巨头几乎垄断了互联网，甚至可以为所欲为。而Web3通过区块链、加密货币和NFT将权力以所有权的形式归还用户。Web3如今已成
从零开始：使用FunC编写TON智能合约之计数器篇 web3func区块链
在区块链技术的广泛应用中，智能合约无疑是最具前景的领域之一。智能合约允许我们在去中心化的环境中执行可信的交易和协议。TON（TheOpenNetwork）作为新兴的区块链平台，以其高效、可扩展的特性吸引了众多开发者的关注。本文将带你入门TON智能合约的编写，通过实现一个简单的计数器合约，让你掌握使用FunC语言编写智能合约的基本技巧。了解TON与FunC在开始编写智能合约之前，我们需要对TON和F
300行ABAP代码实现一个最简单的区块链原型
在多模态模型的架构上，ChatGPT的绘图能力主要依赖以下几个核心组件：跨模态编码器（Cross-ModalEncoder）：跨模态编码器的作用是将文本和图像的特征进行对齐。GPT可以将用户输入的文本描述转换为文本特征表示，然后利用跨模态编码器将这些特征映射到图像特征空间。这种方式确保模型能够理解描述性语言中不同细节是如何与图像特征对应的。
从Web2到Web3：区块链推动的数字进化之路清晨 web3 web3 去中心化人工智能隐私保护
互联网的演变从最初的Web1到如今的Web3，代表了技术和用户需求的深刻变化。Web3是一个基于区块链技术的全新互联网架构，旨在解决传统互联网（即Web2）中数据集中化和隐私保护等问题。通过去中心化的机制，Web3不仅能够增强数据安全性，还能够赋予用户更高的自主权。本文将从Web2和Web3的差异、区块链的作用以及Web3未来的潜力三个角度进行探讨。Web2：社交与互动的新时代Web2，也被称为社
C++语言的区块链沈霁晨包罗万象 golang 开发语言后端
C++语言的区块链实现区块链技术作为一种新兴的分布式账本技术，近年来在金融、供应链管理、身份认证等多个领域得到了广泛关注与应用。C++语言因其高性能和精细的资源管理能力，成为实现区块链技术的重要选择之一。本文将探讨C++语言在区块链中的应用以及如何使用C++实现一个简单的区块链。一、区块链的基本概念区块链是一种由多个区块组成的链式数据结构，每个区块包含一定数量的交易信息和指向前一个区块的哈希值。区
VBA语言的区块链轩辕烨瑾包罗万象 golang 开发语言后端
用VBA语言探讨区块链技术引言区块链技术自2008年比特币的问世以来，逐渐成为了一个热门的话题。它不仅推动了数字货币的崛起，更在金融、供应链、医疗、游戏等众多领域展示出了巨大的应用潜力。然而，对于很多程序员来说，如何实现和理解区块链的概念和原理仍然是一个挑战。本文将结合VBA（VisualBasicforApplications）语言，深入浅出地探讨区块链的基本概念，工作原理，以及如何利用VBA实
mtls加密双向认证 sun007700 安全 ssl https http
https://www.cloudflare.com/en-gb/learning/access-management/what-is-mutual-tls/HTTPS双向认证（MutualTLSauthentication)-API网关-阿里云SSL/TLS双向认证(一)--SSL/TLS工作原理_ustccw-CSDN博客_双向认证SSL/TSL双向认证过程与Wireshark抓包分析_区块链
区块链技术在商贸物流中的变革性作用：透明、安全与高效呆码科技区块链安全
区块链技术在商贸物流中的变革性作用：透明、安全与高效在当今全球化的商业环境中，商贸物流作为商品流通的关键环节，其高效运作对于企业的竞争力和消费者的满意度至关重要。然而，传统商贸物流存在着诸多痛点，如信息不透明、信任缺失、货物追溯难等问题，严重制约了行业的发展。而区块链技术的出现，为这些难题提供了创新的解决方案，正逐渐展现出其在商贸物流领域的变革性作用。信息不透明的难题与区块链的应对在传统的商贸物流
替代区块链 Mindfulness code 区块链开发区块链
随着比特币的成功，人们逐渐意识到区块链技术的潜力，并随之出现了迅速的发展，各种区块链协议、应用程序和平台相应产生。需要指出的是，在这种多元的局面下，很多项目迅速失去了它们的吸引力。事实上，有不少项目只是打着创新的幌子，在玩”击鼓传花“的古老把戏或者干脆就是“骗局”。根据DeadCoins网站的统计，超过70%数字货币都已经没有什么成交量或市值彻底归零，大量区块链项目都已经死亡或者名存实亡。当然，也
Scheme语言的区块链程韵珂包罗万象 golang 开发语言后端
Scheme语言的区块链探索引言区块链技术自从比特币推出以来，已迅速成为全球瞩目的焦点。其去中心化、不易篡改的特点使得区块链在多个领域展现出了巨大的潜力。通常，区块链的实现主要依赖于多种编程语言，例如C++、Java、Python等。然而，Scheme语言以其独特的表达能力和强大的抽象特性，也为区块链的实现提供了新的视角。本文将深入探讨Scheme语言如何在区块链中发挥作用，并介绍如何使用Sche
速通 AI+Web3 开发技能: 免费课程+前沿洞察 OpenBuild.xyz 人工智能 web3 区块链去中心化
AI正以前所未有的速度重塑各行各业，从生成式模型到大规模数据处理，AI逐渐成为核心驱动力。与此同时，Web3去中心化技术也在重新定义信任、交易和协作方式。当这两大前沿技术相遇，AI+Web3的融合已不再是理论，而是未来趋势，有望催生出颠覆性的创新应用和商业模式。AI提供智能化工具和算法支持，Web3则为数据和应用赋予了去中心化的灵魂，二者结合将开创全新的技术生态。无论是智能合约中的AI决策，还是链
智能合约中的异常处理不当问题 (Improper Exception Handling) 纸鸢666 编写安全的智能合约区块链智能合约
简介智能合约是一种自动化执行的协议，用于在区块链上执行合约条款。它通过代码来定义合同条款，并在条件满足时自动执行。然而，由于区块链是一个去中心化的环境，智能合约在执行过程中可能会遇到各种各样的异常情况，包括但不限于合约执行失败、资金转移失败、数据一致性问题等。异常处理在智能合约的设计和实现中扮演着至关重要的角色。正确的异常处理可以确保合约在遇到错误时能妥善回滚操作并保持合约状态一致，而不当的异常处
Golang网络刘贤松精品文章 golang 游戏服务器
golang游戏服务器框架在Go语言中，有许多优秀的游戏服务器框架，以下是一些比较流行的框架：Leaf：一个轻量级的游戏服务器框架，支持多进程、分布式、热更新等特性。它提供了一些常用的组件，如网络层、定时器、数据库等等，可以帮助开发者快速构建游戏服务器。go-ethereum：一个基于以太坊协议的区块链游戏服务器框架，支持智能合约、代币、加密等特性。它提供了丰富的API，可以轻松构建去中心化的游戏
程序员创业公司的技术栈选择与性能优化 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《程序员创业公司的技术栈选择与性能优化》概述本文旨在探讨程序员创业公司在选择技术栈和进行性能优化方面的策略与实践。随着技术的不断进步和市场的快速变化，技术栈的选择和优化成为创业公司成功的关键因素。正确的技术栈选择不仅能够提升系统的性能和可扩展性，还能降低开发成本和维护难度。关键词技术栈选择性能优化创业公司云计算数据库微服务人工智能区块链边缘计算摘要本文首先分析了技术栈选择的重要性以及创业公司在技术
Solidity智能合约中的异常处理（error、require 和 assert） Linke- 区块链智能合约区块链 Solidity
Solidity中的三种抛出异常方法：error、require和assert在Solidity开发中，异常处理是确保智能合约安全性和正确性的关键步骤。Solidity提供了三种主要方法来抛出异常：error、require和assert。本文将详细介绍这三种方法的用途、实现方式及其各自的特点，并对它们的Gas消耗进行比较。目录Solidity中的异常处理1.1什么是异常？1.2异常处理的必要性1
Solidity02 Solidity合约组成结构杰哥的技术杂货铺 Solidity 区块链 Solidity 智能合约
文章目录一、合约的基本构成1.1计数器代码示例1.2智能合约的组成1.2.1License许可声明1.2.2编译器版本声明1.2.3合约定义1.2.4状态变量1.2.5合约函数二、合约的组成结构Solidity的智能合约和面向对象语言中的类很相似。你可能会好奇合约都由什么基本结构组成的呢?我们在编写合约的时候又是如何把这些基本结构结合在一起的呢?一、合约的基本构成1.1计数器代码示例下面是一个简单
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持