I still …

基于Slice-level程序表示的漏洞检测

Slice-level程序表示

1. VulDeePecker
- 1.1.程序表示code gadget
- - 1.1.1.提取library/API function calls和program slice
  - 1.1.2.提取code gadget并给它们打上标签
  - 1.1.3.将code gadget符号化
- 1.2.code gadget向量化
2. SySeVR
- 2.1.提取SyVCs
- 2.2.SyVCs转换为SeVCs
- - 2.2.1.定义
- 2.3.SeVCs向量化
- - 2.3.1.符号化
  - 2.3.2.向量化
3.μVulDeePecker
参考文献

1. VulDeePecker

目标，识别程序中是否有漏洞。如果有，定位漏洞的位置（这个放到今天都算研究的热门话题）。实验用到的数据集地址：VulDeePecker，包括了61,638个code gadget。漏洞类型包括CWE-119和CWE-399。

1.1.程序表示code gadget

作者提出了一个code gadgets来作为程序中间表示。code gadgets是由一些代码行（一行一行的代码，VulDeePecker是基于code gadget分类的。一个目标程序可能包含多个code gadget，一个code gadget被分类为有漏洞，那么，该code gadget中所有的代码行都有问题）组成的程序声明，这些代码行之间有语义（数据流，控制流）相关。

code gadget的生成和key point有关，key point某种程度上是一个漏洞的中心点。key point可以但不限于是：

library/API function calls（库函数调用，不当的库函数调用会造成漏洞）
arrays（数组的不当使用）
pointer（指针的不当使用）

key point和漏洞之间是多对多的关系，作者这里只研究library/API function calls与相关的code gadget。

示例代码：

void 
test(char *str)   
{       
	int MAXSIZE=40;
	char buf[MAXSIZE];       
	if(!buf)             
		return;      
	strcpy(buf, str); /*string copy*/    
}   
 
int main(int argc, char **argv){      
	char *userstr;     
	if(argc > 1) {             
		userstr = argv[1];            
		test(userstr);       
	}       
	return 0;    
}

产生code gadget的步骤如下：

1.1.1.提取library/API function calls和program slice

这里library/API function calls分为

forward library/API function calls
forward library/API function calls指该函数调用直接从外部（命令行，socket，文件）接收输入。如recv函数
backward library/API function calls
backward library/API function calls并不直接从外部接收输入，比如上面示例中的strcpy

forward library/API function calls直接从外部接收输入很容易直接造成漏洞，而backward library/API function calls会受到与其参数有关的传参语句的影响。

program slice最初是表示程序中与一个变量或者程序点相关的语句，这里是与library/API function calls的参数相关的语句。

program slice也分为

forward slice
forward slice对应于受到参数影响的语句，从forward library/API function calls中生成
backward slice
backward slice对应于影响参数的语句，从backward library/API function calls中生成

以上面的示例代码为例，library/API调用是strcpy(buf, str);，参数包括 buf 和 str，buf又与MAXSIZE有关。str是函数test形参，在main函数中userstr作为实参传入test，userstr又可以追踪到userstr = argv[1]; char *userstr; 2句。

所以program slice包括

test(char *str)    
int MAXSIZE=40;
char buf[MAXSIZE];    
strcpy(buf, str); /*string copy*/

main(int argc, char **argv)  
char *userstr;  
userstr = argv[1];
test(userstr);

2个backword slice，可以看到1个slice对应一个函数。而1个库函数调用可能会生成多个slice。

生成code slice的时候用到了checkmarx生成的数据依赖图（data dependency graph）

1.1.2.提取code gadget并给它们打上标签

将上面针对一个库函数调用提取到的每个slice拼接成code gadget

每个code gadget都必须打上标签。如果有漏洞，标1，反之，标0。

1.1.3.将code gadget符号化

该步骤的目的是在训练神经网络的程序中启发式地获取一些语义信息。

采用以下步骤

删除非ascii码字符和注释
用户自定义变量名映射
将用户自定义的变量名映射为 VAR1, VAR2这类符号化后的变量名
用户自定义函数名映射
将用户自定义的函数名映射为 FUNC1, FUNC2这类符号化后的函数名

1.2.code gadget向量化

首先将符号化后的code gadget用词法分析器解析为token序列，token种类包括identifiers, keywords,operators, symbols。

比如，一个一行code gadget strcpy(VAR5,VAR2); 词法分析后就成了"strcpy" , "(" , "VAR5" , "," , "VAR2" , ")" , ";"

这会带来一个很大的token词库。这里用word2vec将token向量化。（感觉fasttext更好，可以利用符号化变量名的信息）

之后用 Bi-LSTM + Dense 解析token序列并分类。

这里作者将token序列的长度固定为 $\tau$

当token序列长度小于 $\tau$ 时需要补0，对于由backword slice组成的code gadget在前端补0。反之在后端补0。
当token序列长度大于 $\tau$ 时需要截断，对于由backword slice组成的code gadget在前端截断。反之在后端截断。

2. SySeVR

SySeVR也是VulDeePecker团队的研究成果，主要针对VulDeePecker存在的以下问题

只考虑与库/API函数调用相关的漏洞
只利用由数据依赖（data dependency）引起的语义信息
只考虑被称为Bi-LSTM的特定RNN
不努力解释假阳性（false-positives）和假阴性（false-negatives）的原因。

作者这里提出了2个概念

SyVCs：SyVCs反映了漏洞的语法特征
SeVCs：SeVCs对SyVCs进行扩展，引入数据依赖（data dependency）和控制依赖（control dependency），反映了漏洞的语义特征

该框架合称为SySeVR：基于语法，语义和向量的表示。

在这篇paper中，作者用到了比VulDeePecker更大的数据集：SySeVR，包括了126种漏洞，VulDeePecker选择Bi-LSTM作为网络架构，SySeVR选择Bi-GRU。

源代码

SyVCs

SeVCs

Vector Representation

2.1.提取SyVCs

该部分输入包括

程序源代码 $P$
漏洞特征集合 $H$

输出包括

一个由SyVC构成的集合 $Y$ （SyVCs）。

定义1：
一个程序 $P$ 由一系列的函数 $f_1, ..., f_n$ 组成。而函数 $f_i, 1 \leq i \leq n$ 由一系列的 statement $s_{i,1}, ..., s_{i,m_{i}}$ 组成。而statement $s_{i,j}， 1 \leq j \leq m_i$ 由一系列token $t_{i,j,1}, .., t_{i,j,w_{i,j}}$ 组成。其中token类型包括 identifiers, operators, constants, keywords，可由词法分析获取。

$P = \{f_1, ..., f_n\}$
$f_i = \{s_{i,1}, ..., s_{i,m_{i}}\}$
$s_{i,j} = \{t_{i,j,1}, .., t_{i,j,w_{i,j}}\}$

给定一个函数 $f_i$ 的AST（可由其它方式生成）。AST每个叶子结点对应一个token $t_{i,j,g}$ ，非叶子结点对应一个statement或者 $s_{i,j}$ 或者 $s_{i,j}$ 内部多个连续的token。

直观上，一个SyVC是一个token(对应于一个叶子结点)或者由多个连续的token(对应于一个非叶子结点)组成，如下图红框标出的部分。

定义2：
给定statement $s_{i,j}$ ，定义

code element $e_{i,j,z} = \{t_{i,j,u},..., t_{i,j,v}\}, 1 \leq u \leq v \leq w_{i,j}$ 。
漏洞语法特征集合 $\{h_k\}_{1 \leq k \leq \beta}$ ， $\beta$ 为漏洞特征数量。 $H$ 的生成用到了checkmarx

提取SyVCs采用以下步骤

可以看到用了一个三层循环

2.2.SyVCs转换为SeVCs

SyVCs转换为SeVCs需要用到program slice技术，这就用到了程序依赖图（PDG），PDG又用到了数据依赖图（data dependency）和控制依赖图（control dependency）。

2.2.1.定义

给定程序源代码 $P = \{f_1, .., f_n\}$ ，对于函数 $f_i$ 。

$f_i$ 的CFG（控制流图）为图 $G_i(V_i, E_i)$ 。 $V_i = \{n_{i,1}, .., n_{i, c_i}\}$ 每个结点 $n_{i,j}$ 表示一个statement或者一个control predicate（不太理解这个概念）， $E_i = \{\epsilon_{i,1},..., \epsilon_{i, d_i}\}$ 中每个边 $\epsilon_{i,j}$ 表示结点之间的控制流向。
$f_i$ 的数据依赖：给定 $f_i$ 的CFG $G_i$ 。若其中2个结点 $n_{i,j}$ 和 $n_{i,l}$ 有下面关系， $n_{i,l}$ 计算出的值在 $n_{i,j}$ 中用到了。那么 $n_{i,j}$ 就数据依赖于 $n_{i,l}$ 。
$f_i$ 的控制依赖：这部分有点绕。给定 $f_i$ 的CFG $G_i$ 。若其中2个结点 $n_{i,j}$ 和 $n_{i,l}$ 有下面关系
- 从 $n_{i,l}$ 到程序结尾的所有路径（对任意的）都会经过 $n_{i,j}$ ，那么 $n_{i,j}$ 后支配（post-dominates） $n_{i,l}$ 。
- 存在一条从 $n_{i,l}$ 到 $n_{i,j}$ 的路径，并满足(1) $n_{i,j}$ 后支配路径上除了 $n_{i,j}$ 和 $n_{i,l}$ 的所有结点。(2) $n_{i,j}$ 不后支配 $n_{i,l}$ ，则 $n_{i,j}$ 控制依赖于 $n_{i,l}$ 。
$f_i$ 的程序依赖图（PDG）： $f_i$ 的程序依赖图为 $G_i^{'}(V_i, E_i^{'})$ ， $V_i$ 和CFG的 $V_i$ 一样。 $E_i^{'}$ 中每条边为一个控制依赖或者数据依赖。

生成PDG时作者用到了Joern

$f_i$ 的SyVC中code element $e_{i,j,z}$ 的前向切片（forward slice） $fs_{i,j,z} = \{n_{i,x_1},...,n_{i,x_{μ_i}}\} \subseteq V_i$ 。其中的结点来自于从结点 $e_{i,j,z}$ （也是一个PDG的结点）开始能遍历到的所有结点
$f_i$ 的SyVC中code element $e_{i,j,z}$ 的后向切片（backward slice） $bs_{i,j,z} = \{n_{i,y_1},...,n_{i,y_{v_i}}\} \subseteq V_i$ 。其中的结点来自于以结点 $e_{i,j,z}$ （也是一个PDG的结点）结束的路径中的所有结点。
code element $e_{i,j,z}$ 过程间前向切片（interprocedural forward slice） $fs_{i,j,z}^{'}$ 通过函数调用可达的一系列结点
code element $e_{i,j,z}$ 过程间后向切片（interprocedural backward slice） $bs_{i,j,z}^{'}$ 中的每个结点可通过函数调用到结点 $e_{i,j,z}$ 。

SyVC的程序切片（Program Slice） $ps_{i,j,z}$ 由 $fs_{i,j,z}^{'}$ 和 $bs_{i,j,z}^{'}$ 合并得到。

定义SeVC：

给定函数 $f_i$ 中 statement $s_{i,j}$ 的code element $e_{i,j,z}$ 的 SeVC为 $\delta_{i,j,z} = \{s_{a_1,b_1},...,s_{a_{v_{i,j,z}},b_{v_{i,j,z}}}\}$ ， $s_{a_p,b_q}$ 与 $e_{i,j,z}$ 存在控制或数据依赖

SeVC按如下算法产生

示例

2.3.SeVCs向量化

2.3.1.符号化

与VulDeePecker一样，采用以下步骤符号化SeVC

删除非ascii码字符和注释
用户自定义变量名映射
将用户自定义的变量名映射为 V1, V2这类符号化后的变量名
用户自定义函数名映射
将用户自定义的函数名映射为 F1, F2这类符号化后的函数名

2.3.2.向量化

和VulDeePecker一样，作者先用词法分析器将SeVC解析为token序列，之后用Word2Vec向量化token，之后用了多种神经网络模型（CNN,RNN,Bi-LSTM,Bi-GRU等）向量化序列并分类（分类是针对SeVC而不是Program或者function）

3.μVulDeePecker

针对VulDeePecker的改进主要是可以识别出code gadget包含的漏洞种类，并改进了code gadget的提取方式，并同时提取一个code attention。这里作者同样只分析库函数调用引起的漏洞（library/API function call）

参考文献

[1] Li Z , Zou D , Xu S , et al. VulDeePecker: A Deep Learning-Based System for Vulnerability Detection[J]. 2018.

[2] SySeVR: A Framework for Using Deep Learning to Detect Software Vulnerabilities[J]. IEEE Transactions on Dependable and Secure Computing, 2021, PP(99):1-1.

[3] Zou D , Wang S , Xu S , et al. $\\u$ VulDeePecker: A Deep Learning-Based System for Multiclass Vulnerability Detection[J]. arXiv e-prints, 2020.

Centos离线安装gcc 为什么要做囚徒 linux运维 linux centos linux 运维
文章目录Centos离线安装gcc1.gcc是什么？2.gcc下载地址3.gcc的安装4.安装结果验证Centos离线安装gcc1.gcc是什么？GCC（GNUCompilerCollection）是GNU项目下的开源编译器套件，主要用于将C、C++等编程语言的源代码编译成可执行程序或库2.gcc下载地址gcc整体打包下载地址CentOS-7所有rpm包的仓库地址：bzip2-devel-1.0.
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
vscode连接远程服务器docker里的容器--使用remote ssh 欢仔要学习 python 学习 ubuntu
背景介绍：因为工作的原因，图像相关，模型训练，需要在服务器上面搞，同时，服务器上面的环境配置，全部使用的是docker创建容器的方式。但是呢，之前没有配置好服务器与本机的交互环境，每次更改代码，要上传，下载，很不方便，同时图片也没办法可视化。很不友好。于是就想要使用vscode来连接远程服务器docker；因为docker创建的那个容器相当于是一台ubuntu主机，配置好端口，然后我们从外面去连接
PyCINRAD 安装和配置指南颜欢钰Edith
PyCINRAD安装和配置指南PyCINRADDecodeCINRAD(ChinaNewGenerationWeatherRadar)dataandvisualize.项目地址:https://gitcode.com/gh_mirrors/py/PyCINRAD1.项目基础介绍和主要编程语言项目基础介绍PyCINRAD是一个开源的气象雷达数据处理和可视化库，专门用于解码中国新一代天气雷达（CINR
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
windows下使用vscode+cline插件体验MCP，体验使用AI控制浏览器，踩坑记录（至少让你节省3个小时弯路版）（喂饭级别）几道之旅人工智能智能体及数字员工 windows vscode ide 人工智能
为什么网上天天说MCP，你这儿却一点动静都没有？1️⃣人家很早之前就用上了制定标准的Claudedesktop，这玩意儿在咱这儿用不了。对策：使用vscode+cline+deepseek（或其它同级别国产大模型deepseek-V3其实有时比R1效果还好）2️⃣人家也Claude，但人家能用Cursor，咱太穷了，用不了。对策：使用vscode+cline+deepseek（或其它同级别国产大模
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
VS Code | 如何快速重启VS Code？默默提升实验室神兵利器 visual studio code
如何快速重启VSCode？安装完插件后，有些时候需要重启才会生效，但是每次都关闭再打开就有点不舒服了。快捷键：CTRL+SHITF+P，打开：“命令面板”，输入即可：> ReloadWindow
深入探索 dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁郁铎舒
深入探索dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁dubbo-rpc-jsonrpcApacheDubbo-rpc-jsonrpc是一个用于ApacheDubbo的JSON-RPC协议实现项目。它提供了一个用于ApacheDubbo的JSON-RPC协议实现库和工具。适合用于在应用程序中处理分布式服务。项目地址:https://gitcode.com/gh_mirrors/dub
成为编程大佬！！-----＞数据结构与算法（2）——顺序表！！ Elnaij 算法数据结构 c语言
前言：线性表是数据结构与算法的重中之重，所有具有线性逻辑结构的数据结构，都能称为线性表。这篇文章我们先来讨论线性表中的顺序表，顺序表和线性表都是后续实现栈，树，串和图等等结构的重要基础。目录❀简单介绍线性表❀顺序表❀顺序表的存储❀动态存储❀静态存储❀静态存储与动态存储的优缺点❀顺序表操作❀1.初始化顺序表❀2.销毁顺序表❀3.插入数据❀插入数据之判断已满否❀插入操作之尾插❀插入操作之头插❀插入数据
基于C语言的数据结构之串——带你熟练掌握串的基本操作！！超级详细！！ Elnaij 数据结构 c语言算法
目录前言1.数据结构——串1.1基本知识主串、子串、模式串1.2对几个字符串库函数的简单介绍1.2.1strcmp1.2.2strcpy1.2.3strlen1.2.4strcat1.3串的分类1.3.1静态分配内存的串1.3.2动态分配内存的串2.串的基本操作2.1初始化串2.2输出字符2.3插入子串2.4删除子串2.5取子串操作2.6撤销删除操作结束语前言掌握串之前最好先去学习好顺序表和单链表
C++与C语言的区别 @haihi c++c语言开发语言
前言本文主要用C语言和C++做对比来学习C++，便于个人理解。C++包含C语言，是对C语言的扩展，在C++中，支持C语言的语法使用，C++是C语言的超集一、C++与C语言的区别C语言简单高效，适合低级系统编程和硬件相关的开发。C++更加灵活、强大，适合大型项目开发，尤其是需要面向对象、代码复用和复杂数据结构的应用。1.编程范式C语言：C是一种过程式编程语言，主要关注函数和过程。程序是通过一系列函数
HarmonyOS开发，A持有B，B引用A的场景会不会导致内存泄漏，代码示例告诉你答案 MardaWang HarmonyOS NEXT OpenHarmony harmonyos 华为
问题：A持有B，B引用A的场景会不会导致内存泄漏？答案：方舟虚拟机的内存管理和GC采用的是根可达算法，根可达算法可以解决循环引用问题，不会导致A引用B，B引用A的内存泄漏。根可达算法原理根可达算法以一系列被称为“根对象”（如栈中的局部变量、静态变量等）作为起始点，从这些根对象开始向下搜索，能够被搜索到的对象被认为是可达对象，而那些无法被搜索到的对象则被判定为不可达对象，会在垃圾回收时被清理。所以，
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
Apache Storm实时流处理的核心技术 Hello.Reader 大数据 apache storm 大数据
1.引言ApacheStorm是一个开源的、分布式的实时计算系统，专为处理流式数据而设计。它能够处理大量数据流并在极低的延迟下提供实时的结果。相比于传统的批处理系统，Storm具有处理无限数据流的能力，支持非常高的可扩展性和容错机制。Storm可以适用于多种编程语言，具有高度的灵活性。1.1什么是ApacheStorm？ApacheStorm是一个流处理引擎，它可以持续处理不断到来的数据流（str
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
Python列表与元组的深度剖析 jijihusong006 程序 python windows 开发语言
Python列表与元组的深度剖析：从底层实现到应用场景的全方位对比一、核心差异概览Python教程https://pan.quark.cn/s/7cefe3163f45传送代资料库https://link3.cc/aa99特性列表(List)元组(Tuple)可变性可变(Mutable)不可变(Immutable)语法表示方括号[]圆括号()内存占用较大(动态数组结构)较小(静态数组结构)哈希支持
推荐开源项目：Tower - 网络服务构建利器劳治亮
推荐开源项目：Tower-网络服务构建利器towerasyncfn(Request)->Result项目地址:https://gitcode.com/gh_mirrors/to/towerTower是一个为构建强大、模块化和可重用的网络客户端和服务端组件库。这个库以其高效且易于使用的特性，为开发者提供了一种便捷的方式去构建可靠的网络应用。项目介绍Tower面向的是那些希望简化网络通信复杂性的开发者
推荐项目：yaml-pro，提升你的YAML编辑体验余靖年Veronica
推荐项目：yaml-pro，提升你的YAML编辑体验项目地址:https://gitcode.com/gh_mirrors/ya/yaml-pro在日常的开发工作中，YAML作为配置文件的宠儿，其简洁明了的语法深受开发者喜爱。然而，当面对复杂或庞大的YAML文件时，高效的编辑工具就显得至关重要。因此，我们强烈推荐一款专为Emacs用户设计的开源神器——yaml-pro，它利用tree-sitter
探索电商大数据的艺术：TBBKAnalysis深度解读与应用推荐洪显彦Lawyer
探索电商大数据的艺术：TBBKAnalysis深度解读与应用推荐TBBKAnalysis关于淘宝“爆款”数据爬取与分析。具体分析见—项目地址:https://gitcode.com/gh_mirrors/tb/TBBKAnalysis在数字化时代的数据洪流中，每一个细微的数据点都蕴含着洞察未来的机遇。今天，我们要探讨的是一个独特且极具启发性的开源项目——TBBKAnalysis。该项目源自知乎上一
【H2O2 | 软件开发】前端深拷贝的实现过期的H2O2 【H2O2】全栈面试题 javascript 开发语言 ecmascript 前端
目录前言开篇语准备工作正文概述JSON方法递归其他结束语前言开篇语本系列为短篇，每次讲述少量知识点，无需一次性灌输太多的新知识点。该主题文章主要是围绕前端、全栈开发相关面试常见问题撰写的，希望对诸位有所帮助。如果您需要为面试八股文做准备，笔者建议重点关注加粗强调部分，它们是概念中的关键词。准备工作软件：【参考版本】VisualStudioCode系统版本：Win10/11正文概述概括地来说，前端实
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
什么是Apache Avro？ maozexijr apache
什么是ApacheAvro？ApacheAvro是一个开源的数据序列化框架，主要用于高效的数据交换和存储。它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。核心特性跨语言支持Avro支持多种编程语言（如Java、Python、C++、Go等），使得不同语言之间的数据交换变
计算机毕业设计PHP保利和院物业服务管理系统小程序（源码+程序+uni+lw+部署）计算机专业毕设程序课程设计 php 小程序
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
单例模式 (Singleton Pattern) 直隶码农二十三种设计模式单例模式 c++设计模式
单例模式(SingletonPattern)是一种创建型设计模式，确保一个类只有一个实例，并提供一个全局访问点。一、基础1.意图确保一个类只有一个实例。提供一个全局访问点。2.适用场景一个类只需要一个实例来协调系统行为时，例如数据库连接池，线程池、缓存、日志对象等。需要控制实例数目，节省系统资源，避免重复创建和浪费，同时保证数据的一致性和正确性。3.结构一个静态成员变量一个私有构造函数一个静态方法
人工智能的未来：从基础到前沿的探索与展望小二爱编程· 人工智能 ai AI编程 AI写作 AI作画
1.人工智能简介内容概述：人工智能（AI）是指模拟和执行人类智能任务的技术。随着计算能力和数据量的增加，AI在各个领域取得了显著进展，从自动化的基本任务到解决复杂的实际问题，人工智能正渗透到我们生活的各个方面。2.人工智能的种类与发展内容概述：AI的种类可以按智能的复杂度分为三大类：弱人工智能（NarrowAI）：目前大多数应用都属于弱AI，如语音助手、自动驾驶等。它们专注于特定任务，并且无法扩展
Autoformer 架构详细解释及举例说明 six.学长 autoformer 人工智能
Autoformer架构详细解释上述图片展示了Autoformer架构的工作流程，包含编码器和解码器的结构。我们来详细解析图中的各个组件及其功能：编码器部分（AutoformerEncoder）输入数据（EncoderInput）：输入的是需要预测的时间序列数据。自动相关机制（Auto-Correlation）：这个模块通过检测时间序列中的周期性依赖关系，生成相关矩阵（K,Q,V表示键、查询和值）
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR