Mindtechnist

人工智能软件系统的非功能属性及其质量保障方法综述

随着神经网络等技术的快速发展, 人工智能被越来越多地应用到安全关键或任务关键系统中, 例如汽车自
动驾驶系统、疾病诊断系统和恶意软件检测系统等. 由于缺乏对人工智能软件系统全面和深入的了解, 导致系统
时常发生严重错误. 人工智能软件系统的功能属性和非功能属性被提出以加强对人工智能软件系统的充分认识和
质量保障. 经调研, 有大量研究者致力于功能属性的研究, 但人们越来越关注于人工智能软件系统的非功能属性.
为此, 专注于人工智能软件系统的非功能属性, 调研了 138 篇相关领域的论文, 从属性定义、属性必要性、属性示
例和常见质量保障方法几个方面对目前已有的研究工作进行系统的梳理和详细的总结, 同时重新定义和分析了非
功能属性之间的关系并介绍了人工智能软件系统研究中可以用到的开源工具. 最后, 展望了人工智能软件系统非
功能属性的未来研究方向和挑战, 以期为该领域的研究人员提供参考.
关键词: 人工智能软件系统; 非功能属性; 质量保障; 神经网络
中图法分类号: TP311
中文引用格式: 叶仕俊, 张鹏程, 吉顺慧, 戴启印, 袁天昊, 任彬. 人工智能软件系统的非功能属性及其质量保障方法综述. 软件学
报, 2023, 34(1): 103-129. http://www.jos.org.cn/1000-9825/6409.htm
英文引用格式: Ye SJ, Zhang PC, Ji SH, Dai QY, Yuan TH, Ren B. Survey on Non-functional Attributes for AI-enabled Software
Systems and Quality Assurance Methods. Ruan Jian Xue Bao/Journal of Software, 2023, 34(1): 103-129 (in Chinese). http://www.jos.
org.cn/1000-9825/6409.htm
Survey on Non-functional Attributes for AI-enabled Software Systems and Quality
Assurance Methods
YE Shi-Jun, ZHANG Peng-Cheng, JI Shun-Hui, DAI Qi-Yin, YUAN Tian-Hao, REN Bin
(College of Computer and Information, Hohai University, Nanjing 211100, China)
Abstract: With the rapid development of neural network and other technologies, artificial intelligence has been widely applied in safety-
critical or mission-critical systems, such as autopilot systems, disease diagnosis systems, and malware detection systems. Due to the lack of
a comprehensive and in-depth understanding of artificial intelligence software systems, some errors with serious consequences occur
frequently. The functional attributes and non-functional attributes of artificial intelligence software systems are proposed to enhance the
adequate understanding and quality assurance of artificial intelligence software systems. After investigation, a large number of researchers
are devoted to the study of functional attributes, but people are paying more and more attention to the non-functional attributes of artificial
intelligence software systems. This paper investigates 138 papers in related fields, systematically combs the existing research results from
the aspects of attribute necessity, attribute definition, attribute examples, and common quality assurance methods, and summarizes the
research work on non-functional attributes of artificial intelligence software systems. At the same time, a summary and relationship
analysis are presented on the non-functional attributes of artificial intelligence software systems. The open source tools that can be used in
the research of artificial intelligence software system are surveyed. Finally, the thoughts on potential future research directions and
challenges are summarized on non-functional attributes of artificial intelligence software systems, which, hopefully, will provide references

基金项目: 国家重点研发计划 (2018YFC0407901); 江苏省自然科学基金 (BK20191297); 中央高校基本科研业务费 (B210202075)
收稿时间: 2020-12-17; 修改时间: 2021-03-15, 2021-06-17; 采用时间: 2021-06-29; jos 在线出版时间: 2021-08-03
CNKI 网络首发时间: 2022-11-15
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: [email protected]
Journal of Software,2023,34(1):103−129 [doi: 10.13328/j.cnki.jos.006409] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
for researchers interested in the related directions.
Key words: artificial intelligence software systems; non-functional attributes; quality assurance; neural network
随着计算机硬件、云计算和移动互联等领域的重大突破, 人工智能 (artificial intelligence, AI) 被逐渐应用于包
括癌细胞识别、农业土壤监测、广告精准投放、金融欺诈识别、信用评价以及自动驾驶汽车等 [1]安全关键或任
务关键系统中. 本文将这类模拟人的某些思维过程进行学习、推理、规划、思考等智能行为的系统统称为人工智
能软件系统. 人工智能软件系统具有较为复杂的结构, 如数字图片识别系统中一个简单的 4 层卷积神经网络就具
有超过 13 000 个参数, 一些人类无法发现的微小扰动就有可能导致神经网络出现相反的判断. 不幸的是, 由于缺乏
对人工智能软件系统的全面认识和评估标准, 导致在高风险应用中时常发生一些重大错误, 引起了人们对于人工
智能软件系统质量保障问题的关注和研究.
研究者从人工智能软件系统的分析、测试、验证等方面对人工智能软件系统的质量保障进行了探索 [2]. 依据
测试、验证的结果, 研究人员可以有依据、有方向地提出保障思路. 当前, 针对人工智能软件系统相比传统软件存
在的差异问题, 研究人员对传统软件测试方法进行改进和创新, 产生了各式各样的测试方法. 如 Pei 等人提出了一
种深度学习系统白盒测试方法——DeepXplore[3], 该方法通过使用生成的测试用例对模型进行重新训练来提高模
型的准确率, Pei 等人在实验中首次使用神经元覆盖率作为对抗性样本生成的度量指标, 同时他们以错误行为发现
次数和训练数据污染抵抗能力作为模型度量指标; Cisse 等人引入一种名为 Houdini 的对抗性示例生成方法 [4], 该
方法可基于语音识别、自然语言处理等应用模型的测试评估指标生成对抗性示例, 并且在实验中使用 PCKh
(percentage of correctly detected keypoints)、结构相似性指数 (structural similarity index, SSIM) 和可感知性
(perceptibility) 作为模型方法的度量指标; Kurakin 等人利用快速梯度符号法 (fast gradient sign method, FGSM)、基
础迭代法 (basic iterative method, BIM)、最相似迭代法 (iterative least-likely class method, ILCM) 等算法生成对抗
性样本 [5], Kurakin 等人还将所生成的对抗性样本打印并通过模拟真实世界中的目标分类场景进行测试, 并在实验
中使用重构率 (destruction rate) 作为模型性能的度量指标.
测试、验证等方法多样化的同时也产生了系统评估标准不统一的问题, 为此研究人员在基于传统软件评估指
标基础上逐渐形成了人工智能软件系统的属性指标. 该指标的提出一方面加强了从业人员对人工智能软件系统的
认知, 另一方面提高了人工智能软件系统的质量保障力度. 人工智能软件系统的软件属性是指其为帮助用户实现
目标或处理问题所需要的条件, 也是人工智能软件系统及其组件要满足标准和规范所要具备的要求. 这些属性指
标对人工智能软件系统的性能维护和质量保障起到指向性的重要作用, 具体可分为功能属性 (functional attributes,
FAs) 和非功能属性 (non-functional attributes, NFAs). 其中功能属性描述系统功能, 它是指人工智能软件系统为实
现用户需求和业务需求所必须具备的能力. 而非功能属性反映系统质量、特性和约束. 作为功能属性的补充, 非功
能属性是依赖于功能属性而存在的属性, 它们紧密约束和限制着人工智能软件系统, 对系统的质量保障具有非常
重要的作用.
对人工智能软件系统使用非功能属性指标进行评估能指出系统存在的不足; 即人工智能软件系统需要在什么
方面改进才能保障系统模型的质量. 当前研究中, 包括文献 [6,7] 在内的一些工作对人工智能软件系统的功能属性
已进行一定程度的概括, 但尚且缺乏对非功能属性进行系统研究的相关工作. 为了填补这个空白, 本文将以人工智
能软件系统非功能属性作为研究对象, 如图 1 所示, 详细地总结包含鲁棒性、安全性、数据隐私性、公平性、可
解释性和可用性在内的非功能属性.
目前王赞等人 [1]、Zhang 等人 [6]和 Vinayagasundaram 等人 [7]在针对人工智能领域的测试工作进行系统总结的
同时, 对人工智能软件系统的非功能属性也进行了一定程度的讨论. 王赞等人从包括测试度量指标在内的多个角
度来系统梳理深度神经网络测试的相关工作; Zhang 等人从范围更广的机器学习测试方面进行总结, 对机器学习
测试流程、测试组件、测试属性和应用场景等部分作出总结; Vinayagasundaram 等人则从整个人工智能软件系统
的体系结构角度对度量标准进行定义, 以衡量系统软件质量. 此外还有 Gilpin 等人 [8]和 Mehrabi 等人 [9]对人工智能
软件系统的单个非功能属性进行系统地梳理和说明. 令人遗憾的是, 这几项相关工作的内容主要讲述人工智能研
104 软件学报 2023 年第 34 卷第 1 期
究领域的测试和人工智能的体系结构, 对人工智能非功能属性的研究并未形成系统、有效的覆盖性总结. 本文将
关注人工智能软件系统的非功能属性. 如图 2 所示, 将从属性定义、属性必要性、非功能属性的示例以及常见质
量保障方法几个方面系统地梳理人工智能软件系统中常见的非功能属性. 其中, 属性定义以文字描述和公式表示
两种形式给出非功能属性的定义; 属性必要性讲述非功能属性在人工智能软件系统开发中的重要性; 属性示例中
以汽车自动驾驶系统等例子来呈现非功能属性; 常见质量保障方法部分总结现有的人工智能软件系统非功能属性
的质量保障方法和研究思路. 本文还将对非功能属性之间的关系进行定义和总结分析, 并展望人工智能软件系统
非功能属性的未来研究方向和挑战, 以期为该领域的研究人员提供参考.
为了对该研究问题进行系统的梳理和分析, 本文首先将“Non-Functional Attributes/Properties for Artificial
Intelligence”“Robustness/Security/Data Privacy/Fairness/Interpretability/Usability of Artificial Intelligence”等设为搜索
关键词, 在国内外重要的学术搜索引擎 (例如 Google 学术搜索、Springer、DBLP、CiteSeerX、CNKI 等) 中检索
出相关论文; 随后, 我们筛选并移除了与该综述问题无关的论文. 有 3 名熟悉人工智能软件系统的研究人员参与了
这一过程, 并通过讨论来消除分歧; 接着, 通过查阅论文中的相关工作和研究人员的已发表的论文列表, 以及通过
已搜索到的文献的引用和被引用获取更多相关论文; 本文最终确定并引用了有关论文 138 篇. 论文的发表时间概
况如图 3 所示, 最终所选中的论文有 75 篇发表在 CCF 评级为 A, B 的各领域顶级期刊和会议上, 其中人工智能领
域 (38 篇)、软件工程及系统和程序设计语言领域 (15 篇)、计算机科学理论领域 (1 篇)、网络与信息安全领域
(18 篇)、计算机体系结构及平行分布计算和存储系统领域 (1 篇)、数据库及数据挖掘和内容检索领域 (1 篇)、人
机交互与普适计算领域 (1 篇). 除此之外, 本文引用的文献还包括 arXiv (17 篇)、CCF 评级为 C 类会议期刊论文
(7 篇)、软件学报 (2 篇)、其他 CCF 未收录的会议和期刊论文 (32 篇) 和相关书籍 (5 本). 图 4 展示了不同非功能
属性的论文分布情况.棒性
安全性
数据隐私性
公平性
可解释性
可用性
人
工
智
能
软
件
系
统
功
能
属
性
图 1 人工智能领域常见非功能属性功能属性
属性定义
属性必要性
属性示例
常见质量保
障方法图 2 非功能属性研究范畴50
41
12
21 21 23 20
40
30
文献数量
20
10
0
年份
2000- 2016 2017 2018 2019 2020
2015
图 3 论文发表时间概况棒性
公平性
可解释性
安全性
数据隐私性
可用性
14%
15%
20%
11%
23%
17% 图 4 不同非功能属性研究工作占比
叶仕俊等: 人工智能软件系统的非功能属性及其质量保障方法综述 105
本文第 1 节从属性定义、属性必要性、示例和常见质量保障方法几个方面对人工智能软件系统的非功能属
性进行详细的总结梳理; 第 2 节对人工智能软件系统非功能属性进行归纳, 并对它们之间存在的关系进行探讨;
第 3 节对本文所列举的人工智能软件系统非功能属性的现有工具或开源项目进行总结; 第 4 节总结全文, 并展望
非功能属性的未来研究方向和挑战.
1 人工智能软件系统非功能属性
在人工智能软件系统发展前期, 人们过于关注人工智能软件系统的功能属性, 从而对于非功能属性的认知远
远低于功能属性, 这不利于对人工智能软件系统的认知和保障工作. 近年来, 人们越来越关注非功能属性的研究,
将其作为人工智能软件发展的新突破.
常见的人工智能软件系统功能属性有正确性 (correctness) 和过拟合程度 (overfitting). 正确性是系统能够正确
处理各种输入并产生正确输出的能力 (概率)[6]. 正确性的研究主要集中于数据 [10]、模型 [11]和统计方法 [12,13]这 3 个
方面. 过拟合程度是衡量模型算法由于过度的拟合当前可用数据而导致无法很好地拟合未来数据或者可靠地
预测未来结果的程度指标 [14]. 关于过拟合的研究主要集中于产生过拟合的原因 (复杂的模型 [15]、稀疏的样
本 [16−18]) 以及模型过拟合验证 [19,20]两个方向.
功能属性描述了人工智能软件系统所具有的实现各种需求的能力. 而非功能属性依赖于功能属性, 是系统特
性和约束的表征. 人工智能软件系统常见的非功能属性有鲁棒性、安全性、数据隐私性、公平性、可解释性和可用
性等. 本节将以属性定义、属性必要性、属性示例和常见质量保障方法 4 个方面对以上非功能属性进行详细的阐述.
1.1 鲁棒性
1.1.1 鲁棒性定义
当前, 不同的研究对鲁棒性 (robustness) 有不同的定义.#(S )E(#(S ))
(1) 鲁棒性在 IEEE 软件工程标准术语中定义为 [21,22]: “在无效输入或者压力环境下, 系统或者系统组件可以正
确运行的程度.” 借鉴这一定义, 用公式 (1) 给出鲁棒性在人工智能软件系统中的定义; 假设 S 为人工智能软件系统;
E(S) 是 S 的正确性; 是对人工智能软件系统 S 的任意组件 (例如数据、学习程序或者框架) 经过干扰后的系
统, 则人工智能软件系统 S 的鲁棒性 r 就是 E(S) 和之差的度量, 即:r = E(S ) - E(#(S )) (1)
因此, 鲁棒性衡量了人工智能软件系统对干扰的抵抗能力.
(2) Huber 从统计学的角度系统地给出了鲁棒性 3 个层面的概念 [23]:
① 对于人工智能软件系统中所有学习模型的基本要求; 模型具有较高的精度或有效性;
② 对于模型所出现的较小偏差, 只能对算法性能产生较小的影响 (主要是噪声, noise);
③ 对于模型所出现的较大偏差, 不可对算法性能产生“毁灭性”的影响 (主要是离群点, outlier).
(3) 对抗鲁棒性是鲁棒性的常见类别, 其主要利用对抗性输入来增强系统的鲁棒性. 参照 Katz 等人 [24]的工作
可将对抗鲁棒性分为局部对抗鲁棒性和全局对抗鲁棒性如公式 (2), 公式 (3) 所示.
首先是局部对抗鲁棒性, 假设: x 是人工智能学习模型 h 的一个测试输入; x’是通过对 x 进行对抗扰动而生成
的另一个测试输入; h(x) 和 h(x’) 是 x、x’在模型 h 上的输出. 对于任意 x’如果满足公式 (2), 则称模型 h 在输入 x 处
是 -局部鲁棒性的.∀x’ : ||x - x’||p ≤ → h(x) = h(x’) (2)
局部对抗鲁棒性要求在给定输入的领域内的所有样本都使用相同的标签进行分类. 换言之, 局部对抗鲁棒性
所关注的是对一个特定测试输入的鲁棒性, 而全局对抗鲁棒性是针对所有输入的鲁棒性."
全局对抗鲁棒性定义如下, 假设: x 是人工智能学习模型 h 的一个测试输入; x’是通过对 x 进行对抗扰动而生
成的另一个测试输入; h(x) 和 h(x’) 是 x、x’在模型 h 上的输出. 如果任意的 x 和 x’满足公式 (3), 则称模型 h 是 -全
局鲁棒性的:
106 软件学报 2023 年第 34 卷第 1 期
∀x; x’ : ||x - x’||p ≤ → h(x) - h(x’) ≤ " (3)上述工作皆表明: 与正确性和过拟合程度不同, 鲁棒性是衡量系统在存在噪声干扰下的正确性 [6,25], 即一个具
有优异鲁棒性的系统在噪声干扰下应该能够很好地抵抗干扰、保持自身性能.
1.1.2 鲁棒性必要性
鲁棒性是人工智能软件系统的一种重要非功能属性 [26,27]. 随着人工智能逐渐在决策和自主系统中扮演至关重
要的角色, 例如在自动驾驶系统、恶意软件检测系统和医疗诊断系统中, 人工智能软件系统被发现在测试和应用
中时常由于环境、输入等因素的变化导致系统出错. 正如 Hamon 等人的工作提出; 当前正在开发的人工智能系统
距离实现自治系统所具有的最低鲁棒性、安全性要求还很遥远 [28]. 如何提高系统鲁棒性以减少系统出错成为亟
待解决的问题.
1.1.3 鲁棒性示例
为更清楚地解释鲁棒性, 本文以汽车自动驾驶系统 (autonomous driving system, ADS) 为示例. PC Magazine 将
自动驾驶汽车定义为“由计算机控制的自动驾驶的汽车”[29]. 自动驾驶系统被应用于汽车上来保证在无人操作情况
下, 汽车能够感知周围环境并且安全行驶. 关于自动驾驶系统的研发试验始于 20 世纪 20 年代, 并于 1977 年成功
在日本实验了第一款半自动汽车. 近年来, 快速发展的自动驾驶汽车呈现出实用化趋势.
就在人们欣喜于汽车自动驾驶系统的市场化时, ADS 却经常暴露一些致命漏洞. 自动驾驶系统中的识别功能
是汽车行驶过程中所做决策的重要依据之一, 包括了标志识别、人物识别和道路识别等. 但本田汽车公司所研发
的汽车自动驾驶系统在一次测试中被发现; 日本拉面“天下一品”的商标和交通标志“禁止驶入”会被汽车错误识别
为同一种标识; 在 2018 年亚利桑那州所发生的无人驾驶汽车致命事故 [30]中, 系统模型将行人错误地识别为物体,
从而导致了错误的行驶决策. 本节所要研究的鲁棒性就是能够表示系统在干扰环境下维持本身正确性的属性.
1.1.4 常见质量保障方法
当前人工智能软件系统鲁棒性质量保障的主流方法为对抗学习, 依据现有的工作可以将对抗学习分为以下
2 种.
(1) 对抗性样本生成
基于 Szegedy 等人 [31]和 Wang 等人 [32]的工作, 攻击者通常可以通过对少量正确标记的输入进行扰动来构造使
系统错误输出的输入, 这些输入被称之为对抗性样本. 现有的方法大都是通过研究和构造对抗性样本来增强系统
模型的鲁棒性 [33−35]. Carlini 等人 [36]依据距离度量方法创建了一组攻击样本, 该方法对当前多种防御方法具有很强
的攻击能力; Tjeng 等人 [25]提出使用测试输入与其最接近的对抗示例之间的距离来衡量鲁棒性.
(2) 对抗性学习训练
这类方法通过在人工智能软件系统模型优化过程中增加噪声、随机性或对抗性损失来实现, 目的是使训练后
的模型更加鲁棒. 比如 Gao 等人通过识别和删除 DNN 模型中不必要的功能来限制攻击者生成对抗性样本的能
力 [37]; Cheng 等人通过对抗稳定性训练来提高 NMT 模型的鲁棒性 [38,39], 他们对神经机器翻译模型 (neural machine
translation, NMT) 中的编码器和解码器加入词汇级别和特征级别的扰动, 训练的结果显示 NMT 的鲁棒性和翻译
性能被大幅度地提升; Gehr 等人 [40]和 Ross 等人 [41]分别使用经典抽象解释和输入梯度正则化来增强模型的鲁棒性
和可解释性; Kwiatkowska 等人 [42]对深度神经网络的对抗性扰动进行研究, 他们介绍了针对深度神经网络所开发
的自动验证和测试技术并利用该技术确保模型决策在有限输入扰动时的安全性和鲁棒性.
除对抗学习外, 还包括对人工智能软件系统鲁棒性建模和构建指标的方法. 比如 Fawzi 等人 [43]对一般噪声情
况下非线性分类器的鲁棒性进行了首次定量分析并证明了实验结论对于各种最新 DNN 和数据集的优异泛用性;
Bastani 等人 [44]提出了 3 种用于度量神经网络鲁棒性的指标, 并基于鲁棒性编码的线性程序设计了一种新算法来
近似这些指标; Banerjee 等人 [45]探索了使用贝叶斯深度学习来建模深度神经网络内部的误差传播, 从而在不进行
大量故障注入实验的情况下, 对神经网络对硬件错误的敏感性进行数学建模.
现有的针对人工智能软件系统鲁棒性的质量保障方法研究仍然存在一些方面的问题. 一方面是方法的研究方
向比较单一, 主要的研究基本聚焦于通过对抗学习来提升系统的鲁棒性, 同时大部分研究在关于对抗攻击、数据
叶仕俊等: 人工智能软件系统的非功能属性及其质量保障方法综述 107
集规模和消耗时间的权衡上也存在不足; 另一方面, 无论是对抗性样本的生成过程还是在对抗学习的训练过程中,
研究者们提出的算法过于地依赖某个特定的模型或环境, 虽然在该模型上能取得较好的效果, 但是算法在其泛用
性和迁移性上存在一定的问题.
1.2 安全性
1.2.1 安全性定义
Zhang 等人在其工作中将安全性定义为 [6]: 人工智能软件系统的安全性 (Security) 是指系统抵御通过操纵或
非法访问模型学习组件造成的潜在伤害、危险或损失的能力.
同鲁棒性相似的是, 安全性也存在抵御外部攻击的要求; 不同的是, 鲁棒性是衡量系统受干扰后保持自身正确
性的能力, 安全性则衡量保护系统内部组件不受破坏或降低破坏程度的能力. 也就是说, 鲁棒性的衡量将依据噪声
等因素干扰下系统的正确性的程度, 而系统安全性的评估则更多地依赖于外部攻击对模型本身的破坏程度.Seval(S )S(S )eval(S )eval((S ))
人工智能软件系统的安全性公式定义如公式 (4) 所示, 假设: 为人工智能软件系统; 是系统的安全
评估函数; 是被操纵或非法访问系统模型学习组件 (例如数据、学习程序或者框架) 之后的人工智能软件系统;
则系统的安全性为和之差的度量:s = eval(S ) - eval((S )) (4)
1.2.2 安全性必要性
自动驾驶汽车的市场化虽然令人期待, 但目前的自动驾驶系统仍然存在许多问题, 包括系统无法在任意环境
中保持绝对的决策正确性以及无法在任何情况下保证系统组件和功能安全. 前者属于鲁棒性的研究动因, 后者属
于本节安全性的研究范围.
可以说, 安全问题是自动驾驶系统研发试验的核心. 对于安全关键或任务关键领域的人工智能软件系统来说,
安全性一直是衡量系统性能的一个非常重要的指标.
1.2.3 安全性示例
以汽车自动驾驶系统为例, Uber 和 Tesla 的自动驾驶汽车皆发生过由于识别系统故障而导致的严重交通安全
事故. 频发的自动驾驶汽车事故, 引发了人们对于高风险人工智能应用的安全性担忧.
在传统的交通工具中, 汽车的行驶安全主要是人为操控, 再辅以另外一些安全功能 (例如车道保持, 紧急制动
等) 设计, 以帮助和减少风险. 即人为控制和安全机制组成了传统汽车的安全保障体系. 在自动驾驶汽车中, 人工智
能应用于包括感知、控制、路由等多个系统模块中. 自动驾驶系统采取的是归纳训练, 即没有明确的要求或设计
见解. 这导致系统不可能涵盖所有未知案例, 当汽车行驶过程中出现未知案例时就有可能导致事故的发生.
当前自动驾驶汽车主要采用危险方位报警指示器来增加安全性, 采取了包括故障树分析 (FTA)、向前向后搜
索 (FBS)、失效模式和影响分析 (FMEA)、危险与可操作性研究 (HAZOP) 在内的多种组合算法和策略.
1.2.4 常见质量保障方法
本小节将当前人工智能软件系统安全性质量保障的研究工作主要分为 3 类.
(1) 第 1 类对人工智能软件系统中常见的攻击方式进行研究, 以此来防御针对系统的大部分攻击.
第 1 种攻击为模型反演攻击. 当前许多互联网公司都推出了人工智能服务即开发平台, 为众多开发者提供便
利的人工智能技术支持, 但同时也为攻击者提供了新的攻击方式. 由于模型是由一系列参数所决定, 攻击者可通过
求解模型参数的攻击方式来实现模型剽窃, 从而对模型持有者造成损失. 这种攻击被称为模型反演攻击.n + 1
Tramèr 等人 [46]在 2016 年的工作中提到这种攻击方式; 对于一个输入为 n 维的线性模型, 依据解方程的思想
(即一个 n 元方程, 至少拥有 n 个等式就能求解), 攻击者只需要通过 API 接口进行次查询便可以窃取到这个
模型; Batina 等人 [47]也证明了假设攻击者已知所使用的神经网络结构, 便可仅通过单发边信道测量就可以对神经
网络的输入进行逆向工程; Yang 等人 [48]通过辅助集和截断技术的有效结合, 提出了一种即使目标模型为黑盒也能
进行模型反演的攻击方法.
第 2 种常见攻击方式是完整性攻击, 常见的完整性攻击有数据下毒攻击 [49]和对抗样本攻击. 下毒攻击多发生
108 软件学报 2023 年第 34 卷第 1 期
在模型的训练过程, 表现为攻击者修改模型现有的训练集或者增加额外的恶意数据 [49], 最后影响模型的完整性和
模型训练的结果; 对抗样本攻击发生在模型的预测阶段, 表现为在预训练数据中添加肉眼无法识别的微小扰动, 使
模型的结果发生错误.
(2) 第 2 类从人工智能软件系统构建出发, 通过建立安全性论证体系、威胁分析及保护机制和安全性系统设
计原则来加强人工智能系统的安全保障.
改进人工智能软件系统安全性贯穿于系统构建全过程. 即开发者要建立安全性论证体系; 识别相关的危害和
安全要求、确定潜在的危害根源、针对每个危害制定一个缓解策略、提供证据证明缓解措施得到适当的实施.
在人工智能软件系统构建过程中, 开发者需要针对所设计的系统进行详尽的安全性考虑. 包括系统的安全需求
(策略)、威胁模型分析、攻击面分析和系统保护机制分析. Papernot 等人 [50]在其工作中对攻击面和威胁模型进行了
讨论, 他们将系统决策过程中的攻击面分成了 4 个阶段; 获取物理世界信息阶段、信息转换成数字化表征形式阶
段、表征进入机器学习模型训练阶段、模型返回物理世界进行推理预测阶段. 以汽车自动驾驶系统为例, 4 个攻
击面对应于: 1) 利用行车传感器获取诸如停车的交通标志 (获取物理世界信息阶段); 2) 将得到的信息转化成图片
进入预处理阶段 (转化成数字表征), 再将图像转化成 3 维的张量 (表征转化); 3) 应用模型对其进行分类置信度的
计算 (表征进入机器学习模型训练阶段); 4) 反馈到物理世界中, 让车辆刹车 (模型返回物理世界进行推理预测阶段).
关于威胁模型, Suresh 提出了建立威胁模型的 5 个步骤 [51].
第 1 步是分析系统、定义外部实体和要保护的资产. 安全性设计的第 1 步是为了了解系统运行的环境以及攻
击者所要攻击的资产目标. 以汽车自动驾驶系统为例, 资产包括系统固件、系统数据和学习模型等, 外部实体则包
括了将与人工智能软件系统交互的用户和潜在的攻击者或对手.
第 2 步是识别潜在对手、攻击面和威胁. 对于大部分人工智能软件系统来说, 潜在对手主要为远程软件攻击
者和网络攻击者, 除此之外还包括通常很容易被忽略的恶意内部攻击者和攻击方式非常复杂的高级硬件攻击者.
威胁和系统安全级别的设置主要根据攻击的严重性来决定的. 目前确定系统安全威胁一般使用 STRIDE 模型
(欺骗身份、篡改数据、否认、信息泄露、拒绝服务和提升权限), 通过分析 STRIDE 威胁模型, 可以揭示应用程
序的泄漏和被攻击的范围. Yang 等人 [52]在其工作中对 STRIDE 威胁模型的 6 种威胁类型进行了详细的讨论. 评估
攻击的严重性可以使开发者能够适当的分配有限的开发资源, Houmb 等人 [53]提出一种风险水平估算模型, 该模型
可将风险水平作为频率和影响估算的条件概率得出. 频率和影响估算值是从“通用漏洞评分系统 (CVSS)”中得出
的. 该模型适用于漏洞级别 (就像 CVSS 一样), 并且能够将漏洞组成服务级别.
第 3 步是确定应对威胁的高级安全目标. 针对不同的对象, 开发者可以设定不同的安全目标来保持系统的 6
个安全要素; 保密性、完整性、可利用性、真实性、安全生命周期以及不可否认性. 依据对人工智能软件系统发
起的攻击类型来判断每个要素的风险. 基于以上信息, 开发者就基本可以确定人工智能软件系统将面对的威胁和
可采取的对策.
第 4 步是为每个安全目标定义安全需求. 例如从“安全生命周期”的目标出发, 开发者可以确定系统的最小权
限和孤立性原则、维持安全的系统状态、系统访问控制策略以及安全系统的初始化执行.
第 5 步是将所有信息整合进威胁摘要表. 将基于前 4 步工作得到的信息合并到威胁摘要表中, 最终得到当前
人工智能软件系统的威胁模型.
开发者在设计系统时须遵守基本的安全设计原则.
● 最小权限原则; 应该给予系统组件实现其功能所需的最低权限. 目的是最大限度地降低受损组件的影响.
● 孤立性原则; 组件之间的交互作用不应超过必要的程度. 目标是减少可信计算基数 (TCB) 的大小.
最小权限原则将通过减少每个系统组件的非必要权限, 防止高权限组件受损引发系统崩溃. 即防止如图 5 所
示, 当网络组件受到木马病毒等攻击而受损时, 由于网络组件的高权限将会导致整个系统的运行陷入混乱或停滞
的情况. McGraw 等人在论述软件安全时提到在设计和架构层次上, 系统必须是一致的, 并呈现一个考虑到安全原
则 (如最小特权原则) 的统一安全架构 [54]; Gollmann 等人在其关于计算机安全的工作中 [55]强调安全系统的设计应
该遵循 Ref13 所制定的最小特权原则等保护原则.
叶仕俊等: 人工智能软件系统的非功能属性及其质量保障方法综述 109
孤立性原则要求尽量降低组件间的耦合度, 减少人工智能软件系统 TCB (trusted computing base) 的大小. 如
图 6 所示, 由于组件间的低耦合, 网络组件遭受破坏所产生的影响将会被限制在有限的非 TCB 中, 不会对人工智
能软件系统的安全造成实质的威胁. TCB 是系统中负责建立安全需求的组件, 如果任一 TCB 遭到破坏表示系统安
全受到威胁, 相反非 TCB 组件遭到破坏但系统安全性仍然保留, 因而在较差的系统设计中, TCB 等同于整个系统.
(3) 第 3 类工作致力于为人工智能软件系统设计特定于任务的自定义安全协议.
由于经典的通用安全计算协议无法扩展至现实世界的人工智能应用中, 为了解决这个问题, 机器学习领域近
几年的工作结合了不同的安全计算基数来设计特定于任务的自定义协议. 包括约束优化 [56]和 K 近邻分类 [57]等.
Agrawal 等人 [58]对 DNN 训练算法和安全协议两方面进行了优化, 提出了 QUOTIENT 方法. 该方法采用了归一化
和自适应梯度法, 不仅在安全性上提升显著, 在训练速度方面相较之前的工作 [59−61]也有明显的改善.
现有的针对人工智能软件系统安全性的质量保障方法研究存在几个不足. 首先, 虽然现有的研究已经提出了
各种方法来增强人工智能软件系统的安全性, 但是对于安全性基准的研究依然缺少. 例如当研究人员在不同工作
中使用了不同数据集时, 很难比较这些方法的优缺点. 其次, 过高的安全性将会带来更大的算法开销、更低的泛化
性能问题, 这 3 个方面如何进行适当的平衡是在设计和构建人工智能软件系统时需要注意的.
1.3 数据隐私性
1.3.1 数据隐私性定义
人工智能软件系统中的隐私性 (privacy) 是系统保留私有数据信息的能力 [50].D1D2""
对于数据隐私性的公式定义, 本文采用 Dwork 等人工作中的差分隐私来定义 [62]; 如公式 (5) 所示, 假定 A 是
随机算法; 和是两个仅在一个实例上不同的训练数据集; S 是 A 的输出集的子集; 参数是隐私预算 (较小的
预算会产生更强的隐私保证); 参数是故障率 (可以决定对于由所定义的边界不成立的容忍程度). 则差分隐私
可用下列公式表示:Pr[A(D1) ∈ S ] ≤ e" ∗ Pr[A(D2) ∈ S ] + (5)D1D2D1D2
基于上述定义, 可知差分隐私可以确保和仅在一个实例中有所不同时, 学习者不应该从中获得比从
中更多的信息.
1.3.2 数据隐私性必要性
在传统的机器学习领域, 研究者们关注模型对于结果预测的准确性, 同时又希望模型在不同场景中都有较强
的泛化能力 (指应用能力). 但在大数据时代, 数据的来源是复杂且敏感的, 个人的数据信息将直接同个人的隐私相
关. 模型在增强泛化能力的同时扩大了使用范围也增加了泄露数据和信息的危险度.
为此欧盟通用数据保护法规 (GDPR)[63]和加利福尼亚 CCPA[64]等监管法规相继出台来保证人工智能软件系统用
户
输
入
网
络
人工智能软件系统
网
络
网
络
网
络
人工智能软件系统
文
件
系
统
用
户
输
入
文
件
系
统
文
件
系
统
文
件
系
统
用
户
设
备
用
户
设
备
图 5 最小权限原则用
户
输
入
网
络
网
络
文
件
系
统
用
户
输
入
网
络
文
件
系
统
文
件
系
统
用
户
设
备
网
络
文
件
系
统
用
户
设
备图 6 孤立性原则
110 软件学报 2023 年第 34 卷第 1 期
应用的数据隐私性.
1.3.3 数据隐私性示例
人工智能已经形成了一个商业模式, 机器学习即服务 (MLaaS) 领域的发展和应用为大量非专业的数据持有者
提供了构建私有模型的快捷方式, 但随之也增加了用户隐私暴露的危险性. 原因在于数据持有者在使用 MLaaS 时
可能使用到攻击者设计的可窃取数据的预训练模型, 攻击者可以通过解码模型参数轻松得到用户的隐私数据. 文
献 [65] 中的工作也提到; 尽管机器学习平台是安全可靠的, 但机器学习模型提供者提供的算法未必可信.
在医学领域中, 人工智能技术主要被用于医疗诊断和药物推荐. 训练模型所需的大量医疗数据和病人的隐私
信息联系紧密, 因而保护这些数据的隐私性是必要的. 但是, Fredrikson 等人在 2014 年针对药物推荐系统的研究工
作却发现可以通过基于机器学习模型和病人的人口属性统计信息逆向推理得到病患的遗传资料 [66]. Fredrikson 等
人在 2015 年的研究工作中介绍了如何给定模型的输出结果去推断模型的输入数据 [67]. 他们利用系统提供的查询
接口进行大量的查询, 根据查询的输入和返回的输出构建了一个无限逼近原始模型的新模型, 最后基于新模型逆
向恢复原始模型的训练数据.
除医学行业以外, 数据的隐私性对于汽车行业也是非常重要的. 未来自动驾驶汽车市场化后, 汽车行业将不仅
成为数据的消费者, 还将成为数据的主要生产者. 据 Google 公司统计, 在其自动驾驶汽车实验中, 平均一辆汽车每
秒产生了超过 1 GB 的数据. 如此庞大的数据涉及到汽车使用者非常详细的个人隐私信息, 这些数据对于汽车制
造商、移动运营商、保险公司、酒店和其他希望与自动驾驶汽车或汽车使用者打交道的服务和产品提供者来说,
具有巨大的价值.
1.3.4 常见质量保障方法
目前人工智能软件系统数据隐私性的质量保障有以下几种常见方法.
(1) 对数据进行匿名化处理
这类方法主要用于一些涉及微数据的应用程序 (包括医学数据保护方面), 大多基于系统全局记录、本地记录
和群集的匿名化方式使得系统中的数据记录无法相互区分来达到隐私保护的目的. Sweeney 等人提出了一种名为
k-anonymity 的隐私保护模型 [68], 这种模型可以使得数据的持有者在保证数据仍然可用的前提下, 在发布其私有数
据时他人无法从中得到敏感的个人信息. 匿名化方法的缺点在于匿名数据分析的工作量非常大, 因而这种方法无
法总是实现有效的数据匿名, 并且现有的大部分方法未充分地考虑数据属性的实用性. 目前也有研究人员在进行
数据匿名化方法的改进研究, 例如 Gao 等人基于多维匿名化的概念, 提出了一种基于属性顺序敏感的实用性匿名
化方法 [69].
(2) 防

你可能感兴趣的:(人工智能)

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
AI技术全景图鉴：从模型开发到落地部署的全链路拆解大模型玩家人工智能 langchain 大模型产品经理学习 ai 程序员
人工智能（AI）技术的快速发展，使得企业在AI模型的开发、训练、部署和运维过程中面临前所未有的复杂性。从数据管理、模型训练到应用落地，再到算力调度和智能运维，一个完整的AI架构需要涵盖多个层面，确保AI技术能够高效、稳定地运行。本文将基于AI技术架构全景图，深入剖析AI的开发工具、AI平台、算力与框架、智能运维四大核心部分，帮助大家系统性地理解AI全生命周期管理。一、AI开发工具：赋能高效开发，提
铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命 LucianaiB 评测人工智能自动驾驶 devops
铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命嗨，我是LucianaiB！总有人间一两风，填我十万八千梦。路漫漫其修远兮，吾将上下而求索。摘要(Abstract)本文深入探讨了人工智能大模型（AILargeModels）如何驱动DevOps从“自动化”（Automation）向“自主化”（Autonomous）的革命性跃迁。文章指出，AI大模型正成为现代软件工厂的“中枢神经系
解读《生成式人工智能服务管理暂行办法》我的大模型服务需要备案还是登记？纵深企服人工智能 AIGC 安全
一、大模型备案和登记是什么？根据《暂行办法》及相关指引文件，大模型相关的合规路径主要分为“备案”和“登记”两种。准确理解二者的定义、适用情形及区别，是企业合规的第一步。1、大模型备案（生成式人工智能服务上线备案）定义：大模型备案，通常指的是生成式人工智能服务上线备案。根据《暂行办法》，“提供具有舆论属性或者社会动员能力的生成式人工智能服务的，应当按照国家有关规定开展安全评估，并按照《互联网信息服务
显卡GPU的架构和工作原理 InnoLink_1024 芯片人工智能 AGI 架构硬件架构人工智能
显卡GPU（图形处理单元）是专为并行计算和图形处理设计的芯片，广泛应用于游戏、科学计算、人工智能和数据中心等领域。以下详细介绍GPU的架构和工作原理，涵盖核心组件、计算流程和关键技术，尽量简洁清晰。一、GPU架构概述GPU架构与CPU不同，专注于高并行计算，适合处理大量简单、重复的任务。其核心设计目标是最大化吞吐量，而非单任务的低延迟。主流GPU厂商（如NVIDIA、AMD、Intel）架构虽有差
Github 2025-01-07Python开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-01-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目10TypeScript项目1C++项目1OpenHands:人工智能驱动的软件开发代理平台创建周期：195天开发语言：Python协议类型：MITLicenseStar数量：31753个Fork数量：3660次关注人数：31753人
Python 生态发展之路仓颉编程语言技术文章 python
目录#Python是如何炼成的##生态系统持续扩张##Python开发的开源社区运作#更加广义的Python社区#广泛应用##Web开发、数据科学##不得不提的人工智能#支持Python成长的商业公司#Python成功之路小结##附：Python生态发展大事记#参考Python是现今最受欢迎的编程语言之一，2021年8月的TIOBE编程语言排行榜中，Python排名第二，仅次于C[1]。2017年
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数