网易智能

黑客如何攻击图神经网络？别小看土豪转账一分钱

作者：谭婧，虎嗅认证作者，《亲爱的数据》公众号出品人，香港浸会大学硕士，N年前高考作文满分得主。曾负责中国节能集团控股企业战略管理工作，许多年管理咨询经验，也曾任人脸识别创业公司合伙人。

世上总会有骗子，人工智能时代也不例外。想起《天下无贼》里葛优说的那句：我最烦你们这些打劫的了，一点技术含量都没有。

在人工智能的骗局里，最不缺的就是技术含量。

当人工智能自动合成语音软件，模仿熟人的声音给你打电话的时候，还可以安慰自己“耳听为虚”。扭脸间，人工智能又在视频中给主人公换脸，让“眼见为实”变得十分尴尬。不过，博弈始终存在，人类也会欺骗人工智能，甚至攻击。

欺骗AI图像识别的低级套路，早已问世

比较常见的欺骗人工智能的套路是，在摄像头识别人脸时，在面部上贴上特殊纹路的纸片，这样人脸识别技术可能会失效，识别不出来，或者识别错误。请脑补，人们打扑克的时候会在额头和脸上贴纸条的惩罚方法。当然，不仅机器识别不了，贴多了，老妈也识别不了。

再比如，一张喵星人的图片，经过有效的恶意攻击，人工智能可能将喵星人误判为一只汪星人。这种欺骗应用在自动驾驶领域会有极危险的情况。假如对无人驾驶汽车的视觉系统进行攻击，识别错误交通标志，可能会引发交通事故，传感器再多也防不住。这种恶意的攻击是在哪里动手脚呢？有的方法是将图片的像素值做一些微小的、人眼观察不到的变换，会使人工智能「晕了」。

黑客再出击，如何攻破机器学习模型

如何有技术含量的欺骗人工智能？如何攻破机器学习模型？这个问题正在被前沿学术界所关注。

众所周知，人工智能的深度学习技术已经成了警队的「天眼」，在特定环境下准确识别人脸图片的能力超过了人类。但是，在鲁棒性和泛化能力方面有缺陷。这种缺陷在不同环境下，会引发不同的问题。

所以，有效地去攻击现有的机器学习模型是可能的。

街角电线杆子，膏药小广告上写着：缺钱吗？朋友，骗过银行人工智能，实现贷款100万的授信额度。如果当黑客拥有了一项技术，可以攻击全天下计算机系统里的机器学习模型时，最想攻击哪里？人性的贪婪的目光总会落在银行身上。如果说武装劫匪的目标是银行大厦里的金库，那么互联网银行就是黑客的目标。

若要实现小广告所示的黑产业务，作案时需要满足两个条件：

条件一：某互联网银行的客户信用积分是用深度学习技术计算的，该银行信用系统中人工智能深度学习技术对转账人信用值这个特征非常敏感。在该银行信用系统的人工智能深度学习模型中，有没有与土豪的往来转账记录，将会作为贷款人贷款级别高低的一个依据。这一关键“特征”的改变会影响贷款额度。

条件二：黑客为了欺诈贷款，想方设法让土豪转了一分钱，虽然只有一次转账，虽然交易数额极低。

在一和二这两个条件都满足的情况下，恶意攻击取得胜利。一夜暴富的状况出现了：凭借土豪一分钱的转账记录，黑客改变了自己的信用评分。顷刻，银行信用系统识别将黑客判定为尊贵的高净值客户。

一分钱的硬币，掉在路边都没有人去捡。但是，这一分钱的转账在“图结构”中，相当于与富豪有一条边相连。如果银行信用系统中人工智能深度学习技术对转账人信用值这个特征非常敏感，这一条边的增加，则举足轻重。其结果，可以是让黑客在顷刻间，拥有了可以向银行贷款100万的信用额度。

这项攻击可以将金融机构置于巨大风险之下。如何解决呢？很遗憾，迄今为止没有办法彻底解决。不过为了解决这个问题所作的第一步的努力，是找到现有深度学习技术在这方面的漏洞，也就是神经网络脆弱的地方。

学术界对此也非常关注，有一篇人工智能的顶级会议论文对这个问题进行了研究。论文出自清华大学朱军和美国佐治亚理工大学宋乐的研究团队，论文标题是《对抗性攻击用于图结构数据（Adversarial Attack on Graph Structured Data）》。这篇论文被收录于第三十五届ICML人工智能顶级学术会议，属于前沿研究领域。

为什么选择图结构数据

金融交易网络等其数据天生就适合于图表达。银行的交易网络天然的就是图结构。图（graph）是什么？图通常由一些结点（nodes）和连接这些结点的边（edge）组成。详细地说，节点（node）通过边（edge）连接，图是互连节点的集合。图（graph）是表示一些对象（objects）与另一些对象之间相互连接的结构。

图结构具有强大的表达能力，许多实际问题可以用图结构来表示。而图结构中的节点和关系就像图像和文本数据一样是到处都存在的数据。图，是一种数据结构，它对一组对象（节点）及其关系（边）进行建模。图上的表征学习，逐渐变成机器学习的一大核心领域。卷积神经网络是深度图像学习技术之一，图卷积神经网络（GNN）是将卷积神经网络技术拓展、升华到更通用的图结构数据，它已被广泛的应用到各大互联网、金融、生物医药公司。

图里的节点可以是用户账号、电子邮箱、WIFI设备、天猫旗舰店、公司、车站，甚至可以是变电站。如果你在淘宝购买了一支口红，你（购买者）、香奈儿官方旗舰店（淘宝商铺）这两者都是可以是节点，而购买行为是边。一次网购可以用一个简单的图来表示，两个节点一条边。一次转账也可以用一个简单的图来表示，两个节点一条边。关系数据是图计算的一个基本的数据。没有关系数据，图计算就是胡扯。

在纷繁复杂的算法世界中，图数据又复杂，又普遍存在。图数据有自己的特点，蕴含的信息极其丰富，极具价值。可以说，图数据是一座宝藏。例如谷歌的搜索业务也用到了图计算，或者可以说，谷歌的成功起步于这个算法。想知道网页（就是节点）的重要性程度，需要有个PageRank的算法。为什么搜索到的这么多网页有的要被放在搜索的首页。因为有了定量的分数，才可以对网页排序。所以，图计算的算法一直在默默地改变世界。

深度学习有缺点？别放弃治疗

在人工智能的世界里，深度学习正处在巅峰。2019 年 3 月 27 日，计算机权威机构ACM 宣布，深度学习的三位创造者 Yoshua Bengio，Yann LeCun，以及 Geoffrey Hinton获得2019 年的图灵奖。图灵奖也爱上了深度学习。可以说深度学习是人工智能世界里最好用的“铲子”。

从人脸识别、内容推荐到疾病诊断，以及自动驾驶，深度学习在决策中发挥着非常重要的作用。现在的问题不仅仅是深度学习如何使用，也应该考虑当神经网络和深度学习算法大规模应用之后，它们特有的安全威胁是什么？黑客找到这些漏洞，然后攻击深度学习模型，后果不堪设想。罪犯从监控摄像头下逃之夭夭，自动驾驶汽车误识交通标志，当街撞人。

所以，需要对深度学习进行对抗性研究。

“对抗性攻击（adversarial attack）”一词最早是在2014年，由谷歌公司人工智能研究人员Christian Szegedy带领的研究小组在论文中提出的。在一辆校车的图片上加上一层对人类来说无形的数据噪声，就是那种人眼看不出来不同的噪声，结果神经网络就被骗了，傻兮兮地认为，它几乎可以肯定校车是一只鸵鸟。这么容易被骗，那还了得，所以，研究人员会开始从对抗的角度来研究它，因为深度学习技术越来越普遍了，有缺陷得早点治疗。

论文《对抗性攻击用于图结构数据》的摘要部分提到，“图结构的深度学习算法在各种应用中取得了令人兴奋的结果。然而，对这些模型的鲁棒性研究还很少，对图像或文本的抗攻击和防御性的研究也很少。在这篇论文里面提出了三种方法：基于强化学习的，基于遗传算法的以及基于梯度近似的。数据表明，图神经网络模型容易受到这些攻击。”该论文对图深度学习鲁棒性及对抗性攻击进行了开创性的研究。

用强化学习的方法，找到漏洞。

论文通讯作者是美国佐治亚理工大学计算科学与工程系终身副教授宋乐。他也是国际机器学习协会董事会成员之一，及第35届机器学习技术国际会议（ICML）署名论文数量排名第三的作者，与其他两位科学家并列。

宋乐教授认为，强化学习的目的是找到一个策略从而最大化累积回馈(Maximize accumulated reward)。强化学习能够通过和环境交互变得越来越聪明。例如黑客不断地试探支付宝芝麻信用的打分机制或者某银行的信用机制，去尝试提高信用分值。用强化学习的方法来寻找图深度学习模型的漏洞的过程也需要反复试错。

这种方法非常有效，在金融机构内部安全演练中也在使用。比如，为了寻找系统漏洞，也会进行红方和蓝方模拟相互间的攻击，来不断的提高系统安全性能。论文的方法，用一句话来概括就是：用一个聪明的算法，尝试较少的次数，成功地找到深度学习网络的漏洞。“尝试较少的次数”一词需要稍加解释，论文里面的“次数”主要是关注修改尽量少的图上的边。比如只需要让巴菲特或者马云给你转一次账，而不是让一群土豪给你转账很多次。”

这里还需要对图数据中节点（node）的重要性进行描述，提炼成表征的描述，强化学习会生成一个策略，比如在网络中给某个节点加一条边，那就是在图结构的数据中，网络中要和谁连接的问题。如果转化成互联网银行的实际业务问题，简单说来，就是“谁转账给你或者你转账给谁？”

论文一作为戴涵俊博士，现为谷歌大脑的研究员。

戴涵俊博士介绍，“论文重点考虑，怎么降低选取一条边策略的复杂度？在一个有N个节点的图中选取一条边的选择空间有O(N^2)。如果一个金融网络中有1万个用户，那选择空间就是1亿种可能性。我们把这个巨大空间的选择分成两步来完成，即第一步选边的起点，第二步在第一步的基础上选边的终点，从而把复杂度降低到O(N)。”

论文的关注点在于图的结构方面。比如针对某个人的社交关系进行修改。从学术角度讲，就是论文中考虑的对图的修改可以是对已有的边删除，也可以是添加新的边。所以，当攻击行为摸索到图深度学习模型的规律，很可能会发生：土豪转账给你，哪怕只有一分钱，也有可能提高你的授信额度。但是更可怕的攻击行为是，马云给马化腾转账了一分钱，从而使你获得贷款100万元的授信额度。因为从图结构数据的本质来理解，对社交关系进行修改，可以是比如跟你加好友，删好友，以及转账给某人。这一小小的动作，也是一种改变网络的一种方式。

说到底，所有的攻击如果想通过最少的步骤（次数）来完成，都是一个优化问题。

论文还提到了其他攻击方法，也就是强化学习之外的方法，包括随机（Random）攻击，基于遗传算法的攻击和基于梯度近似的攻击。按葛优的理解，都是“技术含量极高”的手段。攻击行为可以理解为一种试错行为，一次试错，一次回馈，但是很难窥见模型的全貌。如果攻击者可以访问有关基础模型参数和架构的信息，以及算法及其所使用的参数，则称为白盒攻击。如果攻击者无法访问已部署的模型体系结构等，则该攻击称为黑盒攻击。这些都是高水平的攻击方法。

当然，除了高级的，也有比较简单的攻击方法，比如对图的节点的攻击，也就是攻击贷款人。例如，赵先生的年龄是36岁，通过篡改年龄，将其年龄改为16岁，那么一个中学生的还款能力可想而知，遭受攻击后赵先生的授信额度无辜地受到了负面影响。这种类型的攻击，和文章开头提到的欺骗计算机视觉技术的手法的难度类似，对修改图像数据中的像素点，把猫识别成狗。

在了解了攻击人工智能的招式之后，我们不难发现人工智能机器学习的鲁棒性和泛化能力，关乎金融机构系统安全性，又关乎抗风险能力。土豪转账一分钱，贷款额度瞬间涨。值得欣慰的是，对人工智能技术的攻击已经在前沿科技研究者的视线范围之内。论文作者宋乐教授总结道，“论文的结论包括，论文中设计的方法对图深度学习攻击有效，图深度学习鲁棒性还有待提高”。

RECOMMEND

推

荐

阅

读

AI社群

对AI感兴趣的小伙伴，

网易智能有12个不同垂直领域社群等你加入
添加智能菌微信：kaiwu_club

和我们一起探讨AI的故事~

【网络安全】零基础小白如何入门CTF 程序员橘子 web安全安全网络渗透测试网络安全
新手小白应该怎么入门CTF？要如何学习CTF？分几阶段学习？想打CTF，但是没有思路怎么办？这是我花了两天，整理的CTF学习的思路与方法，方便大家学习时可以参考。如果觉得有帮助的小伙伴，记得点赞收藏关注！一、CTF简介01」简介中文一般译作夺旗赛（对大部分新手也可以叫签到赛），在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。CTF起源于1996年DEFCON全球黑客大会，以代
android+ffmpeg库使用教程,适用于Android的ffmpeg（使用教程：“ ffmpeg和Android.mk”）... OF COURSE想当然
我正在尝试为Android编译ffmpeg。我已经找到了关于该主题的几篇文章，但似乎都没有。如果尝试构建ffmpeg，它会发布在[1]上。是否有人使用这些教程成功编译了ffmpeg？我不确定如何实现步骤4到5。STEP4：配置...步骤5：CD到您的NDK根目录，键入makeTARGET_ARCH=armAPP=ffmpeg-org在我看来，按照第5步的教程中的说明构建类似的应用程序需要一些先前的
chatgpt赋能python：Python怎么打包成APK vacvefito ChatGpt python chatgpt 开发语言计算机
Python怎么打包成APK如果你是一位有10年Python编程经验的工程师，并且想要将自己的Python应用程序打包成APK，那么你来对地方了。本文将会介绍如何使用Python来打包成APK，以及在不同平台上的一些注意事项。在阅读本文之后，你应该可以顺利地将自己的Python应用程序打包成APK了。什么是Python的APKAPK是AndroidPackage的缩写，它是Android系统中的一
帮助应用实现更好的推广下载能力 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第14课。本课程旨在助力应用实现卓越的推广下载能力。全面深入讲解应用市场相关要点，包括应用市场推荐机制与更新功能的深度解析，让开发者了解如何提升应用曝光与更新效率。详细阐述展示应用详情页以促进下载安装目标应用的有效策略，以及查询广告验签版本的关键步骤。同时教授获取模块安装信息与添加按需加载模块的实用技术，使开发者能够优
java中String、List、数组之间的转换方式 ppo_wu JAVA java list windows 后端
在Java中，String、List和数组（如String[]）之间的转换是常见的操作。下面是如何在它们之间进行转换的示例。1.String转List通常，你不会直接将一个完整的String转换为List，但你可以将包含多个元素的字符串（如由逗号分隔的字符串）分割成多个部分，并将这些部分添加到List中。Stringstr="a,b,c,d";Listlist=Arrays.asList(str.
element-plus 的table section如何实现单选肖肖肖丽珠 vue.js javascript 前端
如果是单选那么全新的按钮应该隐藏或者不可编辑的状态。但是我没找到改变成不可编辑的方法，只能采取隐藏import{ref,reactive,toRefs}from'vue'consttaskTableRef=ref();//表格ref//变量定义conststate=reactive({tableData:[{name:'啦啦啦'},{name:'嘻嘻嘻'},{name:'哈哈哈'}],});con
如何查看商品销量 API 接口的性能指标数据前端后端运维数据挖掘api
在当今电商蓬勃发展的时代，数据成为驱动业务决策的关键因素。商品销量作为衡量产品受欢迎程度和销售业绩的核心指标，其获取依赖于高效稳定的API接口。对于电商开发者、数据分析师以及业务决策者而言，了解如何查看商品销量API接口的性能指标数据至关重要。这些性能指标不仅能反映接口的运行状态，还能为优化接口、提升用户体验以及保障业务连续性提供有力依据。本文将深入探讨查看商品销量API接口性能指标数据的方法，并
【YashanDB知识库】MySQL的FIND_IN_SET如何在YashanDB改写数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7323369.html?templateId=171...前言MySQL应用使用的SQL的Where条件存在FIND\_IN\_SET，无法在YashanDB直接执行，需要改写。本文探讨不兼容的原因，并给出改写手段。问题SQL示例MySQL执行成功mysql>selectc1from
deepin-UEFI 引导：从入门到重装 deepin
在现代计算机中，UEFI（统一可扩展固件接口）已成为主流的启动方式，逐渐取代了传统的BIOS。UEFI提供了许多改进，如更灵活的启动管理、更大的分区支持以及更快的启动速度。然而，对于许多Linux用户来说，UEFI的复杂性可能会带来一些挑战，尤其是在多系统环境中。本文将详细介绍如何在Linux下使用UEFI引导系统，以及如何在出现问题时进行修复和重装。1.UEFI的基本原理UEFI是一种替代传统B
指令系统与汇编语言荔枝寄 mongodb 数据库
单片机的学习通常从基础硬件知识开始，逐步深入到指令系统、编程技巧等高级内容。这种学习路径反映了掌握复杂技术时的自然演进：先理解构建块，再了解如何将这些块组合起来创建功能更强大的系统。本文将探讨单片机学习中的关键概念，并通过代码示例加深理解。基础硬件知识单片机（MicrocontrollerUnit,MCU）是一种集成了处理器、内存和输入/输出接口的小型计算机。它可以在嵌入式设备中找到，用于控制特定
20250101面试鸭特训营第9天 Again_acme 面试鸭特训营面试职场和发展
更多特训营笔记详见个人主页【面试鸭特训营】专栏2501011.MySQL中如何解决深度分页的问题？什么是深度分页问题--查询第2页的10条数据，即第21~30条数据select*fromstudentorderbyidlimit2,10;--查询第200000页的10条数据，即第200001~200010条数据select*fromstudentorderbyidlimit200000,10;在分
C++语言的区块链沈霁晨包罗万象 golang 开发语言后端
C++语言的区块链实现区块链技术作为一种新兴的分布式账本技术，近年来在金融、供应链管理、身份认证等多个领域得到了广泛关注与应用。C++语言因其高性能和精细的资源管理能力，成为实现区块链技术的重要选择之一。本文将探讨C++语言在区块链中的应用以及如何使用C++实现一个简单的区块链。一、区块链的基本概念区块链是一种由多个区块组成的链式数据结构，每个区块包含一定数量的交易信息和指向前一个区块的哈希值。区
UE虚幻引擎No Google Play Store Key：No OBB found报错如何处理？东方猫虚幻游戏引擎
问题描述：UE成功打包APK并安装过后，启动应用时提示：```NoGooglePlayStoreKeyNoOBBfoundandnostorekeytotrytodownload.PleasesetoneupinAndroidProjectSettings```UE配置默认在打包APK时会附加生成一个OBB文件，如果只将APK拷贝到设备上安装就会出现这个错误。解决办法：解决办法有两种：打包目录自带
Python网络爬虫核心面试题闲人编程程序员面试 python 爬虫开发语言面试网络编程
网络爬虫1.爬虫项目中如何处理请求失败的问题？2.解释HTTP协议中的持久连接和非持久连接。3.什么是HTTP的持久化Cookie和会话Cookie？4.如何在爬虫项目中检测并处理网络抖动和丢包？5.在爬虫项目中，如何使用HEAD请求提高效率？6.如何在爬虫项目中实现HTTP请求的限速？7.解释HTTP2相对于HTTP1.1的主要改进。8.如何在爬虫项目中模拟HTTP重试和重定向？9.什么是COR
当 Nginx 出现连接超时问题，如何排查？ m0_74823131 nginx php 数据库
文章目录当Nginx出现连接超时问题，如何排查？一、了解Nginx连接超时的基本概念二、可能导致Nginx连接超时的原因（一）服务器负载过高（二）上游服务响应缓慢（三）网络问题（四）Nginx配置不当（五）客户端问题三、排查Nginx连接超时问题的方法（一）检查服务器资源使用情况（二）分析Nginx日志（三）检查上游服务（四）测试网络环境（五）检查Nginx配置（六）模拟客户端请求四、解决Ngin
网站安全之网站劫持的防范德迅云安全-甲锵网络安全安全网络 web安全
在数字化时代，网站作为企业与用户交流的重要平台，其安全性和稳定性至关重要。然而，网站被劫持的现象时有发生，不仅损害了企业的声誉，还可能导致用户数据泄露等严重后果。劫持的常见原因有什么？1.系统漏洞：网站系统或服务器存在未修复的漏洞，为攻击者提供了入侵的机会。攻击者可以利用这些漏洞执行恶意代码，控制网站或窃取数据。2.弱密码和权限管理不善：使用弱密码或权限管理不善也是导致网站被劫持的常见原因。攻击者
个性化的语言模型构建思路由数入道人工智能语言模型人工智能自然语言处理
将开源模型（如Llama3、Qwen、Falcon3…等）转变为个人专属的大语言模型，通常涉及知识库的构建、微调（fine-tuning）和模型定制等步骤。下面提供一个详细的技术解决方案，涵盖了如何利用现有的资料（如文档、PDF、Excel、PPT、图片、语音、视频等）将开源模型转换为个人专属的语言模型的步骤、思路和技术设计。解决方案概述知识库构建：从不同格式的资料中提取有效信息，构建结构化或非结
VBA语言的区块链轩辕烨瑾包罗万象 golang 开发语言后端
用VBA语言探讨区块链技术引言区块链技术自2008年比特币的问世以来，逐渐成为了一个热门的话题。它不仅推动了数字货币的崛起，更在金融、供应链、医疗、游戏等众多领域展示出了巨大的应用潜力。然而，对于很多程序员来说，如何实现和理解区块链的概念和原理仍然是一个挑战。本文将结合VBA（VisualBasicforApplications）语言，深入浅出地探讨区块链的基本概念，工作原理，以及如何利用VBA实
F#语言的Web开发轩辕烨瑾包罗万象 golang 开发语言后端
F#语言的Web开发F#语言是一种多范式编程语言，基于.NET平台，强调函数式编程，同时也支持面向对象和命令式编程。近年来，随着web应用开发需求的不断增加，F#逐渐受到开发者的关注。本文将深入探讨F#语言在Web开发中的应用，包括语言特点、Web框架的选择、开发流程以及与其他语言和技术的比较等内容。一、F#语言的特点1.1函数式编程F#作为一门函数式编程语言，其核心在于如何用函数来描述计算。在F
Bash语言的数据库交互清妍琉璃包罗万象 golang 开发语言后端
Bash语言的数据库交互引言随着信息技术的飞速发展，数据库在各行各业中扮演着越来越重要的角色。无论是企业管理、数据分析，还是大数据处理，数据库都是基础设施的重要组成部分。对于开发者和系统管理员而言，能够高效地与数据库进行交互是一项必不可少的技能。在众多编程语言中，Bash作为一种脚本语言，以其简洁、高效和易用的特点，逐渐在数据库管理和交互中获得了一席之地。本文将深入探讨如何使用Bash进行数据库交
深入解析：使用 Python 爬虫获取苏宁商品详情数据小爬虫@ python 爬虫开发语言
在当今数字化时代，电商数据已成为市场分析、用户研究和商业决策的重要依据。苏宁易购作为国内知名的电商平台，其商品详情页包含了丰富的信息，如商品价格、描述、评价等。这些数据对于商家和市场研究者来说具有极高的价值。本文将详细介绍如何使用Python爬虫获取苏宁商品的详细信息，并提供完整的代码示例。一、爬虫简介爬虫是一种自动化程序，用于从互联网上抓取网页内容。Python因其简洁的语法和强大的库支持，成为
WPF MVVM 模式如何监听IsVisibleChanged 事件踏上青云路 wpf
原本以为这是一个很简单的问题，但是我却走了不少的弯路。记录下来自省。我使用的是库System.Windows.Interactivity.dll，首先在xaml中使用了EventTrrigger但是发现是无效的。经过改变IvokeCommandAction的参数，等方式，发现都无法触发。最后决定使用behavior来进行接下来的写法如下1、首先定义一个Behavior,（注意：这里我也遇到了一个问
网络爬虫技术如何影响网络安全的德迅云安全-甲锵网络安全爬虫
随着网络的发展和网络爬虫技术的普及，一些人收集某些需要的信息，会使用网络爬虫进行数据抓取。网络爬虫一方面会消耗网络系统的网络资源，同时可能会造成核心数据被窃取，因此对企业来讲如何反爬虫显得非常重要。一、什么是网络爬虫网络爬虫也叫网络蜘蛛，是一种用来自动浏览万维网的网络机器人，按照一定的规则可以自动提取网页内容的程序。网络爬虫主要用于网络资源的收集工作，搜索引擎通过网络爬虫爬取内容并将页面保存下来，
WPF3-在xaml中引用其他程序集的名称空间苏克贝塔 wpf wpf
1.如何在XAML里引用类库中的名称空间和类2.小结1.如何在XAML里引用类库中的名称空间和类首先需要记住一点：把类库引用到项目中是引用其中名称空间的物理基础，无论是C#还是XAML都是这样。一旦将一个类库引用进程序，就可以引用其中的名称空间。假设我的类库程序集名为MyLibrary.dll，其中包含Common和Controls两个名称空间，而且已经把这个程序集引用进WPF项目，那么在XAML
Java 大视界 -- Java 大数据文本分析与自然语言处理：从文本挖掘到智能对话一只蜗牛儿 java 大数据自然语言处理
在当今的信息化时代，数据成为了重要的资源。特别是文本数据，随处可见，如社交媒体、新闻网站、技术文档、客户反馈等，这些都包含着大量的潜在信息。因此，如何从海量的文本中提取有价值的信息，成为了大数据分析领域的重要课题。Java作为一种高效、灵活的编程语言，在大数据文本分析与自然语言处理（NLP）中发挥着至关重要的作用。本文将介绍如何利用Java开发大数据文本分析和自然语言处理（NLP）应用，带领你从文
Qt调用网易云API获取歌词等接口 overwriter qt 开发语言
简介前段时间想用Qt做一个歌词处理的小工具，需要从网易云下载歌词；之前已经有大佬用node.js实现了网易云的API集合，但是Qt调用的话需要再走一次网络请求，管理起来有点麻烦，因此用Qt重写了一个网易云API库QCloudMusicApi。这里讲一下如何使用QCloudMusicApi库获取歌词以及调用其他接口。可参考文档API参考目录需求和依赖使用说明需求和依赖Qt5.12+使用说明新建项目新
如何用Netty实现一个负载均衡组件 youyouiknow tech-review java 后端架构
一、总体架构一个基本的负载均衡组件通常包含以下几个核心模块：服务注册与发现(ServiceRegistry&Discovery):功能:维护可用的后端服务实例列表（例如IP地址和端口）。实现要点:注册:服务实例启动时，将自己注册到注册中心。发现:负载均衡器从注册中心获取服务实例列表。健康检查:定期检查服务实例的健康状态，剔除不健康的实例。可选技术:ZooKeeper,etcd,Consul,Nac
如何禁用OpenAI的并行工具调用 hgSdaegva java 前端 javascript python
在使用OpenAI提供的API进行开发时，我们可能会碰到工具调用默认是并行执行的场景。这意味着如果我们询问类似“东京、纽约和芝加哥的天气如何？”的问题，并且我们有一个获取天气的工具，OpenAI将会同时对这三个城市分别发起调用。然而，在某些开发场景中，我们可能希望限制工具调用的并行性，比如在顺序依赖较强的任务中，或者对于某些需要节约资源的场景。本文将通过代码示例，详细讲解如何禁用并行工具调用。核心
如何使用 LangChain 组合提示符模板 GEAWfaacc langchain python
在现代AI应用中，构建灵活且易于重用的提示符（Prompt）是开发者的核心需求之一。LangChain提供了一种直观的方法来组合不同部分的提示，从而实现提示符模板的高效组合和再利用。本篇文章将通过几个具体的例子，带您了解如何在LangChain中进行提示符的组合。技术背景介绍LangChain是一个用于处理语言模型提示符的框架，它支持将字符串提示符和聊天提示符进行组合，从而提高开发效率和代码复用性
Hadoop分布式文件系统-HDFS架构 Fancs2024 hadoop hadoop hdfs
一、HDFS的简介HDFS全称HadoopDistributedFileSystem，是分布式文件管理系统。主要是为了解决大数据如何存储的问题，跟一般文件系统不同的是，它可以通过扩展服务器结点来扩充存储量，可以用低成本的硬件构建出支持高吞吐量的文件系统。二、HDFS的特点高容错性：一个HDFS集群会包含非常多的结点，HDFS将文件分块存储，并且会保存多个副本到不同的机器节点上以保证数据的安全，而且
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。