CSDN资讯

拿来就能用！如何用 AI 算法提高安全运维效率？ | 技术头条

作者 | 黄龙

责编 | 伍杏玲

出品 | CSDN（ID：CSDNnews）

在整个安全工作中，安全运维是不可或缺的一环，其目的是保证各项安全工作持续有效地运作。除了对外的沟通和业务对接相关工作，大部分安全运维的日常工作相对固定，如漏洞审核、安全产品运维、日志审计和应急响应等工作。

安全工程师除了需要具备一些基础的安全技能，通常还需要具备发现问题的能力和举一反三的能力，比如在漏洞审核是发现一个反射型XSS漏洞，需要思考这个问题是否是通用的问题，通过哪些途径（搜索引擎、业务日志、扫描器脚本等）能发现和挖掘出同类问题，以达到通过问题发现本质。

这些要求和能力所需要的技术，往往也在不断地发展。

技术发展

随着互联网、物联网、大数据和云计算的快速发展，整个IT行业的技术栈都在快速发展，这里我们来简单看一下安全工程师对日志进行安全分析的技术发展史。

早期的业务量不多，技术栈简单，业务复杂度不高，通常日志的量级还不算太大，往往通过简单的命令（awk/sort/cat/find等）或者简单的shell/Python/perl脚本，再加上工程师人肉分析来进行处理。比如入侵排查和响应，分析结果和效率往往特别依赖于安全工程师的日志分析能力、经验和Linux操作的熟练度以及脚本的编写使用。

随着互联网的发展，业务量快速增加和技术栈的高速发展，日志越来越多，需要进行日志分析的平台也快速提升，HDFS和ELK（Elasticsearch + Logstash，Kibana）就应运而生。HDFS作为离线分析，安全工程师可以通过简单的Hive SQL完成一些分析和统计工作；ELK一般作为集中日志分析系统，在搜集、展示和查询方面非常灵活，更加简单易用。所以这个时候的日志分析和问题排查，基本上只依赖于安全工程师的日志分析能力和安全经验，而一些hive sql或者es查询语法，学习成本是非常低的。

随着日志量越来越大，一方面日志量越来越大，日志分析的效率需要提高；另一方面很多安全分析的需求也不简单的是一些特征关键字和统计能完成的，可能有些需要依赖于前面的行为等，这时候安全工程师就需要新的工具来进行支撑。

面临的问题

当下，安全运维工作有两个重要指标：效果和效率。

前面我们提到安全运维工程师需要进行安全分析，随着现在业务的快速发展和技术栈复杂度的提升，工程师每天面对的是海量的数据，很多时候的工作可能都是大海捞针，工程师面对海量的日志数据，如何快速地定位问题，以及如何挖掘出更多的安全风险都是急需解决的问题。

安全工程师在运维安全产品的时候，需要通过自身的能力来提升一些安全产品的效果，如降低WAF的漏报情况，安全运维人员或多或少都做过以下一些工作：

比较简单的做法可能就是不停的搜集各种攻击的Payload，进行攻击测试；
除了搜集Payload外，深入一点的做法一般是通过梳理关键字/特征从ES或者HDFS提取疑似攻击日志，进行人工分析；
随着大数据平台和威胁情报的发展，再进一步的方式会考虑将已经发现攻击的IP和威胁情报的扫描IP的对应的请求进行梳理，进行二次分析；
比较理想的做法是对全量日志进行分析，提取攻击行为日志，根据日志提取特征。

这里我们会发现，随着日志量的越来越大，依赖人肉分析大量数据是不现实的。虽然抽样分析和正则或规则匹配也是一种折中方案，但是会存在一定的遗漏风险。这个时候，我们需要通过一些更优的方案和工具，能够快速高效地从海量数据中发现更多未知的问题，而机器学习很可能就是我们的答案。

AI赋能安全运维工作初探

安全与机器学习

目前在安全领域已经有很多方向尝试借助机器学习来解决问题，如恶意软件检测、违规图片识别，垃圾邮件识别，UEBA等。

机器学习在垃圾邮件、风控系统和违禁图片识别方向是效果比较显著的，比如对违禁图片进行打标，通过机器学习进行自动分类：

现阶段，大部分机器学习仅仅是融入到各种安全产品中，而在基础安全领域并没有得到很好的利用。一方面是机器学习本身有一定的成本，在日常运维中使用有一定的门槛；另一方面在基础安全领域的机器学习的效果受制于样本的限制，比如在Webshell的检测中，我们发现现有的Webshell样本是远远不够的，有些时候我们会在实践过程中发现，算法的准确性还不如一些简单的规则。

实际上，并不是所有的场景都适合现阶段的机器学习落地，这里我们先来关注一些适合机器学习的场景，比如大量日志数据的处理和分析。

前面的分析我们已经知道，面对大量日志的分析和处理，我们之前使用的初级工具（shell命令、Python脚本等）和中级工具（ES搜索、HiveSQL等）等都已经满足不了我们的需求了，这时候我们就需要使用机器学习这个高级工具了。

通过日志分析发现异常用户

背景介绍

日志分析和审计在安全运维工作中经常遇到，这里我们考虑一个很简单的日志审计需求：有一个业务，提供了敏感接口的访问日志，需要安全工程师发现哪些人有问题。

针对这类问题，目前比较常见的分析方式主要是基于统计方式，最常见的就是频次统计，比如每个员工的访问阈值是100次/天，当超过了100次我们就报警。这类的分析统计实现是比较简单的，通过时间窗口来实现。

这里，为了展示方便，我选取了一个访问量小的业务，用其中一个功能的访问日志做说明。

简单分析

日志记录的主要信息是：谁在什么时间，在什么地点，对谁做了什么事情？

这里面，每一个维度可以单独分析，同时也可以联合分析，很多时候结果完全依赖于运营人员的经验或者是系统的规则。

通常情况下，我们分析的维度包括：

频率：单个用户在一段时间范围内的行为超过了某个阈值；
时域：在特定的时间做这件事情，如在凌晨3点，下载了3份文件；
地点：通常情况是IP，这里可以和威胁情报做Join，也可以根据业务做分析，比如是员工通过一台美国的服务器访问了xx系统；

这些条件还可以组合，综合一些规则条件来处理。当然，再复杂一点就是一个简单的日志行为分析系统了。

我们考虑一些场景，如果是一些应急的分析需求，日志量有不小，我们怎么来快速进行分析呢？或者是已经有很多日志数据了，因为数据量太大而没有利用起来，我们是否能挖掘其中的价值呢？

这里我们尝试使用机器学习的算法来进行一些分析。

具体实例——发现异常用户

很多时候，我们的需求是发现异常用户行为，所以需要有工具帮助我们快速提取异常的用户行为。有过日志分析经验的同学应该会有这样的经验：通常情况下，大部分的用户基本都是正常请求；有部分用户的请求是异常；但是异常的情况之间往往有很大的差异。简单来说就是正常的人都差不多，奇葩的人可能有各种奇葩。那么，我们怎么去提取这些“奇葩”呢？

最理想的情况就是通过机器学习的算法，直接区分出正常和异常的用户。正如我们前面提到的，异常的情况可能是多种多样，所以这里我们不能简单的进行二分类，而是考虑使用聚类算法，先进行分类，再针对各类的用户进行针对性的分析，这里我们尝试使用K-Means算法。

上图就是通过K-Means算法分簇效果展示，通过图表相信大家比较容易理解。

很多时候一开始分析日志时，我们并不清楚正常访问和异常访问具体的特征和区别，所以这里使用 K-Means算法，K-Means本身是无监督学习算法，所以我们在使用时并不需要花费大量的时间来搜集样本，并进行模型训练（终于不用像识别图片验证码那样整理一大堆的样本文件了）。

另外一个很重要的原因就是K-Means算法非常容易实现，上手也比较容易，简单的来说就是先根据请求的特性进行分类，然后我们去掉正常的请求（通常情况下数量最多的一簇），针对其他簇（异常）进行深入分析。

K-Means算法的思想很简单，对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇。让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。

有关“簇”和“质心”参考下图：

这里具体的原理我们暂时不做解释，感兴趣的同学可以通过搜索引擎自行了解。

算法实践

为了大家方便了解，我们提取了部分数据做一个简单的分析演示。

这是某个系统，敏感接口的访问日志（IP地址和页面信息已经做了脱敏处理），我们现在简单的从用户的访问频次来进行分析。

我们现在主要目的是区分正常用户和异常用户，这里我们并没有之前的用户数据参考，所以选择非监督学习的K-Means算法。

提取特征

首先是提取特征，为了方便演示，我们这里仅使用单个维度特征（用户每天的访问次数）：

我们可以先直接通过折线图看一下各个用户的访问情况：

通过访问情况图表，我们只能比较直观的观察到一些比较明显的数量较多的情况。

因为这个特征本身是数字特征，所以可以直接作为算法的特征，又是单一维度，也省掉了特征转换的一个过程。

提取完特征，我们借助K-Means算法来进行分类，算法会根据业务情况将数据分为几类，到底分为几类需要用户指定，那到底几类比较合理呢？我们可以通过一些方法帮我们决定。

比较直观和常用的方法时肘部法则（Elbow Method），我们来看一下运行的结果：

我们可以看到，通过画K与cost function的关系曲线图，如左图所示，肘部的值（cost function开始时下降很快，在肘部开始平缓）做为K值，K=4。

PS：并不是所有的问题都可以通过画肘部图来解决，这里使用肘部图是为了方便让大家观察。

这里，我们直接调用sklearn中的KMeans算法：

分类完成，发现异常情况

通过K-Means分类，我们可以发现这四类的情况：

0簇的用户最多，139个，根据我们的经验判断这139个用户是正常的。所以我们的重点可以放在后面3个簇中，即关注用户25,28,49,52的行为。

这里我们观察一下这4个异常用户的访问情况，我们可以看到这几个异常用户确实是可疑用户，和我们之前通过阈值分析结果匹配，并且还有些行为特定，如突然某一天的访问量都突然增多。

说明：

K-Means很多时候只能帮助我们进行分簇，并不能直接解决问题，分类之后的工作还是需要安全工程师人工进行分析。

如果面对海量的用户访问数据，通常情况下正常用户的访问占大部分（特别是内部系统），所以使用算法能够帮助我们排除大量正常的数据，让安全工程师更专注于异常的数据分析，可以大大的提高我们的分析效率。

小结

在一些UBA/UEBA的产品中，也是使用了K-Means算法或者其他的聚类算法。当然，在实际情况中远远不止这些工作，从特征提取到模型训练，交叉对比等机器学习有一套完整的工程化流程。

同时，我们也需要注意，并非所有的异常都是有安全问题的，这里就需要安全运营通过对业务的敏感性，以及和业务对接的方式去分析和排查。

WAF漏报问题优化

背景介绍

前段时间在护网行动发现， WAF（Web Application Firewall）基本已经成为各个公司的标配了。我们都知道WAF确实能帮助我们拦截很多Web应用攻击，作为运维人员，都会面对一个触及灵魂的问题：如何评估WAF的拦截效果？漏报率怎么样，误报率怎么样？

我想想大部分运维人员都会有自己的测试工具，包含搜集的一些特定的攻击测试样例，定期做一些评估测试，如：

通常情况下，有基础的测试用例和持续的运营，误报我们比较容易发现和及时处理。但是漏报的问题大家很难评估，尽管我们已经梳理了各种攻击和漏洞利用的场景。

但是在复杂的互联网环境和云环境，如果我们仔细分析日志，还是会发现有不少漏过的情况。

正如我们前面提到的，除了Payload搜集和简单关键字提取外，常见的做法就是可疑请求打标。简单来讲就是将所有已经拦截过的请求的IP，在一定时间需求内的请求都打上可疑的标签，当然IP维度还可以包含一些威胁情报的扫描IP，或者是全量日志直接分析。

这里，我们的目的就是从这些可疑或者全量日志中，提取出特定的攻击日志，以降低我们的人工分析量。

具体实例——XSS攻击日志挖掘

很多时候我们想提升我们WAF的拦截效果，降低漏报，就需要对日志进行分析和攻击行为提取，并转换为拦截规则。

前面我们已经讲了使用K-Means可以帮助我们进行分类的方法，这里我们换一个思路，我们针对XSS这个类型的漏报日志进行提取。

算法实践

1、样本搜集

在WAF的运维期间，已经搜集了很多XSS攻击的Payload和日志，这里我们再整理一些正常的请求日志。

这样我们就已经有了正样本和负样本，可以尝试通过监督度学习，从请求日志中挖掘我们的漏网之鱼。

2、特征提取

因为需要发现XSS攻击，所以我们首先需要简单地梳理一下XSS Payload的特征，XSS攻击通常如下：

很可能包含一些HTML标签或者事件属性，比如html标签, 等;
可能包含一些探测关键字/函数，比如 xss, alert(1), document.cookie等；
通常情况下，如果黑客进行利用需要引入三方js，需要注意短链接等；
通常情况下，在js中需要连接字符，比如注释后面//, 比如连接可执行js代码 ;, -,+, /,*, ^, &等；
去掉闭合支付之后，是一些可解析执行的js语句或者HTML语句。
……

从安全工程师的角度去分析，我们能发现很多特征，但是这里我们需要学习如何把这些特征转换为机器能够识别的特征。

作为文本特征的提取，首先是分词，然后对分词的特征进行处理。再想办法把这些特征进行处理，让他们变成机器能识别的特征向量。比较简单的特征提取方式就是直接针对敏感字符/关键字的个数进行统计和分析，这个更符合统计学的思路，感兴趣的朋友可以参考《Web安全之机器学习入门》。

这里我们尝试另一种思路，选择嵌入式词向量（Word embedding），嵌入式词向量就是通过学习文本来用词向量表征词的语义信息，通过将词嵌入空间使得语义相似的词在空间内的距离接近。

因为XSS攻击通常执行的是HTML/JavaScript脚本，是具有一些语义的关联。这里我们可以使用嵌入式词向量模型，建立一个XSS的语义模型，让机器能够理解< script>、alert()这样的语言，这样看起来更符合人类分析的模式。

首先我们进行分词：

然后取正样例中出现次数最多的300个词，构成词汇表（其他词统一用特定的字符如“NSRC”替代），使用gensim模块的word2vec类处理。

我们可以看看XSS Payload的部分分词情况：

分类完成，挖掘XSS攻击

同样的，我们把正常样本也进行类似的处理，然后这里我们使用支持向量机（Support Vector Machines, SVM）算法进行识别。SVM比较适合二分类问题，即我们所说的好/坏的情况。

SVM是一种监督学习算法，在学习复杂的非线性方程时，能够提供一种更为清晰和更加强大的方式。之前很多有使用SVM进行图片验证码识别，识别的效果也是挺不错的。

而在Python中，我们通过直接引入sklearn的SVM算法实现即可直接调用：

from sklearn.svm import LinearSVC

通过已有的数据测试，SVM数据的准确率基本上是98%，召回率是97%。

这时候我们就开始对日志进行分析，通过SVM的训练模型进行查找，确实发现了很多我们之前没有发现的情况。

对发现的日志进行人工分析，有些场景的误报比较多，特别是参数值包含http请求的情况，这个和我们之前提取的特征有密切关系。

这里我们通过其他维度分析出的日志对比可以发现，目前我们使用Word2vec+SVM的算法还是存在一些漏报的情况：

后续

通过前面的机器学习算法，帮助我们顺利从日志中发现了更多的XSS攻击，虽然还存在一些漏报和误报的情况，但是已经比之前的一些简单的规则好了很多。

SVM算法的实现比较简单，而且性能资源消耗低，不过缺点可能是泛化能力相对较弱，发现问题有限，并不是特别的“智能”，这点通过我们分析的SVM漏报结果就可以发现。

感兴趣的朋友可以考虑一下特征优化和尝试下其他的算法。

总结

随着数据的爆发和算力性价比的提升，相信未来机器学习会越来越普及。

我们完全把算法看作一个高级工具（并没有去讲解算法本身的复杂原理），来提升安全运维工作的价值。

建议

了解机器学习，尝试通过机器学习的视角去了解和解决问题，把机器学习的各种算法当作一个解决问题的工具，就像木工使用锤子一样，先用起来，再慢慢去了解其原理。

在尝试机器学习算法时要考虑几个条件：

数据量是否较大；
样本是否足够；
安全工程师判断成本（是否直观）：比如违禁图片的标签是很容易判断的，而人机识别提取的行为数据是运营很难直接判断的，所以后者的成本远比违禁图片识别高。

另外，在运维环节可以多尝试机器学习的算法和模型（离线），不建议在线上落地。线上落地需要比较专业的工程化和机器学习团队来处理，涉及到成本、效果保证、执行效率、处理结果的相关性以及回放数据对比等一些列因素；

参考：

https://www.jianshu.com/p/942d1beb7fdd

http://www.webber.tech/posts/%E4%BD%BF%E7%94%A8%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%A3%80%E6%B5%8BXSS/

《Web安全之机器学习入门》

作者简介：黄龙，网易易盾资深安全工程师，专注于互联网安全，擅长安全攻防对抗和甲方安全建设，拥有CISSP认证，同时也是网易云课堂《Web安全工程师》微专业核心制作人。

【END】

想要转行AI，程序员该如何学习？

https://edu.csdn.net/topic/ai30?utm_source=csdn_bw

热文 推荐

☞李彦宏内部信曝光；三大运营商否认 4G 降速；ThinkPHP 6.0 RC4 版本发布 | 极客头条

工程师与项目经理之间差距何在？

每秒 10 万并发的 BI 系统如何频繁发生 Young GC？

☞漫画高手、小说家、滑板专家……解锁程序员的另一面！

☞每天超50亿推广流量、3亿商品展现，阿里妈妈的推荐技术有多牛？

☞手把手教你如何用Python模拟登录淘宝

☞做了中台就不会死吗？每年至少40%开发资源是被浪费的！

☞17大主链均狂跌国内项目却看涨, 本周不可不知的7组榜单 | 数据周榜

行！这下 CSDN 玩大了！粉丝：太良心

点击阅读原文，输入关键词，即可搜索您想要的 CSDN 文章。

你点的每个“在看”，我都认真当成了喜欢

你可能感兴趣的:(拿来就能用！如何用 AI 算法提高安全运维效率？ | 技术头条)

Gone v2 提供 gRPC服务 dapeng-大鹏 Gone框架介绍 golang gRPC gone
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/grpc/README.md文章目录编写proto文件，生成golang代码编写服务端代码注册客户端编写配置文件测试总结首先创建一个grpc目录，在这个目录中初始化一个golangmod：mkdirgrpccdgrpcgomodin
Gone 从 v1 到 v2 的更新分析 dapeng-大鹏 Gone框架介绍 gone 依赖注入后端框架
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/gone/blob/main/docs/gone-v1-to-v2-analysis.md文章目录1.概念简化与术语变更2.接口重新设计2.1组件定义的简化2.2组件加载方式的统一2.3生命周期方法的优化3.依赖注入逻辑重写3.1注入标签的简化3.2依赖注入查找流
《解锁华为黑科技：MindSpore+鸿蒙深度集成奥秘》人工智能深度学习
在数字化浪潮汹涌澎湃的当下，人工智能与操作系统的融合已成为推动科技发展的核心驱动力。华为作为科技领域的先锋，其AI开发框架MindSpore与鸿蒙系统的深度集成备受瞩目，开启了智能生态的新篇章。华为MindSpore：AI框架的创新先锋MindSpore自2019年诞生以来，迅速在AI领域崭露头角。它以其独特的设计理念和先进的技术架构，为开发者提供了全场景的AI开发支持。从设计理念上看，MindS
[免费送Claude账号密码]ChatGPT的平替——Claude赠送2个免费Claude账号密码卡密！（内附Claude注册教程） NBA首席形象大使阿坤日常小功能实现人工智能 chatgpt claude gpt-3
一、账号说明1.账号格式：登录邮箱—密码—验证邮箱2.登录方式：访问Claude官网，选择登录，输入登录邮箱、密码不多叭叭，上账号！账号1：登录邮箱:[email protected]—登录密码:c934dfqcwuz8g—验证邮箱:[email protected]账号2：登录邮箱:[email protected]—登录密码:jx68
程序员副业变现的三种模式：我的实践分享程序员
程序员副业变现的三种模式：我的实践分享大家好，今天想和大家分享我作为程序员在探索副业道路上的三种不同变现模式。每种模式都有其特点和优势，希望能给想要开启副业之路的程序员朋友一些启发。一、ToB技术服务：与科技公司的直接合作这是最直接的技术变现模式，通过与其他科技公司的现场对接获取收益。特点：直接面对企业客户谈判周期较短项目需求明确付款相对及时优势：技术门槛高，议价能力强合作方式灵活可以建立长期合作
五大股票金融数据API接口推荐：从实时行情到历史数据全覆盖金融行业
摘要：本文将介绍五大主流的股票金融数据API接口，涵盖实时行情、历史数据、技术指标等功能，帮助开发者快速构建金融数据应用。（本文由deepseek生成）一、StockTVAPI1.核心优势全球覆盖：支持印度、美国、日本、韩国等10+国家的股票市场实时性强：提供WebSocket实时数据推送数据全面：包含股票、指数、期货、外汇、加密货币易于集成：提供多种语言的SDK和详细文档2.主要功能实时行情：支
JavaScript基础-全局作用域難釋懷 javascript 开发语言
在JavaScript编程中，理解变量的作用域是编写高效、可维护代码的关键之一。全局作用域是指变量在整个程序范围内都可访问的状态，这意味着它们可以在任何函数或代码块中被读取和修改。然而，过度使用全局变量也可能导致一些问题，如命名冲突和意外的副作用。本文将详细介绍全局作用域的概念、特性以及如何合理使用全局变量。一、什么是全局作用域？当一个变量在任何函数、代码块之外声明时，它就处于全局作用域下。这意味
PCL 点云OBB包围盒（二）大鱼BIGFISH 点云进阶 C++PCL 点云OBB包围盒
文章目录一、简介二、实现步骤二、实现代码三、实现效果参考资料一、简介包围盒是一种求解离散点集最优包围空间的算法，基本思想是用体积稍大且特性简单的几何体（称为包围盒）来近似地代替复杂的几何对象。（来源于百度）常用的求解包围盒的算法主要有AABB和OOB算法，但AABB算法容易受到物体朝向的影响，产生较大的空隙，因此本文将以OOB算法思想实现最小包围盒的求取。包围盒的应用有很多，如机械上的碰撞测试、物
(4-4)DeepSeek底层架构技术：混合专家架构技术码农三叔训练 RAG 多模态)架构 transformer 深度学习大模型人工智能 DeepSeek
2.4混合专家架构技术DeepSeek引入了混合专家架构（Mixture-of-Experts，MoE），将模型划分为多个专家子模型，每个子模型专注于处理不同的任务或领域。MoE架构通过动态任务分配和稀疏激活机制，减少了不必要的计算量，提升了模型的效率和灵活性。例如，DeepSeek-V3拥有6710亿参数，但每个输入token仅激活370亿参数。2.4.1混合专家架构介绍混合专家架构（Mixtu
Python API接口君王的羔羊 Python AI python
人工智能机器人EverydayWechat老李API图灵机器人：http://www.turingapi.com/（需求实名制认证，并每天免费数量只有100条）青云客智能聊天机器人：http://api.qingyunke.com/（无须申请，无数量限制，但有点智障，分手神器。分手神器，慎用）智能闲聊（腾讯）：https://ai.qq.com/product/nlpchat.shtml(申请使用
什么是Claude API Key？如何使用？ AI_1988 人工智能
Claude，作为一款功能强大的AI工具，它的API接口无疑为开发者提供了极大的便利。那么，ClaudeAPIKey的作用是什么呢？在本文中，我们将详细介绍ClaudeAPIKey的使用方法、能调用的模型，以及如何获取ClaudeAPIKey，帮助开发者更好地利用这一技术。一、ClaudeAPIKey的作用是什么？ClaudeAPIKey是访问ClaudeAI服务的凭证。每当您向Claude的AP
面向对象Demo02 泛轻舟963 java
方法的调用的回顾packageoop;publicclassDemo02{ //静态 publicstaticvoidmain(String[]args){ //studentstudent=newstudent(); student.speak(); //非静态//studentstudent=newstudent(); }}packageoop;publicclass
C++25--lambda表达式大胆飞猪 c++
目录1.C++98中的一个例子2.lambda表达式3.lambda表达式语法4.函数对象与lambda表达式1.C++98中的一个例子templatestructgreater{booloperator()(Ta,Tb){returna>b;}};intmain(){intarray[]={4,1,8,5,3,7,0,9,2,6};//默认按照小于比较，排出来结果是升序std::sort(arr
Gone v2 中 Gone-Gin 性能测试报告 dapeng-大鹏 Gone框架介绍 gin gone 依赖注入请求参数依赖注入
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/gin/benchmark_test.mdGone-Gin性能测试报告文章目录Gone-Gin性能测试报告简介实现原理核心组件工作流程响应处理机制性能测试测试环境测试用例测试代码示例请求结构体定义Gone-Gin处理函数原生Gin处
MATLAB 操作指南（结尾附实操案例） vvvae1234 信息可视化
一、MATLAB简介MATLAB（矩阵实验室）是一个高级技术计算语言和交互环境，它主要用于数值计算、数据分析、算法开发和可视化。MATLAB的核心功能是矩阵运算，它能够处理向量和矩阵为中心的数学问题，方便用户进行算法的开发和数据可视化。主要特点高效的数值计算：MATLAB内置了许多用于数学和工程计算的函数，用户可以轻松地进行数值运算。可视化功能：MATLAB提供了丰富的工具，用于生成各种类型的图形
SQL必知必会40-SQLite：为什么微信用SQLite存储聊天记录？程序员zhi路 MYSQL专栏 sql sqlite jvm
我在上一篇文章中讲了WebSQL，当我们在Chrome、Safari和Firefox等浏览器客户端中使用WebSQL时，会直接操作SQLite。实际上SQLite本身是一个嵌入式的开源数据库引擎，大小只有3M左右，可以将整个SQLite嵌入到应用中，而不用采用传统的客户端／服务器（Client/Server）的架构。这样做的好处就是非常轻便，在许多智能设备和应用中都可以使用SQLite，比如微信就
doris：SQL 方言兼容向阳1218 大数据 doris
提示从2.1版本开始，Doris可以支持多种SQL方言，如Presto、Trino、Hive、PostgreSQL、Spark、Clickhouse等等。通过这个功能，用户可以直接使用对应的SQL方言查询Doris中的数据，方便用户将原先的业务平滑的迁移到Doris中。警告该功能目前是实验性功能，您在使用过程中如遇到任何问题，欢迎通过邮件组、GitHubIssue等方式进行反馈。部署服务下载最新版
自动化测试：灵活书写XPATH定位路径 ZJ_star_1220 python html css 前端 python
进行UI自动化测试过程中XPATH定位是使用最多的定位方法，但是有时候直接复制出来的XPATH路径会比较长，所以就需要掌握一些更高级的方法，通过询问AI，最终得到了以下方法，感觉很有用，所以记录下来一、基础定位语法绝对路径与相对路径绝对路径：以/开头，从根节点逐层定位（如/html/body/div/input），路径长且易受页面结构调整影响相对路径：以//开头，直接定位目标元素（如//input
【信息学奥赛一本通】2040：筛选法找质数 repas-originse C++筛法质数算法 C++程序设计
【题目描述】用筛法求出n(2≤n≤1000)n(2≤n≤1000)以内的全部质数。【输入】输入nn。【输出】多行，由小到大的质数。【输入样例】10【输出样例】2357【代码】#includeusingnamespacestd;intmain
PTA:空心字母金字塔悦悦子a啊 C语言PTA习题 c++算法
输入一个大写的英文字母，输出空心的字母金字塔。输入格式:一个大写英文字母。输出格式:一个空心的大写英文字母金字塔，其中第1层的“A”在第1行的第40列，列从1开始计数。输入样例:E输出样例:ABBCCDDEEEEEEEEE代码如下：#includeusingnamespacestd;intmain(){chara;cin>>a;intn=a-'A';charb='A';if(a=='A'){for
Python 实现的采集诸葛灵签老大白菜 python python 开发语言
Python实现的采集诸葛灵签项目介绍这是一个基于Python开发的诸葛灵签数据采集和展示项目。通过爬虫技术获取诸葛神签的签文和解签内容，并提供数据存储和查询功能。项目结构zhuge/├──zhuge_scraper.py#爬虫主程序├──zhuge_pages/#数据存储目录│├──all_signs.json#汇总数据│└──zhuge_sign_*.json#单个签文数据└──zhuge.m
mybatisSql拼接报错严欣铷 sql mybatis 数据库
Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityConstraintViolationException:Column'id'inwhereclauseisambiguousSELECTs.id,s.serial_no,s.material_requisition_id,s.material_requ
矩阵转置（信息学奥赛一本通-1126） Doopny@ 信息学奥赛一本通算法
【题目描述】输入一个n行m列的矩阵A，输出它的转置AT。【输入】第一行包含两个整数n和m，表示矩阵A的行数和列数(1usingnamespacestd;constintN=1e2+10;intnums[N][N];intmain(){intn,m;cin>>n>>m;for(inti=1;i>nums[i][j];}}for(inti=1;i<=m;i++){for(intj=1;j<=n;j++
Shell 目录 ianozo #反弹shell linux 运维服务器
反弹shellSUID提权一些疑问什么是SUID：SUID=SetUserID，特殊权限，标志为s（如-rwsr-xr-x），当用户执行该程序时，程序会以文件所有者的权限运行（比如以root身份运行）但是为什么不用sudo密码就能直接运行root呢：无需sudo密码的关键原因——管理员错误配置了sudo权限，配置了NOPASSWD为什么需要SUID？比如说最需要SUID权限的/user/bin/p
Java面向对象编程进阶：深入理解static、单例模式与继承 shy2005_5_31 Java全栈开发学习 java 单例模式开发语言
在面向对象编程（OOP）中，掌握高级特性是提升代码质量和设计能力的关键。本文基于Java语言，深入探讨static关键字、单例设计模式、继承等核心概念，并结合实际应用场景与深度思考，帮助读者构建系统化的知识体系。一、static关键字：共享与效率的基石1.静态变量vs实例变量静态变量：用static修饰，属于类，内存中仅一份，被所有对象共享。应用场景：全局计数器、配置参数。publicclassU
25年大数据开发省赛样题第一套，离线数据处理答案 Tometor 大数据 spark scala
省赛样题一，数据抽取模块这一模块的作用是从mysql抽取数据到ods层进行指标计算，在题目中要求进行全量抽取，并新增etl-date字段进行分区，日期为比赛前一天importorg.apache.spark.sql.SparkSessionimportjava.util.PropertiesobjectTask1{defmain(args:Array[String]):Unit={valspark
C语言数据结构——变长数组（柔性数组） Iawfy22 数据结构 c语言柔性数组
前言这是一位即将大二的大学生（卷狗）在暑假预习数据结构时的一些学习笔记，供大家参考学习。水平有限，如有错误，还望多多指正。本文主要介绍了如何手动实现一个变长数组，以及实现其部分功能（如删除、查找、添加、排序等）变长数组介绍变长数组又可以叫柔性数组，与一般数组不同，它是一个动态的数组，具体表现为可以根据数组里面元素个数的多少而自动的进行扩容，以便达到变长（柔性）的特点。预备知识为了实现自动边长扩容这
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
Mybatis的基本使用学c真好玩 mybatis
MyBatis简介MyBatis用于持久层框架,持久层是对数据库操作的部分，前版本iBatis由Apache软件基金组织进行更名并维护。特点:简化数据库的操作SQL映射灵活(半ORM框架)支持高级映射易于集成维护配置动态SQL缓存机制功能：替代JDBC,JDBC是java中提供的用于操作数据库的技术及方案数据库的连接控制难。连接池SQL语句硬编码。将sql语句存放到xml配置文件中参数传递问题。提
pjsip dtmf发送和接收（pjsua）小gpt& Pjsip 音视频 qt c++
DTMF（双音多频，Dual-ToneMulti-Frequency）是一种用于电话系统的信号技术，通过组合两个不同频率的音频信号来表示数字和符号。以下是DTMF的主要使用背景和应用场景：电话拨号DTMF最常见的用途是电话拨号。当用户按下电话键盘上的数字或符号时，电话会生成两个特定频率的音调，交换机接收并解码这些信号以确定用户拨打的号码。交互式语音应答（IVR）系统DTMF广泛用于IVR系统，用户
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR