数据分析v

一文读懂如何用深度学习实现网络安全

作者：Guest Blog；翻译：张玲；校对：丁楠雅

本文约4700字，建议阅读10+分钟。

本文简要介绍深度学习以及它支持的一些现有信息安全应用，并提出一个基于深度学习的TOR流量检测方案。

简介

我们看到的大多数深度学习应用程序通常面向市场、销售、金融等领域，但在使用深度学习来保护这些领域的产品和业务、避免恶意软件和黑客攻击方面，则鲜有文章或资源。

像谷歌、脸谱、微软和SalesForce这样的大型科技公司已经将深度学习嵌入他们的产品之中，但网络安全行业仍在迎头赶上。这是一个具有挑战性的领域，需要我们全力关注。

本文中，我们简要介绍深度学习（Deep Learning，DL）以及它支持的一些现有信息安全（此处称为InfoSec）应用。然后，我们深入研究匿名TOR流量检测这个有趣的问题，并提出一个基于深度学习的TOR流量检测方案。

本文的目标读者是已经从事机器学习项目的数据科学专业人员。本文内容假设您具备机器学习的基础知识，而且当前是深度学习和其应用案例的初学者或探索者。

为了能够充分理解本文，强烈推荐预读以下两篇文章：

《使用数据科学解开信息安全的神秘面纱》
《深度学习的基础知识-激活功能以及何时使用它们》

一、信息安全领域中深度学习系统的现状

二、前馈神经网络概述

三、案例研究：使用深度学习检测TOR流量

四、数据实验-TOR流量检测

一、信息安全领域中深度学习系统的现状

深度学习不是解决所有信息安全问题的“灵丹妙药”，因为它需要广泛的标注数据集。不幸的是，没有这样的标记数据集可供使用。但是，有几个深度学习网络对现有解决方案做出重大改进的信息安全案例。恶意软件检测和网络入侵检测恰是两个这样的领域，深度学习已经显示出比基于规则和经典机器学习的解决方案有更显著的改进。

网络入侵检测系统通常是基于规则和签名的控件，它们部署在外围以检测已知威胁。攻击者改变恶意软件签名，就可以轻易地避开传统的网络入侵检测系统。Quamar等[1]在他们的IEEE学报论文中指出，有望采用自学的基于深度学习的系统来检测未知的网络入侵。基于深度神经网络的系统已经用来解决传统安全应用问题，例如检测恶意软件和间谍软件[2]。

与传统的机器学习方法相比，基于深度学习的技术的泛化能力更好。Jung等[3]基于深度学习的系统甚至可以检测零日恶意软件。毕业于巴塞罗那大学的Daniel已经做了大量有关CNN（Convolutional Neural Networks，卷积神经网络）和恶意软件检测的工作。他在博士论文中提及，CNNs甚至可以检测变形恶意软件。

现在，基于深度学习的神经网络正在用户和实体行为分析（User and Entity Behaviour Analytics，UEBA）中使用。传统上，UEBA采用异常检测和机器学习算法。这些算法提取安全事件以分析和基线化企业IT环境中的每一个用户和网络元素。任何偏离基线的重大偏差都会被触发为异常，进一步引发安全分析师调查警报。UEBA强化了内部威胁的检测，尽管程度有限。

现在，基于深度学习的系统被用来检测许多其他类型的异常。波兰华沙大学的Pawel Kobojek[4]使用击键动力学来验证用户是否使用LSTM网络。Capital one安全数据工程总监JasonTrost 发表了几篇博客[5]，其中包含一系列有关深度学习在InfoSec应用的技术论文和演讲。

二、前馈神经网络概述

人工神经网络的灵感来自生物神经网络。神经元是生物神经系统的基本单元。每一个神经元由树突、细胞核和轴突组成。它通过树突接收信号，并通过轴突进行传递（图1）。计算在核中进行。整个网络由一系列神经元组成。

AI研究人员借用这个原理设计出人工神经网络（Artificial Neural Network，ANN）。在这样的设置下，每个神经元完成三个动作：

它收集来自其他不同神经元的输入或者经过加权处理的输入
它对所有的输入进行求和
基于求和值，它调用激活函数

因此，每个神经元可以把一组输入归为一类或者其他类。当仅使用单个神经元时，这种能力会受到限制。但是，使用一组神经元足以使其成为分类和序列标记任务的强大机制。

图1：我们能获得的最大灵感来自大自然——图中描绘了一个生物神经元和一个人工神经元

可以使用神经元层来构建神经网络。网络需要实现的目标不同，其架构也是不同的。常见的网络架构是前馈神经网络（Feed ForWard Neural Network，FFN）。神经元在无环的情况下线性排列，形成FFN。因为信息在网络内部向前传播，它被称为前馈。信息首先经过输入神经元层，然后经过隐藏神经元层和输出神经元层（图2）。

图2：具有两个隐藏层的前馈网络

与任何监督学习模型一样，FFN需要使用标记的数据进行训练。训练的形式是通过减少输出值和真值之间的误差来优化参数。要优化的一个重要参数是每个神经元赋予其每个输入信号的权重。对于单个神经元来说，使用权重可以很容易地计算出误差。

然而，在多层中调整一组神经元时，基于输出层算出的误差来优化多层中神经元的权重是具有挑战性的。反向传播算法有助于解决这个问题[6]。反向传播是一项旧技术，属于计算机代数的分支。这里，自动微分法用来计算梯度。网络中计算权重的时候需要用到梯度。

在FFN中，基于每个连接神经元的激活获得结果。误差逐层传播。基于输出与最终结果的正确性，计算误差。接着，将此误差反向传播，以修正内部神经元的误差。对于每个数据实例来说，参数是经过多次迭代优化出来的。

三、案例研究：使用深度学习检测TOR流量

网络攻击的主要目的是窃取企业用户数据、销售数据、知识产权文件、源代码和软件秘钥。攻击者使用加密流量将被盗数据混夹在常规流量中，传输到远程服务器上。

大多数经常攻击的攻击者使用匿名网络，使得安全保护人员难以跟踪流量。此外，被盗数据通常是加密的，这使得基于规则的网络入侵工具和防火墙失效。最近，匿名网络以勒索软件/恶意软件的变体形式用于C&C。例如，洋葱勒索[7]使用TOR网络和其C&C服务器进行通信。

图3：Alice与目标服务器之间TOR通信的说明。通信开始于Alice向服务器请求一个地址。TOR网络给出AES加密的路径。路径的随机化发生在TOR网络内部。包的加密路径用红色显示。当到达TOR网络的出口节点时，将简单分组转发给服务器。出口节点是TOR网络的外围节点。

匿名网络/流量可以通过多种方式完成，它们大体可分为：

基于网络（TOR,I2P,Freenet）
基于自定义系统（子图操作系统，Freepto）

其中，TOR是比较流行的选择之一。TOR是一款免费软件，能够通过称为洋葱路由协议的专用路由协议在互联网上进行匿名通信[9]。该协议依赖于重定向全球范围内多个免费托管中继的互联网流量。在中继期间，就像洋葱皮的层一样，每个HTTP包使用接收器的公钥加密。

在每个接收点，使用私钥对数据包进行解密。解密后，下一个目标中继地址就会披露出来。这个过程会持续下去，直到找到TOR网络的出口节点为止。在这里数据包解密结束，一个简单的HTTP数据包会被转发到原始目标服务器。在图3中展示了Alice和服务器之间的一个示例路由方案。

启动TOR最初的目的是保护用户隐私。但是，攻击者却用它代替其他不法方式，来威逼善良的人。截至2016年，约有20%的TOR流量涉及非法活动。在企业网络中，通过不允许安装TOR客户端或者拦截保护或入口节点的IP地址来屏蔽TOR流量。

不管怎样，有许多手段可以让攻击者和恶意软件访问TOR网络以传输数据和信息。IP拦截策略不是一个合理的策略。一篇来自Distil网站[5]的自动程序情势不佳报告显示，2017年70%的自动攻击使用多个IP，20%的自动攻击使用超过100个IP。

可以通过分析流量包来检测TOR流量。这项分析可以在TOR 节点上进行，也可以在客户端和入口节点之间进行。分析是在单个数据包流上完成的。每个数据包流构成一个元组，这个元组包括源地址、源端口、目标地址和目标端口。

提取不同时间间隔的网络流，并对其进行分析。G.He等人在他们的论文“从TOR加密流量中推断应用类型信息”中提取出突发的流量和方向，以创建HMM（Hidden Markov Model，隐马尔科夫模型）来检测可能正在产生那些流量的TOR应用程序。这个领域中大部分主流工作都利用时间特征和其他特征如大小、端口信息来检测TOR流量。

我们从Habibi等人的“利用时间特征来发现TOR流量的特点”论文中得到启发，并遵循基于时间的方法提取网络流，用于本文TOR流量的检测。但是，我们的架构使用了大量可以获得的其他元信息，来对流量进行分类。这本质上是由于我们已经选择使用深度学习架构来解决这个问题。

四、数据实验-TOR流量检测

为了完成本文的数据实验，我们从纽布伦斯威克大学的Habibi Lashkari等人[11]那里获取了数据。他们的数据由从校园网络流量分析中提取的特征组成。从数据中提取的元信息如下表所示：

元信息参数	参数解释
FIAT	前向中间达到时间，向前发送两个数据包之间的时间（平均值，最大值，最小值，标准方差）
BIAT	后向中间达到时间，向后发送两个数据包之间的时间（平均值，最大值，最小值，标准方差）
FLOWIAT	流中间达到时间，向任何一个方向发送两个数据包之间的时间（平均值，最大值，最小值，标准方差）
ACTIVE	时间量，在变成空闲之前的活跃时间
IDLE	时间量，在变成空闲之前的活跃时间
FB PSEC	每秒流字节数。每秒流量包。持续时间：数据流的持续时间。

表1：从[ 1 ]获得的元信息参数

除了这些参数之外，其他基于流的参数也包括在内。图4显示了一个数据集的样例。

图4：本文使用的数据集实例

请注意，源IP/端口、目标IP/端口和协议字段已经从实例中删除，因为它们会导致模型过拟合。我们使用具有N隐藏层的深度前馈神经网络来处理其他所有特征。神经网络的架构如图5所示。

图5：用于Tor流量检测的深度学习网络表示。

隐藏层层数在2和10之间变化。当N=5时是最优的。为了激活，线性整流函数（Rectified Linear Unit, ReLU）用于所有隐藏层。隐藏层每一层实际上都是密集的，有100个维度。

Keras中的FFN的Python代码片段：

model = Sequential()

model.add(Dense(feature_dim, input_dim= feature_dim, kernel_initializer='normal', activation='relu'))

for _ in range(0, hidden_layers-1):

model.add(Dense(neurons_num, kernel_initializer='normal', activation='relu'))

model.add(Dense(1,kernel_initializer='normal', activation='sigmoid'))

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=["accuracy"])

输出节点由Sigmoid函数激活。这被用来输出二分类结果-TOR或非TOR。

我们在后端使用带有TensorFlow的Keras来训练深度学习模块。使用二元交叉熵损失来优化FFN。模型会被训练不同次数。图7显示，在一轮仿真训练中，随着训练次数的增加，性能也在增加，损失值也在下降。

图7：网络训练过程中Tensorboard生成的静态图

我们将深度学习系统的结果与其他预测系统进行了比较。使用召回率（Recall）、精准率（Precision）和F-Score这些标准分类指标来衡量预测系统性能。我们基于深度学习的系统能够很好地检测TOR类。但是，我们更加重视非TOR类。可以看出，基于深度学习的系统可以减少非TOR类的假阳性情况。结果如下表：

Classifier used	Precision	Recall	F-Score
Logistic Regression	0.87	0.87	0.87
SVM	0.9	0.9	0.9
Naïve Bayes	0.91	0.6	0.7
Random Forest	0.96	0.96	0.96
Deep Learning	0.95	0.95	0.95

表2：用于TOR流量检测实验的深度学习和机器学习模型结果

在各种分类器中，随机森林和基于深度学习的方法比其他方法更好。所示结果基于5,500个训练实例。本实验中使用数据集的大小相对小于典型的基于深度学习的系统。随着训练数据的增加，基于深度学习的系统和随机森林分类器的性能将会进一步提升。

但是，对于大型数据集来说，基于深度学习的分类器通常优于其他分类器，并且可以针对相似类型的应用程序进行推广。例如，如果需要训练检测使用TOR的应用程序，那么只需要重新训练输出层，并且其他所有层可以保持不变。而其他机器学习分类器则需要在整个数据集上重新训练。请记住，对于大型数据集来说，重新训练模型需要耗费巨大的计算资源。

尾记

每个企业面临的匿名流量检测的挑战是存在细微差别的。攻击者使用TOR信道以匿名模式偷窃数据。当前流量检测供应商的方法依赖于拦截TOR网络的已知入口节点。这不是一个可拓展的方法，而且很容易绕过。一种通用的方法是使用基于深度学习的技术。

本文中，我们提出了一个基于深度学习的系统来检测TOR流量，具有高召回率和高精准率。请下面的评论部分告诉我们您对当前深度学习状态的看法，或者如果您有其他替代方法。

References

[1]: Quamar Niyaz, Weiqing Sun, Ahmad Y Javaid, and Mansoor Alam, “A Deep Learning Approach for Network Intrusion Detection System,” IEEE Transactions on Emerging Topics in Computational Intelligence, 2018.

[2]: Daniel Gibert, “Convolutional Neural Networks for Malware Classification,” Thesis 2016.

[3]: Wookhyun Jung, Sangwon Kim,, Sangyong Choi, “Deep Learning for Zero-day Flash Malware Detection,” IEEE security, 2017.

[4]: Paweł Kobojek and Khalid Saeed, “Application of Recurrent Neural Networks for User
Verification based on Keystroke Dynamics,” Journal of telecommunications and information technology, 2016.

[5]:Deep Learning Security Papers, http://www.covert.io/the-definitive-security-datascience-and-machinelearning-guide/#deep-learning-and-security-papers, accessed on May 2018.

[6]: “Deep Learning,” Ian Goodfellow, Yoshua Bengio, Aaaron Courville; pp 196, MIT Press, 2016.

[7]: “The Onion Ransomware,” https://www.kaspersky.co.in/resource-center/threats/onion-ransomware-virus-threat, Retrieved on November 29, 2017.

[8]: “5 best alternative to TOR.,” https://fossbytes.com/best-alternatives-to-tor-browser-to-browse-anonymously/, Retrieved on November 29,2017.

[9]: Tor. Wikipedia., https://en.wikipedia.org/wiki/Tor_(anonymity_network), Retrieved on November 24, 2017.

[10]: He, G., Yang, M., Luo, J. and Gu, X., “ Inferring Application Type Information from Tor Encrypted Traffic,” Advanced Cloud and Big Data (CBD), 2014 Second International Conference on (pp. 220-227), Nov. 2014.

[11]: Habibi Lashkari A., Draper Gil G., Mamun M. and Ghorbani A., “Characterization of Tor Traffic using Time based Features,” Proceedings of the 3rd International Conference on Information Systems Security and Privacy – Volume 1, pages 253-262, 2017.

[13]: Juarez, M., Afroz, S., Acar, G., Diaz, C. and Greenstadt, R., “A critical evaluation of website fingerprinting attacks,” Proceedings of the 2014 ACM SIGSAC Conference on Computer and Communications Security (pp. 263-274), November 2014

[14]: Bai, X., Zhang, Y. and Niu, X., “Traffic identification of tor and web-mix,” Intelligent Systems Design and Applications, ISDA’08. Eighth International Conference on (Vol. 1, pp. 548-551). IEEE, November 2008

viumi

原文标题：

Using the Power of DeepLearning for Cyber Security

原文链接：

https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/

译者简介：张玲，在岗数据分析师，计算机硕士毕业。从事数据工作，需要重塑自我的勇气，也需要终生学习的毅力。但我依旧热爱它的严谨，痴迷它的艺术。数据海洋一望无境，数据工作充满挑战。感谢数据派THU提供如此专业的平台，希望在这里能和最专业的你们共同进步！

关联阅读

原创系列文章：

1：从0开始搭建自己的数据运营指标体系（概括篇）

2 ：从0开始搭建自己的数据运营指标体系（定位篇）

3 ：从0开始搭建自己的数据运营体系（业务理解篇）

4 ：数据指标的构建流程与逻辑

5 ：系列：从数据指标到数据运营指标体系

6: 实战：为自己的公号搭建一个数据运营指标体系

7: 从0开始搭建自己的数据运营指标体系（运营活动分析）

数据运营关联文章阅读：

运营入门，从0到1搭建数据分析知识体系

推荐：数据分析师与运营协作的9个好习惯

干货：手把手教你搭建数据化用户运营体系

推荐：最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始，构建数据化运营体系

干货：解读产品、运营和数据三个基友关系

干货：从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读：

干货：数据分析团队的搭建和思考

关于用户画像那些事，看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系，看这一文章就够了

干货：聚焦于用户行为分析的数据产品

如何构建大数据层级体系，看这一文章就够了

80%的运营注定了打杂？因为你没有搭建出一套有效的用户运营体系

从底层到应用，那些数据人的必备技能

读懂用户运营体系：用户分层和分群

做运营必须掌握的数据分析思维，你还敢说不会做数据分析

商务合作｜约稿请加qq：365242293

更多相关知识请回复：“ 月光宝盒 ”；

数据分析（ID : ecshujufenxi ）互联网科技与数据圈自己的微信，也是WeMedia自媒体联盟成员之一，WeMedia联盟覆盖5000万人群。

你可能感兴趣的:(一文读懂如何用深度学习实现网络安全)

单片机之从C语言基础到专家编程 - 4 C语言基础 - 4.14指针 fancyang 单片机之从C语言基础到专家编程单片机 c语言嵌入式硬件
单片机之从C语言基础到专家编程-4C语言基础-4.14指针文章目录单片机之从C语言基础到专家编程-4C语言基础-4.14指针4.14指针1指针的概念2指针的声明与初始化3指针的算术运算4NULL指针1）定义和使用2）NULL指针的用途3）常见误区4）示例代码5）总结5字符串操作1）字符串的定义与初始化2）常用字符串操作函数3）字符串常量与指针6void*指针1）类型转换2）实现通用数据结构3）通用
时光碎片雨天的那棵树
图片发自App时光的碎片漫过四季万物，延绵了开去，便是一条时光的河。在这河里沐浴着人间芳泽，轻点词曲，谱成一首百转千回的诗谣，聆听着世间的风，吹起了那一池皱水，浪花朵朵抵心胸，如时光无言的倾诉。时光，轻轻巧巧地跨越人间万象，深处裂帛之声，有几人能聆听的到？不经意地，时光在身边剪成了纷纷碎片，在门扉轻掩的梨园，在桃花深处的映月潭，在春闱素帘低眉处的暖衾……在每一个时光踏过的地方，留下了对世间万物的留
MySQL数据备份策略监控：实现方法与最佳实践 2401_85743969 mysql 数据库
数据备份是数据库管理中的重要环节，它确保了在数据丢失或损坏的情况下能够恢复数据。在MySQL中，实施有效的数据备份策略监控对于保障数据安全和业务连续性至关重要。监控不仅可以帮助及时发现备份过程中的问题，还可以确保备份数据的完整性和可用性。本文将详细介绍如何在MySQL中实现数据备份的策略监控，包括监控的重要性、监控内容、监控工具和技术、以及监控策略的实施。1.监控数据备份策略的重要性在MySQL环
Node.js+Express|Cookie&Session机制理解|实现保存登录状态绍重先
Q&A各个用户的sessionname如何设置用登陆的用户名？用当时时间？req.session.name=req.body.usernamelogout？url列表标签posthtml退出登陆js//登出事件监听varlogout=document.getElementById('logout');logout.onclick=function(){alert('logout');varlogo
DataBinding-Android JetpacK 组件之一 Mac Zhu android jetpack android
一、DataBinding简介在传统的Android应用开发中，布局文件通常只负责应用界面的布局工作，如果需要实现页面交互就需要调用setContentView()将Activity、fragment和XML布局文件关联起来。然后通过控件的id找到控件，接着在页面中通过代码对控件进行逻辑处理。在这种传统的开发方式中，页面承担了大部分的工作量，大量的逻辑处理需要在Activity、Fragment中
【程序员必读】如何利用AI高效编程，从容准时下班！ z千鑫 AI领域人工智能 Agent AI工具 AI助手工作流 AI编程 ai
前言：在编程的旅途中，程序员们常常面临各种挑战，尤其是在编写代码时，难题层出不穷。尽管传统搜索引擎提供了海量信息，但往往让我们在无尽的例子和复杂分析中迷失，难以找到真正适合自己的解决方案。正因如此，越来越多的程序员开始借助AI的力量，轻松应对这些难题，让工作变得更高效，从而实现准时下班的目标。问题：那么如何利用AI编写代码呢？一、明确问题的核心在使用AI生成代码之前，首先要明确你所遇到的问题是什么
让更多的优秀青年成为先锋战士夏日阳光_1737
在中共中央组织部发布的《中国共产党党内统计公报》中，我们可以看到在2021年发展的438.3万名党员中，35岁及以下党员有354万名，占80.8%，在党中央的鲜明导向指引下，新鲜血液不断被吸收入党，着力以锻造先锋队伍为目标，使党始终保持旺盛生命力和强大战斗力。未来属于青年，希望寄予青年。习近平总书记特别强调，“新时代的中国青年要以实现中华民族伟大复兴为己任，增强做中国人的志气、骨气、底气，不负时代
python实验过程心得体会_web实训心得体会 weixin_39814378 python实验过程心得体会
篇一：JAVAWEB实训心得体会jsp+servlet+mysql论坛项目实训总结实训人：程路峰学号：11103303通过为期10天的实训，我学习了很多关于javaweb的知识。在老师的正确指导下，顺利的完成了我的实训内容。在此，也有同学的帮助，在他们的帮助下我也受益匪浅。最终，能顺利完成实训的任务也很高兴。在实训生活中，我了解开发项目的需求、设计、实现、确认以及维护等活动整个过程，让自己开始懂得
时间识人面，日久见人心映日荷花Q_Q
有句话说得很好：“这世上所有好的感情，都必然经得起时间的检验。”时间如镜，能显露心。人与人的交往始于五官，止于三观，谁都无法预料一段感情能维持多久，日久见人心，世界上有很多变数时刻在发生，我和婷姐是在刚进大学的时候认识的，两人同班，刚开始接触不多，只是点头之交。大一下学期考试月的时候，我经常在图书馆遇到她，我们都喜欢泡图书馆，于是中午一起约饭，交流沟通越来越多，彼此之间也越来越了解。到了大二上学期
使用 i3.LayoutCell() 方法绘制版图并输出为 GDS 文件勤奋的大熊猫 Luceda IPKISS And KLayout IPKISS 芯片版图绘制
使用i3.LayoutCell方法绘制版图并输出为GDS文件引言正文引言在IPKISSi3.SRef()函数一文中我们介绍了如何使用i3.SRef()函数将instance对象添加到i3.LayoutCell()创建的Cell对象上。但是当我们使用write_gdsii()输出版图时代码就会报错。这里我们将介绍如何解决这个问题。这里需要告诉大家的是，IPKISS官网给出的教程是错误的，无法正常运行
构建数字产业生态链，共绘数字经济新蓝图树莓集团人工智能大数据物联网科技生活
在当今数字化浪潮席卷全球的时代，构建数字产业生态链成为了推动经济发展的关键引擎。数字产业生态链如同一个强大的磁场，吸引着各类创新要素汇聚，共同描绘出数字经济的宏伟新蓝图。数字产业生态链的核心在于融合与协同。它将软件开发、数据分析、人工智能、物联网等多个领域紧密连接在一起，打破传统产业界限，实现资源的高效整合与共享。不同的数字技术相互赋能，催生出全新的商业模式和产业形态。构建数字产业生态链，离不开创
Redisson与Redis分布式锁 Lill_bin java redis 分布式数据库开发语言云原生架构微服务
Redis分布式锁Redis分布式锁是一种在分布式系统中用于确保多个进程对共享资源互斥访问的机制。它通常通过Redis的原子指令来实现，比如使用SETNX（SetifNoteXists）指令来设置键，如果键不存在则操作成功，可以认为获取了锁；如果键已存在，则操作失败，表示锁被其他进程持有。但是，这种基本的实现可能会遇到各种问题，如锁无法自动释放导致的死锁问题，或者在高并发情况下的锁安全性问题。为了
一本适合成年人阅读的童话（2019读书第35本）遇见杨小姐
多少开到尘埃里的花是因为深爱，在感情的面前我们有多少踟躇、犹豫与不舍。如果我们知道，红尘万丈原来分离也可以是爱，那爱情故事里会不会少了许多纠缠，少了许多痴男怨女，我们会不会在浓烈如陈酒的感情中变得从容，懂得对我们生命中那些来而又往的人充满感激。——最适合成人阅读的10部童话之一图片发自App小时候很喜欢看童话，因大多结局都是王子和公主幸福地生活在一起。唯独《海的女儿》以悲剧告终，小人鱼永恒地化作泡
【Kotlin】OkHttp框架实现网络下载小叮当不懒 Android kotlin okhttp android
目录【Kotlin】OkHttp框架实现网络下载需求思路实现实现单线程下载功能实现多线程下载功能不积跬步，无以至千里；不积小流，无以成江海。要沉下心来，诗和远方的路费真的很贵！【Kotlin】OkHttp框架实现网络下载需求对网络上的资源进行下载，下载的文件保存在本地mnt/sdcard/Download文件夹。显示下载的进度和下载是否成功的提示。多线程下载，一个线程下载一张图片或者一个视频。只有
Javaweb项目-调用接口-如何在服务器端跳转网页后显示并弹出对话框代码海海不掉头发 Java面试习题 Java基础 java
Webapp项目中在java包下新建一个服务端类使用JOptionPane框架组件调用showMessageDialog的方法实现四个参数null,"这是一个信息对话框","信息",JOptionPane.INFORMATION_MESSAGE还有确认对话框的代码showConfirmDialogpackageservlet;importjavafx.scene.control.Alert;imp
算法设计与分析第一堂课笔记复习海海不掉头发习题每天学习一点点笔记all 算法笔记
算法是解决问题的一种方法或一个过程，是由若干条指令组成的又穷序列，算法的性质输入：有零个或多个输出：“至少一个”确定性：组成算法的每条指令清晰无歧义有限性：算法中每条指令和执行次数和执行时间都是有限的。算法与程序的区别：程序是算法用某种程序设计语言额具体实现的，可以不满足有限性。1.2算法的复杂性分析算法的复杂性分为**时间复杂性**和空间复杂性三种情况下的时间复杂性，可操作性最好最有实际价值的是
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
如何使用JPA自定义更新的sql语句实现对数据表的修改？——SpringDataJpa实现自定义（更新）update语句海海不掉头发笔记all sqlite sql intellij idea jap jpa
文章目录前言一、DAO层/Mapper层二、Service业务处理层三、Controller控制层总结前言有的时候我们在后台管理系统中只需要修改一列的数据时，JPA的操作死对所有字段进行修改，这样就不太方便，而且SpringDataJpa的框架没有线程的更新方法，只能调用save()方法实行保存修改的数据。如果不想把其中一列的数据修改的话，那么JPA就会自动把这一列不想修改的数据默认null，并且
WebKit 简介及工作流程深度解析不知名靓仔 webkit chrome safari edge
WebKit是一个开源的浏览器引擎，最初由苹果公司为Safari浏览器开发，后来被多个浏览器和应用采纳，如早期的Chrome和众多移动平台上的浏览器。WebKit不仅仅是一个渲染引擎，它集成了HTML、CSS、JavaScript的解析与渲染能力，以及网络资源加载、图形处理、排版布局等功能，为用户提供丰富的网页浏览体验。本文将深入探讨WebKit的核心组件以及其复杂的工作流程。WebKit核心架构
【实践出真知】使用Docusaurus将md文档组织起来就是一个网站（写API文档，写教程、写日记、写博客的有福了） IT里的交易员 Python经验池 node.js 产品运营经验分享
文章目录前言一、Docusaurus是什么？二、一键生成网站框架并预览1.系统需求2.脚手架项目网站（一键生成网站框架）3.生成的目录内容4.网站运行与展示总结前言前段时间，学习Flet，访问到Flet中文网，被其简洁的风格吸引，就想着以后将自己的内容也整理一下。最终发现该网站是用Docusaurus这个工具实现的。以后写API文档，写教程、写日记、写博客有福了，只要写出markdown文档即可。
Deepspeed 结合huggingface Trainer实现多机分布式训练 ningzhao 分布式
目前工作中只使用了单机多卡做微调训练，为了提升训练效率，特实验多机多卡分布式训练。一、环境准备本试验使用两台机器（manager，worker），操作系统ubuntu22.4，每台机器有4个GPU为了使安装配置统一，使用docker容器，docker的安装这里不做介绍。1.网络配置-创建overlay共享网络初始化集群，在manager机器上运行:dockerswarminit#输出结果:Swar
深入解析`node-html-to-image`的`main.ts`源码：实现HTML到图片的转换软考鸭 nodeHtmlToImage html 前端 nodeHtmlToImage
引言node-html-to-image是一个强大的Node.js库，它允许开发者将HTML内容转换为图片。本文将深入解析该库的main.ts文件，揭示其内部工作原理，并帮助开发者更好地理解和使用该库。项目背景与功能概述node-html-to-image的主要功能是将HTML字符串或文件渲染为图片。它支持多种输出格式（如PNG、JPEG等），并提供了一系列配置选项，如图片质量、透明度等。该库利用
ASP.NET Core 开源项目详解与入门指南沈菱嫱Marie
ASP.NETCore开源项目详解与入门指南aspnetcoredotnet/aspnetcore:是一个ASP.NETCore应用程序开发框架的官方GitHub仓库，它包含了ASP.NETCore的核心源代码和技术文档。适合用于ASP.NETCore应用程序开发，特别是对于那些需要深入了解ASP.NETCore框架实现和技术的场景。特点是ASP.NETCore官方仓库、核心源代码、技术文档。项目
UPnP服务器（upnpserver）快速入门指南郦祺嫒Amiable
UPnP服务器（upnpserver）快速入门指南upnpserverFastandlightupnpserverfornode项目地址:https://gitcode.com/gh_mirrors/up/upnpserver1.项目目录结构及介绍本项目upnpserver是一个基于Node.js实现的UPnP服务器。下面是其基本的目录结构概览：upnpserver│├──package.json
Cortex—A8处理器编程模型 bv1315008634 单片机
一、Cortex—A8处理器模式Cortex-A8体系结构支持8种处理器模式，分别为：模式缩写说明备注用户user正常程序执行模式不能直接切换到其他模式系统sys运行特权操作系统任务与用户模拟相似，但拥有可以直接切换到其他模式等特权管理svc操作系统保护模式系统复位或软件中断时进入此模式中止abt实现虚拟存储器或存储器保护当存取异常时进入此模式未定义und支持硬件协处理器的软件仿真为定义指令异常响
恒创科技：最小化服务器存储容量的技巧恒创科技HK 科技服务器 5G
最小化服务器存储容量的需求通常来自于希望降低硬件成本、节省能源以及提高系统性能的考虑。以下是一些实现这一目标的技巧：1.评估您的存储需求在开始优化服务器存储之前，您需要清楚了解实际需要和使用的空间大小。您可以使用磁盘使用情况分析器或TreeSize等工具扫描服务器的磁盘和文件夹，并确定最大的文件、目录和分区。这样，您就可以看到是否有任何可以删除、存档或移动到其他位置的不必要或冗余数据。您还可以随时
灾备&云容灾10大误区？看完这篇你就懂了！万博智云OneProCloud 知识科普跨云容灾容灾备份 HyperBDR云容灾 Onepro万博智云
在当今数字化时代，数据和业务连续性对企业至关重要。然而，许多企业特别是中小企业，对于实施容灾，尤其是云容灾计划仍然存在一些误解和顾虑。这些误区不仅限制了他们对潜在风险的准备，还可能导致在真正面临灾难时遭受不必要的损失。今天，就让小博我来理一理这些常见的容灾误区，并简单介绍下HyperBDR云容灾是如何帮助企业克服挑战，实现高效、经济的云容灾的。误区1：灾备都是大企业考虑的事情，我们肯定用不起！Hy
教育是更难的事业（二）琴韵无声
——读《教师的使命》二、学校教育不是万能的孩子一生要经历的教育有很多种，比如家庭教育、学校教育、社会教育等，它们都对孩子的成长产生重要的影响，其中家庭教育的影响尤为重要。孩子成长过程中的大部分时间其实是在家庭中度过的，孩子的全部生活始终与家庭小集体有密切的联系。如书中：“为什么性格内向的孩子容易受伤？”关于这个问题，一定要对它进行彻底的分析，一定要还原到这个人真实的成长环境中。他是怎么变成性格内向
特价电影票在哪购买呢？氧惠全网优惠
特价电影票可以通过多种渠道购买，以下是一些常见的方式：领购物大额优惠券、赚返利佣金用氧惠~氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，教你如
Spark - 升级版数据源JDBC2 大猪大猪
在spark的数据源中，只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式，但是我们在线上的业务几乎全是需要upsert功能的，就是已存在的数据肯定不能覆盖，在mysql中实现就是采用：ONDUPLICATEKEYUPDATE，有没有这样一种实现？官方：不好意思，不提供，dounine：我这有呀，你来用吧。哈哈，为了方便大家的使用我已经把项目打包到mave
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f