Blank_spaces

【论文导读】2018阿里CTR预估模型---DIN（深度兴趣网络），后附TF2.0复现代码

点击上方“潜心的Python小屋”关注我们，第一时间推送优质文章。

前言

大家好，我是潜心。今天分享一篇最近看的，阿里2018在KDD上发表的论文《Deep Interest Network for Click-Through Rate Prediction》。文章的核心就是使用一个局部激活单元（类似Attention机制）来提高与候选广告相关的历史信息的权重。当然文章还提到了两个在工业深度网络上的技术。总体来说这是一篇偏向工程方面的论文，非常值得一读。本文文末还附上了自己用TF2.0复现的代码，有详细注释【官方给的开源代码难以读懂切为TF1.4版本】。

本文约5k字，预计阅读15分钟。

摘要与引言

背景

在工业领域例如在线广告上点击率（Click-through rate，CTR）预测是一个很重要的任务。在每次点击费用（cost-per-click，CPC）的广告系统中，广告按有效价格，即每千个有效成本（effective cost per mille，eCPM）排名，该价格是出价与CTR的乘积，而点击率则需要通过系统预估。因此，CTR预估模型的效果直接影响最终收益，并在广告系统中发挥关键作用。

现状（指2018之前）

如今，CTR预估广告有一个深度学习的Base Model，即Embedding + MLP。大规模稀疏输入特征首先被映射到低维Embedding向量中，然后转换为固定长度向量【sum pooling/avg pooling】，最后被连接在一起【concatenate】输入到MLP以学习特征之间的非线性关系。对比很多的逻辑回归模型，确实减少了很多的特征工程和增强模型的能力。常见的模型有Wide&Deep[1]、 DCN[2]、PNN[3]、DeepFM[4]等。

瓶颈

Embedding&MLP模型的瓶颈就是表达用户多样的兴趣。例如，在电子商务中，用户浏览电商网站时可以同时对多个不同的物品产生兴趣。在CTR预估问题中，就是从用户的浏览历史中去捕获用户的兴趣。而该方法不管候选广告是什么，都是将多个特征向量【Embedding】压缩到一个固定长度的表示向量来学习特定用户所有的兴趣表示，这限制了模型的能力，很难从历史行为中提取用户变化的兴趣。
解决这个问题最简单的方法就是扩展向量的维度，但这样会增加学习的参数和在有限的数据中有过拟合的风险。

启发与创新

其实不必将某个用户所有的兴趣【用户的历史购买记录】全部压缩到向量中，因为只有用户部分的兴趣会影响当前行为（对候选广告点击或不点击）。例如，一位女游泳运动员会点击推荐的护目镜，这主要是由于购买了泳衣而不是上周购物清单中的鞋子。
受到上述启发，作者提出了Deep Interest Network模型[5]，它通过考虑【给定的候选广告】和【用户的历史行为】的相关性，来计算用户兴趣的表示向量。具体来说就是通过引入局部激活单元，通过软搜索历史行为的相关部分来关注相关的用户兴趣，并采用加权和来获得有关候选广告的用户兴趣的表示。与候选广告相关性较高的行为会获得较高的激活权重，并支配着用户兴趣。该表示向量在不同广告上有所不同，大大提高了模型的表达能力。

提出两个工业技术

训练具有大规模稀疏特征的工业深度网络是巨大的挑战。例如，基于SGD的优化方法仅更新出现在每个小批量中的稀疏特征【非零】的那些参数，因此需要加入正则化来降低过拟合的风险。但是，加上传统的l2正则化后，计算量过大，这需要为每个小型批处理在整个参数上计算L2范数。因此本文提出了一种工业技术：mini-batch aware regularization，仅出现在每个微型批处理中的非零特征参数才参与L2-范数的计算，从而使计算可接受。
另外还提出data adaptive activation function，通过输入的分布自适应调整修正点来推广常用的PReLU。

贡献

概括上述创新点，文章的贡献为：

指出使用固定向量来表示用户不同的兴趣的限制性和通过引入局部激活单元建立了一个新的模型DIN。
提出两个训练工业神经网络的技术：小批量感知正则化器（a mini-batch aware regularizer），它可以节省具有大量参数的深度网络上正则化的大量计算，并且有助于避免过度拟合；数据自适应激活函数（a data adaptive activation function），它通过考虑输入的分布来概括PReLU，并显示出良好的性能。
在对公共和Alibaba数据集进行了广泛的实验。结果证实了提出的DIN的有效性。

Base Model与DIN Model

特征表示（Feature Representation）

工业点击率预测任务中的数据大多采用多组类别的形式，如下图所示，这通常要通过转化为高阶稀疏二元特征【one-hot或者multi-hot】。

所有的特征为：

基本模型（Embedding&MLP）

Embedding layer

输入是高维稀疏二元向量，Embedding层将其转化为低维密集表示。

对于第个特征组，用表示第个embedding字典，表示第个特征组的维度。是D维度的embedding向量。Embedding操作后伴随着一个表的查找机制：

如果是一个one-hot向量，则的embedding表示是一个单一的embedding向量
如果是一个multi-hot向量，那的embedding表示是一个embedding向量列表

Pooling layer 和 Concat layer

不同的用户有不同数量的历史行为，即multi-hot行为特征的向量会导致所产生的embedding向量列表的长度不同，而全连接需要固定长度的输入。一个通用的方法去转化embedding向量列表是通过Pooling层去获得固定长度：

两个最常用的池化层是求和池化（sum pooling，各个对应元素进行累加）和平均池化（average pooling，各个对应元素求平均）。

然后将所有向量连接在一起（concatenate），以获得实例的总体表示向量。

MLP

给出连接后的稠密表示向量，利用全连通层自动学习特征的组合。设计MLP的结构，以更好地提取信息。

LOSS

负对数似然函数（the negative log-likelihood function）：

代表训练的集合，为模型的输出，即点击候选广告的概率。

Deep Interest Network

基本模型是获得一个固定长度的用户的表示向量，但不管候选广告是什么，此表示向量对于给定用户均保持不变。这样，维度受限的用户表示向量将成为表达用户多样化兴趣的瓶颈。

与展示广告相关的行为极大地影响了点击操作。DIN通过给定一个候选广告，然后去注意与该广告相关的局部兴趣的表示来模拟此过程。DIN不会通过使用同一向量来表达所有用户的不同兴趣，而是通过考虑历史行为的相关性来自适应地计算用户兴趣的表示向量（对于给定的广告）。 该表示向量随不同广告而变化。

相比于基础模型，DIN引入了一种新颖设计的局部激活单元，并保持其他结构不变。具体而言，将激活单元应用于用户行为表示，将其作为加权累加和池来执行，以在给定候选广告的情况下自适应地计算用户表示：

其中是用户长度为的embedding向量列表，是广告的embedding向量。是一个前向传播网络，输出为激活权重。

局部激活单元与attention方法类似。但不同的是，的约束被放宽了，为了存储更为强烈的用户兴趣。因此，在输出后的用来归一化的softmax函数也舍弃了。例如，如果一个用户的历史行为包含90％的衣服和10％的电子产品。给定T恤和电话的两个候选广告，T恤会激活大多数属于衣服的历史行为，并且可能比电话获得更大的（更高的兴趣强度）价值。传统的注意力方法是通过对的输出进行归一化而失去的数值规模的决心。【这里给出的开源代码却用了softmax】

作者尝试了LSTM对用户历史行为数据进行建模。但这并没有改善。因为用户历史行为的序列可能包含多个并发兴趣。这些兴趣的快速跳跃和突然结束导致用户行为的序列数据似乎很嘈杂。但这是一个研究的方向。【2019年的DIEN】

Training Technique

在阿里巴巴的广告系统中，商品和用户数量达到了数亿。实际上，训练具有大规模稀疏输入特征的工业深度网络是巨大的挑战。

Mini-batch Aware Regularization

模型的过拟合一般来说需要正则化来进行抑制，但对于工业数据集来说，直接应用传统的正则化方法是不实际的，在训练网络上有稀疏输入和上百万的参数。以l2正则化为例。在基于SGD的优化方法的情况下，仅需要更新每个微型批处理中出现的非零稀疏特征的参数，而无需进行正则化。但是，当添加l2正则化时，需要为每个小批量计算整个参数的L2-范数，这将导致计算量极大，并且参数扩展到数亿个是不可接受的。

作者介绍了一种有效的小批量处理感知型正则化器，它仅针对每个微型批处理中出现的稀疏特征的参数计算L2-范数，从而使计算成为可能。定义了整个embedding字典的参数，是embedding的维度，是特征空间的维度。

其中是第个embedding向量，是含有特征id ，代表所有样本中特征id 出现的数量。

进一步转化：

其中定义了mini-batches的数量，定义了第个mini-batch。

可以被近似为：

特征的embedding权重的梯度为：

Data Adaptive Activation Function

PRelu是常用的激活函数：

PReLU采用值为0的硬修正点（a hard rectified point），当每层的输入遵循不同分布时，这可能不适合。作者设计了一个新的激活函数Dice：

其中和为均值和方差，是一个常量，为

Dice的关键思想是根据输入数据的分布来自适应地调整修正点，其值设置为输入的平均值。当则退化为PRelu。

实验

数据集

Amazon Dataset：包含来自Amazon的产品评论和元数据。选取电商类子集包含192403用户，63001物品，801个种类，和1689188个样本。特征包括：goods_id、cate_id、goods_id_list、cate_id_list。

MovieLens Dataset：选用20M，包含138493用户，27278电影，21种类和20000263样本数。为了适应CTR预估任务，将其转化为2元分类数据---评分4～5为正样本，其余为负样本。特征为：movie_id、movie_cate_id、user rated movie_id_list, movie_cate_id_list。

Alibaba Dataset：从阿里巴巴的在线展示广告系统收集了流量日志，其中两个星期的样本用于训练，第二天的样本用于测试。训练和测试集的规模分别约为20亿和1.4亿。embedding维度为12对于所有的16个组来说。

Baseline

LR：在深度学习网络之前应用非常广泛；

BaseModel；

Wide&Deep：wide：手工设计低阶特征的交叉，deep：自动提取高阶非线性特征

PNN：embedding层之后引入乘积层捕获高阶特征交互。

DeepFM：将Wide&Deep模型中的wide部分改为FM。

Metrics

AUC：在原有基础上引入了用户加权AUC的变化形式，它通过对用户AUC进行平均来衡量用户内部订单的优劣，并且显示出与展示广告系统中的在线效果更为相关。计算公式如下：

其中表示用户的数量。

RelaImpr：衡量模型的相对改进。对于随机猜测者，AUC的值为0.5。因此，RelaImpr的定义如下：

Result

1、深度学习网络打败了LR，证明了深度学习提取高阶特征的能力。

2、PNN和DeepFM效果比Wide＆Deep更好。DIN在所有竞争对手中表现最好。特别是在具有丰富用户行为的Amazon Dataset上，DIN表现突出。这归功于DIN中局部激活单元结构的设计。DIN通过软搜索与候选广告相关的部分用户行为来关注局部相关的用户兴趣。通过这种机制，DIN获得了用户兴趣的自适应变化表示，与其他深度网络相比，极大地提高了模型的表达能力。此外，带Dice的DIN带来了对DIN的进一步改进，从而验证了所提出的Dice的有效性。

正则化参数

由于Amazon数据集和Movielens数据集的功能维度都不高（约10万），因此所有深度模型（包括我们提出的DIN）都不会遇到严重的过拟合问题。但是，当涉及包含较高维度稀疏特征的在线广告系统中的Alibaba数据集时，过度拟合将是一个很大的挑战。例如，当训练具有细粒度特征的深层模型（例如，表1中尺寸为6亿个goods_ids的特征）时，不加正则化会在第一个epochs之后会发生严重的过度拟合，这会导致模型性能迅速下降。因此，检验几种常用正则化的性能：

Dropout：在每一个样本中随机丢弃50%的特征id；
Filter：按样本中的出现频率过滤访问的goods_id，仅保留最频繁的那些。剩下的前2000万个goods_id；
Regularization in DiFacto：与频繁特征相关的参数不太会被过度正则化；
MBA：Mini-Batch Aware regularization method；

Dropout可快速防止过拟合，但会降低收敛速度。DiFacto中的正则化会以较高的频率对goods_id设置更大的惩罚，其效果要比Filter差。MBA效果最好。

Result of Alibaba Dataset

online A/B testing

2017年5月至2017年6月在阿里巴巴的展示广告系统中进行了在线A/B测试。在将近一个月的测试中，与在线服务模型的最新版本BaseModel相比，接受了Regularizer和激活函数的DIN贡献了高达10.0％的点击率和3.8％的RPM（每千收入）促销。这是一项重大改进，证明了提出的方法的有效性。

原文：

“值得一提的是，每天都有成千上万的用户访问我们的系统，对工业深层网络进行在线服务并非易事。更糟糕的是，在流量高峰时，我们的系统每秒为超过100万用户提供服务。需要以高吞吐量和低延迟进行实时CTR预测。例如，在我们的真实系统中，我们需要在不到10毫秒的时间内为每个访问者预测数百个广告。”

DIN的可视化

显示了带有t-SNE的商品Embedding向量的可视化图。

总结

1、本文设计了DIN的新CTR预估模型来通过Local activation unit来获取针对不同广告而变化的用户兴趣的自适应表示向量。

2、还引入了两种新颖的技术（Mini-batch Aware Regularization、Data Adaptive Activation Function）来帮助培训工业深度网络并进一步提高DIN的性能。它们可以轻松地推广到其他行业深度学习任务。

代码复现---TF2.0

Github：https://github.com/BlackSpaceGZY/Recommended-System

数据集、代码详细介绍：https://zhuanlan.zhihu.com/p/144153291

参考文献

[1] Cheng H T, Koc L, Harmsen J, et al. Wide & deep learning for recommender systems[C]//Proceedings of the 1st workshop on deep learning for recommender systems. 2016: 7-10.
[2] Wang R, Fu B, Fu G, et al. Deep & cross network for ad click predictions[M]//Proceedings of the ADKDD'17. 2017: 1-7.
[3] Qu Y, Cai H, Ren K, et al. Product-based neural networks for user response prediction[C]//2016 IEEE 16th International Conference on Data Mining (ICDM). IEEE, 2016: 1149-1154.
[4] Guo H, Tang R, Ye Y, et al. DeepFM: a factorization-machine based neural network for CTR prediction[J]. arXiv preprint arXiv:1703.04247, 2017.
[5] Zhou G, Zhu X, Song C, et al. Deep interest network for click-through rate prediction[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018: 1059-1068.

往期精彩回顾

第一次参赛---2020腾讯广告算法大赛Baseline思考与分析

Pandas笔记---通过比赛整理出的10条Pandas实用技巧

【论文导读】异构信息网络的Embedding进行推荐

【论文导读】MATRIX FACTORIZATION TECHNIQUES FOR RECOMMENDER SYSTEMS

机器学习笔记---信息熵

扫码关注更多精彩

我就知道你“在看”

WebRTC入门与提高2：WebRTC开发环境音视频开发老马音视频开发流媒体服务器音视频实时音视频视频编解码 webrtc c++
2.1安装vscode下载和安装vscodevscode官网：VisualStudioCode-CodeEditing.Redefined下载地址：https://vscode.cdn.azure.cn/stable/1b8e8302e405050205e69b59abb3559592bb9e60/VSCodeUserSetup-x64-1.31.1.exe下载完后按引导安装即可2.1.1配置vs
WebRTC基础介绍
WebRTC全称为：WebReal-TimeCommunication。它是为了解决Web端无法捕获音视频的能力，并且提供了peer-to-peer（就是浏览器间）的视频交互。WebRTC汇集了先进的实时通信技术，包括：先进的音视频编解码器（Opus和VP8/9），强制加密协议（SRTP和DTLS）和网络地址转换器（ICE＆STUN）。根据最初的定义，WebRTC被指定为P2P（peer-to-p
DBG+TDE双剑合璧：打造从字段到存储的数据库全栈加密防御体系安当加密数据库网络
一、当数据泄露进入“立体攻击”时代：单一防护已失效某企业遭遇连环攻击：1️⃣攻击面1：黑客利用API漏洞越权访问数据库→窃取明文用户信息2️⃣攻击面2：窃取数据库备份文件→离线破解表数据传统方案短板：仅字段加密：无法防御存储层窃取（如.ibd文件被拷贝）仅TDE加密：无法阻止越权SQL直接读取明文✅安当破局之道：DBG（应用层网关）+TDE（存储层加密）=全链路数据“装甲”二、深度图解DBG+TD
用sklearn库中的算法对数据集进行训练和auc评估（个人学习笔记） ZD困困困 python 机器学习
本文为个人学习笔记，仅供学习参考，欢迎讨论，要是有哪里写的不对或有疑问的欢迎讨论。题目：运用已给数据集进行模型训练，使用逻辑回归、决策树、随机森林和AdaBoost几个算法进行训练，并打印各个算法训练后的auc评价指标。文章目录1.导入数据集①read_csv():读取数据并以某字符分隔。②merge():合并③drop():删除行或列④tolist():将数组或矩阵转换为列表⑤train_tes
【网络编程】EPOLL 事件触发机制的服务器啟明起鸣网络服务器运维
文章目录业务拆解EPOLL机制介绍EPOLL的核心变量和函数EPOLL程序流程图C代码实现准备工作服务器代码代码运行效果总结推荐一个零声教育学习教程，个人觉得老师讲得不错，分享给大家：[Linux，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK等技术内容，点击立即学习:https:/
UDP服务器主要是指什么意思？ wanhengidc udp 服务器网络协议
UDP的全称为用户数据报协议，是一种在计算机网络中常用的传输协议，属于是传输层协议，UDP属于是一种无连接的协议，在发送数据信息之前，发送方和接收方不需要建立任何握手连接，主要是用于发送小量数据的实时应用。UDP服务器则是一种基于UDP协议实现的网络服务端程序，能够用来接收、处理和响应客户端发送的UDP数据报，UDP服务器与TCP服务器相比较来说，UDP服务器不需要建立连接，但是也不能够保证数据信
电信路由模式改桥接模式！想尝一尝被打赏的味道桥接模式
记录一下，怕日后忘记！第一步先进去超级管理后台http://192.168.1.1:8080/超级帐号是：telecomadmin密码：nE7jA%5m里面网络设置可以看到宽带账号，但是看不到密码，致电10000号，愉快的重置了。短信已收到密码；【20240-12-16】换了新猫后，上面的方案失效了。新密码账号：telecomadmin密码：pQCT!mW6直接在192.168.1.1登录就行了，
LLCC68IMLTRT：Semtech新一代LoRa®射频收发器芯片，IoT设备续航翻倍深圳市尚想信息技术有限公司物联网收发器收发器芯片升特半导体工业传感器
LLCC68IMLTRT（Semtech）产品解析与推广文案1.产品概述LLCC68IMLTRT是Semtech（升特半导体）推出的一款高性能、低功耗LoRa®Sub-GHz射频收发器芯片，支持远距离无线通信，适用于物联网（IoT）、智能表计、工业传感器网络等场景。2.主要功能与优势（1）远距离&低功耗通信LoRa®调制技术：通信距离>5km（城市环境），>15km（郊区）。超低功耗：接收电流仅5
科普语音交互所需开源技术方案
以下是ASR（自动语音识别）、LLM（大语言模型）和TTS（文本转语音）三者结合的应用场景及开源方案：一、应用场景智能语音助手如百聆（Bailing），支持语音输入、意图理解、任务管理及语音输出，端到端延迟仅800ms，支持打断和记忆功能。车载语音交互系统（如蔚来、小鹏），结合ASR识别指令、LLM处理复杂查询（如"找有充电桩的高评分餐厅"）和TTS提供语音反馈。语音到语音翻译（S2ST）阿里Fu
结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践大模型之路 RAG rag
一、引言：混合RAG技术的发展与挑战在人工智能领域，检索增强生成（RAG）技术正成为构建智能问答系统的核心方案。传统RAG通过向量数据库存储文档嵌入并检索相关内容，结合大语言模型（LLM）生成回答，有效缓解了LLM的“幻觉”问题。然而，单一的稠密向量检索（如基于Transformer的嵌入模型）在处理关键词匹配和多义词歧义时存在局限性，而稀疏向量检索（如BM25）虽擅长精确关键词匹配，却缺乏语义理
从数据抓取到智能分类：用 LangChain + 爬虫构建自动化工作流的实战笔记大模型之路大模型（LLM）人工智能 langchain
一、从人工到自动化的迫切需求在数字化时代，信息的快速获取与处理成为个人和组织高效运转的关键。然而，许多重复性强、耗时长且缺乏创造性的任务，如定期收集和整理网络信息并制作成特定格式的内容，依然占据着人们大量的时间和精力。本文作者就面临这样的困境：每两周需花费数小时访问多个大学网站，提取活动信息，手动将其整理成繁琐的HTML表格，并确保在Outlook中格式正确无误。这一过程不仅涉及大量枯燥的重复劳动
【web安全】远程命令执行(RCE)漏洞深度解析与攻防实践 KPX web安全安全 web安全 windows linux 漏洞
目录摘要1.RCE漏洞概述1.1基本概念1.2漏洞危害等级2.RCE漏洞原理深度分析2.1漏洞产生条件2.2常见危险函数2.2.1PHP环境2.2.2Java环境2.2.3Python环境3.RCE利用技术进阶3.1基础注入技术扩展3.1.1命令分隔技术3.1.2参数注入技术3.2高级绕过技术3.2.1编码混淆3.2.2字符串拼接3.3盲注技术3.3.1时间延迟检测3.3.2DNS外带数据3.3.
Jupiter项目版本演进与技术架构深度解析齐飞锴Timothea
Jupiter项目版本演进与技术架构深度解析JupiterJupiter是一款性能非常不错的,轻量级的分布式服务框架项目地址:https://gitcode.com/gh_mirrors/jup/Jupiter项目概述Jupiter是一个高性能的分布式服务框架，专注于提供稳定可靠的RPC通信能力。从版本迭代历史可以看出，该项目在性能优化、功能完善和稳定性提升方面持续演进。本文将深入分析Jupite
学习笔记(28):随机噪声的原理、作用及代码实现详解宁儿数据安全 #机器学习学习笔记 python
学习笔记(28):随机噪声的原理、作用及代码实现详解一、什么是随机噪声？为什么需要添加？在机器学习中，随机噪声是指数据中无法用特征解释的随机波动，通常符合某种概率分布（如正态分布）。在房价模拟中添加噪声的核心原因如下：1.模拟真实世界的不确定性真实房价除了受面积、房龄影响，还受装修情况、学区、交通、政策等未被建模的特征影响，这些因素的综合效应可抽象为“噪声”。示例：两套面积和房龄相同的房子，房价可
从零玩转CanMV-K230（9）-Timer、RTC、ADC、WDT、File 叶与花语 K230 人工智能 AI K230 python
文章目录前言一、Timer构造函数初始化销毁函数示例代码二、RTC构造函数initdatetime示例代码三、ADCAPI示例代码四、WDTAPI示例代码五、File示例代码总结前言本章介绍K230常用外设的使用方法，相关内容的详细介绍可以参考K210的教程，这里主要展示K230的使用代码一、Timer定时器（Timer）的作用在于生成精确的计时，当达到预设的时间点时，提醒我们进行特定的操作。Ti
网络基础(1) Mr_Xuhhh 网络 c++c语言算法 qt 开发语言
网络基础协议定义：减少通信的成本，用于快速共识**本质：**一种约定计算机之间，如何实现约定呢？通过OSI（国际标准化组织），OSI标准，不产生代码协议分层协议本质上也是软件，在设计上为了更好地进行模块化，解耦合，也是被设计成为层次结构的所有软件都是层次的，模块化的网络协议就是分层的结论1:两种视角，普通用户，工程师*结论2：*同层之间，在“直接”通信结论3：分层之后，可以无障碍替换任意一层计算机
Flowable11任务驳回退回-------------------持续更新中鱼见千寻 flowable 开发语言 flowable spring boot 后端 java
在真实的工作流应用中，除了线性的“同意”和“驳回”，灵活的流程控制能力（如撤销、撤回、退回）是必不可少的。下面，我将详细解释这四种常见流程操作的概念、实现思路以及在Flowable+SpringBoot项目中的具体代码实现。首先，我们必须明确这几个词在工作流上下文中的精确含义，因为混淆它们会导致错误的实现。区别操作中文名称含义解释操作发起人实现方式Reject驳回审批人不同意，让流程按照预设的“失
基于改进粒子群算法的混合储能系统容量优化（Matlab代码实现）吃兔子的大脑腐算法 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述基于改进粒子群算法的混合储能系统容量优化研究一、混合储能系统容量优化的背景与挑战1.混合储能系统的定义与组成2.容量优化的核心目标3.优化面临的挑战二、传统粒子群算法的局限性及其改进策略1.传统PSO的缺陷2.改进粒子群算法的核心方法三、改进PSO在HESS容量
归并排序详解
创建两个临时数组存储待合并的子数组使用双指针法依次比较两个子数组的元素将较小的元素放入原数组的对应位置处理剩余未合并的元素前言1.算法概述归并排序是一种采用分治法（DivideandConquer）策略的排序算法，由约翰·冯·诺伊曼在1945年提出。它的核心思想是将一个大问题分解成若干个小问题，递归解决小问题后，再将结果合并起来。分治策略分解：将当前区间一分为二解决：递归地对两个子区间进行排序合并
DeepSeek 大模型：工单系统优化与企业提效关键合力亿捷-小亿人工智能
随着信息化时代的到来，企业对运营效率的需求日益增强，工单系统作为重要的运营管理工具，其优化程度直接影响到企业的响应速度与服务质量。DeepSeek大模型通过强大的数据处理能力，为工单系统提供了多维度的优化方案，从分类、派发到内容填充、优先级排序，再到知识管理，全面提升了工单处理的智能化与自动化水平，帮助企业在提升客户满意度的同时，也实现了自身运营效率的跃升。一、工单分类与派发1.精准分类工单分类是
Linux系统JDK 8下载与安装指南丹力
本文还有配套的精品资源，点击获取简介：JavaDevelopmentKit（JDK）8是Java编程语言的重要开发工具包，包含了必要的工具和库以编译、调试和运行Java应用程序。JDK8在2014年发布，引入了Lambda表达式、StreamAPI、新的日期和时间API以及方法引用等特性，提升了开发效率和代码可读性。本文将指导读者如何在Linux系统上下载和安装JDK8，包括下载步骤、解压文件、移
学习笔记(29):训练集与测试集划分详解：train_test_split 函数深度解析宁儿数据安全 #机器学习学习笔记深度学习
学习笔记(29):训练集与测试集划分详解：train_test_split函数深度解析一、为什么需要划分训练集和测试集？在机器学习中，模型需要经历两个核心阶段：训练阶段：用训练集数据学习特征与目标值的映射关系（如线性回归的权重）。测试阶段：用测试集评估模型在未见过的数据上的表现，避免“过拟合”（模型只记住训练数据的噪声，无法泛化到新数据）。类比场景：学生通过“练习题”（训练集）学习知识，再通过“考
在mac下手动编译迁移的android版webrtc组件 jwybobo2007 WebRTC webrtc android
我原先使用的android版webrtc是在linux下编译的，现在因为某些原因需要把整个库迁移到mac下编译。把代码迁移完后，正常是需要通过gclientsync重新构建编译环境，但是由于网络限制等方面原因，会导致完成的比较慢。在摸索一阵后，找到了一种方式可以快速的编译出webrtc，步骤如下：假设已经有NDK、depot_tools、ninja，并且可以正常使用了1.修改src/build/c
【Torch】nn.Dropout算法详解油泼辣子多加深度学习算法
1.定义nn.Dropout是PyTorch中用于防止神经网络过拟合的正则化层。其核心思想是在训练阶段随机“丢弃”（置零）部分神经元的输出，以减少网络对特定神经元的过度依赖；在推理阶段则保持所有神经元输出不变。2.输入与输出输入（Input）任意形状的浮点张量（如torch.float32、torch.float64等），常见于全连接层或卷积层的激活输出。输出（Output）与输入张量形状、dty
Redis总结傲祥Ax redis 数据库 Redis重点总结
一、Redis是什么？key-value形式的非关系型数据库，基于内存（64位系统默认是物理内存的四分之三），单线程多路io复用，通常当缓存使用，提高查询效率。二、为什么使用Redis？2.1快（内单异高算）内存存储，单线程模型，异步操作，高效的网络通信，优化的算法和数据结构2.2作用2.2.1五大数据类型Redis存储，key-value形式，value的五种数据类型String，List，Se
Java代码实现Excel表格导入 IT莫染 Function Module Spring Boot Demo java教程面试题等 excel java poi
Java代码实现Excel表格导入/***Excel解析成员工数据集合**@paramfile*@paramallNations*@paramallPoliticsstatus*@paramallDepartments*@paramallPositions*@paramallJobLevels*@return*/publicstaticListexcel2Employee(MultipartFil
[2219]基于JAVA的物流车智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 人工智能开发语言课程设计毕业设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的物流车智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景与意义：随着我国物流行业的快速发展和互联网技术的深度融合，高效、精准、智能的物流管理已经成为企业提升竞争力的关键要素。在当前信息化、智能化的大背景下，基于Java的物流车智慧管理系统的设计与实现具有重要的理论研究价值和广阔的应用前景。首先，从行业背景看，传统的物流管理模式
C++ 程序崩溃排查默执_ C++基础 c++开发语言
程序报错，可以根据报错信息，日志文件来初步排查。但还是无法知道具体原因，则采用Coredump分析。使用空指针来赋值，故意制造错误。1、临时开启Coredump存储设置2、编译代码，运行程序3、用gdb调试可以准确的找到报错位置在18行#include#include#includeusingnamespacestd;voidtest(vectorv){coutmy_vec{"1","2","3"
如何在GNSS信号丢失时依然保持精准导航？ EriccoShaanxi 技术文章无人机算法数据结构人工智能
在无人机飞行、自动驾驶或水下探测等场景中，GNSS信号遮挡或干扰是常见挑战。ER-GNSS/MINS-03组合导航系统凭借深度融合的GNSS/INS技术，即使在卫星信号中断时，也能持续提供高精度定位、姿态和速度数据，确保任务不间断执行。战术级MEMS惯性器件，稳定可靠该系统采用高性能MEMS陀螺仪（零偏不稳定性<0.3°/h）和加速度计（零偏不稳定性<10μg），结合全温补偿技术，在-40℃~+8
组合导航系统重新定义低成本定位方案 EriccoShaanxi 技术文章无人机人工智能
在自动化、无人系统和精准农业等领域，高精度导航是核心需求，但传统高端组合导航系统的高成本往往让许多用户望而却步。ER-GNSS/MINS-05作为一款低成本组合导航系统，通过技术优化与精准性能平衡，以更经济的价格提供厘米级定位、0.03m/s测速精度以及0.1°实时航向精度，满足无人飞行器、智能无人车辆、路基定位定向等多样化场景需求，真正实现“高性能”与“低成本”的兼得。深度融合，精准导航ER-G
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu