m0_37586850

广告CTR预估中用户行为学习和记忆建模

分享嘉宾：邹衡@阿里，并非花名“擎苍”

编辑整理：陈晟

出品平台：DataFun

导读：CTR 预估是计算广告的底层通用技术，在 CPC/OCPC 营销模式下，预估准确性对广告主流量采买成本和平台变现效率有着非常重要的作用。我们在业界常用解法基础上，纳入时间维度和空间维度信息，基于模型学习用户历史行为和广告上下文 ( 目前是上文 ) 来辅助学习当前广告点击率，在业务上取得了显著的收益 ( 论文已被 KDD-2019 和 KDD-2019 workshop 收录 )。

本次分享的内容包括：

背景介绍
DSTN 模型
MA-DNN 模型

01. 背景介绍

1. 业务场景

我们的业务场景主要是卧龙-搜索广告和汇川-信息流广告，系统架构如上图所示，模型训练模块负责离线训练和模型产出，Model Server 负责模型加载并提供点击率预估服务，Ad Server 负责广告检索和排序。

2. CTR 预估简介

目前主流的效果广告通常按照 eCPM ( Pctr x Bid ) 对广告进行排序，并配合采用 CPC/OCPC 计费模式 ( 仅在用户点击广告时进行扣费 )。eCPM 是由 Pctr 和 Bid 构成，所以点击率预估的准确性将会对平台收益、广告主成本和用户体验产生极大的影响。

CTR 预估问题可以抽象为如下函数：

即根据用户、Query、广告、上下文信息来预估用户在当次请求中对广告的点击概率。

3. 点击率预估场景

当下常见的点击率预估模型包括 LR、FM、DNN、Wide&Deep、DeepFM 等，这里不再进行赘述。这些模型通常在建模时只考虑目标广告，忽略了其他广告对目标广告点击率的影响。举例而言：

除了目标广告以外，预估场景的时序信息 ( Clicked ad、Unclicked ad ) 和空间信息 ( contextual ad ) 也会对当前广告的点击率预估产生较大的影响，所以我们尝试从这两个方面进行探索，提升预估效果。建模的细节将在后面的 DSTN 和 MA-DNN 章节中详细介绍。

4. 用户行为建模

用户历史行为在一定程度上表达了用户感兴趣和不感兴趣的信息，对于点击率预估有着非常重要的作用。目前业界对于这类特征的建模的方式通常有以下两种：

基于特征工程的方法
基于模型的方法

基于特征工程的方法，一般通过构造统计或序列特征来生成用户画像，依赖人工经验，较为繁琐，而且通常会伴有信息损失。基于模型的方法则一般采用类 RNN 模型，使用用户行为历史数据进行训练，它的缺点是不支持多类型历史行为建模，模型复杂度很高。

针对这两种的方式的缺陷，我们提出了两个模型：

深度时空网络 DSTN
深度记忆网络 MA-DNN

深度时空网络 DSTN 模型基于深度学习来捕获用户历史 ( 时间 ) 和前文广告 ( 空间 ) 的信息。注意，这里仅使用了前文而没有使用后文，是因为在预估的时候无法获得下文信息。

深度记忆网络 MA-DNN 则是通过设计记忆单元，自动抽象用户历史行为构建用户行为表示。

这两篇论文目前都已经被 KDD 2019 收录：

（KDD 2019）Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction
（KDD 2019 Workshop）Click-Through Rate Prediction with the User Memory Network

02. DSTN 模型

DSTN ( Deep Spatio-Temporal Neural Network ) 通过利用辅助广告 ( 前文广告、历史点击广告、历史展现未点击广告 ) 对用户行为建模。下面将逐步揭露 DSTN 诞生的过程。

1. 模型设计的挑战

在使用时空信息建模时，需要解决以下几个问题：

辅助广告数量不等，如何兼容？
同类型的辅助广告中，既包含与当前广告相关的信息，也包含无用噪声，如何区分对待？
不同类型的辅助广告对目标广告影响不同，怎样融合所有可用信息？

针对这三个问题，我们分别尝试了三种模型结构：

DSTN-P：Pooling Model
DSTN-S：Self-attention Model
DSTN-I：Interactive Attention Model

接下来我们会按照模型结构，逐步阐述模型的演进过程。

2. 特征 Embedding 化

首先，三类 DSTN 模型都会对广告进行 Embedding 化，Embedding 时会对不同类型的特征将进行如下变换：

单值离散特征：直接 Embedding
多值离散特征：Embedding 后接 Sum Pooling 映射为单个 Embedding
数值特征：离散化后映射为 Embedding

最终，拼接广告所有特征的 Embedding 构造整体输入 Embedding 向量。整体流程如图所示：

3. DSTN-P：Pooling Model

DSTN-P 模型主要考虑解决辅助广告数目不等的问题，模型结构如下图所示：

DSTN-P 模型整体流程如下：

1. 分别对目标广告、前文广告、点击广告、未点击广告进行 Embedding 化

2. 每种类型的辅助广告集合通过 Sum Pooling 合并成一个 Embedding

3. 四类广告 ( 目标广告 x_t和三类辅助广告 x_c、x_l、x_u ) 的 Embedding，通过各自权重矩阵 W_t、W_c、W_l、W_u 映射到统一语义空间，得到整体融合表达 v 向量

4. 整体表示 v 经过多层前馈神经网络 ( 激活函数为 Relu )，计算 sigmoid 函数得到预估点击率，以 logloss 为损失函数迭代学习模型参数

该模型通过 Sum Pooling 解决同类型辅助广告数目不等的问题；基于权重矩阵融合不同类型广告的 Embedding，解决了不同类型广告对目标广告影响不同的问题。

这种结构虽然能够解决同类辅助广告数目不等、不同类型辅助广告影响不同的问题，但是依然存在以下缺点：

同类型广告无区分度：在 Sum Pooling 时直接等权求和，可能会导致有用的信息被淹没在大量的噪音中。
Target 无关：在构造辅助广告的 Embedding 表达时，并未考虑辅助广告与 Target 广告的关系

接下来看看 DSTN-S 和 DSTN-I 是如何解决这两个问题的。

4. DSTN-S：Self-attention Model

DSTN-S 模型结构如下图所示：

相比于 DSTN-P，DSTN-S 将 Sum Pooling 结构替换为了 Self-attention Model，增强有用信息的同时抑制了无用噪声，缓解了 DSTN-S 模型在同类辅助广告上没有区分度的问题。但是该模型存在以下缺陷：

Target 无关：Self-attention 依然与 Target 广告无关
噪音区分能力较弱：尽管使用了 Attention 机制，但 Attention 权重通过 Softmax 归一化，极端情况下噪音数据影响仍然较大

对于第二点，举例来说，假设总共3个辅助广告，且都与目标无关，那么3个广告计算出来的 Attention 得分都接近于0，合理的情况下它们不应该对本次预估产生影响。不过，经过 Softmax 归一化后，三者的权重均为1/3，依然对预估结果产生了一定程度的影响。

最后，我们来看看 DSTN-I 是如何解决这里的问题。

5. DSTN-I：Interactive-attention Model

模型结构如图所示：

相比于 DSTN-S 模型，DSTN-I 进行了如下优化：

基于辅助广告和目标广告的相互关系计算 Attention，根据目标广告动态地提取最有用的信息
不对同类广告进行 Softmax 归一化，避免了上面提到的归一化问题

通过这两个优化，DSTN-I 模型能够较好的解决之前所述的问题。

总而言之，相较于普通 DNN 模型，DSTN 模型有以下几点优势：

引入了三种类型的辅助广告信息
对不同的辅助广告类型采用不同权重
基于注意力机制，从同类辅助广告中动态提取有用的信息
在统一框架下，融合多种类型的不定数目的辅助广告信息

对比三类 DSTN 模型，它们的主要区别在于信息提取方式，其中：

DSTN-P 采用 Sum Pooling，信息提取能力最弱
DSTN-S 采用 Self-Attention，基于同类辅助广告的相互关系提取有用信息，信息提取能力适中
DSTN-I 采用 Interactive Attention，根据与目标广告的关系动态提取有用信息，信息提取能力最强

6. 实验分析

我们基于 Avito，Search，Feed 三份数据集进行了离线实验，其中 Avito 是第三方比赛数据集，Search 和 Feed 则是公司内部业务数据集。对比方法包括常用的 CTR 预估模型，评价指标采用 AUC 和 Logloss，辅助广告数据统一采用最近3天。详细实验信息如下：

实验结果如下：

其中 LR、FM、DNN、Wide&Deep 仅考虑了目标广告，未加入时空、上下文等信息，CRF 模型中加入了空间上文，GRU 模型加入了历史点击广告。

从上图可以看到几个比较有意思的现象：

Wide&Deep 模型优于 LR 和 DNN 模型，DeepFM 模型优于 FM 和 DNN 模型
CRF 模型 ( 引入空间上文广告 ) 优于 LR 模型
GRU模型 ( 引入历史点击广告 ) 优于 DNN 模型
DSTN 模型整体均优于其他模型

这说明了两点：

1. 深浅层模型优于独立模型

2. 历史行为信息和空间信息能够起到重要作用

接下来我们细化分析各个优化点的影响和收益。

首先分析的是不同的辅助广告类型所起作用的大小，通过控制变量法单独使用某种类型的辅助广告进行实验，实验指标分别考虑绝对 AUC 和归一化 AUC。

注：归一化 AUC 指标是为了屏蔽不同数据集的辅助广告数量不同带来的偏差。

实验结果如下图所示：

从绝对 AUC 指标来看，对于不同的数据集，没有绝对的胜利者，不同辅助广告在不同数据集起到的作用不同。从归一化 AUC 指标来看，历史未点击广告的影响最小。

接下来将可视化分析不同模型学到的广告 Embedding 表示，效果图如下：

可以看到，DNN Embedding 的整体结果不错，但是对于部分广告区分度不高，如：床和冰箱，裙子和鞋，三星和苹果手机依然存在一定程度的重叠。而对于 DSTN-I Embedding，各个类别的广告都能够被很好的分开。

最后我们观察模型学到的注意力得分的分布。

图中第一列代表目标广告，一二三行分别表示前文广告、点击广告、未点击广告。从左到右，辅助广告与目标广告的相似度逐渐增加。辅助广告下面的横条代表注意力得分。

从中可以观察到以下现象：

第一行，目标广告与前文广告越相似，注意力的得分越低。推测因为它们会相互竞争用户的注意力。
第二行，历史点击广告与目标广告越相似，注意力得分越高。说明历史点击行为能够在一定程度上反应用户兴趣。
第三行，历史未点击的广告与目标广告越相似，注意力得分越高。说明历史不点击行为能够在一定程度上反应用户不感兴趣。与第二行不同的是，历史点击广告表达的是正向相关，而历史未点击广告则表示负向相关。
纵向对比三行的注意力得分绝对值，可以看出不同类型的辅助广告产生的作用是不同的。

接下来展示的是在线实验框架：

在线实验框架主要包含3部分：

1. 离线模型训练，产出 Model，并推送到 Model Server

2. User realtime session ( RTS ) 实时流，为用户准备实时历史行为数据

3. Model Server 进行在线 pCTR 预估

最终在线上 A/B 实验中取得了+6%的 CTR 提升，十分显著。

7. 小结

深度时空网络 ( DSTNs ) 利用三种类型的辅助数据 ( contextual，clicked and unclicked ad ) 来提升对目标广告 CTR 预估的准确性。模型具体的优化可以归纳为以下三点：

DSTN-I 模型引入了时间和空间维度的辅助数据，并能够有效区分不同类型辅助数据的重要性
DSTN-I 模型能够动态地从辅助数据中提取与目标广告相关的有用信息
DSTN-I 模型能够将多种不同类型的数据有效融合

03. MA-DNN 模型

MA-DNN ( Memory Augmented Deep Neural Network ) 通过巧妙地设计用户兴趣记忆单元和损失函数，建模用户行为兴趣。

1. 背景

在使用 DSTN 模型对用户行为历史建模时，会碰到下面几个问题：

输入数据拼接复杂
数据存储空间消耗大
仅能建模有限数量的辅助广告
在线 Inference 复杂

这些问题使得 DSTN 模型在实际训练和部署时需要较高的机器和人力成本，在一定程度上制约了模型的应用场景。所以我们继续尝试其他模型结构的探索，进一步扩大用户行为建模的应用场景。

首先，再回顾一下业界用户行为序列建模的代表— GRU 模型，模型结构如下图所示：

它通过输入用户行为序列，再经过门控函数逐步学习，建模用户历史行为。GRU 模型存在以下两个缺陷：

训练数据准备复杂
在线 Inference 耗时严重

如上图所示，普通 DNN 的训练数据只需要准备当前的广告，而 GRU 模型则需要拼接用户行为序列。其次，GRU 模型的训练数据存在一定冗余。如示例所示，Ad1 在 DNN 中只出现了一次，而 GRU 中则每条样本都会出现。

在线预估方面，DNN 和 GRU 的对比如下图所示：

相比于 DNN 只有标准的 FC 连接层，GRU 模型需要串行地经过多个 GRU 单元，再经过 FC 层进行预估，这大大提高了 Inference 复杂度。

针对这里的问题，我们思考是否可以通过设计更高效的模型结构，在基本保留 GRU 效果的前提下，大幅降低模型复杂度，使得 Inference 效率与 DNN 基本持平。基于这样的考虑，我们设计了 MA-DNN 网络。

2. MA-DNN Model

MA-DNN 模型的结构如下图所示：

对于每个用户 U，MA-DNN 会保留两个记忆向量 m_u₀和 m_u₁( 图中 User memory )，分别记忆用户不喜欢和喜欢的信息。在预估时，我们会查询当前 User 的两个记忆向量，并将它拼接到 DNN 的输入 Embedding 层，再通过 MLP 获得最终的 CTR 预估结果。

那么如何准确的学习用户的两个记忆向量 m_u₀和m_u₁呢？回顾一下 DNN 模型结构，我们可以将最后一层的 embedding 看成是对输入向量的高阶抽象。那么理想情况下，当发生点击时，应该让用户感兴趣的向量 m_u₁和最后一层 embedding 尽可能相似；同理，当没有发生点击时，应该让用户不感兴趣的向量 m_u₀ 和最后一层 embedding 尽可能相似。

基于上述考虑，我们在设计了如下损失函数：

loss₁ 是经典的交叉熵损失，用于训练 CTR 主模型；loss₂是均方损失，用来学习用户记忆向量 m_u₀和m_u₁。通过巧妙地设计损失函数，使得 Label 为1时更新感兴趣向量 m_u₁，label 为0时更新不感兴趣向量m_u₀。

整体 loss = loss₁ + αloss₂，α 是可调节超参。值得注意的是，loss₂ 只是用来训练兴趣向量，不应该影响 DNN 最后一层的高阶抽象向量 z_L，所以在训练时，loss₂ 只更新 m_u₀和 m_u₁，不更新z_L。

3. 实验分析

离线实验的数据集分别采用了 Avito 和公司内部数据集，评估指标采用 AUC 和 LogLoss，对比模型包括 LR、FM、DNN 等。整体实验数据和模型参数如下图所示：

实验结果如下：

可以看到，记忆组件能够从用户历史行为中提取有用信息，进而提升模型效果。同时，记忆组件具有良好的扩展性，在较低的成本下，能够快速地接入迁移至 DNN、Wide&Deep 等模型。

在线实验的框架和 DSTN 一致，只是将 DSTN 替换为 MA-DNN。最终在线上 A/B 实验中取得了+2.5%的 CTR 提升。

4. MA-DNN vs DSTN

MA-DNN 模型和 DSTN 模型，两者各有优劣。DSTN 优势在于支持多种辅助数据的学习，基于注意力机制高效地提取有用信息，效果很显著；不足在于复杂度和应用门槛较高，导致扩展性受限。MA-DNN 不足在于只支持时间信息的学习，信息提取能力稍弱；优势在于支持更加长期的时间信息学习，拥有良好的扩展性和 Inference 性能，应用门槛更低，能够适用更多场景。

5. 小结

MA-DNN 为每个用户设计了两个记忆向量，分别记录用户感兴趣和不感兴趣的信息。
MA-DNN 实现了在 DNN 和 RNN 之间很好的平衡，以近似 DNN 的复杂度，达到了近似 RNN 的效果。
MA-DNN 拥有良好的扩展性，记忆组件可以灵活的添加至多种模型。

本次的分享就到这里，谢谢大家。

「 更多干货，更多收获 」

全景揭密阿里文娱智能算法-搜索推荐等.pdf（附下载链接）
【招聘内推】阿里巴巴创新事业群实习招聘【招聘内推】阿里巴巴1688推荐算法团队招聘【报告分享】2020年中国知识图谱行业研究报告.pdf智能推荐算法在直播场景中的应用
推荐系统工程师技能树

【电子书分享】美团机器学习实践.pdf

【白岩松大学演讲】：为什么读书？强烈建议静下心来认真看完
关注我们

智能推荐

个性化推荐技术与产品社区

长按并识别关注

一个「在看」，一段时光????

springboot中aop的写法 coderzjy spring boot java spring
自定义注解注解用于标识需要进行代码增强的方法@Target(ElementType.METHOD)@Retention(RetentionPolicy.RUNTIME)public@interfaceAutoFill{OperationTypevalue();}target注解标识注解生效类型，retention指定注解的保留周期，OperationType为枚举类型，指定属性值的类型，value
uni中webview与H5直接的通讯米粒宝的爸爸 web app
突然有个需求，要uni中webview与H5直接进行通讯，本来想的找个例子copy下算了。没想到，很多都不能用啊。至于所谓的什么@message和@onPostMessage好像都不行。试验都没任何反应！算了，自己写吧。我这主要用到2种情况，第一种：uni是H5形式的。第二种：uni是app形式的。都写一下。第一种：uniH5形式的通讯。上代码：H5端1.先上js加载。 2.document.a
轻松实现 vLLM Chat：用 LangChain 替代 OpenAI API ahdfwcevnhrtds langchain python
引言在现代应用中，使用语言模型进行自动化对话生成已经成为一个重要趋势。vLLM作为开源的语言模型实现，可以部署成一个模拟OpenAIAPI协议的服务器，方便成为应用中的替代方案。本篇文章将介绍如何使用LangChain的langchain-openai包来轻松实现vLLMChat。主要内容vLLM概述vLLM可以作为一个服务部署，模拟OpenAIAPI协议，从而成为OpenAIAPI的替代方案。通
.NET MAUI 手搓 UDP/TCP 通信云端狂人 .net udp tcp/ip
在.NETMAUI中，UDP和TCP是网络通信协议，与MAUI框架本身的关系在于.NETMAUI可以利用.NET的网络功能来实现跨平台的网络通信。.NET提供的System.Net.Sockets命名空间来处理。该命名空间提供了创建和管理套接字（Sockets）来进行网络通信的相关类和方法。在.NETMAUI中，这些类同样适用于跨平台应用开发。具体来说：.NETMAUI是一个跨平台框架，用于构建A
头歌实训作业算法设计与分析-动态规划(第1关：0/1背包问题) Milk夜雨头歌实训作业算法动态规划
任务描述求解0/1背包问题。问题描述有n个重量分别为{w1，w2，…，wn}的物品，它们的价值分别为{v1，v2，…，vn}，给定一个容量为W的背包。设计从这些物品中选取一部分物品放入该背包的方案，每个物品要么选中要么不选中，要求选中的物品不仅能够放到背包中，而且重量和为W，并具有最大的价值。测试说明测试输入：第一行为2个整数，分别表示物品数量n（1≤n≤20）和背包容量W（1≤W≤10000）。
Python 网络爬虫进阶：动态网页爬取与反爬机制应对 Milk夜雨 python python 爬虫
在上一篇文章中，我们学习了如何使用Python构建一个基本的网络爬虫。然而，在实际应用中，许多网站使用动态内容加载或实现反爬机制来阻止未经授权的抓取。因此，本篇文章将深入探讨以下进阶主题：如何处理动态加载的网页内容应对常见的反爬机制爬虫性能优化通过具体实例，我们将探讨更复杂的网络爬虫开发技巧。一、动态网页爬取现代网页通常通过JavaScript加载动态内容。直接使用requests获取的HTML可
前端力扣刷题 | 5：hot100之普通数组酒酿泡芙1217 力扣hot100 leetcode 前端算法
53.最大子数组和给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例：输入：nums=[-2,1,-3,4,-1,2,1,-5,4]输出：6解释：连续子数组[4,-1,2,1]的和最大，为6。法一：双指针初始化：res用来存储当前的最大和，初始值为负无穷大。left是子数组的左边界，但它并不在实际计算中起作用，因
ubuntu18.04安装nvm管理本机node和npm 爱学习的狮王 Linux/Shell node npm 前端 node.js nvm
ubuntu18.04安装nvm管理本机node和npmnvm的使用方法1.安装nvm2.加载nvm3.安装执行版本4.设置默认版本(可选)5.检查:6.将配置加入到shell配置文件中(默认已经加入)如果系统全局的Node.js存在，但被nvm覆盖了，可以通过禁用或卸载nvm恢复到系统版本。1.取消nvm的版本管理2.然后从shell配置文件（例如~/.bashrc,~/.zshrc或~/.ba
Jupyter Notebook无法显示pyecharts可视化图表解决方法 conderchi jupyter python pycharm
提示：详细解决方案可直接移步pyecharts官档文章目录问题描述问题原因解决办法总结问题描述在按照某些数据分析教材学习pyecharts库时，遇到如下问题：在JupyterNotebook中使用pyecharts生成可视化图表时，Notebook中显示空白，无任何图表输出显示。代码如下：frompyecharts.chartsimportBarattr=['衬衫','羊毛衫','雪纺衫','裤子
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握 6个q python习题集 python 网络开发语言
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握文章目录前言一、练习题精选1.创建一个空元组2.创建一个单元素元组3.创建一个包含多个元素的元组4.访问元组中的第一个元素5.访问元组中的最后一个元素6.访问元组中的多个元素7.元组拼接8.元组重复9.获取元组的长度10.检查元素是否在元组中11.检查元素是否不在元组中12.计算元组中元素出现的次数13.获取元组中元素的索引14.获取元组
基于centos6.5安装ElasticSearch 小码农叔叔 ElasticSearch linux与容器实战 ElasticSearch ES安装
前面我们讲述了solr的安装搭建过程，今天讲讲ElasticSearch，ElasticSearch是另一款作为分词和搜索的服务器，相比solr，ElasticSearch在做大数据方面更有优势，因为其天然支持分布式，而且其强大的分词技术使得其在众多需要处理大数据量的业务中低位逐渐拔高，像大数据中做日志的提取和分析，使用ElasticSearch很适合，实际工作中，ElasticSearch主要是
kotlin单例 yufumatou kotlin kotlin单例单例
一、饿汉模式（1）类加载是线程安全的，静态变量是在类加载的时候进行赋值，所以该模式是线程安全的。（2）无法懒加载（此处只是伪概念，一般我们使用单例类的时候都需要单例对象。只有当声明了其他的静态方法，在不调用获取单例对象的方法前调用静态方法，才会体现出相对懒汉模式无法懒加载的特性，但实际使用中一般不会在单例类中再声明其他静态方法）（3）无法给构造函数传参//Java实现publicclassSing
C#中的lock关键字详解 watl0 C#开发语言
在C#中，lock关键字可以用来实现线程同步，确保在多线程环境中只有一个线程可以访问被锁定的资源。在下面的内容中，我将详细解释lock关键字的使用方式以及注意事项。语法lock关键字的语法如下：csharpCopycodelock(object){//需要同步的代码}其中，object参数是一个用于同步的对象，也就是需要锁定的资源。工作原理当一个线程进入到lock块中时，它会尝试获取锁。如果锁已经
2 files found with path ‘META-INF/lib_release.kotlin_module’ 我不勤奋v android编译问题 kotlin android gradle
项目场景：记录项目开发中遇到的一个问题，防止后续再踩雷：自己封装了一个功能库，库名字叫lib，满心欢喜接入到app工程。编译打包时却报错：2filesfoundwithpath'META-INF/lib_release.kotlin_module'。问题描述>Afailureoccurredwhileexecutingcom.android.build.gradle.internal.tasks.
Python 虚拟环境搭建 tigercat920 python 开发语言
虚拟环境1.为什么要搭建虚拟环境?在开发过程中,当需要使用python的某些工具包/框架时需要联网安装比如联网安装Django框架django的2.2.5版本sudopipinstalldjango==2.2.5提示：使用如上命令,会将Django安装到/usr/local/lib/python版本号/dist-packages路径下问题：如果在一台电脑上,想开发多个不同的项目,需要用到同一个包的
数组at()方法：负索引的救赎与JavaScript标准化之路不做超级小白前端功能通关秘籍 web前端 javascript 开发语言 ecmascript
数组at()方法：负索引的救赎与JavaScript标准化之路从一次代码评审说起在某次团队代码评审中，小白注意到有同事写下了这样的代码：constlastItem=arr[arr.length-1];这让我回想起自己早期开发时被负索引问题困扰的经历。今天，随着ES2022的发布，我们终于迎来了官方解决方案——Array.prototype.at()。本文将带你深入理解这一新特性背后的设计哲学与技术
miniconda中成功安装gdal库跳动的弦遥感学习 python
通过网上浏览相关帖子，未找到在miniconda中安装gdal库的相关内容，本人在本次安装成功之前已经历过两次失败，故在这里记录本次成功安装的细节，希望对有相似需求的朋友有所帮助。介于本人在这一方面也是初学者，有不正确的地方还请各位好友不吝指教。安装之前先下载安装RedistributingVisualC++Files，配置好VisualC++环境LatestsupportedVisualC++R
git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案爱编程的喵喵 Python基础课程 git github timeout port 443 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了gitclone出现fatal:un
python绘图实例 charlie_wang007 python python
pythonPlt实例背景：业务的健身数据，有一个字段是其他附加信息，格式是json，需要查出该字段，解出json，拿到目标数据，按要求聚合，如燃脂是0.25的有几个目的：要验证运营页面的概览数据是否正确策略：从表中查出数据，格式化，用plt绘制，与被测页面的图形数据对比代码如下：#coding:utf8importMySQLdbimportjsonimportpandasaspdimportnu
Conda 安装gdal地理数据包 Hugo鱼哥 conda windows
安装特定版本的GDAL（例如3.9.1版本），可以使用Conda命令并指定版本号。通常情况下，需要确保指定了正确的Conda频道，以便找到所需版本的软件包。在Conda中安装特定版本的GDAL的步骤如下：查找可用的版本：首先，可以使用condasearch命令来查找GDAL的可用版本，以确定是否有需要的特定版本。例如：登录后复制condasearchgdal1.安装特定版本：一旦确定了版本号，可以
linux lamp源码安装包下载,Linux Lamp源码安装 weixin_39815310 linux lamp源码安装包下载
1.首先检查安装编译环境gcc-v如果没有安装gcc和gcc-c++，则先安装这两个环境。yuminstallgcc和yuminstallgcc-c++2.卸载默认的低版本环境目前发行的Linux操作系统版本中，如果选择默认全部安装，就已经安装了LAMP环境，但是版本相对都比较低。我们可以再安装一个LAMP环境和原来的并存，但是这样做没有必要，因为同时只能开启一个LAMP环境。所要我们要在安装之前
python精彩编程200例-编程语言入门经典100例【Python版】 weixin_37988176
无论学习哪门计算机语言，只要把100例中绝大部分题目都做一遍，就基本掌握该语言的语法了。【程序1】题目：有1、2、3、4个数字，能组成多少个互不相同且无重复数字的三位数？都是多少？#Filename:001.pycnt=0#countthesumofresultforiinrange(1,5):forjinrange(1,5):forkinrange(1,5):ifi!=jandi!=kandj!
MAUI 入门教程系列(1.框架简介) dotNET跨平台 java android linux python 人工智能
前言在2020年5月,微软宣布了MAUI跨平台框架,MAUI是Xamarin.Forms演变而来,这也就意味着,如果你原来具备Xamarin.Forms开发经验,你可以流畅的过渡到MAUI开发当中。原本于2021年底发布的MAUI正式版被推迟到了2022年5月底发布。现在,你目前可以通过安装VS2022预览版进行安装MAUI开发选项。此版本中,将不会存在Xamarin.Forms项目模板。MAUI
01-分布式架构和微服务技术栈 Gy-qwert 微服务 springcloud 微服务架构云原生
一、单体架构和分布式架构单体架构（MonolithicArchitecture）和分布式架构（DistributedArchitecture）是两种不同的软件架构风格，它们在应用程序的组织方式、部署方式和扩展性等方面存在明显的区别。1.单体架构：在单体架构中，整个应用程序作为一个单独的、紧密耦合的单元进行开发、部署和运行。所有组件和功能模块都打包在一起，共享相同的资源和数据库。单体应用通常以单个进
【设计模式-行为型】备忘录模式博一波设计模式备忘录模式
一、什么是备忘录模式来到备忘录模式了，这个模式我感觉相对简单一些，就是备份，或者快照。跟前面一样为了加深理解，我们引入一个电影情结来说明啥是备忘录模式，以来加深大家对备忘录模式的认识。那么，在电影中谁是此模式应用的王者呢。我想起一位，不知道大家有没有看过一个极其经典的电影，星爷的《大话西游》。在电影《大话西游》中，至尊宝利用月光宝盒不断穿越到紫霞仙子自杀前的时间段，试图改变结局。这种时间穿越和状态
【设计模式-行为型】解释器模式博一波设计模式解释器模式
一、什么是解释器模式到此为止23种解释器都将介绍完毕，下面说最后一个设计模式解释器模式。有许多谍战剧大家都会看过，在谍战剧中经常会有一些主要情节需要进行加密传递。间谍会接受或者发送加密信息。比如用收音机接收指令或者消息。间谍会根据特定的解码书去解码收音机传递过来的指令。同样的情节，在电视剧《潜伏》中也经常会出现。解释器模式为自定义语言的设计和实现提供了一种解决方案，它用于定义一组文法规则并通过这组
Python简单Web开发 patrick_wang_bigdata python
WSGI介绍HTTP协议和HTML的介绍不在这里说明，可以去看廖雪峰老师的教程了解这方面内容。一个web应用的本质是：浏览器发送一个HTTP请求服务器收到请求，生成一个HTML文档服务器把HTML文档作为HTTP响应的Body发送给浏览器浏览器收到HTTP响应，从HTTP响应Body中取出HTML并显示最简单的web应用就是先把HTML保存好，然后需要时直接响应给HTTP请求。对Python而言，
数论问题76一一容斥原理李扩继深度学习数学建模大数据学习方法算法
容斥原理是一种计数方法，用于计算多个集合的并集中元素的个数，以避免重复计算。以下是其基本内容及相关公式：两个集合的容斥原理若有集合A和集合B，那么A与B的并集中元素的个数等于A集合元素个数加上B集合元素个数，再减去A与B交集的元素个数，即|AUB|=|A|+|B|-|A∧B|。例如，一个班级中喜欢数学的有30人，喜欢语文的有25人，既喜欢数学又喜欢语文的有10人。那么喜欢数学或语文的人数为30+2
第3章基于三电平空间矢量的中点电位平衡策略嵌入式老牛电力电子技术 dsp开发算法
0前言在NPC型三电平逆变器的直流侧串联有两组参数规格完全一致的电解电容，由于三电平特殊的中点钳位结构，在进行SVPWM控制时，在一个完整开关周期内，直流侧电容C1、C2充放电不均匀，各自存储的总电荷不同，电容电压便不均等，存在一定的偏差。在不进行控制的情况下，系统无法自行调整，长期在该工况下运行会对装置造成严重危害。1中点电位不平衡现象分析1.1定性分析在三电平逆变器中，除了零矢量外，共有24种
补充:关于802.1X身份验证中CA证书的配置 deflag interface authentication windows passwords server access
前几天写了H3C和CISCO两种交换机的802.1X实现方法,但是有人联系我说CA没有配置好,验证不过去.由于时间关系,我这里不写出自己的配置文档.手上有一篇可供参考的配置文档,希望对大家有所帮助.电子版文档在我的究竟中资源里面去下载吧.地址:http://download.csdn.net/user/deflag使用EAP-TLS（智能卡与证书）实现802.1X－－－－验证服务器和交换机相关配置
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

广告CTR预估中用户行为学习和记忆建模

你可能感兴趣的:(广告CTR预估中用户行为学习和记忆建模)