python爬虫人工智能大数据

深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用

分享嘉宾：秀武阿里高级算法专家

编辑整理：Jane Zhang

内容来源：DataFunTalk

注：欢迎转载，转载请在留言区留言。

导读：在 CTR 预估中，能不能有效地利用用户历史行为，页面同屏竞争广告信息，以及用户—广告，广告—广告关系等辅助信息来提升模型效果？本文介绍在这方面的探索工作，主要包括：

深度时空网络 ( DSTN )
深度记忆网络 ( MA-DNN )
特征表达辅助学习 ( MCP )

相关工作发表在 2019 KDD 主会，DLP-KDD 2019 workshop，2019 IJCAI 主会。

背景介绍

1. 智能营销平台的业务背景介绍

智能营销平台是一个广告变现的业务中台，支持多种流量，多种广告类型的变现业务。系统架构主要分为：用户流量通过媒体接入、广告主通过广告投放平台投放广告，检索系统实现变现业务的核心功能。智能营销平台的目标是帮助广告主高质、高效地触达用户，系统优化的核心指标包括点击，转化，变现能力，同时还非常关注用户体验和客户体验。

所有的广告系统都会有个检索漏斗，解决检索效率问题。主要的漏斗环节有：触发/召回、创意检索+初排、样式优选+精排、点击/转化。同时，还需要对用户的精准理解，涉及到用户画像技术。此外还有低质流量、作弊点击和转化识别等问题，需要流量价值建和反作弊建模的策略。这些环节通常都需要进行机器学习建模。

2. 机器学习的方法论和业务要求

整个机器学习就是这样的一个系统：给定信息输入，抽取为特征表达，定义模型结构并学习，然后进行决策和执行，最后得到真实世界反馈来不断优化模型。机器学习的三个要素：数据、算法和工程架构。智能营销平台模型团队的目标就是要搭建这样一套机器学习系统，并为业务赋能。在工业界中，机器学习系统有两方面的要求：

业务要求：准，就是 AUC 和预估偏差；快，时效性要高；稳定，波动性要满足业务要求。
用户对机器学习平台的要求：好用、高效、工具完善。

3. 机器学习全流程系统的要素

搭建一个工业级机器学习系统，需要上图的这些要素。大部分做过模型的同学都清楚，首先要有一个核心的训练框架，智能营销平台搭建了一套自主研发的 DNN 的模型训练框架，支持大规模离散 DNN 模型训练，同时支持 online learning。在我们的业务中， online 模型不会一直训练，会定期训练 batch 模型，给 online 模型做初始模型接着训练，这样做的目的是防止 online 模型在不太准确的实时流样本上累积误差，导致模型学差。然后是训练的数据流，基于我们的日志系统搭建样本流，有天级的样本流和实时的样本流，天级样本流有完善的反作弊策略和脏数据清洗，实时样本流则追求时效性，但是准确性上会有损失。训练好的 online 模型会定期分发到线上模型服务，分发时有分发控制和模型监控，如果模型出现问题，不会分发到线上。机器学习系统的特征非常重要，我们专门抽象出来一个特征工程模块，这个模块在线和离线都会用到，主要是为了保证特征的一致性。另外还有样本流和特征流的监控，监控天级别的特征是否会有大的波动，这在业务上是非常必要的环节。

4. 智能营销平台模型团队的核心业务

模型团队输出两个方面的能力：端到端的学习建模能力，为业务赋能；针对核心业务的创新解决方案，打出自己的特色。

本文主要是分享怎样在业务中做创新的模型解决方案。我们之前根据业界流行的模型方案做过如下的模型迭代：连续 DNN、大规模离散 DNN、Wide&Deep、ESMM。最近一年来，我们针对自己的业务特色，深入思考，做了一些自主创新的探索工作，主要是三个方面的工作：

接下来分别为大家详细介绍下：

我们的工作

1. 深度时空网络 idea

之前的模型有什么问题？主流的模型独立预测每个广告的 CTR，但不考虑用户历史行为等辅助信息的影响。这些信息也可以通过特征工程的方法来做，比如加用户长期信息统计，带来的问题是繁琐、难以全面、需要领域知识，特征挖掘需要做大量的工作。我们希望能通过网络结构能自动完成用户历史行为的捕捉和挖掘。

在我们的业务场景中，可以将用户的历史广告行为和同屏广告信息作为辅助信息输入到模型中。主要引入两类辅助信息：空间信息、时间信息，比如要预估 target 广告，用户历史中看过的、点击过的历史广告广告作为时间维度信息输入，预估时的上文广告作为空间信息输入。

要有效利用时间和空间辅助广告，深度时空网络必须解决以下问题：

每个用户的历史行为有长有短
并非所有的历史信息都有用，需要压制噪声
当前信息对 target 广告的重要性不同
如何融合所有的信息

先从 feature embedding 开始。深度神经网络，需要把每个特征做 embedding 表达，每个广告有多个特征，多个特征的 embedding 通过拼接的方式连接起来，如果有多值特征则通过 sum pooling 方式累加。时空网络的 embedding 如何实现，有3种思路：

第一种是简单的 pooling 网络。Target 广告、上文广告、历史点过的广告、没点过的广告，有共享的特征：查统一的 embedding 表，形成多个拼接向量，单个类型的信息产生的 embedding 向量用 sum pooling 累加起来。有时用户行为比较稀疏，如果没有某种辅助信息的话，就变成0向量输入。这种网络结构简单，解决的问题是怎么把变长变成定长。

第一种方案虽然变成了定长，但是有的信息是有噪声的，没有体现出来。第二种方案就是增加 attention layer 对重要信息进行提取，比如有多个历史点击广告，用 attention 网络计算权重，体现历史广告信息的不同重要性。但是加 attention 还是没有和当前的广告产生重要性的交互。比如用户之前是对游戏感兴趣，切换到教育场景，那历史信息就是噪声了。

要针对当前广告筛选有用的信息，进一步设计了第三种交互式的 attention 模型，具体做法是：在前面的结构的基础上，目标广告的 embedding 和辅助广告一起输入到 attention 结构中，产生权重 pooling 起来。

我们分别在公开数据集和自己的业务数据集进行了实验对比，对比的基线有 LR，FM，DNN，W&D，DeepFM，GRU 等模型，对于论文中提出的三种结构也进行了对比。效果最好的是 interactive-attention 的模型。

我们进一步分析了辅助广告作用大小的分布，可以看到，在搜索场景中，上文广告的作用非常大，信息流广告中一般一次展示一条广告，没有上文，因此点击的作用大一些，不点击的作用小一些。实际业务场景中，点击广告和不点击广告行为长度不一样，我们进一步做了归一化分析，结论：点击广告比不点击广告归一化后提供的信息量要大。

加入时空网络结构之后，对 embedding 学习的表达也起到了聚类效果。我们观察到同类的东西，在时空网络的 embedding 中学到的更接近一些。

同时进一步看了下 attention-weight 学习的结果，同屏展现中越相似的广告权重越小。怎么理解呢？相似的广告在同一屏展示的时候，会分散用户的注意力，用户看到一个相似的东西之后，会 miss 另一个和它相似的东西。但是前文点击序列里面，越相似权重越大；未点击序列也是越相似权重越大，但是整体权重都较小，说明用户未点击的信息量不是太明确。

在搜索广告系统中，由于用到了上文信息，需要加入按位置拍卖的机制，所以对线上的排序机制做了修改，先选第一位的广告，再排后面的广告，后面的广告的上文为第一位广告。

参考论文：

[KDD 2019] Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction

https://github.com/oywtece/dstn

2. 深度记忆网络

第二个 idea 是深度记忆网络，主要目的是为了解决时空网络的线上性能问题。上面的时空网络，需要对输入数据的进行复杂的拼接，离线部分数据存取空间消耗大，仅能建模有限的数据量，历史行为不能太多。同时在线 inference 代价比较大，因此整个时空 DNN 上线过程对我们的工程架构挑战巨大。深度记忆网络的设计目标是不需要拼接信息，带来的好处是存储空间消耗变小，能够无限处理用户历史信息，在线 inference 结构更简单，效率更高。

回到 DNN 网络如何利用历史信息。有些网络结构，如 RNN 可以学到用户的历史信息，最终得到隐向量的输出，给下游模型使用。但是 RNN 离线训练是复杂且费时的，因此提出深度记忆网络目标是希望能够结合 DNN 和 RNN 的优点，同时达到效果的折中：既能像 DNN 一样简单实用，又能像 RNN 一样捕捉用户的历史信息。

先看 RNN 怎么做的：RNN 把用户行为序列通过 embedding 放入 GRU 网络中，得到的输出，再给 DNN 网络做输入，GRU 的的输出可以看做是一种记忆向量。使用 GRU 网络需要对用户历史行为做扩展，显示地指定用户行为序列；深度记忆网络设计的初衷，就是能不能不显示地构造用户的历史行为序列，而是靠模型的学习机制来解决这个问题。

因此我们在 DNN 网络结构中增加了用户的记忆向量，记忆向量不需要很多槽位，只有两类记忆：用户点过和没点过的两种记忆向量，分别代表用户感兴趣和不感兴趣内容。记忆的输入内容是用了当前 DNN 网络最后一个隐层的内容，用这个隐层的原因是它是对样本的抽象表达，这个向量通过一种"写控机制"存储到用户的记忆 embedding 中，线上要预估时，把用户的记忆向量取出来，放入神经网络中使用。

训练的 loss 和普通 DNN 相同，label 和预估值做 log loss。对于写控机制，也就是记忆向量的学习，目标是希望用户的记忆向量和用户所有见过样本的表达，有 MSE loss 的约束，可以理解为最终达到的效果是：如果点了，向用户感兴趣的记忆向量里面记，不点的内容往不感兴趣的记忆向量里面记。整体是两个 loss 一起训练优化。

记忆网络我们也做了一些模型效果对比，在我们的业务模型基线以及公开数据集基线上都取得了 AUC 增益。记忆网络效果没有时空 DNN 强大，但是结构简单，实现代价低，对于希望快速拿到业务收益的场景非常实用。

参考论文：

[DLP-KDD 2019] Click-Through Rate Prediction with the User Memory Network

https://github.com/rener1199/deep_memory

3. 深度匹配、关联与预测网络

第三个工作是在特征表达学习上做了些研究，发表在 2019 IJCAI 会议上。

传统的 DNN 模型将特征 embedding 用全连接网络往上送，最终和 label 一起计算 loss 并优化，学习时更多地关注 label 和特征之间的相互关系，虽然也有神经元连接起到交叉作用，但是特征和特征之间的相互影响学习的较少。比如某个用户点了某个 item，模型学习的结果并不要求用户和 item 表达有相似性。目前有些可借鉴的网络结构，如 DSSM，会要求两个输入 item 有一定的相似性。因此我们借鉴了这种思路，并将现有的模型结构融合起来，使得 DNN 网络学习的同时，对 Embedding 的学习也使用一些辅助网络来强化。对应到我们的业务中，如用户和广告，如果有点击关系，是否能相似一些，用户点击序列中的广告，是否能学的相似一些。

看下业务中具体的具体例子， u 代表用户特征，a 代表广告特征，O 代表其他特征。用户和广告的关系，广告与广告的关系，类似于构建了一个图。比如用户1点了广告1、广告3，用户2点了广告1。用户1和用户2的 embedding 能通过图的关系推断出一些关系，期望 embedding 表达也具有相似性，广告1 和广告3出现在用户的一个行为序列中，也应该具有相似性。如果是放在之前的纯 DNN 网络中，用户1和用户2的 embedding 是随机初始化，向各自的样本的 loss 方向学习，很难取得预期的效果。

整个 DeepMCP 网络分为三个部分：一个是主网络，可以是任何的 DNN 网络结构，如 wide&deep，DeepFM；两个辅助网络：匹配子网络和关联子网络。匹配子网络学习的是用户和广告的相关性 ( 类似 DSSM )，关联子网络是学习广告和广告的相关性 ( 类似 word2vec 和 graph embedding )，目标是希望整个网络既有好的预测能力，又有好的 feature embedding 表达能力，从而提升模型的泛化能力。MCP 模型还有一个优点，线上 inference 时，只需要把主网络激活就可以了，其它部分不需要计算，对线上计算性能没有影响。

网络结构详解：

预测子网络：最左侧的网络部分，也是模型的主任务部分，优化的目标是 log loss，线上预测时只需要激活这部分网络计算。
匹配子网络：一个类似 dssm 结构的网络，挑选用户相关的特征输入左侧的子网络中，广告相关的特征输入右边，上面经过全连接层，最后计算 matching score 和 loss，优化的目标是匹配能力。
关联子网络：一个类似 word2vec 的网络，选择用户的行为序列构建正负样本进行训练，目标是希望同在序列的 Item 表达相似。

匹配子网络，这里有一个细节，中间需要加一个 tanh 的激活函数，因为上面要做 product 计算，如果是 ReLu 的话，会出现很多0值，product 可能无效。

关联子网络，有两类样本，一类是同在一个行为序列的样本形成正样本对，一类是负样本对，随机负采样。Loss 和 word2vec 的思路类似，目标是希望同在一个行为序列的 item 特征表达相似。

训练优化的 loss 是三个网络的 loss 累加，不同的 loss 之间增加了超参数调节。

实验发现超参数的设置非常重要，业务中超参数的具体值需要根据数据集来决定。同样在公开数据集合业务数据集中做了对比，对比了通用的 DNN 模型，DeepCP 效果取得了小幅提升， DeepMP 的效果比较明显；DeepMCP 的效果是最好的。其中 DeepCP 网络的训练样本构造比较复杂，在业务落地时，可以选择 deepMP 上线。

参考论文：

[IJCAI 2019] Representation Learning-Assisted Click-Through Rate Prediction

https://github.com/oywtece/deepmcp

总结

智能营销平台近年来结合业务特点进行了多项模型技术的创新升级，但是我们的创新工作还未停止。智能营销平台力求打造一个效果和效率最好的变现平台，在触发、定向，CVR/OCPC 等技术方向还有很多业务挑战问题亟待解决，也欢迎对模型技术感兴趣的同学一起加入探索。

今天的分享就到这里，谢谢大家。

如果您喜欢本文，欢迎点击右上角，把文章分享到朋友圈~~

社群推荐：

欢迎加入 DataFunTalk 计算广告 交流群，跟同行零距离交流。如想进群，请加逃课儿同学的微信 ( 微信号：DataFunTalker )，回复：计算广告，逃课儿会自动拉你进群。

分享嘉宾

▬

秀武

阿里巴巴 | 高级算法专家

——END——

文章推荐：

CTR预估在动态样式建模和特征表达学习方面的进展

广告CTR预估中用户行为学习和记忆建模

关于我们：

DataFunTalk专注于大数据、人工智能技术应用的分享与交流。发起于2017年，在北京、上海、深圳、杭州等城市举办超过100场线下沙龙、论坛及峰会，已邀请近500位专家和学者参与分享。其公众号DataFunTalk累计生产原创文章400+，百万+阅读，5万+精准粉丝。

【java小灶课】详解java与python的不同之处 wit_@ python java big data web
以下是一篇详细的博客，全面介绍了Java与Python在多方面的区别，包括语法、类型系统、内存管理、面向对象特性、并发编程以及常见应用场景等，希望能帮助你深入理解这两门语言的异同，为学习或实际应用提供指导。目录语言概述语法对比类型系统内存管理与垃圾回收面向对象特性函数式编程与Lambda表达式异常处理标准库与第三方库生态并发和多线程运行效率与性能优化常见应用场景学习曲线与社区支持总结1.语言概述J
JS中const有没有变量提升 lvbb66 javascript 前端开发语言
在JavaScript中，const关键字用于声明一个只读的常量，其值在初始化后不能被重新赋值。关于变量提升（Hoisting），它是JavaScript中一个重要的概念，指的是无论变量或函数声明在何处，它们都会被“提升”到其所在作用域的最顶部。但是，这个规则不完全适用于const和let声明的变量。变量提升（Hoisting）的传统理解在ES6之前，JavaScript只有var关键字用于声明变
贪心算法：求过河的最短时间 2301_81758904 算法
描述：N位旅行者在夜里过桥需要借助手电筒。但N个人中只有一个手电筒，而且桥同时只能让两个人过。每个人单独过桥所需时间已知，但如果两个人同时过桥则所需时间是走得慢的那个人单独过桥所需的时间。要求：设计一个方案，让这N个人尽快过桥，计算这N个人的最短过桥时间。此如：有甲乙丙丁四个人，他们过河所需的时间分别是1，2，5，10。让最快的2个人先过桥，然后让跑的最快的人回去接剩下的人。例如：先让甲乙过去(2
数据库的DQL(1) 比特知识工坊 MySQL专栏数据库
数据库的DQLDQL是sql中的一种重要语言类型，用于查询数据库中表的记录。DQL的主要关键字是select，用于从数据库中检索数据。常见的查询操作包括基本查询，条件查询，排序查询，分组查询，聚合函数等；在MySQL中，可以使用select语句来查询数据。查询数据是指从数据库总根据需求，使用不同的查询方式来获取不同的数据。SELECTFROM表名WHERE表达式在练习之前，导入准备好的sql文件。
常见哈希表相关题目我要学编程(ಥ_ಥ) 优选算法专题算法数据结构哈希表
找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程(ಥ_ಥ)-CSDN博客所属专栏：优选算法专题目录1.两数之和面试题01.02.判定是否互为字符重排217.存在重复元素219.存在重复元素II49.字母异位词分组哈希表我们在数据结构阶段也是重点学习了，并且也已经刷了一部分的题目了。下面还练习一部分题目即可。1.两数之和题目：给定一个整数数组nums和一个整数目标值target，请
使用 Caffeine 和 Redis 实现高效的二级缓存架构微技术 redis 架构数据库缓存
在现代应用开发中，缓存是提升系统性能的关键手段。为了兼顾本地缓存的高性能和分布式缓存的扩展能力，常见的实现方式是结合使用Caffeine和Redis实现二级缓存架构。本文将详细介绍如何通过SpringBoot实现一个Caffeine+Redis二级缓存，并通过合理的架构设计和代码实现，确保缓存的一致性、性能和容错性。一、需求与挑战1.多级缓存的需求：•一级缓存（Caffeine）：快速响应，存储本
Wi-Fi 7、Wi-Fi 6 与 5G、4G 的全方位对比微凉的衣柜科技头条 5G 网段
随着无线通信技术的飞速发展，Wi-Fi7、Wi-Fi6，以及5G、4G已经成为人们生活和工作中不可或缺的网络技术。无论是家庭网络、高速移动通信，还是工业物联网，这些技术都在发挥各自的作用。那么，它们之间有什么区别？适用的场景又有哪些呢？本文将从速度、延迟、覆盖范围、网络架构和应用场景等多方面为大家做一个详细的对比分析。1.技术基本概念Wi-Fi7（802.11be）：最新一代Wi-Fi标准，主打超
【Python】成功解决ValueError: zero-size array to reduction operation minimum which has no identity 高斯小哥 BUG解决方案合集 python 新手入门学习 debug
【Python】成功解决ValueError:zero-sizearraytoreductionoperationminimumwhichhasnoidentity个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、
docker运行Java项目，Kaptcha因为字体缺失没法显示验证码图片商鼎云技术 docker java 容器
2015工作至今，10年资深全栈工程师，CTO，擅长带团队、攻克各种技术难题、研发各类软件产品，我的代码态度：代码虐我千百遍，我待代码如初恋，我的工作态度：极致，责任，死磕！欢迎点赞、收藏、关注，更多分享请进我主页。Java项目在开发主机以及宿主服务器，Kaptcha都可以正常显示验证码图片，而docker运行Java项目，Kaptcha会因为字体缺失而没法显示验证码图片，报错如下java.lan
第五篇 vue3 ref 与 reactive 对比小画家~ 前端 vue.js
ref若需要自动加载.value,那么就要在底部菜单中设置选项选择vue勾选：AutoInsert:DotValueAuto-completeRefvaluewith`.value`.注意点：ref不能写越过value.必须要在valeu前面进行定义通过reactive来修改整体名称的值letcarad=reactive({brand:"小汽车",price:"1888"})//通过reactiv
MacOS/C/C++下怎样进行软件性能分析(CPU/GPU/Memory) 捕鲸叉软件调试和诊断软件调试软件验证
在macOS环境下进行C/C++软件性能分析，可以使用多种工具和技术来测量和优化CPU、GPU和内存的性能。macOS提供了丰富的性能分析工具，如Instruments、gprof、Perf、以及NVIDIA和Intel的专用工具。下面详细介绍了实现思想和操作方法。1.性能分析的目标CPU：分析CPU的使用情况，找出性能瓶颈、热点代码。GPU：分析GPU的使用情况，确保GPU资源被有效利用。内存：
开源AI图像工具—Stable Diffusion 蚂蚁在飞- 人工智能 stable diffusion
StableDiffusion是一种基于深度学习的生成式模型，用于图像生成、图像修复和风格转换等任务。它是由StabilityAI和CompVis团队联合开发的。StableDiffusion在生成高质量图像方面表现出色，并且是开源的，可以自由使用和扩展。StableDiffusion的核心技术1.扩散模型(DiffusionModels):•基于概率生成模型。•从噪声中逐步反向生成清晰的图像。•
Numpy基础01（Jupyter基本用法/Ndarray创建与基本操作） XYX的Blog 数据分析与可视化 numpy jupyter
内容一：Jupyter开发环境IPython是一个增强型的Python交互式解释器，提供了自动补全、命令历史、魔法命令等功能。它支持与操作系统命令交互、内联绘图和多语言扩展，并可与JupyterNotebook集成，适用于数据分析和科学计算。IPython还支持远程访问、包管理和插件扩展，是一个功能强大且灵活的开发工具。JupyterNotebook是IPython的开发环境。1.1Jupyter
基于TSN的混合5G网络中的确定性通信研究需求与综述神一样的老师论文阅读分享网络
ResearchDemandandReviewonDeterministicCommunicationinHybrid5GnetworksbasedonTSNMahmoudAlqudahUniversityofSiegenSiegen,Germanymahmoud.alqudah@uni-siegen.deRomanObermaisserUniversityofSiegenSiegen,Germa
数据库的DQL(3) 比特知识工坊 MySQL专栏数据库
数据库的DQL(3)分组查询在MySQL中，groupby关键字可以根据一个或多个字段对查询结果进行分组groupby字段名1.分组函数有时也叫聚合函数count():查询表中的记录数量avg():求平均值sum():求和max():求最大值min():求最小值案例1：mysql>selectcount(empno),sum(sal),avg(sal)fromemp;+--------------
《重生到现代之从零开始的C++生活》—— 入门基础语法2 yttandb c++生活
缺省参数缺省参数就是在函数的声明和定义里制定一个缺省值，如果没有指定的实参就用该形参的缺省值voidadd(inta=0,intb=0){returna+b;}简单的的说就是将形式参数附一个值，如果没有实参传入的话，就默认用形参的值voidadd(inta=0,intb=3){returna+b;}intmain(){inta=1;intb=5;add(a,b);//结果为6add(a);//结果
《重生到现代之从零开始的C语言生活》——C语言的数据类型和变量 yttandb c语言生活
C语言的数据类型和变量数据类型C语言中的数据类新用来描述数据，而类型可以理解为是数据的分类。数据类型可以分为以下几个内置类型字符型整型浮点型布尔类型自定义类型数组结构体-struct枚举-enum联合体-union在下面我们着重讲解内置类型字符型char可以创建一个字符型的变量（变量会在下文进行描述，在这知道即可）整形短整型shortint整形int长整型longint更长的整形longlongi
Python魔法方法__call__深入详解图灵学者 python精华 python 开发语言
目录1、魔法方法__call__初探‍♂️1.1什么是__call__?1.2基础用法演示1.3自定义行为与参数传递2、实现轻量级装饰器模式️2.1装饰器概念回顾2.2利用__call__构建装饰器2.3深入理解装饰器应用场景3、类实例变身函数调用3.1类似函数的行为模拟3.2动态执行与灵活性提升3.3实战案例：日志记录器4、实现状态机模式4.1状态机概念回顾4.2通过__call__管理状态转换
Python魔法参数：深入解析*args和**kwargs的强大用途图灵学者 python精华 python java linux
目录引言基础概念解析*args：处理位置参数**kwargs：处理关键字参数*args和**kwargs的实际应用场景1.函数装饰器中使用*args和**kwargs2.类构造函数中使用*args和**kwargs3.API调用中使用**kwargs与其他参数类型的结合使用结合默认参数位置参数与关键字参数的混合使用高级技巧和注意事项参数解包与重打包性能考量调试技巧案例研究场景描述实现步骤实际应用案
机器学习：scikit-learn 和 Jupyter Notebook（推荐初学者使用google colab） wyc9999ww 机器学习 scikit-learn jupyter 人工智能 python
对于初学者来说，scikit-learn是一个理想的机器学习入门工具。不仅提供了丰富的算法和功能，还通过一致的API设计，确保能够快速上手并进行各种机器学习任务。通过使用scikit-learn，可以专注于理解和实践机器学习的核心概念，而不必过多担心底层实现细节。所以scikit-learn能轻松实现从数据预处理到模型训练和评估的完整流程。此外在推荐一个适合初学者的深度学习平台工具googleco
使用Python解决数独谜题的实用指南 werf456456asddd python 开发语言
在这篇文章中，我们将探讨如何编写一个Python函数来解决数独谜题。这个函数将接收一个9x9的数独网格作为输入，并使用回溯算法来解决谜题。如果谜题无法解决，函数将返回None。此外，我们还会确保输入网格是一个有效的数独谜题。技术背景介绍数独是一种经典的逻辑游戏，目标是填满一个9x9的网格，使每列、每行和每个3x3的子网格都包含1到9之间的数字。在计算机科学中，数独可以通过回溯算法来求解，这是一种尝
AI赋能：高职院校实验实训教学如何拥抱人工智能浪潮？武汉唯众智创人工智能实训人工智能实验实训教学
随着信息技术的迅猛发展，人工智能技术已成为推动社会各行业转型升级的核心力量。它不仅在提升生产效率、优化管理流程、提高服务质量方面发挥着关键作用，也深刻影响着高职教育的专业发展和课程教学内容的改革。作为培养专业技术技能人才的摇篮，高职院校必须创新其教学模式和方法，以适应新的发展需求，从而培育出能够适应未来技术变革的高素质人才。特别是在实验实训教学领域，人工智能的融入为职业教育改革提供了新的思路和工具
cpp智能指针 xianwu543 c++开发语言 mysql 数据库网络
普通指针的不足new和new[]的内存需要用delete和deletel]释放。程序员的主观失误，忘了或漏了释放。程序员也不确定何时释放。普通指针的释放类内的指针，在析构函数中释放。C++内置数据类型，如何释放?new出来的类，本身如何释放?C++11新增三个智能指针类型unique_ptrshared_ptrweak_ptr一、智能指针unique_ptrunique_ptr独享它指向的对象，也
SQL Server实现将分组的其他字段数据拼接成一条数据新鑫S 数据库 sql
在SQLServer中，可以使用STRING_AGG函数（SQLServer2017及更高版本支持）将分组的其他字段数据拼接成一条数据。以下是示例代码：假设有一个表Orders，结构如下：OrderIDCustomerIDProduct1C001Apple2C001Banana3C002Orange4C002Grape5C001Mango需要按照CustomerID分组，将每个客户的产品（Prod
【深度学习】CrossEntropyLoss需要手动softmax吗？ zz的学习笔记本深度学习深度学习人工智能
【深度学习】CrossEntropyLoss需要手动softmax吗？问题：CrossEntropyLoss需要手动softmax吗？答案：不需要官方文档代码解释问题：CrossEntropyLoss需要手动softmax吗？之前用pytorch实现自己的网络时，使用CrossEntropyLoss的时候将网路输出经softmax激活层后再计算CrossEntropyLoss。答案：不需要调用了损
服务器性能监控与优化系统：实战指南与代码案例我的运维人生服务器运维运维开发技术共享
服务器性能监控与优化系统：实战指南与代码案例在现代IT基础设施中，服务器性能监控与优化是确保业务连续性和高效运行的关键环节。通过实时监控和调优，能够及时发现并解决潜在的性能瓶颈，从而提升用户体验和系统稳定性。本文将详细介绍服务器性能监控与优化系统的实践方法，并通过具体代码案例进行说明。一、性能监控的重要性性能监控是服务器管理的核心任务之一，通过实时监控关键性能指标（如CPU使用率、内存使用率、磁盘
1、Java 环境搭建与基本概念：开启 Java 编程之旅的第一步翻晒时光从0学Java java 开发语言
大家好，欢迎来到我们的Java学习系列博客，今天是第一课，我们将一起探索Java环境搭建与基本概念。无论你是编程新手，还是想要学习一门新语言的老手，Java都是一个非常值得学习的语言，它在众多领域都有着广泛的应用，从企业级软件开发、安卓应用开发到大数据处理，都能看到Java的身影。让我们开始这充满挑战与乐趣的Java学习之旅吧！一、Java的发展历程与特点Java诞生于SunMicrosystem
mathtype如何嵌入到word中 weixin_42408281 word 经验分享笔记
1.点击文件进入word文档文件后点击左上角的文件，点击进入选项菜单。2.点击加载项在左侧的菜单中点击加载项，在右侧窗口找到底部的管理选项。3.选择模板下拉菜单选择模板后点击后面的转到，浏览新窗口中的模板列表，点击“转到”4.勾选mathtype加载项找到并勾选mathtype加载项后点击添加，确定，点击菜单栏中出现的mathtype选项就能使用对应功能了。
有趣的python代码实例_Python之路：200个Python有趣的小例子一网打尽 weixin_39845406 有趣的python代码实例
概述博主最近在学习python，看完了一整套学习视频，然后呃呃呃，还是用不太流畅。碰巧在全球最大的同性交友论坛GayHub(呸！是开源代码托管平台Github)上面发现了一个项目，该项目列举了200多个Python小例子，Python基础、Python坑点、Python字符串和正则、Python绘图、Python日期和文件、Web开发、数据科学、机器学习、深度学习、TensorFlow、Pytor
python module错误_修复python的ModuleNotFoundError weixin_39761696 python module错误
我在项目里面用到了python，但其他的同事并没有安装python环境，为了不强制每个人都安装python，我下载了python-3.6.1-embed-amd64，并将用一个.bat去调用它。大概像这样myscript.bat"%dp0\python-3.6.1-embed-amd64\python.exe""%dp0\myscript.py"pause我写了两个python文件，这里假设是my
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用

你可能感兴趣的:(深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用)