我就算饿死也不做程序员

CTR特征建模：ContextNet & MaskNet(Twitter在用的排序模型)

在之前的文章中 FiBiNet&FiBiNet++模型，阐述了微博在CTR特征(Embedding)重要性建模方面的一些实践方向，今天再来学习下这个方面的两个相关研究：致力于特征和特征交互精炼(refine)的ContextNet和MaskNet，其中MaskNet也是Twitter(推特)使用的精排模型底座。

ContextNet

论文：ContextNet: A Click-Through Rate Prediction Framework Using Contextual information to Refine Feature Embedding

地址：https://arxiv.org/pdf/2107.12025.pdf

受NLP领域的启发，如ELMO和BERT，word embedding是可以通过上下文的句子信息进行动态精炼(refine)的，这延伸到CTR任务，这种方法是否仍然可行呢？

如果可行的话，那么我们就能够通过这个方式来高效地捕获有用的特征交互。基于这个动机，论文提出了ContextNet的框架，依靠输入的上下文信息来对feature embedding进行一层一层地动态提炼，从而完成隐式的高阶特征交互。

ContextNet包含两个关键的组件：

contextual embedding module： 从输入实例为每个特征聚合上下文的信息
ContextNet block： 一层一层地维持feature embedding的同时，将上下文的高阶交叉信息合并到feature embedding，从而实现特征动态提炼。

ContextNet结构如上图所示。

Embedding Layer.

最底层的feature embedding layer仍然是常规的做法：离散特征输入经过one-hot，然后经过Embedding Layer映射到低维的embedding，而数值特征输入则是与对应的field embedding相乘。

Contextual Embedding

如上所述，Contextual Embedding模块有两个目标：为每个特征聚合上下文信息、将汇聚的上下文信息映射到feature embedding所在的低维向量空间，这个过程可以表达为下式：

$CE_i \in \mathbb{R}^k$ 代表第i个特征 $E_i$ 的contextual embedding，k是field embedding的维度大小。
$\mathcal{F}_{agg}(E_i,E;\Theta_a)$ 是第i个特征的上下文信息聚合函数，即aggregation model，使用了Embedding Layer的输出E和feature embedding $E_i$ 作为输入；
$\mathcal{F}_{project}(\mathcal{F}_{agg};\Theta_p)$ 则则是一个映射函数，即projection model，将聚合后的上下文信息 $\mathcal{F}_{agg}$ 投影到feature embedding所在的低维空间。
$\Theta_a,\Theta_p$ 分别是aggregation model和projection model的参数。

如上图，论文采用了两层的前馈网络来分别作为聚合函数 $\mathcal{F}_{agg}(E_i,E;\Theta_a)$ 和映射函数 $\mathcal{F}_{project}(\mathcal{F}_{agg};\Theta_p)$ ，称为two-layer contextual embedding network (TCE)，可以表达为下式：

其中， $\in \mathbb{R}^{m=f \times k}$ ，并假定特征 $E_i$ 属于field d：

第一层前馈网络即全连接网络（FC layers）是聚合网络，是一个相对更宽的网络层，为了能够更好从Embedding Layer收集到上下文信息，其参数为 $W_d^a \in \mathbb{R}^{t \times m}$ ；
第二层FC layers是映射网络，将上下文信息投影到feature embedding所在的低维空间，其参数为 $W_d^p \in \mathbb{R}^{k \times t}$

为了平衡模型的能力和复杂度，论文使用了这样的参数策略：所有特征共享聚合网络的参数A，而映射网络则是每个特征独享自己的参数P，因为聚合网络是比较宽的网络层，其计算复杂度是比较高的。这也是根据实验结果选择的最优策略：

ContextNet Block

ContextNet Block是为了动态提炼每个feature embedding来达到隐式捕获高阶特征交互，通过合并特征的contextual embedding的方式。

如上图[ContextNet结构]，ContextNet block包括两个步骤：merge embedding和non-linear transformations。并且ContextNet block是多层的，可以一个block接着一个block堆起来，即上一个block的输出是下一个block的输入，可以表达为下式：

$E^l_i$ 代表第i个特征在第 $l$ 层block的输出， $CE^{l+1}_i$ 代表第i个特征在第 $l + 1$ 层block的由TCE
计算得到的contextual embedding
$E^{l+1}_i \in \mathbb{R}^k$ 则是通过第 $l + 1$ 层ContextNet block微调之后的第i个特征的feature embedding，k是field embedding的维度大小
$\mathcal{F}_{merge}(E^l_i,CE^{l+1}_i;\Theta_m)$ 是一个合并函数，使用上一层block的输出 $E^l_i$ 和contextual embedding $CE^{l+1}_i$ 作为输入，论文使用了没有参数 $\Theta_m$ 的Hadamard product(阿达玛积)，如下式：

而 $\mathcal{F}_{non-lieanr}(\mathcal{F}_{merge};\Theta_n)$ 则是一个映射函数，对merge embedding进行了non-linear transformation，从而更深入捕获第i个特征的高阶交互。论文提出了两种形式point-wise feed-forward network、single-layer feed-forward network，如下图所示：

Point-Wise FFN

如上图[Non-Linear Transformation]左边的Point-Wise FFN所示，其实就是由两层FC layers+残差连接+layer normalization(LN)，如下式：

其中， $W^1,W^2 \in \mathbb{R}^{k \times k}$ ，并且在整个FFN网络中是共享的参数。

Single-Layer FFN

如上图[Non-Linear Transformation]左边的Single-Layer FNN，也正如它的名字，是一层单层网络的版本，即一层FC layers+layer normalization(LN)，如下式：

同样， $W^1 \in \mathbb{R}^{k \times k}$ ，在整个FFN网络中也是共享的参数。

MaskNet

论文：MaskNet: Introducing Feature-Wise Multiplication to CTR Ranking Models by Instance-Guided Mask

地址：https://arxiv.org/pdf/2102.07619.pdf

一些研究如Alex Beutel et.al证明了加法的(addictive)特征交互，比如标准的feed-forward neural networks即DNN，在捕获通用(common)的特征交互方面是低效的。

为了解决这个问题，论文通过instance-guided mask，引入了乘法(multiplicative)操作:

它对feature embedding和feed-foward layers都应用了element-wise product；
利用从输入实例收集的全局信息，以统一范式来动态地强调feature embedding和隐藏层中含有有用信息的elements；
同时，通过输入实例的指导，它属于一种有效的bit-wise attention，能够削弱feature embedding和MLP layers的噪声影响。

MaskBlock将feed-forward layer转化为加法和乘法混合的特征交叉：结合instance-guided mask的同时，仍然保留feed-forward layer和layer normalization。

Embedding Layer.

底层的feature embedding layer仍是常规做法，与ContextNet一致，不再赘述。

Instance-Guided Mask

如上所述，论文实现了利用从输入实例收集的全局信息，来动态地强调feature embedding和隐藏层中含有有用信息的elements，而关键就是这个输入实例指导的掩码(mask)：

对于feature embedding，mask会强调那些含有更多信息的关键elements，以此来更高效地表征每个特征；
对于隐藏层，mask会帮助那些重要的特征交互更为突出即更被重视。

如下图所示，论文使用了与上面contextual embedding相同的结构来计算这个mask：总共两层的FC layers，一层较宽的聚合网络+一层降维的投影网络。

其中， $V_{emb} \in \mathbb{R}^{m=f \times k}，W_{d1} \in \mathbb{R}^{t \times m}，W_{d2} \in \mathbb{R}^{z \times t}$ 。并且定义超参数reduction ratio $r = t / z$ 。

得到mask之后，就可以增强feature embedding和隐藏层中那些重要的elements，使用的方法是点积element-wise product，更重要的elements，mask对应位置的数值就会更大：

从上述表达式，确实可以理解为一种bit-wise attention，并且feature embedding和隐藏层拥有各自的实例指导mask。

MaskBlock

为了克服feed-forward layer捕获复杂的特征交互低效问题，提出了MaskBlock这种基础组件，如下如所示，MaskBlock包含了：

有利于模型训练优化的layer normalization
为feed-forward layer引入乘法操作的instance-guided mask
聚合masked的信息，来更好地捕获重要特征交互的feed-forward layer

Layer Normalization

这里可以重温下layer normalization的知识，如下式：

让 $x=(x_1,x_2,...,x_H)$ 是size为H的向量表征。h是LN的输出， $\odot$ 是点积操作(element-wise product)， $\mu$ 和 $\delta$ 是输入x的均值和标准差。bias $b$ 和gain $g$ 则是需要学习的参数。

应用到feature embedding和隐藏层则分别对应以下：

对于MLP隐藏层的LN，其实是有两个可选位置的：非线性操作(即ReLU)之前和非线性操作之后，选择放在ReLU是因为其实验效果更佳的。

MaskBlock结构

MaskBlock也可以像普通的MLP或者Transformer那样堆叠更加深度的网络，因此MaskBlock跟ContextNet一样，即可以接收feature embedding作为输入，也可以接收上一层MaskBlock的输出。

前面也提到，MaskBlock包含了三个关键的组件：layer normalization、instance-guided mask、feed-forward layer，也正是因为这三个关键的操作，才能将只含加法操作的标准DNN转化为加法混合乘法操作的特征交互。

MaskBlock on Feature Embedding.

接收feature embedding作为输入的MaskBlock当然也不例外，如下图所示：

MaskBlock利用instance-guided mask $V_{mask}$ 来重点突出 $V_{emb}$ 中更富含信息的元素，通过点积的方式element-wise product即 $\odot$ 。

接着，再引入一个feed-forward layer和LN操作，来更好聚合masked之后的信息。其中 $W_i \in \mathbb{R}^{q \times n}$ 表示第i层MaskBlock中的feed-forward layer参数，n是 $V_{maskedEMB}$ 是维度，q是feed-forward layer的神经元数量，即隐藏层的输出维度。

MaskBlock on MaskBlock.

而进行堆叠的MaskBlock结构(即MaskBlock on MaskBlock)基本与MaskBlock on Feature Embedding一样：

先通过instance-guided mask $V_{mask}$ 来highlight上一层MaskBlock输出中重要的特征交互，
然后再引入一个feed-forward layer和LN操作来更好地捕获特征交互。

串行和并行结构

如上图所示，论文提出了两种不同结构的MaskNet：串行(Serial) MaskNet和并行(Parallel) MaskNet。

Serial MaskNet则是像上述提到的堆叠起来的MaskBlock：

第一层是MaskBlock on feature embedding即接收feature embedding作为输入的MaskBlock
后面的其他层则是都是接收上一层MaskBlock输出作为输入的MaskBlock on MaskBlock
但是所有层的MaskBlock的instance-guided mask都是通过feature embedding计算而来
其结构类似于每个time step都共享输入的RNN模型

Parallel MaskNet则是像MMoe结构，共享feature embedding layer，多个MaskBlock像多个Expert一样，关注各自不同类型的特征交互，然后再汇聚多个MaskBlock的输出，如下式：

$V^i_{output} \in \mathbb{R}^q$ 对应第i个MaskBlock的输出。

为了更深入地合并每个expert即MaskBlock捕获的特征交互，后面再引入多个feed-forward layer。令 $H_0=V_{merge}$ ，其输出如下式：

后面的Prediction Layer则与常规的CTR模型无异。

总结

受NLP领域(如ELMO和BERT)的启发，word embedding可以通过上下文的句子信息进行动态精炼(refine)的，这种思想可以延伸到CTR任务，通过输入的上下文信息来指导每一层网络的特征交互捕获。

ContextNet使用Contextual Embedding作为指导，将高阶交叉信息合并进去feature embedding；
ContextNet更像BERT或Transformer，一层一层地维护和精炼(refine)feature embedding；
MaskNet则是使用Instance-Guided Mask作为指导，但不同的是MaskNet致力于指导highlight每一层中重要的特征交互，每一层都进行深度的特征交互捕获，而不是refine feature embedding；
并且MaskNet还提出了类似MMoE并行的结构，即共享feature embedding layer，多个MaskBlock承担多个expert的角色同时计算各自的部分。

代码实现

git：ContextNet、MaskNet

你可能感兴趣的:(推荐系统,推荐系统,新浪微博,twitter)

向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
怎么能得到各种淘宝优惠券呢？领取淘宝优惠券的平台有哪些? 氧惠评测
要得到各种淘宝优惠券，可以通过以下几种途径：一、使用第三方优惠券平台除了直接在淘宝平台领取外，还可以使用第三方优惠券平台来获取更多的优惠券资源。这些平台通常会与淘宝商家合作，提供额外的优惠券和返利服务。以下是一些常见的领取淘宝优惠券的平台：氧惠APP特点：氧惠APP不仅提供了淘宝的优惠券，还涵盖了其他主流电商平台和生活服务平台，如美团、饿了么等。它以其全面的优惠信息和精准的推荐系统赢得了用户的喜爱
智能体学习记录一罗同学213 学习
智能体是什么智能体（IntelligentAgent）是一种能够感知周围环境、自主决策并执行行动以实现特定目标的智能化系统或程序。它可以是软件（如聊天机器人）、硬件（如机器人），或两者结合的实体，核心特征包括：自主性：无需人工实时干预，独立运行（如自动驾驶车辆避障）。反应性：实时感知环境变化并快速响应（如智能家居调节温度）。目标导向：基于预设目标优化行动（如推荐系统最大化用户点击率）。学习能力：通
基于Python的Twitter Card数据爬取与分析实战：从入门到精通 Python爬虫项目 python twitter dreamweaver 自动化开发语言宽度优先爬虫
摘要本文详细介绍了如何使用Python最新技术栈构建一个高效的TwitterCard数据爬虫系统。我们将从TwitterCard的基本概念讲起，逐步深入到爬虫架构设计、反爬策略应对、数据解析与存储等核心环节。文章包含完整的代码实现，使用Playwright+Asyncio的高性能爬取方案，以及数据分析与可视化的实战案例。通过本文，读者将掌握大规模社交媒体数据采集的关键技术，并能够将这些技术应用于实
Python爬虫实战：高效解析OpenGraph协议数据 Python爬虫项目 python 爬虫开发语言宽度优先音视频 json
OpenGraph协议简介OpenGraph协议是由Facebook于2010年推出的一种网页元数据标准，旨在使任何网页都能成为社交图中的丰富对象。通过在网页的部分添加特定的标签，网站所有者可以控制内容在社交媒体上分享时的呈现方式。OpenGraph协议的核心元数据包括：html这些标签不仅被Facebook使用，也被Twitter、LinkedIn、WhatsApp等主流社交平台广泛支持。据统计
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
实训任务一：我与新媒体佐智雄
一、自我介绍大家好哦，我是来自湖南商业技师学院的刘某某是一名中职的学生，我喜欢听音乐、画插画，无聊时也会打打游戏，我比较社恐，性格比较内向我对新媒体的认知是通过快手，抖音等网络平台传递信息，新媒体传播速度快，广泛，便捷。而传统媒体指的是报纸、广播、电视等。“新媒体是以数字技术为基础，以网络为载体进行信息传播的媒介”中国的新媒体起源于1994年第一家曙光论坛的创立，兴起于2012年新浪微博的用户爆发
打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
2018-08-25 周六竹村浪里个郎
爱范儿今天搞怀旧，弄了一篇谈饭否的文章。我07年8月有的饭否，比我用Twitter还早。刚想去登陆看看，账号邮箱和密码忘了，因为当时邮箱是自己域名弄了google套件自架的邮箱，而那个域名早已没用，自然邮箱也废弃了的。所以，找不回来了，这辈子是找不回来了。唉，记得以前里面个个都是人才的。我想起个日文名。回想我出生的农村，我们村坐落在一座山上，但村子还是被地势划开，山腰半个村，我们说上村，山脚半个村
RabitQ 量化：既省内存又提性能大禹智库《向量数据库指南》《实战AI智能体》人工智能 AI自动化大禹智库 AI智能体向量数据库
突破高维向量内存瓶颈：MlivusCloudRaBitQ量化技术的工程实践与调优指南作为大禹智库高级研究员，拥有三十余年向量数据库与AI系统架构经验的我发现，在当今多模态AI落地的核心场景中，高维向量引发的内存资源消耗问题已成为制约系统规模化部署的“卡脖子”因素。特别是在大规模图像检索、个性化推荐系统和语义搜索引擎中，动辄数亿级别的向量数据需要实时处理，传统全精度索引方式会让内存资源消耗呈指数级增
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
SpringBoot服装推荐系统实战 KENYCHEN奉孝 java AI spring boot 后端人工智能
SpringBoot服装推荐系统实例以下是基于SpringBoot实现的服装推荐系统的30个实例代码示例，涵盖核心功能和实现方法。用户注册与登录功能@RestController@RequestMapping("/api/auth")publicclassAuthController{@AutowiredprivateUserServiceuserService;@PostMapping("/re
知识表示与推理：AI智能的核心技术 AIGC应用创新大全人工智能 easyui 前端 ai
知识表示与推理：AI智能的核心技术1.引入与连接：AI如何"思考"世界？想象一下，当你询问智能助手："我明天需要带伞吗？"它如何得出答案？它需要理解"带伞"与"天气"的关系，需要获取天气预报信息，需要推断明天的天气状况，最终综合这些"知识"给出建议。这一看似简单的过程，背后正是AI的核心能力：知识表示（如何"记住"信息）和推理（如何"思考"问题）。从Siri到AlphaGo，从推荐系统到自动驾驶，
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐标题极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐TagAI,知识蒸馏,实时推荐,模型压缩,技术挑战,高性能描述面对实时推荐系统必须在50ms内完成推荐这一极限条件，AI研发工程师团队在数据量从GB级飙升至PB级的巨大冲击下，展现出极高的技术实力和创新能力。团队通过引入先进的模型压缩和优化技术，成功在性能和精度之间找到了
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
推荐算法召回：架构理解 Jay Kay c++推荐算法推荐算法架构算法
一、召回服务的定位与挑战召回层是推荐系统的第一道漏斗，负责从亿级候选集中筛选出千级别的相关项，其效果直接决定推荐效果的天花板。核心挑战包括：低延迟约束：需在50ms内完成海量候选检索；高召回率要求：98%的召回率需覆盖用户多样化兴趣；数据漂移应对：实时用户行为分布变化需动态适应；误杀控制：避免优质内容被过度过滤引发用户投诉。⚙️二、召回服务核心架构1.多路召回并行召回策略实现方式适用场景规则召回基
推荐系统中的归因分析 liliangcsdn 人工智能大数据
推荐系统中，归因分析(AttributionAnalysis)分析用户完成转化前到底是哪个渠道最起决定性作用。参考网络相关资料，常用的用户转化归因分析模型有如下6种，现收录参阅。1）最后点击归因转化全部归因于用户转化前最后一次点击的渠道。用户8月1日小红书种草，8月5日搜索官网，8月10日淘宝广告点击并完成下单。“最后点击归因”将此次转化归于淘宝广告，适用电商促销季投放归因。2）首次点击归因转化价
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
2025年人工智能、虚拟现实与交互设计国际学术会议学术小八学术人工智能 vr 交互
重要信息官网：www.aivrid.com时间：2025年10月17-19日地点：中国-东莞部分介绍征稿主题包括但不限于：生物特征模式识别机器视觉专家系统深度学习智能搜索自动编程智能控制智能机器人系统组件虚拟现实平台用于VR/AR的AI平台数据和生成、操作、分析和验证浸入式环境和虚拟世界的生成优化和现实的渲染人工智能与用户体验个性化推荐系统情感计算与用户响应虚拟现实与沉浸式技术沉浸式环境设计交互设
时尚搭配助手，深度解析用Keras构建智能穿搭推荐系统忆愿高质量领域文章 keras 人工智能深度学习机器学习 python
文章目录引言：当算法遇见时尚第一章数据工程：时尚系统的基石1.1数据获取的多元化途径1.2数据预处理全流程1.2.1图像标准化与增强1.2.2多模态数据处理第二章模型架构设计：从分类到推荐2.1基础CNN模型（图像分类）2.2多任务学习模型（属性联合预测）第三章推荐算法核心3.1协同过滤与内容推荐的融合第四章系统优化4.1注意力机制应用第五章实战演练5.2实时推荐API实现第六章前沿探索：时尚AI
Shusen Wang推荐系统学习 --召回 ItemCF 我.佛.糍.粑学习深度学习人工智能推荐算法
学习b站up主ShusenWang的推荐系统基于物品的协同过滤（ItrmCF）中心思想就是，如果你喜欢a，b，c三件商品，d商品与abc相似，那么你也可能喜欢d商品对此就要计算物品的相似程度物品相似度物品相似度的思想是，一个物品的相同用户很多就意味着这两件物品是相似的sim(i1,i2):=∣V∣∣W1∣∣W2∣sim(i_{1},i_{2}):={\frac{\big|\mathcal{V}\b
python之requests库解析失败又激情的man python每日剂量 python 爬虫开发语言
Pythonrequests库全面解析requests是Python中最受欢迎的HTTP客户端库，以其简洁优雅的API设计著称。有以上使用场景：1.API交互：与RESTfulAPI进行交互，如获取、创建、更新或删除资源。例如：-从TwitterAPI获取推文-发送消息到Slack-调用GoogleMapsAPI进行地理编码2.网页抓取（WebScraping）：虽然通常与BeautifulSou
知识图谱系列（2）：知识图谱的技术架构与组成要素程序员查理 #知识图谱知识图谱架构人工智能 AI Agent RAG
1.引言知识图谱作为一种强大的知识表示和组织方式，已经在搜索引擎、推荐系统、智能问答等多个领域展现出巨大的价值。在之前的上一篇文章中，我们介绍了知识图谱的基础概念与发展历程，了解了知识图谱的定义、核心特征、发展历史以及在AI发展中的地位与作用。要深入理解和应用知识图谱，我们需要进一步探索其内部的技术架构和组成要素。知识图谱不仅仅是一个简单的数据结构，而是一个复杂的技术体系，涉及知识的表示、存储、查
Python在人工智能领域的实际应用：示例代码解析辣条yyds python python 人工智能开发语言
摘要：本文将通过几个典型的人工智能应用场景，展示Python在图像识别、自然语言处理、推荐系统等方面的高级用法。通过示例代码，带大家深入理解Python在人工智能领域的实际应用。正文：Python作为一门流行的编程语言，凭借其简洁的语法、丰富的库和框架，成为了人工智能（AI）领域的主流开发语言。下面，我们将通过几个示例，探讨Python在人工智能方向的实际应用。示例一：图像识别-使用OpenCV进
Python 机器学习实战：Scikit-learn 算法宝典，从线性回归到支持向量机清水白石008 python Python题库 python 机器学习算法
Python机器学习实战：Scikit-learn算法宝典，从线性回归到支持向量机引言各位Python工程师，大家好！欢迎来到激动人心的机器学习世界！在这个数据驱动的时代，机器学习已经渗透到我们生活的方方面面，从智能推荐系统到自动驾驶汽车，都离不开机器学习技术的支撑。作为一名Python开发者，掌握机器学习技能，无疑将为您的职业发展注入强大的动力，让您在人工智能浪潮中占据先机。Scikit-lea
LSA主题模型：基于奇异值分解的主题模型 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSA主题模型：基于奇异值分解的主题模型1.背景介绍主题模型是一种无监督的机器学习技术，用于发现大规模文本语料库中隐藏的语义结构。它能够自动识别文档集合中的主题，并根据这些主题对文档进行聚类和分类。主题模型在文本挖掘、信息检索、推荐系统等领域有着广泛的应用。LSA（LatentSemanticAnalysis）是一种经典的主题模型算法，基于奇异值分解（SVD）对词-文档矩阵进行分解，从而揭示词语和
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他