腾讯大数据

联邦学习在腾讯微视广告投放中的实践

分享人：宋凯博士

整理者：林宜蓁

导读:

本文从广告主的角度，分享联邦学习实践的经验跟思考。

先介绍业务与技术选型背景：团队项目为用户增长及成本控制，方式为广告渠道投放，投放目标分为拉新、拉活两类。

拉新时，微视侧端内用户特征稀疏，而广告平台积累大量信息，但仅有有限性的oCPX标准化数据回传。
拉活时，微视侧具备用户行为序列等宝贵画像数据，与广告平台特征有互补性，但又无法直接粗暴的与广告平台共享数据。

所以，希望微视侧能与广告平台侧利用双方数据，实现收益共赢，但保证数据的安全不出域。在这种背景下我们团队选择了“联邦学习”，其为多方安全合作提供了一种解决方案。

文章围绕下面五点展开：

联邦学习
腾讯联邦学习平台 PowerFL
微视广告投放整体业务
广告投放联邦学习架构
建模实践和细节介绍

一、联邦学习

首先，简介联邦学习（Federated Learning，FL）的先导知识。

1. 联邦学习背景

机器学习模型都是 data-driven，但现实里数据皆为孤岛：公司与公司之间、甚至部门与部门之间无法共享数据；直接的共享会侵犯用户的隐私，也损伤公司的利益。2016年 Google 的文章以输入法 NLP 为背景，提出用安卓手机终端在本地更新模型，这篇文章一般被认为是联邦学习的开端。随即，我国微众银行、腾讯等公司也做了许多开创性的工作。

联邦学习的基本定义为：在进行机器学习的过程中，各参与方可借助其他方数据进行联合建模。各方无需直接触达他方数据资源，即数据不出本地的情况下，安全进行数据联合训练，建立共享的机器学习模型。

2. 联邦学习的两种架构

中心化联邦架构：早期发展包括 Google、微众银行，皆是此类架构。由可信赖的第三方（中央服务器）负责加密策略、模型分发、梯度聚合等。
去中心化联邦架构：有时双方合作，找不到可信赖的第三方，各方需参与对等计算。此架构需要更多的加解密和参数传输操作，比如：n方参与时，需进行2n(n-1)次传输。这里可以认为加解密算法实际上扮演了第三方的角色。

3. 联邦学习的三种分类

横向联邦学习：样本的联合，适用于特征重叠多，用户重叠少时的场景。比如：两个业务相似的公司，用户正交多但画像相似，可进行横向联邦学习，更像是一种数据变形的分布式机器学习。
纵向联邦学习：特征的联合，适用于用户重叠多，特征重叠少时的场景。比如：广告主与广告平台，希望结合两方的特征进行训练。
联邦迁移学习：参与者间的特征和样本重叠都很少时，可以考虑使用，但难度较高。

三种联邦学习交互的信息有异，受到的困扰也不同；比如：横向联邦学习时，各参与方数据异构，因此数据非独立同分布，也是联邦学习的研究热点。

目前纵向联邦学习已在我们业务中落地，也在探索联邦迁移学习、横向纵向的结合。

4. 联邦学习与分布式机器学习比较

精度上界：联邦学习不像优化其他具体的排序、召回模型，更像是在数据安全限制下，去推动整个建模。所以，理论上把共享数据下分布式机器学习（Distributed Machine Learning，DML）的结果作为上限。

联邦学习（FL）与分布式机器学习（DML）比较

虽然有人把联邦学习作为一种分布式机器学习的特殊情况，但是与一般的DML相比，联邦学习仍存在如下区别：

存在数据不共享的限制；
各server节点对worker节点控制弱；
通讯频率和成本较高。

二、腾讯联邦学习平台Angel PowerFL

从联邦学习发展开始，腾讯参与度就非常高。包括：制定发布《联邦学习白皮书2.0》、《腾讯安全联邦学习应用服务白皮书》等；基建方面，基于腾讯开源的智能学习平台Angel（https://github.com/Angel-ML/angel），构建PowerFL，目前内部开源；实践方面，在金融、广告、推荐场景，有多次尝试和落地。

1. 工程特色

腾讯联邦学习平台PowerFL除了易部署、兼容性好等机器学习平台基本要求，还有以下五个工程特色：

学习架构：使用去中心化联邦架构，不依赖第三方；
加密算法：实现并改进了各种常见的同态加密、对称和非对称加密算法；
分布式计算：基于 Spark on Angel 的分布式机器学习框架；
跨网络通信：利用 Pulsar 对跨网通信优化，增强稳定性，提供多方跨网络传输接口；
可信赖执行环境：TEE（SGX等）的探索和支持。

2. 算法优化

另外，针对算法侧也做了许多优化：

密文运算重写：基于 C++ GMP 重写密文运算库；
数据求交优化：分别就双方和多方优化，特别是多方侧进行了理论上的改造（改进的 FNP 协议）；
GPU支持：密文运算部分可用GPU并行；
模型扩展支持：支持模型灵活扩展，可使用Tensorflow、Pytorch开发DNN模型嵌入。

值得提到的是，除了基于同态加密方案，PowerFL还支持秘密分享和差分隐私（噪声扰动）等联邦神经网络隐私保护方案。

三、微视广告投放整体业务

我们团队的一个整体目的是迭代优化智能投放系统，我们从以下三点进行了发力：

1. 增长获客渠道

包含外渠采买、内软导流、自增长；其中，外渠采买实现形式上又可细分为 Marketing API 批量创建广告、RTA 人群定向、sDPA/mDPA 商品库、RTB 实时竞价等。

2. 增长素材形式

为了承接 Marketing API、RTA，持续优化广告创意；为了承接 RTB、sDPA/mDPA，优化原生广告内容；为了与自增长中的分享/收徒呼应，优化了补贴、红包、优惠券等策略或模型。

3. 增长技术

无论 RTA、RTB，核心都是优化用户与素材的精准匹配。我们针对素材、用户、两者的交互持续探索：

素材方面：包含制作、挖掘、理解、质量控制，比如：易出现负反馈内容的甄选、清晰度的识别与增强、素材的自动上下线与出价。#
用户方面：画像侧持续建设用户画像，如人群扩展（lookalike）、用户标签；运营侧借助 uplift、LTV 模型推进；体验侧追求拉承一体。
流量方面：广告投放决策核心即针对流量和成本的管理，于此发展一系列的策略；目前已尝试使用强化学习，来解决流量与成本的两难。

四、广告投放联邦学习架构

以下介绍联邦学习在微视广告投放框架中的角色：对 RTA 人群包的圈选。

1. 广告系统概览

首先，下图即为一个简单普适的广告系统：来自用户设备ID的广告请求，到达广告系统；通过广告召回、广告定向过滤 RTA、广告粗排、广告细排、广告下发，最后达成广告曝光。

2. RTA广告投放架构

然后，我们把其中 RTA 侧的框架放大。RTA 的目的为前置判断用户价值，执行人群定向、辅助分质出价。

RTA 广告请求发起，用户设备ID到达实验平台；
通过渠道的分配策略与 ID Mapping 识别，把历史用户使用拉活策略承接、非历史用户使用拉新策略承接；
联邦学习决定的即是 RTA-DMP 侧，以人群包的方式导入DMP，进行人群定向与分层。

3. 联邦学习粗粒度框架

这里，我们介绍下联邦学习粗粒度框架：

微视侧提供用户ID、画像、Label，广告平台侧提供用户ID、画像；
安全样本对齐（Private Set Intersection，PSI）得到用户交集，开始联邦学习协作训练；
模型评估后，双方合作抽取全量用户特征导出，并对全量用户打分；
最后将结果返回 RTA-DMP。

第五部分我们将详细拆解。

五、建模实践和细节介绍

1. 先导工作

相比于拉活，拉新更迫切使用联邦学习，因为端内特征更加稀疏，许多用户仅有用户设备ID；所以，优先切入拉新，先导工作包含：

1.1 拟合目标：四任务模型

主任务：主启次留率，即T日拉新，T+1日主动打开微视APP留存的用户占比。
副任务：主启次留成本、有效新增成本、有效新增占比；其中，用户新增有效性已模型化，根据停留时间等行为，给出概率打分。

1.2 微视单侧数据探索与特征工程

样本与采样：样本量摸底，确定采样策略。
特征与模型：ID 类特征、行为序列特征；使用 DNN 模型。
制定与线上表现一致的离线指标：经探索，Group-AUC 是良好的离线指标，Group 即为用户分层。Group-AUC 与线上表现正相关，且较 AUC 更敏感。

2. 模型训练

做完准备工作，微视侧开始与广告平台侧进行联合联邦学习建模。

2.1 联邦模型训练迭代流程

（1）数据对齐：确定用于协作训练的公共样本集合{id}，有以下两种方式

明文：速度快，十亿与亿级别求交，仅需几分钟~十几分钟，但此种方法不安全，因两方只想确认公共集合部分，并不想泄露自己的补集；可使用信赖环境（TEE），在明文下保证安全。
密文：速度慢，较明文花费10倍以上时间，因涉及大量的加解密操作和碰撞；我们目前选用此策略，借助自研PowerFL 平台实现。

（2）多方特征工程

纵向联邦学习：两侧特征独立，分而治之即可，比如：特征的标准化、补全。
横向联邦学习：部分统计量的获取，需要获得整个特征的全量分布，依然要使用联邦学习的通讯来解决数据同步。

（3）协同训练

确定计算环境、存储资源。
通讯信息（何种物理量承载，如梯度、embedding）。

（4）离线评估

（5）在线评估

2.2 基于 DNN 的联邦模型（FL-DNN）

微视侧与广告平台AMS侧共同训练多任务 DNN 模型，多任务结构从样本策略、修改损失函数等简单实现方式，演进到 MMoE ；工程上基于 Horovod 并行。

2.3 FL-DNN 模型参数的迭代过程

（1）初始化：A（host，AMS侧）、B（guest，微视侧）分别初始化各自网络（记为和）的参数、，交互层参数，记学习率为 $\eta$ ，记噪声为 $\epsilon^A$ 、 $\epsilon^B$ 、 $\epsilon^{acc}$ ；

（2）前向传播：（ $[[ \cdot ]]$ 表示同态加密）

A侧计算：计算 $X^A=(f^A(x^A,\omega^A)$ ；加密得到（即为A侧输出的 embedding），将其发给B。
B侧计算：同样进行 embedding 计算生成，为符号对称，记；接收，并计算，然后计算 $[[]Z^A+\epsilon^B]]$ 并发送给A。
A侧接收 $[[Z^A+\epsilon^A]]$ ,解密得到 $Z^A+\epsilon^B$ ；计算 $Z^A+\epsilon^B+X^A \cdot\epsilon^{acc}$ 并发送给B
B侧接收 $Z^A+\epsilon^B+X^A\cdot\epsilon^{acc}$ ,减去 $\epsilon^B$ ，得到 $Z^A+X^A\cdot\epsilon^{acc}$ 。在交互网络 $g( \cdot )$ 下传播，得到 $g(Z^A+X^A\cdot\epsilon^{acc},Z^B)$ ，计算损失函数 $L = L(g,\hat{y})$ 。

（3）反向传播

B侧计算：损失函数对参数、求导，得到梯度、；计算 $[[g^A\cdot X^A+\epsilon^B]]$ ，并发送给A。
A侧接收 $[[g^A\cdot X^A+\epsilon^B ]]$ 并解密；计算 $g^A\cdot X^A+\epsilon^B+\epsilon^A/\eta$ ,加密 $[[\epsilon^{acc}]]$ ，将次两个量发送给B。
B侧接收 $g^A\cdot X^A+\epsilon^B+\epsilon^A/\eta$ 和 $[[\epsilon^{acc}]]$ ；计算损失函数相对的梯度 $[[\delta W^A]] = [[g^A\cdot (I+\epsilon^{acc})]]$ ，并将 $[[\delta W^A]]$ 发送给A。
A侧接收 $[[\delta W^A]]$ 并解密。

（4）梯度更新：A、B、I分别对梯度更新，完成一轮迭代：

$W^A += \delta W^A$

$W^B += \delta W^B$

$I += \eta(g^A\cdot W^A + \epsilon^A/\eta)$

此结构与召回、粗排常用的双塔看似相似，但实际上设计原则并不同。双塔结构常被诟病 embedding 交互时机过晚，所以有了许多改进版，比如 MVKE模型（腾讯），把 embedding 的交互时机提早。纵向联邦学习中，A侧的可以在第一层，甚至没有变化（即仅做特征加密）就交给B侧，如此原则上没有交互时机问题。

2.4 FL-DNN 模型参数迭代特殊情况：单侧特征

B（guest侧）在没有或特征太弱下，只能提供用户设备ID、label，上述参数迭代过程退化为没有的情况，读者可尝试写下参数更新过程。

实际中，因为数据量、特征覆盖度、求交损耗等问题，为保证 DNN 训练充分，以下两种情况叠加：

B侧无特征：+ ；
B侧有特征： + 。

3. 在线服务

各参与方只能得到与自己相关的模型参数，预测时需要各方协作完成：

（1）发送请求：用户设备ID，分别触达A、B；

（2）embedding 计算

A侧计算 $f^A(x^A,\omega^A)$ ，加密 $[[f^A(x^A,\omega^A)]]$ ；
B侧计算 $f^B(x^B,\omega^B)$ ；

（3）label 计算

A侧将 $[[f^A(x^A,\omega^A)]]$ 发给B侧；
B侧计算label；
B侧解密得到y。

4. 效果展示

在与腾讯广点通AMS的合作中，相对微视单独训练，联邦学习使得 Group-AUC +0.025；主目标与3个次目标都呈正相关且有提升。主要目标主启次留率（覆盖率折算后）提升 +4.7PP。初版上线后各项指标均有显著提升，已发布全量。在迭代的第二版也取得了GAUC的显著提升，正在小流量实验。

下图则展示了主启次留成本的有效降低（橙色）：

5. 迭代中

5.1 拉新模型

推进与其他渠道的联邦协作，但团队无力在每个投放平台都维护一个联邦模型。初步尝试将与AMS平台联合训练的模型，放到在其他平台拉新。但因数据异构（样本分布偏差）等原因，此模型不如 base 模型（微视单侧）好；另各投放平台存在利益冲突，都希望广告主重点投放自家流量，因此，我们在尝试横向与纵向的结合：微视与广告平台是纵向，广告平台之间是横向，期望从三方联邦协作切入，目前正在迭代联邦迁移思路。

5.2 拉活模型

与AMS平台合作，联邦模型打通后，我们想复用到拉活模型上。因用户拉活是多目标、多兴趣、异行为序列的情形，我们将重心放在时效性与模型的创新上，进行了基于 MMoE-Mind-transformer 模型的探索。

5.3 迭代困难

（1）效率和稳定性

提升数据对齐速度：为提升密文求交速度，以哈希分桶做到简单的并行而加速。
压缩训练时间：增量训练做 finetune；与全量训练得到相似结果，时间少一半。

（2）可解释性和 debug 困难：联邦的双方都看不到对方原始数据，甚至有时双方还会隐藏各自的神经网络结构。这样的确保证数据的安全；但从迭代角度看，问题定位更难。

（3）多方联邦建模的困难

与多个合作广告平台联合建模，彼此有利益冲突，与 Google FedAvg 场景不同。
与其他事业部联合建模，如微信、搜索具强而有力的特征，但对方没有动机。
存在技术/网络稳定性/沟通成本。

六、Q&A

Q1. TEE（可信赖执行环境）在联邦学习任务中是必备的吗？什么场景下会基于TEE完成任务？当前介绍的项目是基于TEE计算的吗？

A1. 当前并无使用 TEE 环境，若使用 TEE 就可直接明文操作，无需大量加密操作；因 TEE 环境下保证即使明文操作，数据也是安全且对对方不可见；目前无论数据求交、模型训练（梯度、embedding）都是密文操作。

Q2. 联邦学习的第一步数据对齐，需要做映射表维护吗？

A2：无需维护映射表，因数十亿用户量加上特征，映射表数据量达到数百G级别，其实是一种资源的浪费；实际操作样本对齐时是按顺序操作，广告平台侧给的ID，是按约定从上往下的顺序，即无需再维护kv的映射关系。

Q3. Serving（在线服务）时，需要拿对方（广告平台）的特征，这块延时如何？

A3. Serving 的延时还是通讯带来的，广告平台在自己的机器上训练广告平台侧的模型，微视侧在自己的机器上训练微视侧的模型，最终交互时也是交互 embedding。

Q4. 所有情况下，B侧（guest侧）提供 label 都是必须的吗？

A4. B侧（guest侧，微视侧），因数据不出域不会提供 label 给对方，见“FL-DNN 模型参数的迭代过程”章节公式可知，梯度是在 B 侧计算完成，对方无法得知 label。

Q5. 使用联邦学习后 Group-AUC 增加 +0.025，未使用联邦学习前的 Group-AUC 是多少？

A5. 数值没有太直接指导意义，不同场景下的样本定义、拟合目标改变即改变；原先从 0.70 级别，提到 0.72-0.73 级别。

Q6. 腾讯前段时间发的 MKVE 论文全名是？

A6. 2021-tencent-Mixture of Virtual-Kernel Experts for Multi-Objective User Profile Modeling。

Q7. FL-DNN 建模中需要第三方，如何信任第三方？

A7. 其实按去中心化的架构无需第三方，可由一系列的加解密操作的算法来承担。

Q8. 如果双方都是 TEE 的执行环境，网络中交换的数据都是明文的吗？

A8. 对，明文即可。

Q9. 联邦框架和RTA结合，是离线产出人群包，还是在线实时预估？

A9. 经探索，拉新侧的实时重要度并不高，是把离线人群包导入DMP，再给RTA对接；拉活侧因为想抓住用户短时间内的兴趣变化，有实时性的要求，目前正在研究。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
一分钟学会刷牙，受用终生！好易康
讲真，刷了十几二十年牙，没刷对过一次......来来来，划重点，更重要的是执行：①每天刷牙2次，②每次刷牙2~3分钟，③每3个月更换牙刷。最后，请使用正确的刷牙方法：巴氏（BASS）刷牙法undefined_腾讯视频视频来源ADA美国牙医协会巴氏刷牙法又称龈沟清扫法或水平颤动法。是由美国牙科协会推荐的一种有效去除龈缘附近及龈沟内菌斑的方法。刷牙不仅是刷牙齿，同时也要刷牙龈。因为口腔与细菌的战场就在
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
抱怨很廉价，别做空想家 Fang2023
今天在整理浏览器收藏夹的时候，看到一个很多年前保存的一个网页，上面是一支央视公益广告的视频，《我创故我在》。思绪一下子回到了好几年前。还记得第一次无意中在电视上看到这支广告，喜悦之情溢于言表。抱怨很廉价，别做空想家，这句歌词尤其喜欢。听着歌曲，仿佛那时候的潮气蓬勃、意气风发，又回来了，即使此时感到疲惫。【公益】央视公益广告歌曲《我创故我在》_腾讯视频
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
是“王者荣耀”还是“王者农药”？颓废思物者
近些日子，王者又双叒叕火了。而腾讯公司的老总马化腾也跟着他的游戏在人声鼎沸的汪洋中飘荡——我最先是在公众号文章《腾讯推出游戏未保“双减双打”新措施》中看见了未成年人将减少在线时长限制，非节假日从1.5小时降低至1小时，节假日从3小时减到2小时。心中不由掀起一丝波澜：又有家长对游戏出手了。不过大家心中你知我知，在这场纷争中，必定也带着市场的挤压和变化。除去这些市场变化，我们来探讨几个问题：1.没有游
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
「鲸灵」获数千万美元B+轮融资，旗下日日团打造团购电商新时代想想再说可以吗
小编获悉，社交电商鲸灵集团（以下简称鲸灵）已完成数千万美元B+轮融资，由启明创投领投，IDG资本联合领投，老股东跟投。鲸灵刚于7月完成数亿元B轮融资，由腾讯领投，IDG资本、险峰长青、元璟资本跟投。据小编了解，鲸灵旗下的日日团业务单日交易额已突破100万元。鲸灵创始人&CEO邬强强（花名：鬼谷）曾在阿里巴巴任职9年，曾任聚划算事业部总经理、淘宝开放平台创始人。针对本轮融资，邬强强告诉小编：“社交电
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

联邦学习在腾讯微视广告投放中的实践

你可能感兴趣的:(机器学习,人工智能,腾讯)