阿里妈妈技术

万字长文，漫谈广告技术中的拍卖机制设计（经典篇）

本文尝试将拍卖机制的几个经典问题做脉络性梳理，重点阐述概念之间的演进关系。希望可以勾勒清楚技术全貌，有助于大家系统性地认识计算广告领域的拍卖机制设计。

丨目录：

1.初识广告拍卖机制和相关博弈论基础知识

2.社会福利最大化的有效机制

3.平台营收最大化的最优机制

4.经典广告拍卖基本框架和预告进阶篇

5.参考文献

搜索、推荐和广告在过去几年互联网蓬勃发展的浪潮中起到了核心助推引擎的作用，三者技术发展也是互相借鉴和相辅相成，有很多共通之处也有不少差异的地方。本文从广告视角出发，重点介绍广告技术与搜推技术最本质的差异点——拍卖机制的原理和实践。作为最具广告特色的技术模块，拍卖机制理解起来往往较为晦涩。一方面因为这个技术领域是基于博弈论思维，概念较多且定理推导复杂，和已经标准化的基于数据驱动的机器学习思维截然不同；另一方面因为理论假设过于严格，和实际差距较大，使得论证过程无论多么完善，实践落地仍然需要考量诸多复杂因素。本文尝试将拍卖机制的几个经典问题做一个脉络性梳理，概念和论证过程可自行查阅这里不再赘述，但概念之间的演进关系会重点阐述，希望可以勾勒清楚技术全貌，有助于大家系统性地认识计算广告领域的拍卖机制设计。

本文会按照几个小话题顺次展开介绍：

广告领域的拍卖机制简化而言是一个什么拍卖问题，背后最基本的博弈论概念是什么；最理想的拍卖机制长什么样，需要满足哪些条件；理想照进现实，哪些条件可以妥协松弛使得真正落地的拍卖机制即使没有非常理想但依然运行良好；本文所说的经典的拍卖机制设计范畴是什么？
社会福利最大化的拍卖机制如何设计才能使得市场蛋糕被有效扩大；点击率的不同假设这一关键变量如何影响拍卖机制的性质；机制设计需要做哪些与之对应的调整与升级？
平台营收最大化的拍卖机制如何设计才能使得市场蛋糕被最优地分配；以保留价设计为代表的这一关键技术是如何影响拍卖机制的性质；机制设计背后的假设需要做哪些与之对应的调整？
经典的拍卖机制的基本框架长什么样；多个优化目标在这个框架下是如何平衡；面向广告业务新形势下的AutoBidding模式，拍卖机制该如何重新思考面向未来？

1. 初识广告拍卖机制和相关博弈论基础知识

1.1. 为什么说拍卖机制是广告与搜推最本质的差异点

先从本文开头提到的“为什么拍卖机制是广告与搜推最本质的差异之处”说起。以电商场景为例，搜索推荐涉及到免费资源位的高效分配问题，广告涉及到付费资源位的高效分配问题。以最基础的单目标价值最大化为例，搜推的资源位分配按照GMV期望最大化排序，广告的资源位分配按照CPM期望最大化排序，其中和是模型预估分，是广告主报价（如果是系统自动出价，则是的相关函数）。可以看出广告领域中广告主可以通过调整自身的bid报价策略使得自身的竞争力发生改变，从而影响资源位的分配结果，然而搜推领域的分配结果商家没有办法直接干预，纯粹由平台决策。所以从分配结果来看，搜推的主角是平台，但是广告的主角是广告主。

更为重要的是，广告除了资源位分配环节以外还有广告主扣费环节，以GSP机制为例，赢得第一个资源位的广告主需要付费，广告主又会根据实际付费情况核算营销表现是否符合预期，从而进一步影响下一轮报价策略。如此往复，广告主个体竞价策略变化的相互博弈最终形成了广告系统整体的收敛分配结果，这个博弈收敛的过程也是搜推领域不需要考虑的。所以广告的拍卖机制包括资源位分配和广告主扣费两个环节，如何设计能够促使广告主的竞价博弈收敛结果是符合平台引导预期的拍卖机制是重点也是难点。

1.2. 广告拍卖机制相关的博弈论基础知识

提到博弈过程和收敛结果，就不得不引出博弈论的相关知识，因为博弈论是一门独立的学科，广告的拍卖机制仅仅是博弈论的一个应用案例，所以下文讲述的侧重点是博弈论在广告拍卖机制中的应用。何谓机制？机制就是设计者想方设法让参与者做设计者想让他们做的事情，手段就是利用参与者的各自偏好，引入博弈环境，使得博弈收敛后的均衡结果符合设计者初衷。注意，参与者必须是智能体，体现在理性和有能力权衡偏好得失，且智能体的偏好往往是私有信息Private Value（有些地方称作Type类型）、外界不可知，所以好的机制设计需要具备偏好诱导能力，提供某种激励方式使得智能体在博弈环境中的真实表达是他的最优策略，这样单个个体的行为结果可预期，整体博弈收敛结果可以有导向性。总结来说，机制设计有几个要点：

智能体有偏好需求：广告主就是智能体，他的营销偏好是理性且私有的，常见偏好模式有效用最大化（Utility Maximizer）和价值最大化（Value Maximizer），机制设计之初就需要先确定智能体的偏好模式，后续才能有针对性地设计偏好诱导方式，下文会结合具体技术再详细阐述。
设计者有引导目标：广告平台就是设计者，他的引导目标是明确的，常见目标有社会福利最大化和平台营收最大化，即引导的博弈均衡结果（包括分配结果和扣费结果）是有设计初衷的。下文会按照两条迭代主线展开介绍。
偏好诱导激励相容：激励相容（Incentive Compatibility） 就是鼓励竞拍者讲真话，使得竞拍者目标和平台目标可以同向发力，有两个标准：1）优势策略激励相容（Dominant-Strategy Incentive Compatibility，简称DSIC），不管其他智能体如何报告自己的私有信息，如实报告（即讲真话）是每个智能体的最优反应，所谓最优反应就是如果不这么做就会有损失；2）贝叶斯纳什激励相容（Bayes-Nash Incentive Compatibility，简称BIC），如果其他智能体是如实报告的，那么你的最优反应也是如实报告。
博弈结果存在均衡：博弈结果可以有一个均衡，也可以有多个均衡，关键不能是非均衡，起码有确定性的纳什均衡 Nash Equilibrium存在。激励相容引导的均衡可以是较弱的贝叶斯纳什均衡 Bayesian Nash Equilibrium，也可以是严格的优势策略均衡 Dominant Strategy Equilibrium（可进一步细分三个版本，强、弱和极弱等，这里不再进一步介绍）。

以最常用的囚徒困境为例，介绍一下纳什均衡的应用。有两个智能体囚徒，分别都有两个策略：抵赖NC和招供C，表格里的数字表示囚徒在不同的环境下选择不同的策略可以获得的效用utility，即利益偏好，这里数字表示判刑多少年。可见(C, C)->(-5, -5) 是纳什均衡 Nash Equilibrium，纳什均衡的意思是任何智能体单方面偏离自己的均衡策略均无利可图，当下策略是其他智能体均衡策略的最优反应。(C, C)->(-5, -5)状态表明不会有哪个囚徒会单方面改变自己的策略，因为只要对方不动，自己改变都会让自己利益受损，判刑年数更长。另外需要注意，纳什均衡仅保证参与人不会单方面偏离，但不能保证其他人或者大家共同偏离，而且纳什均衡结果不一定是整体收益最大化，显然该例子如果两个囚徒选择共同偏离、合谋采取 (NC, NC) 策略，(-2, -2) 可以使得整体收益最大。

智能体1/智能体2	策略NC	策略C
策略NC	-2，-2	-10，-1
策略C	-1，-10	-5，-5

综上该小节内容，广告拍卖机制涉及到的博弈论要研究的内容就是新设计的机制能否达到纳什均衡；达到的纳什均衡属于什么强度；均衡唯一还是均衡多值；收敛性能如何；收敛结果能否达到预期目标最大化。

1.3. 理想化的拍卖机制和理想照进现实的松弛策略

前文已经介绍基于博弈论的机制设计原则，那么最理想的广告拍卖机制需要满足哪些性质？主要有3个：

高动机保证，优势策略激励相容（DSIC）即如实报价是优势策略，注意均衡不仅存在，而且是以最严格的优势策略均衡（DSE）的形式存在；
高效果保证：均衡结果满足引导预期，社会福利最大化或平台营收最大化；
高效率保证：多项式时间（一般近似线性）内完成分配和扣费两个计算过程。

如何实现理想化的拍卖机制？大体思路可以用一句话概括：先定分配规则（Allocation Rule），再定扣费规则（Payment Rule）。展开来说：

先假设所有竞拍者如实报价，则如何设计分配规则使得上述高效果保证和高效率保证都成立？
再假设得到上述分配结果之后，则如何设计扣费规则使得高动机保证成立？

Myerson引理可以将上述实现理想化拍卖机制的抽象思路具象化，介绍Myerson引理之前需要先了解3个概念：

直接显示机制（direct-revelation mechanism）：要求竞价者如实报价的机制，但是该机制能否达到均衡，更别说能否达到优势策略均衡，不在要求范畴；
可实施的分配规则：对于一个分配规则x，如果存在一个扣费规则p，使得直接显示机制 (x, p) 是DISC，那么就称这个分配规则x是可实施的；
单调的分配规则：当其他竞价者报价不变，当前竞价者的分配函数是报价的单调非减函数，即报价越高，广告主可以获得更高位置更高点击率。

Myerson引理基于上述概念提供了具体可操作路径：

一个分配规则是可实施，当且仅当它是单调的；
如果分配规则是单调的，那么存在唯一的扣费规则，使得直接显示机制是DSIC的，且这个扣费规则有明确的表达式。

Myerson引理前者说明可实施的分配规则和单调的分配规则是等价的，言下之意就是设计分配规则非常清晰，只要满足单调性即可；后者说明一旦分配规则确定了，扣费规则也是唯一的，且有明确的解析式，这个解析式推导过程可以详见论文，具体形式会在下文详细介绍。按照Myerson引理进行机制设计，理想化的广告拍卖机制就可以应运而生。

然而理想照进现实，当拍卖环境变得复杂，需要权衡的因素变多时，理想化的三个性质很难同时得到满足，此时有选择性地适当松弛很有必要。这里给出经典的松弛思路：

高效率保证是最基本要求，通常不做松弛。 原因是计算广告领域往往会面对大规模高并发请求，低时延的高性能计算能力是服务可靠性的基本保障；
高效果保证是第一个允许松弛的性质，主要涉及到分配规则。 因为最优分配问题本质是一个背包问题，而背包问题是NP困难问题，分配规则不可能在多项式时间内被实现，所以往往采用启发式的贪心算法，也就是业界常用的排序策略。这样分配问题就转化为了排序问题，例如本文开头Rankscore计算公式的设计，可以获得高效率的近似最优解。
高动机保证是第二个允许松弛的性质，主要涉及到扣费规则。 Myerson引理证明当分配规则确定，扣费规则就是唯一的、且有明确的表达式，假设该表达式是a。可是实际环境非常复杂，或因为计算效率问题，或因为业务约束问题，导致实际采用的扣费规则没有用a，却用了b，那么DSIC就会被破坏。但是非DSIC机制就一定很糟糕吗？答案非也。前文提到，优势策略均衡是最理想的均衡结果，机制设计的底限是要有均衡的预期，有均衡预期就有足够假设来预测智能体的行为，那么机制结果就能有效推演。所以非DSIC机制也可以有不错的均衡性质，它们在实际中很常见。例如广告拍卖机制中，假设广告主偏好模式是Utility Maximizer，平台优化目标是社会福利最大化，那么只有VCG机制是DSIC，GSP机制不是DSIC，但是也不妨碍GSP机制盛行，详细内容下文会重点介绍。

1.4. 广告拍卖机制的类型划分与经典机制设计范畴

拍卖机制设计前提是需要对拍卖形式有一定规约，广告拍卖形式有很多不同的视角划分方式：

按照拍卖品个数划分，分为单物品拍卖和多物品拍卖。单物品拍卖理论研究完备，机制设计空间较小，可直接应用于实践，而多物品拍卖机制设计空间大，需要对理论做很多假设才能平衡好效果与性能。广告往往有多个付费资源位在一次请求下同时拍卖，所以广告拍卖形式属于多物品拍卖，而且是多个非相同物品拍卖，位置越好点击率越高，对应的价值就越大。
按照竞拍者报价个数划分，分为单参数拍卖和多参数拍卖。报价个数对应竞拍者的估值对象个数，如果广告主只需要报价流量价值，那么就是单参数拍卖；如果广告主需要同时上报多个估值例如不同资源位的流量价值，那么就是多参数拍卖。和上一个划分方式面临的问题一样，参数越多，机制设计空间就越大，无论对理论设计还是计算性能都有很大挑战。
按照竞拍轮数来划分，分为单轮拍卖和多轮拍卖。轮数越多，竞拍者的私有信息Type会越来越成为公有信息，使得竞拍者能有更多的信息做决策从而调整报价策略。虽然多轮拍卖更加契合实际广告拍卖场景，广告主一笔预算往往会参与很多轮的请求报价，但是多轮的机制设计比单轮复杂很多，一般简化为单轮拍卖形式进行分析讨论。
按照广告主优化目标是否带约束来划分，分为无约束拍卖和有约束拍卖。有约束是指在广告主追求营销目标最大化的同时会带有指标约束，例如预算约束或者ROI约束等，这样广告主报价策略会从短期收益最大化调整为长期收益最大化，这对机制性质也会带来不小挑战。

可见，上述划分标准每一类的后者更加接近广告拍卖实情，但是相比前者会让整个机制设计难度系数大幅提升，所以本文将广告的经典机制设计范畴规约在“异质多物品、单参数、单轮和无约束”拍卖形式下（简称多物品拍卖），这也是目前工业界实践最为成熟的版本之一。其中多物品的拍卖形式没有再进一步简化了，但是下文讲述逻辑依然会从单物品拍卖开始说起，这样便于理解逐步过渡到多物品拍卖，近似理想的拍卖机制该如何调整与设计。

另外，前文提到的广告主优化目标即偏好需求的划分标准（Utility最大化 vs Value最大化）和广告平台优化目标的划分标准（社会福利最大化和平台营收最大化）每一项都是广告拍卖实情，属于可选项，不存在升级的说法，但是广告主偏好建模Value最大化是目前较新的需求类型，本文暂且没有归类到经典机制设计范畴，后续会作为新业态下的机制设计进行介绍。所以下文的讲述逻辑会基于广告主Utility最大化即利润最大化的前提，分别介绍面向社会福利最大化和平台营收最大化的拍卖机制该如何设计。

2. 社会福利最大化的有效机制

2.1. 广告主和平台优化目标的各自确立

本文以点击付费广告类型为例（可以推广至任意出价类型广告产品），广告主对每个点击流量内心有明确的私有估值，对外报价采取策略是v的函数即，可以是的如实报价，也可以对有所隐瞒，关键看哪个策略对自己是有利的。机制设计首先需要确定竞拍者的偏好模型，本文采用经典的效用Utility最大化，即广告主追求利润最大化。如果广告主竞得该次流量对应的系统扣费为，则效用函数是简单拟线性函数，利润=价值-成本。理想的拍卖机制就是要诱导广告主的报价是私有估值的真实反映，即，使得博弈收敛均衡下广告主追求目标效用是最大的。

另一方面，平台目标视角面向社会福利（Social Welfare）最大化是指资源位的分配一定要物尽其用，分配给最需要的竞拍者，即分配给最高真实估价的那些广告主，同时扣费机制方面需要诱导广告主如实报价是最优策略。于是机制（包含分配和扣费）的设计首先需要确定分配规则是面向社会福利最大化，即，其中表示竞拍者个数，是广告主对于点击流量的私有估值（一个点击值多少钱），表示广告主赢得当前请求下的付费资源位的点击率（介于0和1之间）。在确保分配规则是单调（广告主提高报价，有机会获得点击率更高的资源位）的基础上，再设计扣费规则使得广告主如实报价是最优策略，即效用可以最大化。

通常，社会福利最大化的机制是对资源最有效率的配置方式，所以该类型的机制也叫有效机制（efficient mechanism）。

2.2. 单物品拍卖的有效机制设计

先从最简单的单物品拍卖场景说起，假设只有一个资源位需要拍卖，有多个广告主同时参与竞拍，Second-price auction（简称SP机制，也叫 Vickrey auction）是社会福利最大化的DSIC机制。SP机制首先确定分配规则，将资源位分配给报价最高的广告主，使得资源分配效率最高；然后确立扣费规则为二价扣费，除广告主以外的最高报价，令，即扣费,使得广告主如实报价可以让自身效用最大化，从而让SP机制具备优势策略激励相容DSIC的性质。

接着简单论证SP机制如何保证DSIC性质。广告主报价只有两种结果：当，则广告主输掉这场竞拍，效用；当，则广告主赢得这场竞拍，支付价格为，效用。然后我们再针对广告主的私有估值进行分情况讨论：当，最大效用，显然广告主选择如实报价，输掉这场竞拍效用最大；当，最大效用，显然广告主选择如实报价，赢得这场竞拍效用最大。证明完毕，平台优化目标和广告主优化目标均在优势策略激励相容的性质下得以满足。

2.3. 多物品拍卖的VCG机制和GSP机制比较

真实广告拍卖场景往往是多个资源位同时竞拍，而且不同资源位点击率的差异使得多物品非同质，单物品拍卖下的有效机制设计无法直接应用过来。我们先从最简单的假设说起，点击率仅和资源位本身有关，不考虑广告本身质量，这也是最早期广告技术的真实落地方式，而且对于机制性质的分析也不失一般性。假设一共有个广告位，点击率分别是，一共有个广告主，报价从高到低排序分别是，一般。如果将广告主分配到广告位，则其效用收益是，是广告主对点击流量的估值，是广告主的单位点击支付。

前文提到单调的分配规则往往较为容易制定，我们按照报价的大小从高到低排序，第高报价的广告主被分配至第好的广告位，这样平台目标即社会福利最大化就可以得以满足（分配问题贪心启发式转化为排序问题）。难点是扣费规则该如何设计，可以保证DSIC且实现广告主目标Utility最大化。Myerson引理论证，满足该性质的唯一支付公式是VCG扣费方式，多物品拍卖下的Vickrey–Clarke–Groves auction（简称VCG机制）是单物品拍卖下的Vickrey auction（也称SP机制）有效升级。单次点击VCG扣费公式：，其中，注意这里分母出现是因为按照点击扣费。VCG扣费基本原理就是该竞拍者赢得广告位后，给其他广告主带来的收益损失是该竞拍者需要支付的费用。

下图是来自《博弈论二十讲》课件中的图示，个人认为是对VCG机制的DSIC性质最为直观和形象的表述了，所以就原封不动摘抄过来。为了和本文的参数定义对齐，这里做一下简单的解释：图中表示估值分布；是真实估值；是报价；表示分配结果（对应不同坑位的点击率），仅考虑位置点击率的情况下就是对应本文的定义；表示扣费结果，红色面积区域是展现视角下的期望点击扣费，所以对应本文的。根据 Utility=期望价值-期望扣费的定义，用绿色面积来表示Utility大小，比较 (g)(h)(i) 三张图的绿色面积，可见当即如实报价，广告主效用最大。

VCG机制固然可以满足DSIC性质，使得广告主目标Utility最大化，但是其运行效率较低且给广告主解释成本较高。综合考虑诸多因素，实际系统常常选用GSP机制（Generalized second-price auction），分配规则和VCG机制一致，扣费规则有差异但更简单，单次点击GSP扣费公式：。GSP机制虽然看似是SP机制的广义延伸，但不是DSIC，如实报价不能让广告主效用最大化。举例：有两个广告位点击率如下，和；有三个广告主对点击流量的私有估值如下，、和。假设另外两个广告主均如实报价，若广告主1也如实报价，则可以赢得第一个广告位，根据GSP机制扣费，他的效用收益为。但是如果其隐瞒报价，虽然只能赢得第2个广告位，根据GSP机制扣费，但是其效用反而更大。所以GSP机制下广告主有隐瞒价值出低价的动机（under-bidding incentive）。

下图是参考《博弈论二十讲》关于VCG性质图示的方法，相同定义方式下画了GSP机制的性质表现。同样紫色面积表示期望价值，红色面积表示GSP机制下的期望扣费，绿色面积表示期望效用，可见：1）GSP机制不是DSIC，即如实报价的绿色面积不一定是最大的；2）高报价的绿色面积是负数，表示高报价没有正向收益；3）低报价绿色面积和如实报价的绿色面积两项比较孰高孰低不一定，存在获利空间，所以GSP机制下广告主有under-bidding incentive。

虽然GSP机制在广告主Utility最大化的目标下并不是DSIC的，但是它也有不错的均衡性质，包括两个视角的均衡：Pure Nash Equilibrium under Full-Information Setting 和 Bayesian Nash Equilibrium under Partial-Information Setting。以前者为例，假设多轮竞价交互之后广告主的估值成为公有信息，GSP机制达到的一种均衡结果是广告主会认为保留当前位置是最优策略，不愿意与比他顺位高的人换位置，不然利润受损，这种均衡叫 locally envy-free equilibrium（也称symmetric Nash equilibrium），对应广告主的报价策略不再是如实报价，详细可见文献。

GSP机制除了有不错的均衡性质以外，还有其他优势：1）计算高效、对客解释成本低、扩展性好；2）最新研究论证在广告主Value最大化的目标下GSP机制又是DSIC的，这点会在文章最后提及；3）GSP存在多个均衡，其中包含一个均衡结果和VCG等价，因为扣费大于VCG，所以平台营收会比VCG更高。后续技术演进都是在GSP机制框架下进行。

2.4. 点击率因素如何影响GSP机制升级

前文提到的GSP机制是最基础的版本也是互联网公司落地最早的一个版本，但是点击率仅与资源位有关的假设显然和实际情况相差甚远，对于点击付费的广告类型，离谱的点击率假设会让资源位的配置效率大打折扣。为此，引入广告质量本身的点击率是非常自然而然的想法。关于资源位点击率和广告质量点击率的关系，主要有两个大版本的升级。

基础假设是整体点击率关于位置因素可分离，即，GSP机制升级为wGSP（weighted GSP，weighted体现在广告质量分的引入）。这样平台优化目标变成，是广告主个数，是资源位个数；广告主优化目标变成，表示广告分配至资源位效用函数；分配规则是按照进行排序，第大的广告分配至第好的资源位；扣费规则是。如此升级可以论证机制性质保持不变，但因为点击率和真实情况更为接近，SW表现更好。实际真实点击率无法提前预知，往往需要有点击率预估的能力。wGSP机制要求除了具备预估粗粒度的位置点击率以外，系统还要有能力预估细粒度的广告点击率。

升级假设是整体点击率关于位置因素不可分离，即位置点击率和广告质量点击率无法解耦，这个假设与现实更加接近，两方面原因：1）不同广告在不同位置上的点击率影响各异；2）不同广告在不同上下文影响下的点击率各异。前文提到的VCG机制满足DSIC性质的隐含假设是位置因素可分离，如果遇到位置因素不可分离则满足DSIC性质的机制就会演变成Laddered Auction，详细内容参见文献。同样对面这种情况，GSP机制也需要升级，iGSP（iterated GSP）可以最大限度保证 existence of efficient equilibria，但也仅限2个资源位同时拍卖，如果遇到3个及以上就仍然是一个 open question，不过还算乐观的情况是移动端的资源位往往较少。iGSP的分配规则是既然位置点击率不可分离，那就逐个坑位顺次拍卖。先根据经验选择一个拍卖序，可以假定从高到低，针对当前资源位考虑位置因素和上下文因素重新计算每个广告主的点击率，获得当前资源位下的广告新排序；接着执行扣费规则，对首位广告主进行二价扣费，；然后将首位竞得广告主从队列内去除，相同逻辑继续执行下一个资源位拍卖流程；如此遍历迭代，直至资源位竞拍完。以上通过点击率假设和预估能力的不断完善，使得SW更优，资源配置效率越来越高，市场蛋糕不断做大，接下去作为平台视角，营收最大化也是目标之一，如何合理分配蛋糕也是重要课题。

3. 平台营收最大化的最优机制

3.1. 通过对比VCG和GSP来看平台营收空间

前文介绍了面向社会福利最大化的机制该如何设计，即把资源位有效地分配给高估值的广告主，使得整体价值最大化。整体价值通过扣费规则一分为二，一边是对广告主的扣费形成平台营收，另一边是广告主留下的效用即利润，即Value=Utility+Price。以下图VCG和GSP机制对比为例，假设广告主都选择如实报价，因为两者分配规则相同所以社会福利对应的面积大小也相同，但是因为两者扣费规则不同所以两者的平台营收和广告主利润就会有差异。从图示面积一目了然，相比VCG，GSP的平台营收更高，同时与之对应的广告主利润就会更低，所以从平台营收视角来说GSP机制更受欢迎。

这就是一个分蛋糕的过程，如果平台收益变多了，那么广告主收益就会变少。当然，分蛋糕也不是一个简单随意修改扣费规则的事情，是不是找个小暗门扣费多一点，平台营收就能多一些，然后就解决问题了？其实不然，扣费规则和激励相容性质息息相关，前文提到即使松弛了DSIC性质，但是均衡结果是最起码的要求，否则从长期博弈结果来看短期的平台营收都不可持续。换个角度解释这个现象，GSP机制不是DSIC的，广告主有隐瞒估值低报价的动机，所以长期来看会随着广告主低报价整体社会福利不如VCG，使得虽然在分蛋糕方面GSP有优势但在做大蛋糕方面存在不利因素，此消彼长，长期看平台营收GSP一定会打折扣。GSP有不错的均衡性质尚且如此，更何况其他粗暴魔改扣费规则的机制了，所以事情看来没有那么简单。

相较社会福利最大化（简称SW）通过分配规则就可以直接达到平台优化目标的运作逻辑不同，平台营收最大化（简称Rev）则需要结合分配和扣费规则一起才能实现（因为只有知道了扣费金额才能知道平台营收），这对机制设计带来不小挑战，以点击广告为例，ppc是表示单次点击扣费，SW类似于，Rev类似于。SW的扣费规则只需要承担激励相容要求即可，但是Rev的扣费规则除了激励相容的部分还要承担平台目标，而且之前分配规则和扣费规则都是解耦地有先后地分别设计，此时两者却要耦合在一块儿共同围绕相同目标一起设计。最优机制（optimal mechanism）的出现就是来解决这个问题，它可以使Rev机制的设计范式像SW一样清晰明了，还能保证DSIC性质。

3.2. 单物品拍卖的最优机制设计

先从最简单的单物品拍卖说起，并且进一步简化假设只有一个竞拍者，该设定因为没有其他竞拍者和他竞争，所以如果平台不做点其他的设置，竞拍者可以瞒报自己估值，以一个很低的报价竞得这个物品，导致即使平台按照一价扣费，营收也会大大受损。为了解决这个问题，平台可以设置一个保留价，类似虚拟竞拍者角色。如果竞拍者报价高于保留价，则竞得物品，平台按照二价扣费，即收取保留价费用；如果竞拍者报价低于保留价，则物品流拍。这样最核心的问题就变成了保留价该设置多少才能使得平台营收最大化？显然，如果保留价刚好比竞拍者私有估值小一点点，即，竞拍者又如实报价，这样物品可以竞得，并且平台收取的费用和竞拍者私有估值相当，也就是说平台赚取了估值中的绝大部分，竞拍者仅保留微乎其微的利润，但毕竟利润还是正的，竞拍者也只能勉强接受。

上述保留价的取巧设计，可以使得平台营收最大化，前提需要猜准竞拍者的私有估值，毕竟估值是私有信息，平台无从准确知晓。可以借助贝叶斯分析方法，假设该估值服从某个分布，则竞拍者如实报价可以竞得物品的概率是，那么平台的营收期望就是。举例来说，如果是均匀分布，则，通过求导梯度为0的方式得到，则。同样计算方法继续求解稍微复杂一点的两个竞拍者场景：如果采用DSIC的SP机制，假设两个竞拍者的私有估值独立且服从均匀分布，此时平台期望营收为；如果采用SP机制配合保留价，上述假设基础上增设保留价，如实报价最高者竞得物品并支付第二名报价和保留价中更高的价格，此时平台期望营收为。

那么有没有其他办法可以获得更高的平台收益？换一个保留价，或者换一个拍卖形式？Myerson机制就是可以获得最大化期望收益的最优机制。首先定义虚拟估值，它和私有估值以及分布有关；然后可以论证在满足DSIC的机制空间上对期望收益最大化，可以等同于在同一个空间对期望虚拟福利最大化，这样原本关心的收益最大化问题就转变为了分配最优化问题，，与前文2.1.章节中相比仅仅是将私有估值转换为对应的虚拟估值，其他分配规则的细节以及扣费规则都与社会福利最大化一模一样；最后只需要保证是单调的，即私有估值的分布是正则分布，许多常见分布基本都是正则分布，例如normal、lognormal、uniform and exponential distributions等；非正则分布包括多峰分布和长尾分布，分配的单调性是机制DSIC性质的前提。论证过程可详见文献。

可以发现虚拟估值可能为负，在分配的过程中如果遇到<0的竞拍者会被剥夺竞拍资格，如果所有竞拍者的虚拟估值均为负，则流拍，所以即虚拟估值为0的逆函数起到了个性化保留价的功能。如果假设所有竞拍者的私有估值服从独立但不同分布，则不仅会有各自不同的保留价，还会遇到如实报价情况下报价高，但虚拟估值不一定高，导致没有竞得更好的资源位，也好理解，此时虚拟估值代表了个性化自己和自己对比的报价意愿强烈程度；如果假设所有竞拍者的私有估值服从独立同分布，因为估值分布相同则虚拟估值函数也相同，又因为估值分布服从正则分布，则严格递增，那么虚拟估值最高的竞拍者就是私有估值最高的竞拍者，这样虚拟福利最大化机制就和带有保留价的二价机制相同，回答上文提到的两个竞拍者估值服从独立同分布均匀分布的例子，确实是最优保留价。以下是单物品拍卖的几个机制对比：

3.2. 多物品拍卖的经典保留价方案与Squashing方案

虽然Myerson机制可以完美解决单物品拍卖场景下的平台营收最大化问题，但是面对多物品拍卖场景该机制性质的理想化状态就很难保持，更大方面来说目前整个多物品拍卖领域关于平台营收最大化的最优机制设计问题依然是一个开放问题。回到广告多坑位拍卖场景，经典的机制设计会围绕GSP机制做针对性改造，将Myerson机制的思路和GSP机制的流程相融合，在保持良好机制性质的前提下持续优化平台营收，获得近似最优结果。接下来会介绍3种基于wGSP机制改造的提升平台营收的常见方法。

第一种是mGSP（myerson GSP）机制，想法很直接，就是将Myerson保留价技术直接应用到wGSP机制上。和单物品拍卖的设计思路类似，Myerson保留价最核心的虚拟估值依赖广告主的私有估值分布，系统可以酌情根据独立同分布的颗粒度进行假设的调整，例如客户之间完全独立不同分布、相同搜索词的客户之间独立同分布、整体流量客户独立同分布等。因为广告系统是多轮拍卖系统，假设广告主是如实报价，则私有估值分布可以根据广告主历史报价进行不同粒度的分布拟合，从而得到虚拟估值。有了虚拟估值和保留价，在分配规则方面有两种类型可做尝试：Eager模式，先过滤后排序，即先根据保留价过滤没有竞争力的广告主，再按照虚拟估值排序；Lazy模式，先排序后过滤。Eager模式对最高报价无法胜出保留价的情形更友好，Lazy模式对第2高报价无法胜出保留价的情形更友好，多数情况下Eager模式在提营收方面会比Lazy更有优势。

第二种是aGSP（anchoring GSP）机制，是对mGSP机制一种松弛方式，业务落地过程中虚拟估值的求逆计算和私有估值的正则分布要求等均会让机制实现不够简洁且解释性较差，略牺牲效果的情况下精简机制设计也是可接受的迭代方向。首先保留价的计算方法和mGSP机制相同，一般保留价的颗粒度会选择数据积累较为充分的粒度。其次主要差异点就是将虚拟估值由简化为，如果假设私有估值分布是均匀分布，化简的表达式就非常接近，求逆也方便，而且业务含义与myerson思路很吻合，报价竞争力更多看重每个广告主超出个性化保留价的那部分。

第三种是rGSP（reserve GSP）机制，是对aGSP机制更加进一步的松弛。因为有文献提出，为了解决私有估值和虚拟估值趋势不一致问题，虚拟估值可以仅用于个性化保留价的过滤，分配和扣费依然按照私有估值进行，这样虽然对营收有折损但是机制实现更加简洁且易解释。

另外一类不是在报价因子上做文章，而是在wGSP的广告质量点击率上做文章，通过对广告质量点击率进行挤压，也能达到提升营收的效果，这类机制叫做sGSP（squashing GSP）机制。分配规则是按照进行排序，其中就是挤压因子，扣费规则按照。该挤压因子能够体现三方面的结论：1）Efficiency视角：当是社会福利最大化及Efficiency最大化，凡是的调节都提升平台的短期收入，从而影响广告主价值；2）Relevance视角：只要往大调节，整体点击率就会提升，相关性就会变好；3）Revenue视角，当相邻广告质量随排序递减即，在不改变排序的情况下调小，变大，利好营收增加，当相邻广告质量随排序递增即，在不改变排序的情况下调大，变大，利好营收增加。这一方案为了进一步挖掘营收空间，可以升级为分位置调控挤压因子等，具体详见文献。

4. 经典广告拍卖基本框架和预告进阶篇

4.1. 经典的广告拍卖基本框架

前文介绍了机制性质不算完美但还算良好的面向平台营收的拍卖机制，但也明确强调平台营收最大化是一个分蛋糕的过程，它其实是和广告主零和博弈相互争夺利润，一味提升平台营收短期来看没有问题，但长期来说一定会影响广告主的预算投入，从而影响社会福利最大化即做大蛋糕的结果。所以我们需要在两者之间做平衡，把握好做大蛋糕和分好蛋糕的节奏。同时，用户体验也是广告系统需要兼顾的重要考量，和免费资源位相比，付费资源位或多或少会牺牲用户体验换取社会福利，如果不加以约束，长期以往用户会失去对付费资源位的关注度，从而平台会彻底丧失流量变现的机会。

综上，以一个开放生态的视角看待广告系统，广告主和用户都会用脚投票，进行不同平台之间的选择，所以平衡好三者之间的利益述求就极其关键。那么经典的广告拍卖基本框架就是一个带约束的最优化问题：max 社会福利最大化；s.t. 平台营收约束、用户体验约束（电商场景可以是点击率、转化率和相关性等）。然后通过拉格朗日对偶法将分配问题转变为多目标排序问题，同时扣费规则明确为关键最小扣费，即广告主仅需要支付保持住当前广告位的最小费用。这样一套广告拍卖机制可以在业务发展的不同阶段择机调整适配，能够促进广告生态健康发展。

4.2. 广告拍卖进阶版展望

本文从机制设计原理出发，不断加强前提假设，改造机制内容，逐渐完善广告拍卖的基本框架，至此经典范畴的内容介绍完毕。但是随着广告业务和技术的不断发展，新趋势孕育新机会，主要有三个方向的持续升级：

业务方面，广告主优化目标的改变：广告主的营销述求不再以利润Utility最大化为第一优化目标，而是以价值Value最大化为主要优化目标；扣费不再是广告主的敏感成本项，而是一个必须要花完的预算，核心关注这笔预算花完能否最大化价值，当然了如果获得相同价值的前提下可以考虑少付费。那么一旦广告主偏好模型发生变化，现有机制就需要重新审视，哪些机制的DSIC性质会发生改变，是否需要设计新机制来满足新要求？
广告主方面，Autobidding模式的兴起：越来越多的DSP开始智能化承接广告主的营销述求，此时广告主不再对流量进行估值报价，而是以更加高阶的或者直观的优化目标形式（最大化进店等）出现，伴以业务约束要求（预算和ROI约束等），然后由智能报价系统进行在线实时地对每个流量进行自动报价。面对使用占比越来越高的Autobidding模式，拍卖机制该做哪些假设的调整，新机制该如何设计才能满足良好性质实现平台优化目标？
技术方面，数据驱动的机制设计：数据驱动的深度学习技术已经逐渐成为广告系统其他算法模块（召回和预估等）的标配，而以平台收入最大化为目标的最优机制设计目前仍然有较大的优化空间，经典的设计方案需要依赖较强的领域知识，通过先验缩小优化范围，获得的近似最优解质量不高。我们该如何为机制设计进行定制化改造，满足机制性质的同时借助数据驱动的能力使得最优值的搜索过程更加智能，而且标准化的迭代流程又可以进一步加快技术升级，从而打开优化天花板？
生态方面，生成式模型颠覆广告营销模式：以ChatGPT为代表的生成式大模型让科技行业重新兴奋起来，也为广告营销注入了新的想象力。生成式大模型几乎一定会带来用户与互联网产品交互模式的改变，例如，多模态交互式对话方式会取代搜索引擎的地位，以广告位拍卖为基础的互联网广告的逻辑也会发生改变。一方面，新的用户交互模式会孕育新的商业机会，给自动出价的产品带来颠覆的改变；另一方面，新的技术理念和技术范式也会给自动出价算法带来革命性的升级。在如此汹涌磅礴技术浪潮到来之际，我们该如何革新广告营销的技术体系？

以上四个方向的技术演进如今如火如荼，希望未来有机会可以以进阶篇的形式分享给大家我们的思考与实践~

5. 参考文献

[1] Ranking and Tradeoffs in Sponsored Search Auctions

[2] Optimal reserve prices in weighted GSP auctions

[3] Revenue Optimization in the Generalized Second-Price Auction

[4] Learning Algorithms for Second-Price Auctions with Reserve

[5] Reserve Prices in Internet Advertising Auctions- A Field Experiment

[6] A Field Guide to Personalized Reserve Prices

[7] Position auctions

[8] Truthful Auctions for Pricing Search Keywords

[9] GSP with General Independent Click-Through-Rates

[10] Bidding to the Top- VCG and Equilibria of Position-Based Auctions

[11] Truthful Outcomes from Non-Truthful Position Auctions

[12] Revenue Monotone Mechanisms for Online Advertising

[13] Sponsored Search Auctions with Rich Ads

[14] Revenue Analysis of a Family of Ranking Rules for Keyword Auctions

[15] Multi-Score Position Auctions

[16] Internet Advertising and the Generalized Second-Price Auction- Selling Billions of Dollars Worth of Keywords

[17] Simplified Mechanisms with Applications to Sponsored Search and Package Auctions

[18] General Auction Mechanism for Search Advertising

[19] Bayes–Nash equilibria of the generalized second-price auction

[20] Sponsored Search Auctions- Recent Advances and Future Directions

[21] On Revenue in the Generalized Second Price Auction

[22] Optimal Auction Design and Equilibrium Selection in Sponsored Search Auctions

[23] OPTIMAL AUCTION DESIGN

[24] Optimal Multi-Object Auctions

[25] Simple versus Optimal Mechanisms

[26] Auction Mechanism for Optimally Trading Off Revenue and Efficiency

[27] Efficiency-Revenue Trade-offs in Auctions

[28] Optimising Trade-offs Among Stakeholders in Ad Auctions

[29] 《斯坦福算法博弈论二十讲》

加入我们：阿里妈妈搜索广告算法团队，诚招日常实习生和暑期实习生，欢迎对广告算法感兴趣的同学（最好有NLP、CV和信息检索背景）投递简历。

邮箱：[email protected]

END

也许你还想看

丨阿里妈妈展示广告智能拍卖机制的演进之路

丨阿里妈妈展示广告预估校准技术演进之路

丨从二值检索到层次竞买图——让搜索广告关键词召回焕然新生

丨阿里妈妈搜索广告预估模型2021思考与实践

关注「阿里妈妈技术」，了解更多~

喜欢要“分享”，好看要“点赞”ღ~

↓欢迎留言参与讨论↓

你可能感兴趣的:(人工智能,大数据)

使用LangGraph迁移MapReduceDocumentsChain进行长文档的摘要 dgay_hua python
在大数据处理和文本分析领域，MapReduce是一种非常重要的策略，用于处理和分析大型数据集。具体到文本处理方面，MapReduceDocumentsChain구현了一种map-reduce策略，可以有效地处理长文本。本文将介绍如何从MapReduceDocumentsChain迁移到LangGraph，并探讨LangGraph在流处理、检查点恢复等方面的优势。技术背景介绍MapReduceDoc
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
Python用Bokeh处理大规模数据可视化的最佳实践一键难忘 Bokeh python 开发语言
用Bokeh处理大规模数据可视化的最佳实践在大规模数据处理和分析中，数据可视化是一个至关重要的环节。Bokeh是一个在Python生态中广泛使用的交互式数据可视化库，它具有强大的可扩展性和灵活性。本文将介绍如何使用Bokeh处理大规模数据可视化，并提供一些最佳实践和代码实例，帮助你高效地展示大数据集中的重要信息。1.为什么选择Bokeh？Bokeh是一个专为浏览器呈现而设计的可视化库，它支持高效渲
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
分页优化之——游标分页 PhilipJ0303 Java面试 java 数据库优化游标分页分页查询
游标分页（Cursor-basedPagination）是一种高效的分页方式，特别适用于大数据集和无限滚动的场景。与传统的基于页码的分页（如page=1&size=10）不同，游标分页通过一个唯一的游标（通常是时间戳或唯一ID）来标记分页的位置，避免了传统分页在数据变动时的重复或遗漏问题。以下是游标分页在前后端的实现方式：1.游标分页的核心概念游标（Cursor）：游标是一个唯一标识符，通常是数据
轻松入门Apache SeaTunnel：数据集成利器窝窝和牛牛 SeaTunnel ETL 数据集成
文章目录轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnel基本原理运行流程SeaTunnelvsDataX：两大数据集成工具对比实战场景：MySQL数据同步至ElasticsearchSeaTunnel实现方案DataX实现方案实现原理对比底层依赖环境方案优缺点分析快速上手环境准备简单示例总结轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnelAp
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
探索数据安全新境界：Apache Spark SQL Ranger Security插件深度揭秘乌昱有Melanie
探索数据安全新境界：ApacheSparkSQLRangerSecurity插件深度揭秘项目地址:https://gitcode.com/gh_mirrors/sp/spark-ranger随着大数据的爆炸性增长，数据安全性成为了企业不可忽视的核心议题。在这一背景下，【ApacheSparkSQLRangerSecurityPlugin】以其强大的数据访问控制能力脱颖而出，成为数据处理领域的明星级
Java 大视界 -- Java 大数据在智能医疗远程会诊与专家协作中的技术支持（146）青云交大数据新视界 Java 大视界 java 大数据智能医疗远程会诊专家协作数据安全病例诊断
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
深入探讨盘古大模型的高精度多尺度能力 Hardess-god WRF 人工智能算法
随着人工智能技术的快速发展，大模型的研究逐渐进入新的阶段。其中，盘古大模型以其卓越的高精度和多尺度处理能力成为研究热点。本文将详细分析盘古模型在高精度多尺度问题上的技术特征、优势和应用潜力，并探讨其深入研究的方向。一、盘古模型概述盘古模型是华为推出的中文预训练大模型系列，拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础，通过海量文本数据进行训练，表现出优异的自然语言理解和生成能
AI巨浪中的安全之舵：天空卫士助力人工智能落地远航天空卫士人工智能安全数据安全网络安全大数据
"AI时代的安全战场，不在云端在本地；数据治理的胜负手，不在防御在认知。"近期，众多企业纷纷接入DeepSeek大模型，迅速推动了大型模型应用的广泛铺开。无论是在制造业、金融业，还是在医疗、教育等领域，DeepSeek大模型的应用都如火如荼，遍地开花，展现出了其广泛的应用前景和巨大的商业价值。顺势而来的是DeepSeek一体机以"低成本、高算力、私有化部署"的优势席卷企业市场。因为DeepSeek
DeepSeek重塑软件行业：研发工程师的机遇与挑战 LiuSid7 人工智能 llama 语言模型 ai
人工智能技术的浪潮正以前所未有的速度重塑软件行业，而DeepSeek作为其中的代表性技术，已成为研发工程师日常工作中不可忽视的变革力量。从代码生成到架构优化，从效率提升到职业生态重构，DeepSeek正在重新定义工程师的工作范式。以下从技术革新、职业发展、行业趋势三个维度，分析其对研发工程师的核心影响。一、技术革新：从“重复劳动”到“创造力释放”代码生产的效率革命DeepSeek通过自然语言指令生
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南 m0_57781768 python langchain 搜索引擎
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。检索增强生成（RetrievalAugmentedGeneration，RAG）是一种技术，通过将模型知识与额外数据结合来增强LLM的能力，使其能够回答关于特定源信息的问题。这些应用不仅限于公开数据，还可以处理私有数据和模
不用再当“技术宅“！这个AI神器让我5分钟变身人工智能达人阳光永恒736 AI工具人工智能 deepseek 一键包本地部署 AI资源
最近我在朋友圈刷到好多朋友都在玩AI画图、AI写诗，看得我心痒痒。可每次想自己试试，打开教程就被满屏的代码吓退——"Python环境配置"、"CUDA驱动安装"这些词比数学作业还让人头疼。直到我发现了一个叫DeepSeek本地部署一键包的神器，我的AI探索之旅终于变得像搭乐高一样简单！夸克网盘分享一、原来AI离我们这么近上周三放学路上，我看见隔壁班的小美用AI给自己照片生成古风造型，这让我突然意识
DeepSeek API在AutoCAD中的创新应用与挑战 CodeJourney. 数据库算法人工智能
在数字化设计领域，随着人工智能技术的飞速发展，将AI能力融入传统设计软件成为提升设计效率和质量的重要趋势。AutoCAD作为广泛应用的计算机辅助设计软件，与DeepSeekAPI的结合展现出了巨大的潜力。这种融合不仅为设计工作带来了全新的思路和方法，还在多个方面对设计流程进行了优化和创新。一、DeepSeekAPI赋能AutoCAD的多元应用场景（一）智能设计辅助：让创意快速落地在传统设计过程中，
AI 赋能应急管理：ChatGPT、DeepSeek、Grok 的应用探索一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能（AI）技术的快速发展，大语言模型（LLM）在应急管理领域的应用逐步扩大。ChatGPT、DeepSeek、Grok等AI模型凭借强大的文本处理、数据分析和推理能力，可为灾害预警、应急响应、风险评估等提供高效支持。本文将对比三大AI模型在应急管理中的优势，并探讨其在未来智能化应急管理体系中的应用前景。2.应急管理中的核心挑战应
DeepSeek的崛起：2025新春国产AI模型的全球影响力耶耶Norsea 网络杂烩人工智能百度
摘要在2025年新春之际，国产AI模型DeepSeek以现象级的姿态迅速崛起，凭借免费、易用及高性能的特点，吸引了全球科技界的广泛关注。这款大型人工智能模型不仅展现了国产技术的实力，还为用户提供了高效便捷的使用体验，成为行业内的焦点。关键词DeepSeek崛起,2025新春,国产AI模型,免费易用,高性能特点一、国产AI的崭新篇章1.1DeepSeek的诞生背景在2025年新春之际，DeepSee
一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！小城哇哇人工智能语言模型 AI大模型大模型微调预训练 agi LLM
前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助
ONE Deep模型：LG AI Research的开源突破耶耶Norsea 网络杂烩自动化
摘要由LGAIResearch开发的ONEDeep系列开源AI模型，参数规模覆盖2.4亿至32亿。经评估，2.4B参数规模的ONEDeep模型在性能上优于同类其他模型，展现出显著优势。这一成果为AI技术的应用与研究提供了强有力的支持。关键词ONEDeep模型,开源AI模型,LGAIResearch,2.4B参数,性能优越一、ONEDeep模型概述1.1ONEDeep模型的开发背景在当今人工智能技术
深度解析大模型推理框架：原理、应用与实践百度_开发者中心人工智能大模型自然语言处理
在当今数据驱动的时代，大模型推理框架已经成为人工智能领域的重要支柱。本文将通过简明扼要、清晰易懂的方式，带领读者深入了解大模型推理框架的原理、应用领域和实践经验，帮助读者更好地掌握这一技术，并在实际工作中发挥其价值。一、大模型推理框架简介大模型推理框架是指一种基于深度学习技术的推理框架，主要用于解决大规模数据集下的复杂问题。该框架通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分析
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本