阿里妈妈技术

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架

丨目录：

· 摘要

· 背景

· 基础概念

· IL的行为分析

· 我们的方法

· 实验

· 总结

· 参考文献

▐ 摘要

在在线广告中，自动竞价已经成为广告主优化自身广告性能的必需工具，自动竞价允许广告主通过简单地设置计划目标以及相应约束来优化其关心的广告性能指标。之前的工作大多从单智能体的角度考虑自动竞价问题，少有考虑建模智能体之间的相互影响。本文从分布式多智能体系统的角度研究自动竞价智能体的设计问题，并提出了一个通用的多智能体自动竞价框架，称为MAAB（Multi-Agent Auto-bidding)，用以学习自动竞价策略。首先，我们研究自动竞价智能体之间的竞争与合作关系，并提出了一种基于温度调控的奖励分配机制来建立自动竞价智能体之间的混合协作竞争关系。通过调节竞价智能体之间的协作与竞争，从而达到了一种能够同时保证广告主自身效用和社会福利最大化的均衡状态。其次，我们观察到协作关系会引导智能体走向共谋出低价的行为模式，从而破坏平台生态。为了解决这个问题，我们引入了门槛智能体来为每一个自动竞价智能体设置一个个性化的竞价门槛。第三，为了将MAAB部署到拥有数百万广告主的大型广告系统中，我们提出了一种基于平均场方法，通过将目标相同的广告主分组为一个均值自动竞价智能体，广告主之间的复杂交互得以简化，从而使MAAB得以高效训练。在工业离线数据集以及阿里巴巴广告平台的实验表明，本文的方法在社会福利以及平台收入上能够超越基准算法。

论文下载：https://arxiv.org/pdf/2106.06224.pdf

▐ 背景

在线广告已经成为广告主提高其产品曝光机会的一种不可或缺的工具。在传统的广告拍卖中，广告主需要对每一次广告拍卖进行手动出价，然而这种细粒度的出价过程需要广告主对参竟环境有全面的了解。为减轻广告主的竞价优化负担，在线平台部署了各种类型的自动出价服务，例如谷歌的 AdWords 广告活动管理工具、百度的凤巢以及淘宝的超级推荐产品。这些服务使得广告主可以通过简单地表达其目标和约束，然后由自动出价智能体优化其广告效果。在线广告的自动出价的过程如下图所示：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第1张图片

其中自动出价智能体由广告平台负责设计，该智能体目标是在广告主设置的约束下，根据广告主设置的目标来优化其出价策略。在阿里妈妈超级推荐&引力魔方上存在多种诉求，大体可以分为三类：优化点击、优化成交和优化收藏加购。这些自动出价智能体之间存在相互竞争关系。为了学习自动竞价智能体的竞价策略，最自然的方式就是去为每一个自动竞价智能体求解一个独立的优化问题，而将其他智能体出价的影响隐式地建模为环境的一部分。然而这种方式忽略了拍卖机制本质上是一个多智能体系统，即最终的拍卖结果取决于所有智能体的出价，且任一智能体的策略的改变会影响到其他所有智能体的策略。因此若不做任何的协调，则所有智能体会处于一个无约束状态，进而降低系统的整体效果。因此我们希望构建一个多智能体框架，通过精心设计协作机制来引导智能体走向一个具有较好系统性能的均衡状态。然而这面临以下几个挑战：

智能体间复杂的竞争与合作关系使得联合优化个体效果和系统整体性能变得困难。一方面，在完全竞争的环境下，每个广告主的效用可以被极度优化，但预算充足或可接受成本更高的广告主将会以更加激进的出价方式以获得更多的曝光，导致流量的按需分配无法实现，进而导致对社会福利的负面影响。另一方面，在完全协作的优化范式中，尽管能够让所有广告主以最优化整体社会福利为目标进行出价，但这可能会牺牲单个广告主的效果，同时广告主可能学得“共谋”出低价的行为，导致平台受损。因此，为了平衡个体效果和整体社会福利，一个可能的方案是构建一个混合合作-竞争框架(MCC, mixed cooperative-competitive)，来使平台能够在社会福利和平台收入之间进行一个灵活的取舍。为实现混合合作-竞争，现有方案一般通过手动修改奖赏函数或改变与环境有关的参数来达到该目标，然而前者在拍卖场景下并没有一个确定的奖赏函数形式，而后者仅在模拟器中可行。
MCC中的合作关系可能会损害平台的收入，例如合作的出价智能体可能会共谋出低价。尽管保留价是一种保证平台收入的有效方法，但如何在MCC框架中优化保留价来减少对社会福利的影响仍是一个开放性问题。
MCC框架在工业界的实现也是一个巨大的挑战。理想情况下每个广告主对应一个智能体，但这个数量级过于巨大，且每个智能体得到的奖赏过于稀疏，导致难以学得一个较好的出价策略。

基于以上挑战，我们提出了合作-竞争多智能体自动出价框架(MAAB, Multi-Agent Auto-bidding)，其主要思想如下：

为了平衡出价智能体间的竞争和合作关系，我们提出了一种基于温度调控的奖励分配机制。即将一次拍卖中的奖赏根据softmax函数产出的权重分配给各方智能体。此外，softmax函数中引入的温度参数可以有效调控智能体之间的竞争与合作关系。
为了减少智能体合作共谋出价导致平台收入受损的问题，我们引入了门槛智能体来为每一个自动出价智能体设置一个个性化的竞价门槛。直觉上，门槛智能体的目标是通过提高竞价门槛来获取较高的平台收入，然而自动竞价智能体则具有一个相反的目标，即降低出价门槛使得可以以较低的成本获取流量。门槛智能体和出价智能体是通过一种对抗的方式进行联合训练，直到彼此策略达到某种均衡点。
我们提出一种类似平均场的方法来解决来自工业场景大规模多智能体系统的挑战。通过将同目标的智能体聚合为一个平均自动出价智能体，百万级别广告主之间复杂的交互可以被简化，使得在大规模多智能体系统中部署自动竞价服务变为可能。

▐ 基础概念

1. 自动出价模型

广告主诉求和约束多种多样，预算约束是最常见的一种约束形式。为了简化说明，我们以BCB计划为例介绍我们的机制设计。

对BCB计划来说，假设一段时间内(如一天)有T个参竟机会，日预算为的计划i对机会t出价。如果他出价最高则竞得该流量，并按照GSP进行扣费，消耗记为，并获得价值。BCB计划目标则是在总消耗小于预算的约束下，最大化其获得的价值，即：

其中表示是否竞得流量。

2. 马尔科夫过程

一个部分观测的马尔科夫过程可以表示为

402 Payment Required

。其中s是环境的真实状态，o是能够观测到的状态，观测函数为：。在任一时刻，任一智能体根据观测做出的动作为：。当所有智能体动作执行后，每个智能体可以得到一个奖赏，且环境状态变为s'，转移函数记为：。为折扣系数，每个智能体需要通过优化其策略最大化累计奖赏：我们采用马尔科夫过程建模自动出价中的多智能体系统。每个自动出价智能体i的动作为出价，其观测状态由三部分构成：，分别为剩余预算、流量价值和剩余竞价机会。出价受业务限制，一般存在上下界。奖赏为，竞得后通过二价算得扣费，则下一时刻的观测变量为

402 Payment Required

。每个智能体目标为优化竞得流量的价值总和：

3. 独立学习 (IL, Independent Learner)

在多智能体强化学习领域，最常用的训练方式是同时学习非中心化的价值函数和策略，比如Independent -learning ，每个agent共享环境，并同时分别用DQN或者Q-learning训练独立Q函数。在后面我们将这种agent记为IL。

IL中每个agent的Q函数表示为：，其参数表示为。函数的训练细节DQN一致。replay buffer中的存储了。loss为：

其中是target network的参数，是每个智能体用于训练的奖赏，有两种：

环境奖赏，即每个智能体从环境中获得的自己的奖赏。当时，各智能体之间是完全竞争的，称为CM-IL。
总奖赏，是所有智能体奖赏之和，也为此次分配结果的社会总福利(Social welfare)。当时，各智能体是合作关系，即为了总社会福利共同努力，此时他们为合作关系，称为CO-IL。

我们也定义了合作和竞争关系如下：假设一次拍卖中有两个智能体，这次展现对两个智能体的价值分别为：、，假设，当他们的出价满足时，这两个智能体间的关系是合作的，否则是竞争的。这种定义是基于直觉的，合作的目标是为了更大的社会总福利。

▐ IL的行为分析

在本节中，我们分析了CM-IL和CO-IL两种模式下的自动出价智能体的表现，并发现CM-IL会导致寡头现象的产生并不利于社会总福利，而CO-IL虽然具有较高的社会福利，但会损害平台收入。为了直观阐明以上结论，我们构建了一个由两个自动出价智能体构成的环境，这两个自动出价智能体的目标都是在固定预算内最大化他们的总价值。我们分别以CM-IL和CO-IL模式训练50k轮，并从以下三种指标观察其最终效果：

智能体1获得的总价值：智能体2获得的价值由社会福利以及智能体1获取的总价值反推出来，因此没有绘出。
社会福利：社会福利为所有智能体价值的总和。
平台收入：扣费使用GSP机制。

假设两个智能体预算总和为，预算分配比例参数为，则两个智能体的预算分别为：和，我们尝试了不同和的参数组合，在此环境下得到的实验结果如下图所示：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第3张图片

其中每张图中的每一个单元中的数值代表在不同参数组合下的实验结果。我们首先观察CM-IL下的智能体1获取的价值，如图(a)所示，当，即智能体1预算显著多于2时，智能体1获得的总价值为(39, 38, 41, 36)，其显著多于智能体2所获得的价值(19, 19, 16, 21)。此时智能体1通过出更高的出价获取了大部分展现机会，形成了寡头现象。同时这种寡头现象也导致了较低社会福利，如图(c)和(d)所示，CM-IL达到了比CO-IL更低的社会福利，特别是在具有充足预算的设置下（例如当时，CO-IL的社会福利为（64，64，64），显著低于CM-IL的社会福利（57，56，58）。

适当的合作可以通过防止寡头现象的产生从而提高社会福利。这可以通过比较图(a)和图(b)得出：有较多预算时（），智能体1的价值从（39，38，41，36）降低为（35，38，33，33），而具有较少预算时（），智能体1的价值从（20，16，17，22）提高为（20，25，28，30）。这表明CO-IL更多是通过展现价值而非预算来进行展现机会的分配，并且就社会福利而言，CO-IL的这种方式显然达到了一种更好的均衡。

然而CO-IL也会导致部分广告主利益受损，尤其当存在其他广告主的value显著大于它时。同时，合作也会使各智能体“合谋”降低出价，导致平台收入受损（对比(f)和(d)）。

总的来说，竞争和合作状态会导致两种极端情况：竞争会导致在预算差异过大时出现寡头现象，进而损害社会总福利；合作能达到更高的社会总福利，但会导致平台收入和部分广告主利益受损。

▐ 我们的方法

为了在大规模多智能体环境中兼顾社会总福利和平台收入，我们提出了MAAB框架。该框架示意图如下图所示：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第4张图片

框架主要包含三部分：

为平衡竞争与合作关系，提出基于温度调控的奖励分配机制（Temperature Regularized Credit Assignment, TRCA）；
为了降低因合作导致的平台收入损失，引入门槛智能体；
用于大规模多智能体系统的平均场方法。

下面我们进行详细的介绍。

基于温度调控的奖励分配机制TRCA

受上文实验中IL在竞争和合作下分别产生的极端行为启发，我们提出了TRCA这种奖励分配机制，来建立多智能间的一种混合合作竞争关系。

TRCA的主要思路是给每个智能体的奖赏赋以一个权重参数。这个权重衡量了每个智能体对总奖赏的贡献，因此各智能体的奖赏为：。其中我们将定义为

402 Payment Required

。它是一个softmax式的权重，满足和。超参 ( )决定了竞争和合作的程度，为了分析是如何影响智能体行为的，我们以一轮拍卖中的两个智能体的情况进行简要分析，并给出下面的定理证明在此处省略，有兴趣的同学可以查看原文。：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第5张图片

证明在此处省略，感兴趣的同学可以查看原文。

由上可知，当大于一定阈值时，智能体将会倾向于合作状态，反之则处于竞争状态。因此我们可以使用来很方便的调节混合竞争合作状态中竞争和合作的相对程度，进而达到平台收入与社会福利之间的适当取舍。

门槛智能体

在线广告的一个目标是实现平台和广告主的双赢。如上节仿真实验可知，尽管合作有助于提升社会总福利，但各智能体会倾向于共谋出低价，导致平台收入下降。在本节中，我们提出了几种提升平台收入的方法。

最简单的方法是设置一个固定的出价门槛。当自动出价智能体出价时，使用TRCA奖赏，反之奖赏为0：。但固定的门槛很难设置，过高会损失广告主收益，过低则对提升平台收入无益。

一种进阶方法，是对每次参竟设置自适应出价门槛。我们可以新增一个面向平台收入的智能体，并使用RL方法优化其设置出价门槛的策略。但该智能体的奖赏很难定义。如果简单地将其奖赏定义为平台收入，那么这个智能体会倾向于设置一个过高出价门槛。另一方面，同一拍卖中的不同自动出价智能体具有差异化的个体信息，因此共用一个出价门槛可能并非一个好选择。

基于以上分析，我们在MAAB中提出使用多门槛智能体，每一个门槛智能体为对应的自动出价智能体提供一个出价门槛。每次拍卖中，门槛智能体和出价智能体分别给出出价门槛和出价。参竟后我们得到客户收益并计算得到TRCA奖赏，同时门槛智能体获得平台收入，其定义为单次拍卖中的扣费。同时，为了防止门槛智能体出过高的竞价门槛，我们提出了一种称为门槛门控（bar gate）机制的方法。门槛门控机制为每对出价智能体和门槛智能体输出：

然后我们采用和分别作为两个智能体的奖赏。注意门槛智能体仅用作训练，在线执行阶段不发挥作用。

门槛智能体和出价智能体采用同时训练的方式。门槛智能体致力于提升平台收入，出价智能体致力于提升客户收益。门槛门控机制将这两种不同的奖赏建立了一种关系。一方面，当门槛过高，双方都获得0奖赏，此时门槛智能体会降低门槛，出价智能体则增加出价，直到两方达成一致，即，此时双方才能同时获得奖赏。另一方面，当门槛过低时，双方均会获得一定的收益，但下一轮门槛智能体会尝试提升出价，同时受TRCA中合作关系鼓励出价智能体会尝试降低出价，直到稳态形成。

总的来说，我们提出的这个多门槛智能体和对应的奖赏设计，能够通过将出价提升至合适水平来提升平台收入。值得一提的是，这个方案看起来和保留价很相似，但我们提出的门槛智能体仅在训练阶段生效，在执行阶段被移除，因此在线的GSP机制仍然得到保留。

用于大规模多智能体系统的平均场方法

在实践中，我们面临上百亿的参竟机会和数百万的参竟计划，理想情况下每个计划应当对应一个出价智能体，这些智能体同时进行训练，但这会导致计算资源紧张以及奖赏稀疏等问题。一个可行方案是把智能体按照更高视角、按照某种划分标准做聚类。聚类后的智能体会有更稠密的奖赏，同时训练的智能体个数也大大减少。我们的方法中提出使用计划间最本质的不同来做计划分组，即计划的诉求。当然也可以使用其他原则进行分组。按照待优化目标分组后，我们得到，其中每组包含了对应目标下的所有计划。但是，在对每组训练可以应用于组内所有计划的出价策略时，还面临以下困难：

Q-learning算法中需要下时刻状态下的最大Q值用于训练，但聚类后的下时刻状态未知
计划间通常有不同的预算约束，每条流量对应的流量价值也不同，共用策略存在困难

为了解决上述问题，我们的平均场方法如下：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第6张图片

其主要思想是平均策略先基于平均预算等观测变量计算平均出价，组内各计划则在平均价值的基础上，考虑自身流量价值与平均价值的相对大小关系调整其出价。在详细介绍我们的方案前，我们首先介绍下我们使用的符号的含义。我们将一段时间（如15分钟）看做是一个时间戳，每段时间内会陆续出现展现机会。将时间戳t内的所有参竟机会集合记作，为其中一次展现机会。代表展现机会e对计划的价值。表示计划k是否赢得了展现机会e，即它的ecpm排序分=是否最高。上述方案的马尔科夫过程的具体定义如下：

观测状态：平均智能体i在时刻t的观测值被定义为：。其中是在时刻t的剩余预算，其初始值为。为流量的平均价值。是剩余出价机会。
动作空间：平均智能体的动作为平均出价。计划在展现机会e上的出价为，其中。clip(.)用于保证最终出价不会出现极端值。
奖赏函数：奖赏也定义在一个聚合粒度：
402 Payment Required
转移函数：展现机会e上获胜计划的期望扣费为，其中j为ecpm排序中下一位广告的下标。因此平均智能体的消耗为：，则下一时刻观测状态为，当剩余预算为0是，智能体的出价只能为0.

在线阶段，组内计划共享一个出价策略。如对于计划，出价策略的输入为计划k自身观测状态（而非组内平均状态），策略输出即为其出价。

配合以上平均智能体模型，我们的门槛智能体和TRCA奖赏也需要进行一些适配：TRCA中的替换为平均出价；门槛智能体也采用平均场方法，每个平均出价智能体对应一个门槛智能体。如此我们的方法就可在大规模广告系统中进行训练了。

▐ 实验

离线数据集仿真

离线数据集

离线数据集来自阿里巴巴广告系统在2020年某天中某6小时的参竟日志。包含了约70w次展现机会，每次参竟约有400个广告参竟。日志中包含了广告主id、时间、广告主目标、流量价值预估值、原始手动出价等信息。日志中的计划按照其目标大体可以分为三类：优化点击的、优化购买的、优化收藏加购的，后文我们将这三组计划分别记为CLICK, CONV, CART 。

评估指标

我们主要关注两个指标：(1) 社会总福利(Social welfare)；（2）平台收入，拍卖机制使用GSP机制。

预算约束

对于离线实验，我们首先令所有平均智能体出最高价，然后计算按最高进行出价的总扣费，记为。然后计划的预算设置为。

我们考虑两种设置：1），，这种设置下所有自动竞价智能体的预算一致（记为setting 1）；2），，这种为预算不均衡的设定（记为setting 2）。

对比方法

（1）MSB(Manually set bids)：人工设定的出价，即广告主的原始出价。

（2）DQN-S：单智能体版本的IL，每一类需求对应一个智能体，假设其他广告使用原始出价进行训练。

（3）CM-IL

（4）CO-IL

（5）MAAB，即我们的方法。

实验结果

离线实验结果如下图：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第7张图片

我们发现，传统的手动竞价(MSB)方式并没有取得很好的效果，其社会福利为64.5，平台的收入为16.9，且是所有方法中最差的。相比之下，DQN-S在三个组的价值(29.3, 35.8, 36.0)，社会福利(101.0)和平台收入(68.3)上均更优，这是得益于RL可以较好地控制预算的使用。

然而，DQN-S的性能仍然受到其他智能体出价固定这一不切实际的假设的限制。采用多智能体学习范式可以进一步消除这种假设，例如CM-IL无论从社会福利(例如,setting 1中104.1 > 101.0)还是平台的收入上(例如,setting 1中86.8 > 68.3)均优于DQN-S。

然而，这种竞争关系可能并不能帮助实现更好的社会福利，这一点可以从CM-IL与CO-IL的比较中看出。CO-IL建模智能体之间的合作关系，因此其在社会福利上略优于CM-IL(Setting 1中104.3 > 104.1，Setting 2中103.0 > 99.6)，然而，这种提升是以牺牲平台收入为代价的(Setting 1 中 66.9 < 86.8，Setting 2中52.9 < 85.0)。

在这两个极端之间，MAAB采用了TRCA并以混合合作竞争的方式建立智能体之间的关系，从而实现了社会福利与收入之间更好的均衡。如表所示，MAAB的社会福利优于CM-IL(在Setting 1中为105.3 > 104.1，在Setting 2中103.4 > 99.6)，同时在收入方面显著优于CO-IL(在Setting 1中为80.6 > 66.9，在Setting 2中为69.0 > 52.9)。

在线实验

我们也进行了线上AB实验，效果如下表（各指标数值均进行了归一化），能够看出我们的方法能够在有限的平台收入损失下，有效的提升社会总福利。

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第8张图片

消融实验

TRCA有效性

为了评估TRCA在建模合作和竞争关系上的有效性，我们去除MAAB中门槛智能体，并将该方法成为MIX-IL，然后通过调整MIX-IL中的参数进行离线实验分析。越大关系越倾向于合作，越小关系越倾向于竞争。当时，MIX-IL等价于CM-IL；当时，MIX-IL等价于CO-IL。

我们使用和进行实验，我们尝试了= 0, 2, 4, ，结果如下：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第9张图片

可以看到合作和竞争程度可以很方便的通过调节来平衡。

门槛智能体的影响

为了验证门槛智能体在提升平台收入上的必要性以及自适应门槛智能体的效果，我们用这两种方法和MAAB进行了比较：（1）MIX-IL：无门槛智能体；（2）MAAB-fix：使用固定的门槛智能体动作：。预算设定为：和。离线实验结果如下：

WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架_第10张图片

对比MIX-IL和MAAB-fix，可以看到出价门槛对平台收入的明显提升，门槛越高提升越大(99.6->114.3->164.9)。但同时过高的门槛也会降低社会福利(104->99.3)，过低的门槛平台收入提升有限。采用自适应门槛的MAAB则能兼顾两者，在社会福利损失有限情况(104->103.9)下大幅度提升平台收入。

▐ 总结

自动出价已经成为在线广告中优化广告主投放效果的基础工具。我们提出的MAAB是一个能用于大规模广告系统自动出价的多智能体强化学习框架，它主要有三个贡献：

（1）提出了TRCA，建立了自动出价智能体间的混合竞争-合作关系。

（2）提出了在训练时使用门槛智能体提升平台收入。

（3）使用了平均场方法，将MAAB用于大规模广告平台。

未来我们将会持续探索TRCA中的温度参数实时动态调整，和升级门槛智能体的奖赏方案设计以加快其收敛。

参考文献

[1] Gagan Aggarwal, Ashwinkumar Badanidiyuru, and Aranyak Mehta. 2019. Autobidding with constraints. In WINE. Springer, 17–30.

[2] Han Cai, Kan Ren, Weinan Zhang, Kleanthis Malialis, Jun Wang, Yong Yu, and Defeng Guo. 2017. Real-time bidding by reinforcement learning in display advertising. In WSDM. 661–670.

[3] Google Ads Help Center. 2021. About automated bidding. https://support.google. com/google-ads/answer/2979071. Accessed: January 24, 2021.

[4] Carl Davidson and Raymond Deneckere. 1986. Long-run competition in capacity, short-run competition in price, and the Cournot model. The Rand Journal of Economics (1986), 404–415.

[5] Paul Dütting, Zhe Feng, Harikrishna Narasimhan, David Parkes, and Sai Srivatsa Ravindranath. 2019. Optimal auctions through deep learning. In ICML. PMLR, 1706–1715.

[6] Benjamin Edelman, Michael Ostrovsky, and Michael Schwarz. 2007. Internet advertising and the generalized second-price auction: Selling billions of dollars worth of keywords. American economic review 97, 1 (2007), 242–259.

[7] eMarketer. 2015. Worldwide retail ecommerce sales: eMarketer’s updated estimates and forecast through 2019. (2015).

[8] Facebook. 2021. Facebook. https://www.facebook.com/business/m/one-sheeters/ facebook-bid-strategy-guide. Accessed: January 24, 2021.

[9] Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, and Shimon Whiteson. 2018. Counterfactual multi-agent policy gradients. In AAAI, Vol. 32.

[10] Google. 2021. Google AdWords API. https://developers.google.com/adwords/ api/docs/guides/start. Accessed: January 24, 2021.

[11] Ziyu Guan, Hongchang Wu, Qingyu Cao, Hao Liu, Wei Zhao, Sheng Li, Cai Xu, Guang Qiu, Jian Xu, and Bo Zheng. 2021. Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization in e-Commercial Sponsored Search. arXiv preprint arXiv:2106.04075 (2021).

[12] Garrett Hardin. 2009. The tragedy of the commons. Journal of Natural Resources Policy Research 1, 3 (2009), 243–253.

[13] Pablo Hernandez-Leal, Bilal Kartal, and Matthew E Taylor. 2019. A survey and critique of multiagent deep reinforcement learning. AAMAS 33, 6 (2019), 750–797.

[14] Junqi Jin, Chengru Song, Han Li, Kun Gai, Jun Wang, and Weinan Zhang. 2018. Real-time bidding with multi-agent reinforcement learning in display advertising. In CIKM. 2193–2201.

[15] Jean-Michel Lasry and Pierre-Louis Lions. 2007. Mean field games. Japanese journal of mathematics 2, 1 (2007), 229–260.

[16] Joel Z Leibo and Marc Lanctot. 2017. Multi-agent Reinforcement Learning in Sequential Social Dilemmas. (2017). arXiv:arXiv:1702.03037v1

[17] Michael L Littman. 1994. Markov games as a framework for multi-agent reinforcement learning. In Machine learning proceedings 1994. Elsevier, 157–163.

[18] Xiangyu Liu, Chuan Yu, Zhilin Zhang, Zhenzhe Zheng, Yu Rong, Hongtao Lv, Da Huo, Yiqing Wang, Dagui Chen, Jian Xu, Fan Wu, Guihai Chen, and Xiaoqiang Zhu. 2021. Neural Auction: End-to-End Learning of Auction Mechanisms for E-Commerce Advertising. In SIGKDD. 3354–3364.

[19] Ryan Lowe, Yi I Wu, Aviv Tamar, Jean Harb, OpenAI Pieter Abbeel, and Igor Mordatch. 2017. Multi-agent actor-critic for mixed cooperative-competitive environments. In NIPS. 6379–6390.

[20] Robert C Marshall and Leslie M Marx. 2007. Bidder collusion. Journal of Economic Theory 133, 1 (2007), 374–402.

[21] Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Andrei A Rusu, Joel Veness, Marc G Bellemare, Alex Graves, Martin Riedmiller, Andreas K Fidjeland, Georg Ostrovski, et al. 2015. Human-level control through deep reinforcement learning. nature 518, 7540 (2015), 529–533.

[22] Mehryar Mohri and Andres Munoz Medina. 2014. Learning theory and algorithms for revenue optimization in second price auctions with reserve. In ICML. PMLR, 262–270.

[23] Roger B Myerson. 1981. Optimal auction design. Mathematics of operations research 6, 1 (1981), 58–73.

[24] Michael Ostrovsky and Michael Schwarz. 2011. Reserve prices in internet advertising auctions: A field experiment. In EC. 59–60.

[25] Tabish Rashid, Mikayel Samvelyan, Christian Schroeder, Gregory Farquhar, Jakob Foerster, and Shimon Whiteson. 2018. QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning. In ICML. 4295–4304.

[26] Peter Sunehag, Guy Lever, Audrunas Gruslys, Wojciech Marian Czarnecki, Vinícius Flores Zambaldi, Max Jaderberg, Marc Lanctot, Nicolas Sonnerat, Joel Z Leibo, Karl Tuyls, et al. 2018. Value-Decomposition Networks For Cooperative Multi-Agent Learning Based On Team Reward.. In AAMAS. 2085–2087.

[27] Ardi Tampuu, Tambet Matiisen, Dorian Kodelja, Ilya Kuzovkin, Kristjan Korjus, Juhan Aru, Jaan Aru, and Raul Vicente. 2017. Multiagent cooperation and competition with deep reinforcement learning. PloS one 12, 4 (2017), e0172395.

[28] Ming Tan. 1993. Multi-agent reinforcement learning: Independent vs. cooperative agents. In ICML. 330–337.

[29] David RM Thompson and Kevin Leyton-Brown. 2013. Revenue optimization in the generalized second-price auction. In EC. 837–852.

[30] Chao Wen, Xinghu Yao, Yuhui Wang, and Xiaoyang Tan. 2020. SMIX (): Enhancing Centralized Value Functions for Cooperative Multi-Agent Reinforcement Learning.. In AAAI. 7301–7308.

[31] Di Wu, Xiujun Chen, Xun Yang, Hao Wang, Qing Tan, Xiaoxun Zhang, Jian Xu, and Kun Gai. 2018. Budget constrained bidding by model-free reinforcement learning in display advertising. In CIKM. 1443–1451.

[32] Xiao Yang, Daren Sun, Ruiwei Zhu, Tao Deng, Zhi Guo, Zongyao Ding, Shouke Qin, and Yanfeng Zhu. 2019. Aiads: Automated and intelligent advertising system for sponsored search. In SIGKDD. 1881–1890.

[33] Yaodong Yang, Rui Luo, Minne Li, Ming Zhou, Weinan Zhang, and Jun Wang. 2018. Mean field multi-agent reinforcement learning. In ICML. PMLR, 5571–5580.

[34] Shuai Yuan, Jun Wang, Bowei Chen, Peter Mason, and Sam Seljan. 2014. An empirical study of reserve price optimisation in real-time bidding. In SIGKDD. 1897–1906.

END

也许你还想看

丨阿里妈妈技术团队4篇论文入选WSDM 2022

丨WSDM 2022 | 合约广告自适应统一分配框架

丨WSDM 2022 | 基于元学习的多场景多任务商家建模

丨WSDM 2022 | 点击率模型特征交叉方向的发展及CAN模型介绍

欢迎关注「阿里妈妈技术」，了解更多~

疯狂暗示↓↓↓↓↓↓↓

你可能感兴趣的:(大数据,算法,机器学习,人工智能,深度学习)

Anaconda3 介绍和安装 gorgor在码农 #python入门基础 python conda
介绍Anaconda是一个开源的Python和R语言发行版，专注于数据科学、机器学习和科学计算，主要面向数据科学和机器学习领域。它集成了大量常用的科学计算库（如NumPy、Pandas、Matplotlib、Scikit-learn等），并提供了强大的包管理工具Conda和环境管理功能，适合快速部署和管理复杂的开发环境。特点：预装丰富库：包含250+常用的数据科学工具包，无需手动安装。跨平台支持：
TPAMI 2024 | SSR-2D: 从2D图像进行语义3D场景重建小白学视觉论文解读 IEEE TPAMI 深度学习顶刊论文论文解读 TPAMI
论文信息题目：SSR-2D:Semantic3DSceneReconstructionFrom2DImagesSSR-2D:从2D图像进行语义3D场景重建作者：JunwenHuang,AlexeyArtemov,YujinChen,ShuaifengZhi,KaiXu,andMatthiasNießner论文创新点首次提出了一种基于深度学习的方法，能够在不使用任何3D标注的情况下，从不完整的RGB
C++优选算法五位运算 gkdpjj 优选算法算法 c++开发语言
一、位运算位运算（BitwiseOperations）是直接在整数的二进制表示上进行的操作。这些操作包括位与（AND）、位或（OR）、位非（NOT）、位异或（XOR）、左移（LeftShift）和右移（RightShift）等。位运算在处理低级别数据、优化性能、实现加密算法等方面非常有用。以下是这些操作的详细介绍：位与（BitwiseAND,&）：对应位都为1时，结果位才为1，否则为0。示例：5&
读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读躺柒人工智能算法导读总结 AI
1.基本信息算法简史：从美索不达米亚到人工智能时代克里斯·布利克利著中信出版集团股份有限公司,2024年9月出版1.1.读薄率书籍总字数18.6万字，笔记总字数51653字。读薄率51653÷186000≈27.77%1.2.读厚方向当我点击时，算法在想什么？算法霸权极简算法史：从数学到机器的故事算法的陷阱：超级平台、算法垄断与场景欺骗天才与算法：人脑与AI的数学思维算法图解1.3.笔记--章节对
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点) 管哥的运维私房菜大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址：prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
【机器学习】无监督学习算法之：K均值聚类 Carl_奕然机器学习算法学习
K均值聚类1、引言2、K均值聚类2.1定义2.2原理2.3实现方式2.4算法公式2.4.1距离计算公式2.4.1中心点计算公式2.5代码示例3、总结1、引言小屌丝：鱼哥，K均值聚类我不懂，能不能给我讲一讲？小鱼：行，可以小屌丝：额…今天咋直接就答应了？小鱼：不然呢？小屌丝：有啥条件，直接说，小鱼：没有小屌丝：这咋的了，不提条件，我可不踏实小鱼：你看看你，我不提条件，你还不踏实，那你这是非让我提条件
spiking neural network概念学习 Zaгathustra 科研工作深度学习神经网络机器学习
我们认为，SNNs最大的优势在于其能够充分利用基于时空事件的信息。今天，我们有相当成熟的神经形态传感器，来记录环境实时的动态改变。这些动态感官数据可以与SNNs的时间处理能力相结合，以实现超低能耗的计算。在此类传感器中使用SNNs主要受限于缺乏适当的训练算法，从而可以有效地利用尖峰神经元的时间信息。实际上就精度而言，在大多数学习任务中SNNs的效果仍落后于第二代的深度学习。很明显，尖峰神经元可以实
C++学习指南月眠老师 c++java 算法
一、引言C++是一种功能强大的高级编程语言，它融合了面向过程编程和面向对象编程的特性。由于其效率高、可移植性强等优点，广泛应用于系统开发、游戏编程、嵌入式系统等诸多领域。对于想要深入学习C++的人来说，需要全面掌握其语法、编程范式、数据结构、算法以及相关的开发工具等多方面的知识。二、C++基础语法（一）基本数据类型整型（Integer）在C++中有多种整型类型，如int（通常为32位有符号整数）、
第二章：13.1 机器学习的迭代发展望云山190 机器学习人工智能
目录机器学习模型开发流程构建电子邮件垃圾邮件分类器示例总结垃圾邮件分类示例构建垃圾邮件分类器机器学习模型开发流程确定系统架构：首先，需要决定机器学习系统的总体架构，这包括选择合适的模型、确定使用的数据集、可能还包括选择超参数等。实现和训练模型：根据上述决定，实现并训练一个模型。通常，第一次训练的模型不会立即达到预期的效果。诊断和调整：对模型进行诊断，查看算法的偏差、方差或进行错误分析。根据诊断结果
蓝桥杯备考：贪心算法简介无敌大饺子 1 贪心算法算法
贪心算法就是企图用局部最优的策略找出全局最优步骤就是1，把解决问题的过程分成若干步。2，每一步都选择当前看起来最优的解法。3，希望得到全局最优的结果比较经典的例题一个就是找零问题钞票种类[20,10,5,1]用最小的张数找零46的时候，先把最大的20的找完，然后找10的，再找5的，最后再找1的直到不能再找，过程就是46：找零20---》26：找零20-----》6：找零5-----》1：找零1--
备战蓝桥杯：贪心算法之货仓选址无敌大饺子 1 贪心算法算法
当我们货仓选址在最中间的时候，货仓到每家商店的距离最短#include#include#includetypedeflonglongLL;usingnamespacestd;intn;constintN=1e5+10;LLa[N];intmain(){cin>>n;for(inti=1;i>a[i];sort(a+1,a+1+n);LLret=0;for(inti=1;i=|a-b|我们的代码也可
深度学习（1)-简单神经网络示例 yyc_audio 深度学习人工智能
我们来看一个神经网络的具体实例：使用Python的Keras库来学习手写数字分类。在这个例子中，我们要解决的问题是，将手写数字的灰度图像（28像素×28像素）划分到10个类别中（从0到9）。我们将使用MNIST数据集，图2-1给出了MNIST数据集的一些样本。在机器学习中，分类问题中的某个类别叫作类（class），数据点叫作样本（sample），与某个样本对应的类叫作标签（label）。你不需要现
简化版奇异值分解（SVD）方法详解 DuHz 数理统计学知识机器学习人工智能算法信息与通信信号处理
简化版奇异值分解（SVD）方法详解奇异值分解（SVD）是一个强大的矩阵分解工具，广泛应用于数据降维、图像压缩、机器学习等领域。然而，对于大规模数据或高维矩阵，计算和存储的开销非常大，因此提出了多种简化版的SVD方法。这些简化版方法在保证解的精度的同时，能够显著减少计算量和内存占用。本文将详细介绍几种简化版SVD方法，包括经济型SVD、随机化SVD、增量SVD、分块SVD和偏最小二乘法（PLS），并
Python爬虫——网站基本信息 IT·小灰灰 python 爬虫开发语言网络
在智能时代，数据是新的石油。Python爬虫技术赋予了我们成为数据猎人的能力，让我们能够在网络的广袤土地上狩猎，为机器学习和人工智能的发展提供燃料目录一、介绍——Python二、介绍——Python爬虫1.请求库2.解析库3.数据存储4.多线程/多进程5.异步编程6.代理和反爬虫7.爬虫框架8.爬虫的法律和道德问题9.异常处理10.日志记录三、爬虫示例代码一、介绍——PythonPython是一种
使用Docker搭建Flink集群 O_1CxH Flink大数据 Kafka大数据 docker flink 容器
目录使用Docker搭建Flink集群docker-compose一键搭建步骤附录参考资料使用Docker搭建Flink集群在学习大数据框架的时候，需要一个真实的环境。我们知道，像spark、flink这些计算框架都有多种运行模式：在本地使用多线程模拟集群真正的分布式集群如果直接在IDE（Intellj）里面编译和运行写好的程序，实际上是用的前一种运行模式；如果想尝试真正的生产环境中任务的提交和管
Python 自动排班表格（代码分享）趣享先生 Python案例分享专栏 python 开发语言
✅作者简介：2022年博客新星第八。热爱国学的Java后端开发者，修心和技术同步精进。个人主页：JavaFans的博客个人信条：不迁怒，不贰过。小知识，大智慧。当前专栏：Java案例分享专栏✨特色专栏：国学周更-心性养成之路本文内容：Python自动排班表格（代码分享）前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录前言问题描述解决步骤1
理论一、大模型—概念伯牙碎琴大模型自然语言处理 ai
一、总述大模型通常指的是参数规模庞大、训练难度较高的人工智能模型。随着深度学习技术的发展，研究人员和企业越来越倾向于构建更大的模型，以提高模型的性能和泛化能力。这些大模型往往需要大量的数据和计算资源来训练，并且在实际应用中通常表现出色。大模型全称是大型语言模型（LLM，LargeLanguageModel），这个“大”主要指模型结构容量大，结构中的参数多，用于预训练大模型的数据量大。一个大模型可以
Python：第三方库衍生星球 python 第三方库
1.第三方Python库库名用途pip安装指令NumPy矩阵运算pipinstallnumpyMatplotlib产品级2D图形绘制pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文分词pipinstalljieba
自动驾驶系列—颠覆未来驾驶：深入解析自动驾驶线控转向系统技术学步_技术自动驾驶自动驾驶人工智能机器学习线控系统
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
Java 实现拖拽列表更新排序架构师成长进阶空间 Java spring cloud spring boot java 后端
拖拽列表更新排序，接口提供给前端这个功能主要是需要的算法逻辑很多图解：如在前端页面上想把id=5拖拽到id=3上拖拽之后的效果：解析图例：代码示例：DevToCoding｜Java面试指南、学习笔记/***拖拽数据更新排序*@paramcurrentId当前数据id*@paramtargetId目标数据id*@return*/@RequestMapping("/sort/{currentId}/{
【C++】STL之string类源码剖析 AllinTome c++STL 数据结构类与对象 string
目录概述源码MyString.htest.cpp概述string是字符串类，出现早于STL，不过string完全符合STL标准库的语法规则，故将string类也归于STL中string类实现的功能有字符串元素的随机访问、迭代器遍历、字符串追加/删减/查找、字符串随机插入、字符串扩容与修改长度、重载输入/输出运算符算法设计：利用构造临时对象、自定义swap函数，完成string对象的拷贝、赋值构造，
10.3字符串manacher算法赵鑫亿 c++数据结构与算法算法 c++
字符串manacher算法Manacher算法是用于在O(n)时间复杂度内查找字符串中最长回文子串的高效算法。以下是详细的技术解析：一、算法核心思想中心扩展优化：利用回文的对称性避免重复计算奇偶统一处理：通过插入特殊字符将奇偶长度回文统一处理动态维护边界：记录当前已知最右回文边界及其对应的中心二、关键数据结构vectorradius;//存储每个位置的回文半径intcenter=0;//当前中心点
自动驾驶---Motion Planning之参考线Path平滑智能汽车人自动驾驶人工智能
1背景有了由lane_segment插值得到的粗糙参考线，这种参考线是无法输出给下游使用的，需要进一步的处理使得参考线更加平滑，才能供下游控制模块使用。Apollo中共有三种参考线平滑算法，分别为：1.QpSplineSmoother2.SpiralReferenceLineSmoother3.DiscretePointsSmoother目前Apollo中默认配置为最后一种，基于离散点的平滑。这种
仿生机器人核心技术与大小脑天机️灵韵人工智能具身智能硬件设备机器人人工智能具身智能
以下是针对仿生机器人核心技术的结构化总结，涵盖通用核心技术与**“大脑-小脑”专用架构**两大方向：一、机器人通用核心技术这些技术是仿生机器人实现功能的基础，与生物体的“身体能力”对应：1.感知与交互技术多模态传感器融合视觉：3D视觉（如RGB-D相机）、动态目标跟踪（如光流算法）。触觉：柔性电子皮肤、分布式压力传感器（模仿人类皮肤）。听觉：声源定位、噪声抑制（如麦克风阵列）。环境感知：激光雷达（
《一文吃透！NLTK与SpaCy，自然语言处理的神兵利器》人工智能深度学习
在人工智能的璀璨星空中，自然语言处理（NLP）无疑是最为耀眼的领域之一。它让机器能够理解、处理和生成人类语言，极大地推动了智能交互的发展。而在Python的NLP工具库中，NLTK和SpaCy就像两把锋利的宝剑，各自散发着独特的光芒。今天，就让我们深入探究这两款工具的使用技巧与优势，为你的NLP之旅增添强大助力。一、NLTK：自然语言处理的瑞士军刀NLTK（NaturalLanguageToolk
Flux架构：构建可预测的Web应用状态管理体系阿珊和她的猫架构前端
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章
”人货场”模型搞懂没？数据分析大部分场景都能用！接地气的陈老师人工智能数据分析大数据机器学习推荐系统
做数据分析的同学，很多都听过：人、货、场的分析模型。然而，这东西又是个只闻其名，不见真身的东西。到底该怎么结合实际分析？今天我们系统讲解下。问题场景：某生鲜电商，用户复购率较低，60%的用户在30天内无二次购买行为，运营领导非常着急，要求通过数据分析提升复购率，请问你作为数据分析师该怎么做？建立人工智能精准推荐算法（40%概率用协同过滤，60%用关联分析）把过往6个月月初复购率做成折线图，然后写下
3 ＞数据结构与算法栈与队列 irisart 数据结构与算法（C语言考研期末复习版）c语言数据结构
概览本节总结了栈和队列的基本概念和用法，另外附上栈与队列的基本操作代码（C语言版）。本节适合有C语言基础的初学者、期末复习、考研等方面的用途。栈只允许在一端插入和删除操作的线性表。代码如下特点：先进后出模式（LIFO），只能在栈顶操作。什么是卡特兰数：有n个元素进栈（顺序可以不同），出栈元素不同的排列个数为1n+1C2nn\frac{1}{n+1}C^n_{2n}n+11C2nn。共享栈：两个栈共
8 ＞查找 irisart 算法 c语言
基本概念查找表：用于查找的数据集合称为查找表，由同类元素组成。静态查找表：只需要进行查找操作。动态查找表：还可以进行增删操作。唯一表示数据元素的数据项。算法好坏评价：查找长度：在查找运算中需要对比关键字多少次。反映了查找操作时间的复杂度。平均查找长度：所有查找过程中进行关键字比较的平均值。（通常考虑查找成功和失败）ASL=∑i=1nPiCi(P：查找i号元素的概率，C：查找i号元素的查找长度)AS
Forrester发布2024年五大网络安全新威胁岛屿旅人网络安全 web安全网络安全网络安全
文章目录前言一、大选年的叙事（舆论）操控攻击二、深度伪造引发身份安全危机三、生成式人工智能数据泄露四、人工智能软件供应链攻击五、太空成为安全战略高点数据泄露平均成本高达218万美元前言人工智能正重塑网络安全格局，武器化大语言模型正成为首选攻击工具，安全团队在应对武器化人工智能攻击方面将面临日益严峻的挑战。Forrester近日发布《2024年网络安全威胁预测报告》指出，人工智能正重塑网络安全格局，
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p