falao_beiliu

深度学习word2vec笔记之应用篇

声明：

1）该博文是Google专家以及多位博主所无私奉献的论文资料整理的。具体引用的资料请看参考文献。具体的版本声明也参考原文献

2）本文仅供学术交流，非商用。所以每一部分具体的参考资料并没有详细对应，更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益，还望海涵，并联系老衲删除或修改，直到相关人士满意为止。

3）本人才疏学浅，整理总结的时候难免出错，还望各位前辈不吝指正，谢谢。

4）阅读本文需要机器学习、概率统计算法等等基础（如果没有也没关系了，没有就看看，当做跟同学们吹牛的本钱），基础篇url：http://blog.csdn.net/mytestmy/article/details/26961315 。

5）此属于第一版本，若有错误，还需继续修正与增删。还望大家多多指点。请直接回帖，本人来想办法处理。

6）本人手上有word版的和pdf版的，有必要的话可以上传到csdn供各位下载。

好不容易学了一个深度学习的算法，大家是否比较爽了？但是回头想想，学这个是为了什么？吹牛皮吗？写论文吗？参加竞赛拿奖吗？

不管哪个原因，都显得有点校园思维了。

站在企业的层面，这样的方式显然是不符合要求的，如果只是学会了，公式推通了，但是没有在工作中应用上，那会被老大认为这是没有产出的。没有产出就相当于没有干活，没有干活的话就……呃……不说了。

下面就给大家弄些例子，说说在互联网广告这一块的应用吧。

一．对广告主的辅助

1.1基本概念

互联网广告的广告主其实往往有他们的困惑，他们不知道自己的目标人群在哪里。所谓目标人群，就是广告主想向他们投广告的那帮人。就像互联网广告的一个大牛的一句名言——我知道互联网广告有一半是浪费的，问题是我不知道是哪一半。

这个困惑就给媒体带来一个义务——要帮助广告主定向他们的目标人群。

对于普通的广告主来说，比如说一个化妆品广告的广告主，它的目标人群很明显就是年轻的女性。注意关键词“年轻”和“女性”，这是决定媒体这边能否赚到钱的关键词。要知道对于媒体来说，广告主是它们的客户，满足客户的要求，客户就给它们钱，不满足客户的要求，就没有人为媒体买单；没有人为媒体买单，媒体就没有钱养它们的员工和机器，也弄不来新闻和互联网的其他内容，那样媒体公司就垮了……

那么在媒体这边，需要做的的工作就很明确了——满足它们的客户（也就是广告主）的需求。怎么满足呢？这工作说容易也容易，说简单也简单，就是把喜欢这个广告主的广告的人找出来，然后帮这个广告主把他们的广告投放给这些人，让这些人看到这个广告主的广告。

这个工作带来的问题就真多了，媒体又不是什么神人，比如说一个新闻网站，浏览这个网站的每天有100万人，这个新闻网站的员工不可能一个个去访问他们的用户（浏览这个网站的人），整天问他们你喜不喜欢化妆品啊，喜不喜欢体育啊之类的问题。

那怎么办呢？媒体的员工只好猜了，但是哪怕是猜都很费劲，想想都头疼，一百万人啊，一个个猜也得吃力不讨好啊。这时候计算机的作用就来了，用计算机猜嘛，而且不一定需要全部瞎猜的，因为用户如果注册了的话，还有一些用户的个人信息可以参考的。一般的网站注册的时候都要求提供年龄性别之类的个人信息，有时候要要求写一些个人的兴趣什么的标签。这个时候这些数据就用上大用处了。

网站可以把注册用户的个人信息保存下来，然后提供广告主选择。如上面的那个化妆品的广告主，它就可以跟媒体提它的要求——我要向年轻的女性投放广告。媒体这个时候就可以提供一些条件给这个广告主选择，如媒体说我有很多用户，18到80岁的都有，然后男性女性用户都有。广告主就可以根据这些条件选择自己的目标用户，如选择了18到30岁的女性用户作为目标人群。选中了目标人群后，广告主和媒体就可以谈价钱了，谈好了价钱广告主就下单，然后媒体就帮广告主投广告，然后媒体的钱就赚到了。

1.2兴趣挖掘的必要性

上面多次提到的“目标人群”，就是广告主最关心的事情。客户最关心的事情自然也是媒体最关心的事情。所以媒体会尽力帮助它们的客户去定向它们的目标人群。

一般所谓的定向也不是媒体亲自有一个人来跟广告主谈的，是媒体建立好一个页面，这个页面上有一些选项，比如年龄，性别，地域什么的，都是条件。广告主在上面把自己的目标人群符合的条件输入，然后下单购买向这些人投放广告的机会。

媒体为了更好地赚钱，肯定是愿意把这个页面上的条件做得更加丰富一点，让更多的广告主觉得这个网站的用户里面有它们的目标人群，从而让更多的广告主愿意过来下单。

广告主的定向其实有粗细之分的，有些广告主粗放点，它们有钱，选的定向条件比较宽，就说女性的用户，全部都投放；有些就定向得比较窄，比如说，北京的20到25岁的女性，并且要喜欢羽毛球的用户。对于定向宽的广告主好处理，问题就是这些定向窄的广告主，它们还希望知道用户的兴趣所在，这就麻烦了。

为啥麻烦呢？一个用户的兴趣鬼才知道呢。就算当面问，人家也不乐意回答，何况就凭借一点点东西瞎猜。但是为了赚钱，瞎猜也得上的了，工业界为了赚这个钱，诞生了整整一个行业——数据挖掘，甚至在学术界还有一个更加生猛的名字——机器学习。学术界的那个名字和解释都是相当大气的：让机器学会像人一样思考。工业界就务实一点，只是对数据内容本身做一个挖掘，获取到啥呢？一般就是用户的兴趣啊，爱好啊什么的。这些东西供谁使用呢？暂时看来只有广告主愿意为这些掏钱，其他的就有些媒体做来让自己推荐的内容不至于让用户那么反感而已。

上面有个名词“数据”，没错了，这个词是互联网广告业，甚至是数据挖掘行业的核心的东西。所谓数据，这里简单点说就可以认为是用户的年龄、性别、地域等用户的基本属性；复杂点说可以说是用户兴趣、爱好，浏览记录等；更高级的有用户的交易数据（当然这个高级的数据很少媒体能搞得到）等。

解释完“数据”这个词，结合一下广告这个场景，就可以得到活在媒体公司里面的互联网广告行业数据挖掘工程师的工作是什么了。他们的工作就是：根据用户自身的基本属性和用户流量的网页记录以及内容，想方设法让计算机猜出用户的兴趣爱好。用户的兴趣爱好“挖掘”出来后，就可以作为定向条件放到上面说的那个网页上面供广告主选择了。这事情整好了，广告投了有人点击，公司的钱就赚到了；没整好，广告没人点击，广告主不乐意下单了，公司就赚不到钱……怎么着？炒这些工程师的鱿鱼去。

上面可以看到了，辅助广告主定位它们的目标人群是很重要的。

经过一番的探索，word2vec在互联网广告上面也是可以辅助广告主定向他们的目标人群的，下面就讲讲这个算法在互联网广告的应用吧。

1.3利用word2vec给广告主推荐用户

为了用上word2vec，把场景转换到一个新闻媒体如A公司。

在A公司的多个页面中，电商公司B有他们的一个主页，专门介绍他们公司一些产品促销，抢购和发布会什么的。

公司A目前有很多用户的浏览数据，如用户u浏览了公司A的页面a1，a2，a3等。

把这些数据处理一下，整合成word2vec能处理的数据，如下

U1 a1,a2,a3……

U2 a2,a3,a5,……

U3 a1,a3,a6,……

其中u1，u2，u3表示不同的用户，后面的一串表示这些用户的浏览记录，如U1 a1,a2,a3表示用户u1先浏览了页面a1，再浏览a2，然后浏览了a3,……

这些数据还不符合word2vec的输入数据格式，把第一列去掉，变成下面的样子

a1,a2,a3……

a2,a3,a5,……

a1,a3,a6,……

这些数据就可以作为word2vec的输入数据了。

就把这些数据作为word2vec的训练数据，词向量维度为3，进行训练，完成后得到下面的输出

A1 (0.3,-0.5,0.1)

A2 (0.1,0.4,0.2)

A3 (-0.3,0.7,0.8)

……

An (0.7,-0.1,0.3)

就得到了每个页面的向量。

这些向量有啥意义呢？其实单个向量的意义不大，只是用这些向量可以计算一个东西——距离，这个距离是页面之间的距离，如页面a1和a2可以用欧式距离或者cos距离计算公式来计算一个距离，这个距离是有意义的，表示的是两个网页在用户浏览的过程中的相似程度（也可以认为是这两个页面的距离越近，被同一个人浏览的概率越大）。注意这个距离的绝对值本身也是没有意义的，但是这个距离的相对大小是有意义的，意思就是说，假设页面a1跟a2、a3、a4的距离分别是0.3、0.4、0.5，这0.3、0.4、0.5没啥意义，但是相对来说，页面a2与a1的相似程度就要比a3和a4要大。

那么这里就有玄机了，如果页面a1是电商公司B的主页，页面a2、a3、a4与a1的距离在所有页面里面是最小的，其他都比这三个距离要大，那么就可以认为同一个用户u浏览a1的同时，浏览a2、a3、a4的概率也比较大，那么反过来，一个用户经常浏览a2、a3、a4，那么浏览a1的概率是不是也比较大呢？从实验看来可以这么认为的。同时还可以得到一个推论，就是用户可能会喜欢a1这个页面对应的广告主的广告。

这个在实验中实际上也出现过的。这里模拟一个例子吧，如a1是匹克体育用品公司在媒体公司A上的官网，a2是湖人队比赛数据页，a3是热火队的灌水讨论区，a4是小牛队的球员讨论区。这个结果看起来是相当激动人心的。

根据这样的一个结果，就可以在广告主下单的那个页面上增加一个条件——经常浏览的相似页面推荐，功能就是——在广告主过来选条件的时候，可以选择那些经常浏览跟自己主页相似的页面的用户。举个例子就是，当匹克体育用品公司来下单的时候，页面上给它推荐了几个经常浏览页面的粉丝：湖人队比赛数据页，热火队的灌水讨论区，小牛队的球员讨论区。意思是说，目标人群中包括了经常浏览这三个页面的人。

这个功能上线后是获得过很多广告主的好评的。

这样word2vec这个算法在这里就有了第一种用途。

二．对ctr预估模型的帮助

根据另一篇博文《互联网广告综述之点击率系统》，里面需要计算的用户对某广告的ctr。在实际操作的时候，这个事情也是困难重重的，其中有一个冷启动问题很难解决。冷启动问题就是一个广告是新上线的，之前没有任何的历史投放数据，这样的广告由于数据不足，点击率模型经常不怎么凑效。

但是这个问题可以使用同类型广告点击率来缓解，意思就是拿一个同行的广告的各种特征作为这个广告的特征，对这个新广告的点击率进行预估。

同行往往太粗糙，那么怎么办呢？可以就利用跟这个广告主比较相似的广告的点击率来预估一下这个广告的点击率。

上面说过，可以得到每个页面的词向量。这里的方法比较简单，如在媒体公司A上面有1000个广告主，它们的主页分别是a1、a2、……、a1000。

根据上面的方法，得到了这1000个词向量，然后运行kmean或者其他聚类算法，把这1000个广告主聚成100个簇，然后每个簇里面的广告主看成是一个。

这里可以模拟一个例子，聚类完成后，某个簇c里面包含了几个广告主的主页，分别是京东商城，天猫，唯品会，当当，聚美优品，1号店，蘑菇街，卓越，亚马逊，淘宝这10个，这10个的目标人群看起来基本是一致的。

这里的看成是一个簇是有意义的，比如说第一个簇c1，c1这个簇里面的所有历史投放数据和实时数据可以做特征，来预估这个流量对这个簇的ctr。得到这个ctr后，就很有用了，如果某广告投放数据比较充分，就直接预估这个广告的ctr；如果某广告的历史投放数据很少，就用这个广告主所在的簇的ctr来代替这个广告，认为对簇的ctr就是这个广告的ctr，这样能让一个新广告也能得到相对靠谱的预估ctr，保证不至于乱投一番。

三．一些总结

如何应用好一个算法，确实是很多算法工程师的一个重大课题。

数据挖掘算法工程师经常要面对的一个难题就是：这个算法怎么用到我们的数据上面来？有不少同学会认为是：我到了公司，就发明一个很牛逼的算法，把公司的原来的问题解决掉，然后大大增加了效果，获得了领导的好评。这个天真烂漫的想法就不评价了，免得被说打击人。互联网企业里面的真实情况是算法工程师面对那一团乱遭的数据，得想尽办法去把数据整合成能用的格式。

拿上面的（1.3）中的例子，那个把数据组合成a1,a2,a3……这样一行行的，然后进入word2vec去进行训练是最难想到的而且是最核心的东西，虽然明着说是word2vec这个算法厉害，实际上面是“把数据整合成合适的方式交给word2vec进行训练”这个想法重要，因为尝试了很多想法，做了很多实验才能想到这样的一招的。

还有数据的整合其实也费了很多功夫的，比如说媒体有些用户是一些机器的账号，人家乱搞的，要想办法排除掉的，而“想办法排除”这么简单一句话，真正要做的工作真是多多的有。

哪怕结果都训练出来了，怎么解释这个结果是好的？这个问题也是得想了一段时间的，后来是实验发现了利用词向量的距离来评价相似性这个东西最靠谱，然后才用上的。

一个数据挖掘的过程其实不简单，这个博客也没办法一一体现做的过程里面的那些各种折腾，各种不顺畅。

数据挖掘工程师经常要面对的另一个难题就是：明明理论上推得杠杠的，算法性能也是杠杠的，但是对于互联网广告的效果，怎么就那么不咸不淡的呢？

这个问题真没有什么统一的答案，这种现象多了去了。经常遇到的原因有：数据本身处理的方式不对和算法不合适。

所谓数据本身处理的方式，可以参看博文《互联网广告综述之点击率特征工程》，里面说的那些方法不是从哪本书上面看到的，是经过比较长时间实践，然后各种折腾，各种特征取舍，各种胡思乱想，各种坑踩出来的。可能志在学术的人看起来都简单，实际上课本那些东西，学生们吹起牛皮来不眨眼的那些东西，一跟真实应用场景结合起来就各种坑要踩的了。

拿上面的（二）中的例子来看。方法简单得不得了，但是可以想象一下，word2vec牛逼啊，kmeans牛逼啊，第一次聚类出来的结果也不过如此。后来又加入了每个广告主的行业和地域作为特征，而且这个加特征，就是直接把行业和地域处理一下，连接到广告主的词向量后面的。如a1的词向量是(0.3,-0.5,0.1)，然后假设只有两个行业，体育和化妆品，处理成二值特征，占据第4和5两个index，第4个特征为1，第5个特征为0表示体育类广告主，反过来，第4个特征为0，第5个特征为1表示化妆品；再对地域的下标做了一下处理，成为二值特征，比如说占据了6到10这5个位置（假设第6个位置为1，其余7到10为0表示北京；第7个位置为1，其余为0表示广东，以此类推）。

经过了上面的处理，再用kmeans进行聚类，从聚类后一个个簇去看，结果看起来才顺眼了很多。上面的行业和地域特征的加入，也是用了比较多的经验的，不是凭空乱整出来的一个吹牛皮的东西，当然谁有更好的方法，也可以提出来试试看。另外还希望大家注意关键字“一个个簇去看”，这个工作真是费时费力，比较辛苦的。

以上举了一些例子，也把互联网广告的数据挖掘算法工程师的一些工作中的成功和不成功的地方都说出来了，基本上算是实话实说，希望对大家有点帮助吧。有过类似经历的人能看懂，没啥兴趣的就呵呵吧。

致谢

多位同事提供的建议与指导。

多位google研究员有关word2vec的资料。

个人信息保护法实施后，互联网广告的未来在哪里？数字化营销攻略
随着互联网和移动手机的普及，传统纸媒越来越逐步困难，网络已经发展成为十分重要的媒介形式。其中互联网在线广告已经构成现代社会中各大商家和企业主必不可少的广告模式。互联网广告形式主要分为两种：用户主动寻找的搜索广告，比如百度搜索等；还有就是用户被动推送的广告，各大信息流app中插入的广告，比如头条，知乎，抖音等文章和页面中与内容融为一体的信息流广告。2020根据艾瑞咨询数据显示，网络广告市场中信息流广
2021.11.27 科技新闻 | 生活很慢，世界很快【豌豆姑娘整理】豌豆壳外
2021.11.27科技新闻|生活很慢，世界很快【豌豆姑娘整理】5、市场监管总局拟规定：互联网广告不得倒计时结束才能关闭【新榜】1、京东旗下跨境出口电商平台JOYBUY将升级为跨境B2B交易和服务平台【36氪】2、美团：截至三季度末年交易用户数为6.7亿，创历史新高（三季度期内亏损99.9亿元，反垄断处罚所致，上年同期盈利63亿元）【36氪】3、拼多多发布Q3财报：营收环比下降，利润全部投入“百亿
互联网广告怎么做好精准引流五谷丰登登
随着移动网络的蓬勃发展，互联网广告成为各大商家必争之选。而互联网广告的最核心的价值，是流量，这也是它与传统广告行业的最大区别，但是殊途同归，最终目的都是为了获客。获客这个概念比较笼统，不同的商家企业对获客的判定也不一样，大体上来说，是指获得客户。任何一个产品想要生存，都需要不断获客，而获客的来源是流量。在保证流量的基础上尽可能的精准投放，将最有吸引力的广告放到最有需求的人眼前。获客的最终目的是为了
百度电商“历劫”归来 liukuang110 dubbo
随着互联网广告市场的日趋饱和以及竞争的逐渐加剧，互联网企业都开始寻求新的增长点。电商作为获得利润的最佳捷径，就成为了很多互联网企业跨界布局的首选。而国内领先搜索引擎和人工智能技术公司的百度，自然也走上了探索智能时代新零售的道路。只不过，相较于已经拥有了较为成熟电商模式的淘宝、京东、拼多多、抖音等玩家，百度的电商之路则走得十分坎坷。早在2007年，百度就开始尝试发展电商业务，但其陆续上线的几款电商产
大学生做什么兼职副业比较赚钱？分享12个适合学生赚钱的项目氧惠购物达人
互联网创业的热潮依旧，互联网思维对当今中小企业的创业方向产生了巨大影响，如今，网络创业什么项目好呢？像做互联网广告就很不错，当下媒体时代已经从传统到互联网广告，并且商家对于互联网广告的需求也是越来越大的。下面，为你推荐网上创业的好项目有哪些，让你足不出户就可以赚钱。➤推荐使用“氧惠”，邀请码:887766，团队有滑落，佣金真的高，全新模式，你注册我推广，我的直邀会在你的下面，创始团队―裂变快、收益
三十而立，当今如何才能立？ fighterking
时间一晃，2020年马上步入32岁的年龄，老话儿说的“三十而立”仿佛在自己身上显得这么尴尬。本人男，在互联网广告公关行业混迹多年，但...自认为没什么成功感，我所指的成功感大概就是钱没赚到，职位平平，或许和我本身的性格也有关系。从小我是一个性格偏向内向的人，学生时代成绩不错，高中时候也算是班上佼佼者，随后进入大学，读广告学专业，经过几年的大学生活，性格也逐渐开朗起来。不如社会开始工作，选择的是与专
移动app广告变现，对接广告联盟还是选择第三方聚合广告平台？ AdSet聚合广告平台
作为互联网广告的载体，APP天生就比线下传统广告位更具优势，不受地域限制可以辐射到地球上的每一个角落，可以让广告获得更广的覆盖面。通过丰富的广告形式，精准的目标用户画像，也可以更好地实现品牌广告或效果广告的投放目的。AdSet官方资讯-上海神蓍信息科技有限公司接入广告联盟第三方APP（一般称为流量方，区别于第二方平台和第一方广告主），向广告联盟平台请求并曝光广告，并以一定比例和平台进行广告收入分成
干货 | PID算法在广告成本控制领域的应用携程技术广告算法人工智能 python 深度学习
作者简介JasonPei，携程高级算法工程师，对计算广告、推荐系统、NLP等领域有浓厚兴趣。一、背景介绍在商品服务高度发达，信息爆炸的市场经济体制下，企业之间的竞争日益激烈，广告作为一种重要的营销手段，肩负着将企业自身的品牌形象及产品服务准确传达给消费者，促进企业商业利益达成的使命。可以说广告对于企业的生存发展至关重要。随着信息技术的进步，互联网广告由于投放周期短、触达范围广、可精准投放等优点，近
淘宝联盟招商团长规则有哪些? 古楼
淘宝联盟是阿里巴巴旗下的一个广告联盟平台，而招商团长则是淘宝联盟中的一种职业身份。招商团长在淘宝联盟中起到了推广产品和招揽广告主的重要作用。那么，关于淘宝联盟招商团长的规则有哪些呢？下面我将对此进行详细介绍。首先，招商团长需要具备一定的专业知识和技能。在申请成为淘宝联盟招商团长之前，个人需要通过专业的培训和考试来获取相关资质证书。这些培训包括对于互联网广告行业的基本知识、淘宝联盟的政策规定等内容。
详解2020推广获客新业态：智能化、存量之争、流量闭环弹吉他的小姐姐
广告是经济发展的晴雨表，做营销推广的朋友都知道，近几年，广告市场发展尽管非常迅速，但增速也呈放缓趋势。尤其是2020年疫情年，广告行业更是“破屋更遭连夜雨”，更有行内人士称“今年是中国互联网广告最困难的一年”。据TalkingData数据显示，倾向于在2020增加营销推广预算的广告主占比同比下滑7%。其中的意味，不言自明。互联网广告主要分为两大块，一块是品牌广告，一块是效果广告。随着互联网广告行业
新浪爱问自问自答怎么做，新浪爱问售后联系方式河南贝杰文化传媒有限公司
新浪爱问自问自答怎么做，新浪爱问售后联系方式多少?业务咨询找河南贝杰传媒开户快-业务合作咨询【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么新浪爱问自问自答怎么做，新浪爱问售后联系方式多少?新浪爱问做问答营销的
哪家公司能做新浪爱问推广，新浪爱问广告怎么做？河南贝杰文化传媒有限公司
哪家公司能做新浪爱问推广，新浪爱问广告怎么做？可找河南贝杰传媒靠谱，业务咨询QQ：532504880（微信同号）现在是互联网广告时代，新浪爱问问答平台是一个基于搜索的互动式知识问答分享平台，是国内目前三大问答平台之一。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑。那新浪爱问开户费用哪家最便宜？新浪爱问是现在非常受关注的问答营销平台之一，我们在新浪爱问上面能够找到最为专业的知识
网上创业做什么好？在家网上创业挣钱项目有哪些？氧惠好项目
互联网创业的热潮依旧，互联网思维对当今中小企业的创业方向产生了巨大影响，如今，网络创业什么项目好呢？像做互联网广告就很不错，当下媒体时代已经从传统到互联网广告，并且商家对于互联网广告的需求也是越来越大的。下面，为你推荐网上创业的好项目有哪些，让你足不出户就可以赚钱。➤推荐使用“氧惠”，邀请码:521521，团队有滑落，佣金真的高，全新模式，你注册我推广，我的直邀会在你的下面，创始团队―裂变快、收益
产品经理学习之路（9）-盈利模式 anchord
了解盈利模式，纵观行业现象。一、流量变现流量是产生消费的重要因素；1.1、普通广告1.1.1、案例：门户首页（1）banner、浮窗、文字链；（2）点击率低，1%以下；（3）商业广告与非商业广告内容交替出现，以便降低用户对广告位的印象，从而使商业广告获得更多的注意；1.1.2、案例：feed流广告（1）移动互联网广告的点击率高于PC互联网；（2）以banner等形式出现的普通广告一般以展现时间的长
广西新浪爱问代理商,新浪爱问广告怎么做？河南贝杰文化传媒有限公司
广西新浪爱问代理商,新浪爱问广告怎么做？找正规代理商河南贝杰传媒，咨询【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么如何在新浪爱问上做问答?新浪爱问做问答营销的优势有成本低、见效快、排名好、效果直观、信任度高
要透过现象看本质丸子爱吃丸子
我们总是喜欢看着别人时而羡慕别人：“哇！他生活的好好哦哦”等等，总是能看见别人光鲜亮丽的一面。在大学的时候我很羡慕那些能交到真心朋友的人，结果现实却是你的好朋友也有可能在后背捅你一刀的。都说眼睛是心灵的窗户，那我们这扇“窗户”还能相信吗？新媒体互联网广告行业等等，我在没入行的时候觉得听起来特别高大上，等我开始接触广告业的时候我很后悔。每天都有做不完的工作。。。我能退缩吗？不能，既然当初选择了这份工
互联网广告行业发展历程 WitsMakeMen 广告
在20年的历程中，广告主与媒体方持续面对着一些问题，一些核心问题推动了行业的迭代。互联网广告经过了20年左右的高速发展，已愈发成熟，其历程是有趣的。对互联网广告发展的理解，网上的文章并不多，已有的文章从不同角度有些梳理：从媒体平台看：先后有了PC端广告、移动端广告等。从业务场景看：先后有了搜索广告、视频广告、信息流广告等。从交易方式看：先后有了合约广告、程序化广告等。从计费方式看：先后有了CPT、
新浪爱问全国代理招商政策【新浪问答代发/开户】河南贝杰文化传媒有限公司
新浪爱问全国代理招商政策【新浪问答代发/开户】-找河南贝杰传媒才靠谱，咨询【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么如何在新浪爱问上做问答?新浪爱问全国代理招商政策【新浪问答代发/开户】新浪爱问做问答营销
应对广告虚假流量，app广告变现该如何风控？ AdSet聚合广告平台
移动广告市场中的虚假流量一直是困扰各移动应用厂商的难题，广告作为app商业化变现最为直接快捷的途径，也引申出了流量作弊与反作弊的纷争。根据《2021中国异常流量报告》，2021年中国品牌广告市场因异常流量造成的损失约为326亿人民币，其中互联网广告异常流量占比10.1%。分媒体类型来看，垂直媒体和广告联盟均为异常曝光重灾区，广告联盟和门户资讯的异常点击占比远高于其他媒体类型。综合来看，广告联盟异常
海外移动应用广告变现平台——AdMob特点 AdSet聚合广告平台
海外的移动互联网广告平台非常多，比如Admob、FacebookAudienceNetwork、ApplovinMAX、Unity、Vungle、Mopub、Amazon、Pubmatic、Fyber等等。根据《2020全球手游广告买量投放与变现报告》，各国Top收益广告平台（针对游戏产品）：其实总结来说，游戏变现当前主要使用的广告平台包括：Facebook、UnityAds、Admob、AppL
新浪爱问最低多少钱能开户，新浪问答怎么做？河南贝杰文化传媒有限公司
新浪爱问最低多少钱能开户，新浪问答怎么做？咨询河南贝杰传媒靠谱！【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么新浪爱问最低多少钱能开户，新浪问答怎么做？新浪爱问做问答营销的优势有成本低、见效快、排名好、效果直
互联网广告的前世今生 ted程
今年刚刚毕业，有幸进入了互联网产品商业化这个领域，也很荣幸可以接触到到广告变现，成为一名广告人，在这里记录一下自己的所学所思所想。主要是自己从小白慢慢学习的一个过程，同时也和其他的广告人进行探讨学习。程序化广告对营销人、广告人来说都像是一个熟悉的陌生人，熟悉的可能是这是营销人惯用的广告投放方式，但陌生的可能是其演变、形成原因、内在逻辑等的认知都不很深入。我自己也在阅读吴俊撰写的《程序化广告》一书，
看见这些广告，你会点吗木叶生活
现在投放广告都讲究软植入，也就是将广告打得悄无声息，顺其自然，猝不及防。当前正流行的就是电视剧中的软植入。比如剧中两人在喝下午茶，一人随口说：“这饮料还蛮好喝的”，随后就给这饮料logo一个特写镜头。尽管我们知道这是广告，但只要贴合剧情，植入巧妙，观众都是能接受的。总比之前看电视时，突然冒出一句“今年过年不收礼，收礼还收脑白金”没那么让人崩溃。图片发自App说到软植入，其实互联网广告已经在这方面发
重铸买量新格局，AppStare AI优化师博弈存量新时代 liu7322 人工智能
今年可以说是“AI元年”，因为ChatGPT的爆火，大家发现原来AI真的有那么神奇，它真的足够智慧，能够帮助甚至代替人类去做很多事情。而我们也在意识到AI能力的第一时间，就开始思考，如何把AI结合到互联网广告中，让广告投放真正变得智能起来。我们都知道，传统广告投放，有很多重复性高的繁琐工作。很多时候，人的时间并不是花在像确定方向、制定策略这样真正有价值的工作上，而是被花在比如广告搭建、找素材找关键
不花钱买课补课，按照专八的方法学习英语，进步竟如此简单！无标题文章一起学英语吧
互联网广告人，持英语专八证书。从今天起，和大家一起聊聊学英语的那些事儿。*本文分享给那些不参加补习班、不参加网络上各种英语授课、仅仅依靠教材上和学校的一些英语辅导材料而学习英语的孩子们。一直以来就想写这样的一篇分享文章，但因工作+懒的原因迟迟没有动笔。前几天回老家，很多叔叔阿姨都问我：我家你弟弟/妹妹的英语学的不好，你什么时候方便给辅导一下？或者是怎么学英语，你给指导一下？我没参加过英语培训，只能
南阳新浪爱问代理商哪家公司？河南贝杰文化传媒有限公司
南阳新浪爱问代理商哪家公司？找正规代理商河南贝杰传媒，咨询【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么如何在新浪爱问上做问答?新浪爱问做问答营销的优势有成本低、见效快、排名好、效果直观、信任度高、提高知名度
新浪爱问广告业务联系方式，新浪爱问开户咋做？河南贝杰文化传媒有限公司
新浪爱问广告业务联系方式，新浪爱问开户咋做？业务咨询找河南贝杰传媒开户快-业务合作咨询【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么新浪爱问广告业务联系方式，新浪爱问开户咋做？新浪爱问做问答营销的优势有成本低
2022-11-04 Preciousboy
梯屏传媒——电梯投影广告正在产生深远的影响越来越多的消费者不会在电视机面前等待着某个节目的到来，也很少会有时间去看完一整份报纸，消费者在"家外"的时间越来越多。随之而来的就是新媒体对于70后和80后人群正在产生深远的影响，这些新媒体包括电梯广告、影院广告以及互联网广告等。一直以来，受众所接触的广告大都来自电视、平面纸质媒体、户外广告、互联网等一些大众化的传媒,但随着生活节奏的加快，很多上班人士无暇
成长|人要把注意力放到长期的事情上 Unicorn独角兽社区
本文由Unicorn独角兽社区主创成员大庆撰写。01今早在得到学习，听到一段文章：人工智能思想家本吉奥说，“不要让自己的精力过于分散”。如果你总追求当前的想法，就会忘记长期的挑战，人应该把注意力要放到长期的事情上。比如学者要考虑是否发布了足够的论文、要不要申请终身教职，职场人士要考虑职业发展规划。02我认识一个广告公司的老总，这个公司是做国内中长尾客户的互联网广告，属于行业的领头羊，但是这个公司老
新浪爱问知识人最低多少钱一条？河南贝杰文化传媒有限公司
新浪爱问知识人最低多少钱一条？找正规代理商河南贝杰传媒，咨询【电话/微信：13581665528、QQ：532504880】互联网广告时代，新浪爱问问答平台作为一个基于搜索的互动式知识问答分享平台，其权重和流量都是不能小觑的。好的问答营销不仅可以给企业带来正面的品牌宣传，还能够获得良好的口碑，那么如何在新浪爱问上做问答?新浪爱问知识人最低多少钱一条？新浪爱问做问答营销的优势有成本低、见效快、排名好
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

深度学习word2vec笔记之应用篇

深度学习word2vec笔记之应用篇

一．对广告主的辅助

1.1基本概念

1.2兴趣挖掘的必要性

1.3利用word2vec给广告主推荐用户

二． 对ctr预估模型的帮助

三．一些总结

致谢

你可能感兴趣的:(互联网广告)

二．对ctr预估模型的帮助