搜索推荐广告的技术发展

博主在搜索推荐广告这个行业呆了一段时间,对技术方向有了一点自己的发展理解

((本文出自微信公众号:AI爱好者社区))

 

        互联网已经发展了有好久了,国内也有好多公司依靠互联网的发展成为了国内巨头,或者是国际巨头,人们首先就能想到的是阿里、百度和腾讯,也就是IT行业俗称的BAT。这些互联网公司最挣钱的部门之一肯定会是广告部门,作为一名行外人士,能大概知道公司里面就是将这些广告投放到一些渠道去,比如百度的广告部门-凤巢,就是投放在网页上,腾讯的广告部门-广点通,就利用自己的QQ、微信这些工具进行投放广告,阿里的阿里妈妈就利用自己旗下的众多阿里系公司进行广告运作。那么作为一个技术界的行内人士,今天我就给大家从技术方向仔细讲解一下互联网公司的广告部门的一个技术升级换代的4个大的阶段。

        在第一个阶段,也就是广告这个挣钱的方向刚刚出来的时候,也就是国内互联网公司刚刚兴起的那个时候,什么阿里、新浪、搜狐,都是在那个期间兴起的,这些公司刚开始在广告方向就是用到了一些简单的策略进行投放,比如网页版很有代表性质的百度,他们将广告死死的用程序写在网页中,有哪个人看了这个网页,这个人就能看到广告,百度就把钱挣了,如果刚巧他还点进去看了的话,那么百度会赚的更多。

        第一个阶段几乎没有什么技术可言,因为在那个阶段,公司的发展重点不是如何把广告做的更好、如果更好的服务于用户,而是在公司的战略发展上面,和广告的关系仅仅是要不要有而已,所以我不会说太多,在这个阶段。

        在第二个阶段的时候,公司里面就使用到一种叫model的东西,这个东西可以同时考虑到很多种因素,根据每个场景的不同来设计不同的影响因素,比如百度的业务中,就是用户在搜索框里面搜一个字,一个词,一个句子,一万个人就会有一万种排序结果,做到万人万面,不信你可以和身边的人试试,看是不是这样。刚开始的时候是一种比较简单的逻辑回归模型,也就是俗称的lr,这种模型有它的优点,也有它的缺点,优点就是可以通过看模型内部的数据,知道这个模型会把什么因素放在第一位,缺点就是太简单了,往往在数据量比较少的时候,就没办法有很好的效果。

        Lr模型是第二个阶段刚进行时候的开始,再往后发展,也就是2010年大概的时间,一种叫决策树的模型就开始流行了起来,他的预估效果更好,而且也不复杂。决策树模型是一类大的统称,他下面比较流行的几个种类有这样几个,xgboost、gbdt、lightgbm、随机森林,每一种具体的模型都有各自有优势的地方,以致于到现在这些模型依旧在公司里面有使用,比如阿里的ps-smart,就是gbdt的一种变形。随机森林模型,在过拟合效果上比较好,在数据量少的情况下这种模型比较有优势,gbdt利用上次迭代和真实值之间的差值作为新label进行优化,xgbsoot在优化函数上做的很好,lightgbm在内存优化和速度上做的很好,这几种模型现在都在公司里面有实际应用,大概流行到2015年左右。

        接下来就是第三个阶段,第三个阶段流行起来和图像界的发展密不可分。众所周知,图像算法也分成两个阶段,一个是传统人工设计特征、提取的阶段;第二个是利用深度学习,也就是神经网络,各种深层、浅层的网络去自动提取图像里面展现的特征。因为第二个阶段的深度学习,神经网络在图像界流行了起来,所以也就很自然的迁移到了广告业。深度学习具有自动从输入数据(也可以说是特征)进行学习、组合的功能,所以相比较于前面的lr、决策树,深度学习模型对企业算法工程师在特征提取方面的要求就要低一些,尽可能的去设计一些序列特征、id特征就可以了,接下来就是训练模型+调参。

        第四个阶段,实际上是在优化第二、三个阶段,并没有破天荒的提出来什么新的思路的模型,或者方法。而是因为第二、三个阶段有个问题,就是在企业数据量很大的时候,lr也罢,神经网络也罢,训练模型起来都很慢,所以需要一种能够提升训练速度的框架,也就是俗称的分布式框架,分布式框架会同时利用成千上百台linux服务器来训练模型,每台服务器的内存都不是很大,32G足够,训练的时候,可能是讲究数据并行,也可能是讲究参数并行,比较经典的陈天奇和李沐带来的ps-lite,还有腾讯开源的angel平台等。

        之所以会经历这几个阶段,是因为广告投放越来越讲求效率,就是投放的成本和收益之间的一个平衡;也越来越考虑受众用户的一个体验,不能给一个学医学的人去推荐一些it行业的广告,这些显得不合适,也浪费资源。再往下走也会有第五个阶段,这个阶段和第四个阶段一样,并不是一种新的思路的提出,而是在前面的基础上的优化,比如整个广告系统不再需要算法人员去优化,而是机器自己去优化一个效果,达到一个更加智能的地步。

欢迎访问我的博客:https://blog.csdn.net/a1066196847

 

 

 

你可能感兴趣的:(行业经验,AI爱好者社区)