仓库地址:https://github.com/DA-southampton/Tech_Aarticle/edit/master/README.md
建这个仓库的是因为工作之后发现生产环境中应用的模型需要做到速度和效果的平衡,并不是越复杂越好。所以一味的追求新的模型效果不大(并不是不追,也要多看新东西)。学到模型最终是要用,而且要用好,于是就建了这么个仓库,积累一下深度学习模型在各个公司中的应用以及细节,这样在自己工作中可以做到借鉴。主要是罗列一些各大公司分享的文章,涉及到搜索/推荐/自然语言处理(NLP),持续更新...
最近更新文章
因为下面的文章是按照领域划分的,顺序是按照我自己觉得不错的文章在前面,所以担心我最近更新的理解的文章大家看不到,所以单开一个版块,把最近读的文章迭代列出来,保持五篇吧。
最近更新文章 | 简单介绍 | 进度(粗度/精读) |
---|---|---|
精读-Embedding技术在民宿推荐中的应用-原文发表时间201907 | 使用item2vec对app内房源进行embding,然后进行推荐,细节比较多,包括训练细节,数据构造细节等等,推荐看一看,我自己有精读,大家可以对照着看一看 | 精读完成 |
精读-ALBERT在房产领域的实践-原文发表时间202005 | 讲的是贝壳用ALbert做意图分类,和Fasttext相比,提了大概8个点,推理速度耗时20ms | 精读完成 |
部署
在我实际工作中,一般来说部署就是Flask+负载均衡,或者Grpc来提供服务。这个模块积累一下我看到不错的模型部署不错的文章
部署领域相关文章 | 简单介绍 | 进度(粗读/精读) |
---|---|---|
蘑菇街自研服务框架如何提升在线推理效率? | 使用协程解决并发问题,使用FLask提供Restful接口,进行容器化部署 | |
如何解决推荐系统工程难题——深度学习推荐模型线上serving? | 介绍了几种serving方式,值得一看 | |
爱奇艺基于CPU的深度学习推理服务优化实践-201904 | 爱奇艺主要是在算法,应用以及系统三个方面对模型的部署进行优化。系统级主要是针对硬件平台上做的一些性能优化的方法,应用级是跟特定应用相关的分析以及优化的方法,算法级是针对算法的优化,例如模型的裁剪,模型的量化,在四个任务上提升了10倍左右(引自原文) |
搜索:
搜索领域文章 | 简单介绍 | 进度(粗读/精读) |
---|---|---|
Albert在房产领域的应用-202005 | 讲的是贝壳用ALbert做意图分类,和Fasttext相比,提了大概8个点,推理速度耗时20ms | 精读完成 |
DSSM文本匹配模型在苏宁商品语义召回上的应用-201909 | 详细介绍了DSSM模型在苏宁召回的使用,细节很多,居然还点出用的hanlp做的分词(也太细了吧),推荐大家看看 | |
Transformer在美团搜索排序中的实践-202004 | (引用文中原句)本文旨在分享 Transformer 在美团搜索排序上的实践经验。内容会分为以下三个部分:第一部分对 Transformer 进行简单介绍,第二部分会介绍 Transfomer 在美团搜索排序上的应用以及实践经验,最后一部分是总结与展望。希望能对大家有所帮助和启发。 | |
深度学习在文本领域的应用-201808 | 美团的文章,主要是讲了基于深度学习的的文本匹配和排序模型。其中讲了DSSM和变种,引申出来美团自己的ClickNet,基于美团场景进行了优化,大家可以细看一下 | |
基于BERT,神马搜索在线预测性能如何提升?-201908 | 讲了一下在神马搜索中bert的性能优化细节,大致就是使用了知乎的cuBert,然后重写了预测逻辑 | |
阿里文娱搜索算法实践与思考-202006 | (引用文中原句)本文将以优酷为例,分享视频搜索的算法实践,首先介绍优酷搜索的相关业务和搜索算法体系,从搜索相关性和排序算法的特点和挑战到技术实践方案的落地,最后会深入介绍优酷在多模态视频搜索上的探索和实践。 | |
视频搜索太难了!阿里文娱多模态搜索算法实践-202005 | 对比上一个看 | |
XGBoost在携程搜索排序中的应用-201912 | 如题 | |
爱奇艺搜索排序模型迭代之路-201909 | 如题 | |
滴滴搜索系统的深度学习演进之路-201908 | 如题 | |
深度学习在 360 搜索广告 NLP 任务中的应用-201907 | 本文作者比对了DSSM 和 ESIM 以及Bert三种模型,介绍了三种模型在实际工作中的应用细节 | |
小米移动搜索中的 AI 技术-201906 | 大概讲了一下搜索中用的技术,比如文本相似度-dssm,具体的看文章吧 | |
深度学习在搜索业务中的探索与实践-美团-201901 | (引用文中原句)本文会首先介绍一下酒店搜索的业务特点,作为O2O搜索的一种,酒店搜索和传统的搜索排序相比存在很大的不同。第二部分介绍深度学习在酒店搜索NLP中的应用。第三部分会介绍深度排序模型在酒店搜索的演进路线,因为酒店业务的特点和历史原因,美团酒店搜索的模型演进路线可能跟大部分公司都不太一样。最后一部分是总结。 | |
深度学习在搜狗无线搜索广告中的应用-201803 | (引用文中原句)本次分享主要介绍深度学习在搜狗无线搜索广告中有哪些应用场景,以及分享了我们的一些成果,重点讲解了如何实现基于多模型融合的CTR预估,以及模型效果如何评估,最后和大家探讨DL、CTR 预估的特点及未来的一些方向。 | |
百度中文纠错技术 | 主要讲了中文纠错技术,接下来会重点精读中文纠错方面的。 | |
达观数据搜索引擎的Query自动纠错技术和架构详解 | ||
搜索中的 Query 理解及应用 | ||
搜索中的Query扩展技术 | ||
京东电商搜索中的语义检索与商品排序 | ||
搜索相关性算法在 DiDi Food 中的探索 | ||
滴滴搜索系统的深度学习演进之路 | ||
说一说视频搜索 |
推荐:
推荐领域文章 | 简单介绍 | 进度(粗度/精读) |
---|---|---|
Embedding 技术在民宿推荐中的应用-201907 | 使用item2vec对app内房源进行embding,然后进行推荐,细节比较多,包括训练细节,数据构造细节等等,推荐看一看,我自己有精读,大家可以对照着看一看 | 精读完成 |
双 DNN 排序模型:在线知识蒸馏在爱奇艺推荐的实践-202002 | 还没看。。但是看文章写得效果很厉害,“其中,在爱奇艺短视频场景时长指标 +6.5%,点击率指标 +2.3%;图文推荐场景时长指标 +4.5%,点击率指标 +14% ”(引用自原文) | |
美团BERT的探索和实践-201911 | Bert在美团场景中的改进和优化,很厉害,细节很多 | |
wide&deep 在贝壳推荐场景的实践-201912 | 如题,看了之后感觉还不错, | |
贝壳找房的深度学习模型迭代及算法优化-201910 | (引用文中原句)第一阶段:建立初版模型系统,采用 XGBoost 模型,完成项目从 0 到 1 的过程; 第二阶段:深度学习模型,采用 DNN+RNN 混合模型; 第三阶段:效果持续优化,也是业务需要。 | |
千人千面营销系统在携程金融支付的实践 | (引自原文)支付中心数据组开发的一套用户精准营销系统 | |
爱奇艺个性化推荐排序实践-201907 | 还没看 | |
强化学习在携程酒店推荐排序中的应用探索 | (引用原文)我们尝试在城市欢迎度排序场景中引入了强化学习。通过实验发现,增加强化学习后,能够在一定程度上提高排序的质量。 | |
搜狗信息流推荐算法实践-201904 | 还没看。。。 | |
深度学习在美团点评推荐业务中实践-201901 | (引用文中原句)在推荐平台的构建过程中,多策略选品和排序是两个非常重要的部分,本文接下来主要介绍深度学习相关的推荐算法,主要包括 DSSM、Session Based RNN 推荐召回模型与 Wide Deep Learning 的排序模型,我们会介绍深度学习模型在推荐业务应用及实现的相关细节,包括模型原理、线上效果、实践经验及思考。 | |
美团“猜你喜欢”深度学习排序模型实践-201803 | (引用文中原句)目前,深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学习的应用提供了必要的条件。本文将主要介绍深度学习模型在美团平台推荐排序场景下的应用和探索。 | |
优酷视频基于用户兴趣个性化推荐的挑战和实践-201802 | 简单介绍:(引用文中原句)本文将介绍一下优酷个性化搜索推荐的服务,优酷在视频个性化搜索推荐里用户兴趣个性化表达碰到的挑战和问题,当前工业界常用的方法,以及我们针对这些问题的尝试。 | |
深度学习在58同城智能推荐系统中的应用实践-201802 | ||
携程个性化推荐算法实践-201801 | ||
深度学习在美团点评推荐平台排序中的运用-201707 | ||
Embedding技术在房产推荐中的应用 | ||
智能推荐算法在直播场景中的应用--花椒推荐系统 |
多模态:
多模态相关文章 | 简单介绍 | 进度(粗读/精读) |
---|---|---|
爱奇艺短视频分类技术解析 | 全文重点在三个,一个是爱奇艺视频分类体系,一个是层次表示模块,一个是特征模块,介绍的比较详细,需要精读一下 | |
爱奇艺短视频质量评估模型 | 介绍封面文本视频内容质量评分,大概读一下就可以 | |
阿里文娱多模态视频分类算法中的特征改进 | 主要介绍类目体系构建介绍,模型特征调优,模型调优,值得精读一下 | |
爱奇艺短视频软色情识别技术解析 | 很细致,看一下 | |
优酷在多模态内容理解上的研究及应用 | 主要是一些多模态概念的讲解,干货不多,大概看一下就可以 | |
多模态商品分类解决方案-深度学习在真实NAVER购物网站的应用 | 细节点比较多,偏实战,精读一下 | |
FashionBERT 电商领域多模态研究:如何做图文拟合? | ||
阿里文娱搜索算法实践与思考 | ||
NLP 技术在微博 feed 流中的应用 | ||
5G 时代下:多模态理解做不到位注定要掉队 | ||
短视频数据补充1补充2 | ||
UC信息流视频标签识别技术 | ||
技术动态-多模态学习调研 (附完整PPT) | ||
多模态情感分析简述 |
NLP其他领域:
NLP 其他领域文章 | 简单介绍 | 进度(粗读/精读) |
---|---|---|
语义匹配在贝壳找房智能客服中的应用-202005 | 还没看 | |
百度语义解析 ( Text-to-SQL ) 技术研究及应用 | ||
丁香园在语义匹配任务上的探索与实践 | ||
大规模预训练模型在阿里机器翻译中的应用 | ||
情感分析算法在阿里小蜜的应用实践 | ||
AI技术如何打造58同城智能客服商家版“微聊管家” | ||
58同城智能客服技术解密 | ||
深度文本表征与深度文本聚类在小样本场景中的探索与实践 |
2020303
搜素
搜索中的 Query 理解及应用https://mp.weixin.qq.com/s/rZMtsbMuyGwcy2KU7mzZhQ
搜索中的Query扩展技术https://mp.weixin.qq.com/s/WRVwKaWvY-j-bkjxCprckQ
京东电商搜索中的语义检索与商品排序https://mp.weixin.qq.com/s/4UBehc0eikVqcsFP7xL_Zw
机器学习在高德搜索建议中的应用优化实践https://mp.weixin.qq.com/s/D3qxlzZgwnMprzEVuMpmgg
再谈搜索中的Query扩展技术https://mp.weixin.qq.com/s/q4aPtUYi27h-0sqD4bokQQ
搜索query意图识别的演进-微信AIhttps://mp.weixin.qq.com/s/0Hh_iV8tNFd0eEpXSxy9nA
阿里文娱深度语义搜索相关性探索https://mp.weixin.qq.com/s/1aNd3dxwjCKUJACSq1uF-Q
阿里文娱算法公开课#04:算法工程师的核心技能-搜索推荐篇https://mp.weixin.qq.com/s/vgrWwSZLbl5svAcrxNuJpg
图谱
百度事件图谱技术与应用https://mp.weixin.qq.com/s/A3uqaQcJz0UHpdgKggi_9w
知识图谱在小米的应用与探索https://mp.weixin.qq.com/s/GbZK9U-ePx3zyUjnw8vvUA
视频
阿里文娱多模态视频分类算法中的特征改进https://mp.weixin.qq.com/s/6kTb6r3Vj3mgQn90UsZ1nw
美团本地生活场景的短视频分析https://mp.weixin.qq.com/s/UyMDskA0eGN-NmiifwQF6Q
爱奇艺视频精彩度分析https://mp.weixin.qq.com/s/hDqyItDxBfJ652BI0OT4dA
推荐
美图个性化推送的 AI 探索之路https://mp.weixin.qq.com/s/HRGk5bfaOdj-6X4opEYA-w
深度召回在招聘推荐中的挑战和实践https://mp.weixin.qq.com/s/mcETNOICbabRRq9BBdL4zw
推荐系统 Embedding 技术实践总结https://mp.weixin.qq.com/s/7DXVrJUU-PvKiQnipJKVtw
网易严选画像建设实践https://mp.weixin.qq.com/s/pmovTV3TIoB6oA60pL_zeg
网易大数据用户画像实践https://mp.weixin.qq.com/s/jyiDWiK0zczEaZKY5Hy5xg
阅文用户画像https://mp.weixin.qq.com/s/ddRjNDBVuY03nQSGLncjtg
信息流推荐的用户增长机制https://mp.weixin.qq.com/s/hjeS_nEsvxu0D_Bj2vJe7w
Attention机制在深度学习推荐算法中的应用https://mp.weixin.qq.com/s/1LYyiDJBDKVgNjc7a1Qc4A
"全能选手"召回表征算法实践--网易严选https://mp.weixin.qq.com/s/s4tNPWQrisYIiMuNUzEtNQ
360展示广告智能化演进https://mp.weixin.qq.com/s/b7aD7yU1Ok8NZOvr3VaC2g
深度学习在商业排序的应用实践-58同城https://mp.weixin.qq.com/s/2SRGdFZ9RVl4ljBh5MIUqQ
旅行场景下的个性化营销平台揭秘https://mp.weixin.qq.com/s/RCtjaX3y7xa8co3GwBi2Lg
阿里飞猪个性化推荐:召回篇https://mp.weixin.qq.com/s/323D5MFivtrmo3ISwQbpYg
因果推断在阿里文娱用户增长中的应用https://mp.weixin.qq.com/s/oZTU7TAEf-gYzlSXdt0_BA
网易云音乐推荐中的用户行为序列深度建模https://mp.weixin.qq.com/s/Whf0rmuVapzZAB33TUj1Ig
智能推荐算法在花椒直播中的应用https://mp.weixin.qq.com/s/ec88cMR4K6pWyHhJs7FEFQ
58同镇下沉市场中的推荐技术实践https://mp.weixin.qq.com/s/j6FWqkdbOdQk-qAmYNmJqQ
汽车之家推荐系统排序算法迭代之路-视频https://mp.weixin.qq.com/s/3wAR3evFAeKfsCYJ6WLTHQ
要提升微信看一看推荐混排的长期收益?试试深度强化学习https://mp.weixin.qq.com/s/zfVrmErz3ZaGz7Ha7qGoIw
信息流推荐在凤凰新闻的业务实践https://mp.weixin.qq.com/s/aCTP4OCGyWxWGrlCFHSYJQ
阿里文娱算法公开课#01:算法工程师的进阶之路(校招篇)https://mp.weixin.qq.com/s/Sc-3ktfKrRN9pwIZsibXJw
知识图谱辅助的个性化推荐系统https://mp.weixin.qq.com/s/VqmxV_JJN61QgESQDPi93Q
广告算法在阿里文娱用户增长中的实践https://mp.weixin.qq.com/s/NVQPv5ua9kxw1MK8UVQcuQ
向量体系(Embedding)在严选的落地实践https://mp.weixin.qq.com/s/NJDfrGJgIE2KK_t-yJ-C9Q
NLP
腾讯信息流内容理解技术实践https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247495622&idx=1&sn=3d229e34dfe061b61bb47b4677def6a0&chksm=fbd75daacca0d4bc83d02b78b7d7c8485521eba07a03553db52ba039f3d948835f3d750a301e&scene=21#wechat_redirect
微信"看一看"内容理解与推荐https://mp.weixin.qq.com/s/vr9bKEXI5o6L3FYig4HgNA
优酷视频元素内容召回系统:多级多模态引擎探索 | 禅与文科生实用技术https://mp.weixin.qq.com/s/MTi_fzCA_wUR640CwWeLMg
网易严选nlp-预训练语言模型的应用https://mp.weixin.qq.com/s/hUbMbmEtLB7L0_H4DGc8Ew
深度学习在网易严选智能客服中的应用https://mp.weixin.qq.com/s/SPtNy_1_6fiFXKukMmVPlA
严选智能客服业务知识库自动挖掘方案https://mp.weixin.qq.com/s/AyaDkbKYhdRbc-uvFHNv4w
文本增强技术的研究进展及应用实践https://mp.weixin.qq.com/s/CHSDi2LpDOLMjWOLXlvSAg
通用的图像-文本语言表征学习:多模态预训练模型 UNITERhttps://mp.weixin.qq.com/s/GxQ27vY5naaAXtp_ZTV0ZA
NLP 中的实体关系抽取方法总结https://mp.weixin.qq.com/s/gbGZDbi7XcExgHcUqiI94w
NLP技术在金融资管领域的落地实践-视频https://mp.weixin.qq.com/s/tQou1whJrvMY8iGxBB3_TQ
情感分析在阿里小蜜中的应用https://mp.weixin.qq.com/s/k-gS6k3-hy-ZI_r901IGvg
任务式对话中的自然语言理解https://mp.weixin.qq.com/s/z06l-s3RUomxlhANz8SfUg
腾讯信息流热点挖掘技术实践https://mp.weixin.qq.com/s/keSYVCS0k3rvngGvcsJKbA
医疗健康领域的短文本理解-丁香园https://mp.weixin.qq.com/s/CNBP5xSvr4Y3Xm1-NMS79g
Seq2seq框架下的文本生成-丁香园https://mp.weixin.qq.com/s/NAPIUtTD7ZEAIEgoJeQM4A
基于BERT的ASR纠错https://mp.weixin.qq.com/s/JyXN9eukS-5XKvcJORTobg
跨域推荐技术在58部落内容社区的实践https://mp.weixin.qq.com/s/YylA34cBEshzb9sFY0gklw
NLPCC:预训练在小米的推理优化落地https://mp.weixin.qq.com/s/itOyETgKBoRHOrIfKuphrw
爱奇艺深度语义表示学习的探索与实践https://mp.weixin.qq.com/s/f524bPx0pq7qxXGjpa7WCQ
百度语义解析 ( Text-to-SQL ) 技术研究及应用https://mp.weixin.qq.com/s/2ub1qbLF7cRGE_E0TsSB4g
大规模预训练模型在阿里机器翻译中的应用https://mp.weixin.qq.com/s/phPU0SDcTQ6l1fnZi2Hy-Q
热点挖掘技术在微信看一看中的应用https://mp.weixin.qq.com/s/oMNy-g2DxUnsGErefQBkyg
诸葛越:关于算法工程师职业发展的思考https://mp.weixin.qq.com/s/mV-oXdWRe3Jcs9OJnXbEbw