架构、搜索、推荐、广告系统优质资源整理
AI架构、搜索系统、 推荐系统、广告系统等技术资料整理。这篇文章意图是收集市面上质量不错的后端架构、AI架构、搜索、 推荐、 广告引擎技术资料,内容来源包括开源项目官网(Lucene、Solr、Elastic)、综合技术网站(AIQ 、infoQ、Stackoverflow、github 等、国内外知名互联网公司技术博客(阿里中间件团队博客、美团技术博客等)、知名技术牛人公众号博客等。
点击打开Github地址,欢迎Star
个人视角有限,还望各位大佬进行PR补充、丰富,谢谢。
开源相关
Lucene
- Lucene 官网
- Lucene 7.6.0源码
- Lucene Wiki
### Solr
- Solr 官网
### Elastic
- Elastic 官网
- Elastic Blog
- Elastic Formus
- Elasticsearch: 权威指南 - 中文版
### LucidWorks
- LucidWorks
### 中文分词
- ansj 分词
- HanLP 分词
- ES-Analysis-IK
大公司
阿里
天猫推荐算法团队的那些事儿 - 20140401 - infoQ
_本文以访谈的方式呈现,对搜索和推荐算法进行了简单的比较,提到了 AB 测试和离线测试,主要对推荐算法团队的工作方式、工作考评、任务分配、招聘等进行了介绍。_
天猫 11.11:搜索引擎实时秒级更新 - 20141111 - infoQ
_文章简单介绍了阿里搜索引擎架构,提到了以下内容:1)为提高数据实时性(库存、价格等),去掉应用层和业务层的缓存,重点提升引擎层的服务能力。2)排序链,根据业务场景定制排序链。3)sku 搜索,搜索结果和属性导航联动(标类产品)。_
- 阿里搜索离线技术团队负责人谈 Hadoop:阿里离线平台、YARN 和 iStream
- 基于 Apache Flink 的实时计算引擎 Blink 在阿里搜索中的应用 - 20170216 - infoQ
- 阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景 - 20181128 - AIQ
- 阿里巴巴搜索引擎平台 Ha3 揭秘 - 201811 - AIQ
阿里搜索事业部技术团队
阿里集团搜索、推荐、图像技术的大本营,大数据时代的创新主场。
阿里中间件团队博客
2012 年期间,阿里中间件博客记录了 20 多篇 Lucene、Solr 相关博文,主要记录了一些在项目开发过程中遇到的问题,以及部分源码解读。内容丰富、实用,但不是很系统。
- 阿里中间件团队博客
- Solr 调优参考 - 20120521
- Solr Lucene 优劣势分析 - 20120626
- SolrQuery 性能压测参考 - 20120731
- NumericField NumericRangeQuery 原理分析 - 20120731
- Solr schema 编写指导 - 20120731
- 关于搜索挖掘所想 - 20120731
- SolrQuery 挖掘 -- 单维度聚合分析 - 20120920
- 我感受到的排序机制参考 - 20120920
- 垂直搜索新问题 - 20120920
- Solr 平台化搜索实战必知场景 - 20120921
- Solr Schema 配置小细节大问题 - 20121015
- Solr DisjunctionMax 注解 - 20121015
- Sql Support within Solr- 类 Sql 的 solr 搜索实现 (1) - 20121015
- Sql Support within Solr- 类 Sql 的 solr 搜索实现 (2) - 20121015
- 关于 TrieField 的全面认识、理解、运用 - 20121015
- Solr Facet 引发思考 on the road - 20121029
- 查询问题 ---queryparse 深入理解 - 20121029
- TermRangeQuery 源码解析 - 20121106
- Solr 之缓存篇 - 20121106
- 搜索的测试话题 - 20121113
- 关于搜索夜话 ---- 作为阶段序列的告别 - 20121113
- solr 长文本搜索问题 - 20121210
- SolrCore2.9.1 源码分析备忘 - 20121210
百度
京东
- 京东 618:揭秘大促销背后的个性化推荐 - 20150618 - infoQ
- 京东 11.11:商品搜索系统架构设计 - 20151111 - infoQ
- 京东 618:机器学习与商品数据挖掘和知识抽取 - 20170618 - infoQ
美团点评
美团点评技术团队博客
在国内互联网公司中,个人认为“美团点评技术团队博客”是最持之以恒的,而且非常干货。
- 美团点评技术团队
- 美团 O2O 排序解决方案——线下篇 - 20151207
- 美团O2O排序解决方案——线上篇 - 2015-11-16 17:00
- 美团点评旅游搜索召回策略的演进 - 20170616 - AIQ
携程
去哪儿
搜狗
- 搜狗搜索广告检索系统 - 弹性架构演进之路 - 20160111 - infoQ
- 深度学习在搜狗无线搜索广告中的应用 - 20160808 - infoQ
- 以搜狗为例,谈语音输入如何影响你的生活 - 20161208 - infoQ
一号店
- 1 号店 11.11:分布式搜索引擎的架构实践 - 20151112 - infoQ
- 1 号店 11.11:机器排序学习在电商搜索中的实战 - 20161111 - AIQ
- 机器学习在 1 号店商品匹配中的实践 - 20170506 - 携程技术中心
待分类
国内
- 当当 11.11:促销系统与交易系统的重构实践 - 20151113 - infoQ
- 苏宁易购 11.11:商品详情系统架构设计 - 20151227 - infoQ
- 达观数据 点击模型:提升算法精度的利器 - 20160315 - infoQ
- 达观数据 一个可供参考的搜索引擎排序架构实践案例 - 20160830 - infoQ
- 达观数据 "搜你所想" 之用户搜索意图识别 - 20170608 - AIQ
- 链家网 数据驱动在搜索优化与推荐策略中的实践 - 20170406 - infoQ
- 深度学习在 Airbnb 大规模搜索排名上的实战经验 - 20181118 - AIQ
- 51 信用卡的个性化推荐体系 - 2018 - AIQ
- 苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用 - 20181105 - AIQ
国外 - Twitter 实时检索 6700 亿条推文,细谈 Twitter 搜索引擎的演进历程 - 20160330 - infoQ
- Yelp 是如何用数据驱动搜索过滤器的? - 20151209 - infoQ
开发应用
理论基础
源码解读
- 刘超觉先 详细分析了 Lucene3.x 的源码,推荐。
- Anatomy of an Elasticsearch Cluster: Part I
- Anatomy of an Elasticsearch Cluster: Part II
- Anatomy of an Elasticsearch Cluster: Part III
常见问题
其他
- 对话 Kibana 之父:如果需要,你应该自己动手编写工具 - 20170111 - infoQ
- 配置高性能 Elasticsearch 集群的 9 个小贴士 - 20170104 - infoQ
- 基于 ElasticStack 的数据探索与分析 - 20161018 - infoQ
- 使用 Akka、Kafka 和 ElasticSearch 等构建分析引擎 - 20160825 - infoQ
- 万亿级日志与行为数据存储查询技术剖析 - 20170222 - infoQ
- 谷歌的自然语言部门是啥样的? - 20160118 - infoQ
- 通过 Baratine 将 Lucene 库暴露为微服务 - 20160225 - infoQ
-
- *
人工智能领域文集
- 基于内容和上下文的音乐推荐
- 滴滴 ElasticSearch 千万级 TPS 写入性能翻倍技术剖析
- ES 在十几亿的数量级下如何提升查询效率?
- 汽车之家电商平台秒杀系统架构实现
- 网站日志实时分析之 Flink 处理实时热门和 PVUV 统计
- 第三十九期人工智能深度学习 DeepLearning----Tensorflow 核心技术实战培训班
- 电商知识图谱
- 预训练语言模型在网易严选的应用
- 基于机器学习的文本分类!
- 搭建企业级 AB/Testing 平台实践
- PB 级大规模 Elasticsearch 集群运维与调优实践
- 微博基于 Flink 的机器学习实践
- 什么时候值得去使用上下文嵌入 (Embedding)?
- 深入互联网广告中的出价模式(补充篇)
- 深入互联网广告中的出价模式 (上中下完整版)
- 用户画像方法论与工程化解决方案
- 微信 "看一看" 内容理解与推荐
- 58 同城 | 多业务融合推荐策略实践与思考
- 文字识别在高德地图数据生产中的演进
- 基于 Apache Flink 的爱奇艺实时计算平台建设实践
- 58 技术 | 金融数仓体系建设
- 美团搜索中 NER 技术的探索与实践
- 如何快速入门大数据
- 机器学习中算法与模型的区别
- 详文解读微信「看一看」多模型内容策略与召回
- 滴滴司机调度系统实践
- 美团点评 | 智能搜索模型预估框架的建设与实践
- 吴恩达老师的作业问题关于 SVM 向量机采用核函数计算出结果怎样才能用
- 基于 BERT 的 ASR 纠错
- 有赞 ABTest 系统:数据驱动增长实践
- 救火必备!问题排查与系统优化手册
- 淘系技术 | 极简而高效的沟通管理法
- 数据智能在二手车业务场景中的探索与沉淀 - 业务标签挖掘
- 所有机器学习项目都适用的检查清单
- 【特征工程】时序特征挖掘的奇技淫巧
- 平安寿险 AI 团队 | 文本纠错技术探索和实践
- 微信「看一看」 推荐排序技术揭秘
- TensorFlow 中最大的 30 个机器学习数据集
- BERT 在美团搜索核心排序的探索和实践
- 医疗搜索中的 query 词权重算法探索
- 优酷视频元素内容召回系统:多级多模态引擎探索
- 【布道师系列】周晓凌——乘风而来,利用数据科学平台解决运筹学问题
- 如何用 OKR 促进跨团队协同
- 【综述】基于知识图谱的推荐系统综述
- 一文总结词向量的计算、评估与优化
- 深入浅出词嵌入技术
- [[详解] 一文读懂 BERT 模型](http://www.6aiq.com/article/1...
- Elasticsearch 遇上 BERT:使用 Elasticsearch 和 BERT 构建搜索引擎
- 机器学习数学基础:常见分布与假设检验
- 细粒度实体分类论文综述:(二)
- 命名实体识别 NER 论文综述(一)
- 图文并茂带你了解依存句法分析
- 机器学习模型评估与超参数调优详解
- MRR vs MAP vs NDCG:具有排序意义的度量指标的可视化解释及使用场景分析
- 干货 | 查询耗时降低 2/3,携程度假搜索引擎架构优化
- NLP 模型的产品化
- 汽车之家机器学习平台的架构与实践
- 推荐系统 embedding 技术实践总结
- IDC 再评中国机器学习开发平台市场,九章云极位列三甲!
- 准确率、精准率、召回率、F1,我们真了解这些评价指标的意义吗?
- 主流推荐引擎技术及优缺点分析
- 塔勒布《反脆弱》读后感
- 趣头条基于 Flink+ClickHouse 的实时数据分析平台
- 58 同城 | 深度召回在招聘推荐系统中的挑战和实践
- 异常检测
- 拼多多创始人黄峥:我的人生经历和创业理念
- 算法工程师如何应对业务方和老板的灵魂拷问?
- 程序员精进之路:性能调优利器 -- 火焰图
- 深度学习在高德 POI 鲜活度提升中的演进
- 关键短语抽取及使用 BERT-CRF 的技术实践
- 内容理解在新浪微博广告中的应用
- 医疗健康领域的短文本解析探索(三 ) ---- 文本纠错
- 医疗健康领域的短文本解析探索(二)
- 医疗健康领域的短文本解析探索(一)
- 谈谈医疗健康领域的 Phrase Mining
- 58 同城 | Embedding 技术在房产推荐中的应用
- 来阿里 6 年,我是如何快速成长的?
- 微众银行在联邦推荐算法上的探索及应用
- 腾讯万亿级 Elasticsearch 内存效率提升技术解密
- 五年磨一剑:滴滴顺风车服务端之稳定性规范
- 深入理解推荐系统:排序
- 深入理解 YouTube 推荐系统算法
- 京东电商搜索中的语义检索与商品排序
- 滴滴数据驱动利器之 AB/Test 实践
- 美团配送 A/B 评估体系建设与实践
- 谈一谈NLP中语言模型的发展
- 见微知著,你真的搞懂 Google 的 Wide&Deep 模型了吗?
- 用户画像技术及方法论
- 【布道师系列】杨健——30 天到 3 分钟的改变!下篇
- 为什么 L2 正则化能够缓解模型过拟合并使得模型更简单
- 知识蒸馏在推荐系统的应用
- Embedding 技术在推荐系统中的实践总结
- xDeepFM 算法理论与实践
- Wide&Deep 算法理论与实践
- 推荐系统系列(二):FFM 算法理论与实践
- 推荐系统系列(一):FM 算法 理论与实践
- 深度学习推荐系统中各类流行的 Embedding 方法(下)
- 【深度语义匹配模型】实践篇:语义匹配在贝壳找房智能客服中的应用
- 请问深度学习里面生成式模型验证常用的一个数据集来源(有图)
- 算法工程师必知必会的经典模型系列一:Transformer 模型串讲
- 基于多任务学习和负反馈的深度召回模型
- 算法工程师也会遇到 35 岁这道坎么?
- 图解 SimCLR 框架,用对比学习得到一个好的视觉预训练模型
- 从算法工程师到主管的转变,需要改变的是什么
- NLP 技术在金融资管领域的落地实践
- BERT 的优秀变体:ALBERT 论文图解介绍
- 贝壳找房【深度语义匹配模型】原理篇二:交互篇
- 推荐系统中稀疏特征 Embedding 的优化表示方法
- Netflix:使用 A/B 测试来找到最佳的插图
- 搜索相关性算法在 DiDi Food 中的探索
- 菜鸟实时数仓技术架构演进
- Netflix 中的插图个性化推荐
- 推荐系统中不得不说的 DSSM 双塔模型
- 贝壳找房【深度语义匹配模型 】原理篇一:表示型
- 使用嵌入来做个性化的搜索推荐:来自 Airbnb
- 干货 | 业界实时数据体系架构
- 字节跳动—实习算法面经
- 深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用
- 深度学习推荐系统中各类流行的 Embedding 方法(上)
- 我的 ElasticSearch 认证工程师之路
- 机器学习工程化模型部署的几种方式总结
- 透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等
- 字节游戏急招数据挖掘工程师 - 帖子
- 字节游戏急招数据挖掘工程师
- 究竟什么是图数据库,它有哪些应用场景?
- 基于强化学习的 Contextual Bandits 算法在推荐场景中的应用
- 超强整理,非科班硕士的算法面经 (阿里 腾讯 字节 美团)
- 贝壳找房【语言模型系列】实践篇:ALBERT 在房产领域的实践
- 一文详尽之 SVM 支持向量机算法!
- 搜索中的 Query 理解及应用
- 汽车之家如何构建用户画像
- 搜索中的 Query 扩展技术
- 各大 AI 研究院共 35 场 NLP 算法岗面经
- 详解图表示学习经典算法 node2vec
- 搜索引擎背后的经典数据结构和算法
- 搜索系统中的意图识别
- 推荐系统的未来发展趋势
- 实验室小师弟的新鲜春招算法面经 (阿里搜索,微信,微软等)
- 字节跳动混沌工程实践总结
- SHAP 值的解释,以一种你期望的方式解释给你听
- 黑盒模型实际上比逻辑回归更具可解释性
- 浅谈搜索系统中 Query 理解和分析
- 干货! 搜索系统中的深度匹配模型
- 干货! 推荐系统中的深度匹配模型
- 线下 auc 涨,线上 ctr/cpm 跌的原因和解决办法
- CS224w L11. LinkAnalysis_PageRank 算法
- 模型剪枝技术原理及其发展现状和展望
- 大规模特征向量检索算法总结 (LSH PQ HNSW)
- 贝壳找房—置信度计算在语音识别系统中的应用
- 产品经理,项目经理和技术经理是如何一起协作管理的?
- Lucene 源码系列——索引文件的生成(十二)之 dim&&dii
- 2020 最新版《神经网络与深度学习》中文版更新完毕!(附 pdf 下载)
- 阿里文娱优酷视频搜索算法应用实践与思考
- 贝壳找房【语言模型系列】原理篇二:从 ELMo 到 ALBERT
- “疫情”黑天鹅,让企业管理数字化转型迫在眉睫
- 算法工程师常见面试问题及相关资料汇总
- 用 TensorFlow Extended 实现可扩展、快速且高效的 BERT 部署
- 干货 | 内容型产品 Feed 流的生成、效果评估及优化
- 机器学习中的隐私保护
- 一个关于项目管理者与程序猿之间的笑话
- PTMs:史上最全面总结 NLP 预训练模型
- Apache Flink OLAP 引擎性能优化及应用
- 企业如何选择适合自己的项目管理软件?
- 贝壳找房—【图数据库系列】Dgraph 原理篇
- 贝壳找房—【图数据库系列】Dgraph 简介篇
- 贝壳找房—【图数据库系列】之 JanusGraph VS Dgraph:贝壳分布式图数据库技术选型之路
- 阿里—飞猪的“猜你喜欢”如何排序?
- 你所不知道的,华为项目管理之道!
- 智变·未来——九章云极 COOL NEWS 发布会
- 6 个你应该用用看的用于文本分类的最新开源预训练模型
- 阿里广告 CTR 预估中用户行为学习和记忆建模
- 贝壳找房【语言模型系列】原理篇一:从 one-hot 到 Word2vec
- 个性化搜索的介绍,推荐和搜索的强强结合
- Lucene 源码系列——pos pay 索引文件
- Lucene 源码系列——tim tip 索引文件
- Lucene 源码系列——fdx fdt 索引文件
- Lucene 源码系列——tvx tvd 索引文件
- Lucene 源码系列——默认 merge 策略 TieredMergePolicy
- Lucene 源码系列—— LogMergePolicy
- Lucene 源码系列——工具类 FixedBitSet
- Lucene 源码系列——Automaton 有穷自动机 (DFA)
- Lucene 源码分析——BKD-Tree
- Lucene 源码系列——查询原理(下)
- Lucene 源码系列——查询原理(上)
- i 技术会 | 爱奇艺效果广告探索与实践
- Lucene 源码系列—— Collector 收集各个 Segment 命中的 docs
- Lucene 源码系列——LRUQueryCache
- Lucene 源码系列——多个 SHOULD 的 Query 的倒排求并集
- Lucene 源码系列——多个 MUST 的 Query 的倒排求交集
- Lucene 源码系列——索引文件的生成(十一)之 dim&&dii(Lucene 8.4.0)
- Lucene 源码系列——索引文件的生成(十)之 dim&&dii(Lucene 8.4.0)
- Lucene 源码系列——索引文件的生成(九)之 dim&&dii(Lucene 8.4.0)
- Lucene 源码系列——索引文件的生成(八)之 dim&&dii(Lucene 8.4.0)
- Lucene 源码系列——索引文件的生成(七)之 tim&&tip
- Lucene 源码系列——索引文件的生成(六)之 tim&&tip
- Lucene 源码系列——索引文件的生成(五)之 tim&&tip
- Lucene 源码系列——索引文件的生成(四)之跳表 SkipList
- Lucene 源码系列——索引文件的生成(三)之跳表 SkipList
- Lucene 源码系列——索引文件的生成(二)之 doc&&pay&&pos
- Lucene 源码系列——索引文件的生成(一)之 doc&&pay&&pos
- Lucene 源码系列——倒排表
- Lucene 源码系列——DirectWriter&&DirectReader
- Lucene 源码系列—— PackedInts
- Lucene 源码系列——LZ4
- Lucene 源码分析——FST
- 特斯拉宣布降薪!开源节流,疫情之下如何提升企业管理效能
- Lucene 源码系列——BytesRefHash
- Lucene 源码系列——BulkOperationPacked
- Lucene 源码系列——去重编码 (dedupAndEncode)
- Lucene 源码系列——IntBlockPool 类
- Lucene 源码系列——BooleanQuery 介绍
- 从罗永浩直播刷屏,来看如何做好项目管理
- CTR 预估在动态样式建模和特征表达学习方面的进展
- 图解半监督学习 FixMatch,只用 10 张标注图片训练 CIFAR10
- 如何高效的进行多项目管理?
- 构造 IndexWriter 对象(十)
- 构造 IndexWriter 对象(九)
- 构造 IndexWriter 对象(八)
- 构造 IndexWriter 对象(七)
- 构造 IndexWriter 对象(六)
- 构造 IndexWriter 对象(五)
- 构造 IndexWriter 对象(四)
- 构造 IndexWriter 对象(三)
- 构造 IndexWriter 对象(二)
- 构造 IndexWriter 对象(一)
- 如何构建 A/B 测试系统,其核心功能有哪些?
- 有赞搜索中台的探索与实践
- 字节跳动核心竞争力到底是什么?
- DeepTables: 为结构化数据注入深度学习的洪荒之力
- 零基础入门数据挖掘——一文学习模型融合!从加权融合到 stacking, boosting
- 零基础入门数据挖掘——建模调参
- 零基础入门数据挖掘——特征工程实战
- 零基础入门数据挖掘——数据分析实战
- DevOps 在企业项目中的实践落地
- 怎样评价推荐系统的结果质量?
- 初探 GNN- 文本表示学习
- Java 线程池实现原理及其在美团业务中的实践
- 深入理解推荐系统:召回
- 敏捷开发流程, 您缺一个这样的协作平台
- 基于知识图谱的语义理解技术及应用
- 【腾讯】揭秘微信 "看一看" 是如何为你推荐的
- 揭秘微信「看一看」如何精准挖掘你感兴趣的内容
- 用户画像从 0 到 100 的构建思路
- Word delimiter graph token filter(word_delimiter_graph 词元过滤器)
- BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(4)
- BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(3)推理
- 阿里文娱多模态视频分类算法中的特征改进
- 通俗的理解牛顿 - 莱布尼茨公式及其证明
- 白话条件随机场(conditional random field)
- 阿里文娱算法公开课 #02:算法工程师的进阶之路(进阶篇)
- 阿里文娱算法公开课 #03:算法工程师的核心技能(CV 篇)
- 阿里文娱算法公开课 #04:算法工程师的核心技能 - 搜索推荐篇
- BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(2)损失函数
- 效果工具链之算法迭代篇
- 效果工具链之运营平台篇
- 如何设计一个 A/B test?
- 阿里文娱智能营销增益模型 (Uplift Model) 技术实践
- BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(1)
- 从文本中进行关系抽取的几种不同的方法
- 字节 AI Lab-NLP 算法热乎面经
- 深度学习在花椒直播中的应用—推荐系统冷启动算法
- 干货 | Softmax 函数详解
- 深度学习在阿里 B2B 电商推荐系统中的实践
- 对 Reformer 的深入解读
- Self-Attention 与 Transformer
- 通用的图像 - 文本语言表征学习:多模态预训练模型 UNITER
- 【推荐系统】协同过滤推荐算法
- 怎么理解基于机器学习“四大支柱”划分的学习排序方法
- 敏捷开发的那些事
- 【全面总结】机器学习经典书 PRML 相关资料全面总结:中文译本,官方代码,课程视频,学习笔记等等
- 如何只使用标签来构建一个简单的电影推荐系统
- 信息流推荐在凤凰新闻的业务实践
- 机器学习加持的 Airbnb 体验搜索排序实践
- 理解计算机视觉中的损失函数
- 项目管理软件这么多,为什么我只推荐它?
- 知识图谱辅助的个性化推荐系统
- 从阿里的 User Interest Center 看模型线上实时 serving 方法
- 深度学习在省钱快报推荐排序中的应用与实践
- 百度凤巢算法面经
- 你们都在用什么项目管理软件?
- 广告算法在阿里文娱用户增长中的实践
- 【超详细讲解】深入理解 GBDT 二分类算法
- 搜索系统中的纠错问题
- 【算法面经系列】百度、寒武纪、科大讯飞、追一科技、腾讯、作业帮算法面经
- 【算法面经系列】头条 + 腾讯 算法工程师面经(NLP 实习)
- 如何做好项目管理,做好人人都是项目经理
- 微软小冰:如何构建人格化的对话系统
- 【论文笔记】TEM: 结合 GBDT 叶节点嵌入的可解释推荐模型
- 图解 Reformer:一种高效的 Transformer
- Flink 如何支持特征工程、在线学习、在线预测等 AI 场景?
- 算法在岗一年的经验总结
- 项目经理必备的项目管理工具——CORNERSTONE
- Flink Checkpoint 原理流程以及常见失败原因分析
- 58 同城智能语音质检系统架构实践
- 淘系高级技术专家的十年 | 既往不恋,纵情向前!
- 【贝壳找房】关系图谱在贝壳的构建和应用
- [NLP.TM[28] | 浅谈 NLP 算法工程师的核心竞争力](http://www.6aiq.com/article/1...
- 机器学习的可解释性:因果推理和稳定学习
- 远程办公 | 适应时代的工作模式
- 在阿里,新人如何快速上手项目管理?
- 图解自监督学习,人工智能蛋糕中最大的一块
- 让 AI“读懂”短视频,爱奇艺内容标签技术解析
- 字节跳动自研万亿级图数据库 & 图计算实践
- 水墨 - 在线 Markdown 编辑器
- 如何扩充知识图谱中的同义词
- 万字长文梳理 CTR 预估模型发展过程与关系图谱
- BERT 的嵌入层是如何实现的?看完你就明白了
- 浅谈流式模型训练体系
- “人工智能”初创公司所面临的问题
- 汽车之家推荐系统排序算法迭代之路
- “云开工”成主流,远程办公需求暴涨 663%
- 疫情之下 | 教你远程办公高效又安全
- 阿里 B 类电商用户增长实践
- 二部图表示学习 | Graph Convolutional Matrix Completion
- 为什么机器学习项目非常难管理?
- 不要犯战略性的失误——如何合理制定推荐系统的优化目标?
- 工作效率低? 这个锅远程办公不背
- 关于使用 pytorch 能否对 SE ResNext 进行预训练
- 项目经理: 在家远程办公如何提高工作效率?
- BERT, ELMo, & GPT-2: 这些上下文相关的表示到底有多上下文化?
- 一些 NLP 的面试问题
- 停班不停工,远程办公助力击穿疫情下企业困局
- 自然语言理解(NLU)难在哪儿?
- 视频 | 信息流推荐技术在凤凰网的业务实践
- Elasticsearch 高级调优方法论之——根治慢查询!
- LinkedIn 招聘推荐系统中的机器学习的威力
- 为什么我们选择 LambdaMART 作为我们的酒店排序模型
- 如何(以及为什么需要)创建一个好的验证集
- 美团一站式机器学习平台建设实践
- 携程实时智能检测平台实践
- HMM 模型在贝壳对话系统中的应用
- NLP 中文分词知识梳理
- 阿里 B2B:融合 Matching 与 Ranking 的个性化 CTR 预估模型
- 部署基于嵌入的机器学习模型的通用模式
- 视频 | 阿里文娱搜索算法实践和思考
- 从算法到应用:滴滴端到端语音 AI 技术实践
- 深入 Lucene 搜索引擎原理
- 掌握它才说明你真正懂 Elasticsearch
- 如何增强推荐系统模型更新的实时性?
- 深度学习在花椒直播中的应用——排序算法篇
- 35 岁技术人如何转型做管理?阿里高级算法专家公开 10 大思考
- 知识图谱基本概念 & 工程落地常见问题
- 2020 “跳槽”还是“卧槽”,你想好了吗?
- 敏捷开发实践之 Scrum 方法运用
- 机器学习在马蜂窝酒店聚合中的应用初探
- 项目管理软件的应用现状与发展趋势
- 亚马逊畅销书的 NLP 分析——推荐系统、评论分类和主题建模
- 推荐系统 pipeline 的构建过程和总体架构描述。
- 做机器学习项目的 checklist
- 敏捷实践经验分享,企业如何在敏捷开发中实施 DoD
- 推荐系统论文回顾:神经协同过滤理解与实现
- 阿里淘外商业化广告工程架构实践
- 腾讯万亿级 Elasticsearch 技术解密
- 新一代海量数据搜索引擎 TurboSearch 来了!
- 机器学习在微博 O 系列广告中的应用
- 不仅仅用 CTR:通过人工评估得到更好的推荐
- 搜索,推荐,广告系统架构及算法技术资料大合集吐血整理——2019 年终分享
- 毕业 10 年才懂,解决问题的能力原来这么重要
- 跨境电商 Etsy 如何使用交互行为类型进行可解释推荐
- 机器学习模型的可解释性
- 个性化海报在爱奇艺视频推荐场景中的实践
- 华为招聘
- 华为人才招聘
- Query 理解和语义召回在知乎搜索中的应用
- 推荐系统技术演进趋势:从召回到排序再到重排
- 程序员必知必会的零拷贝技术
- 推荐系统的发展与简单回顾
- 沟通的重要工具——乔哈里视窗
- NLP 技术在微博 feed 流中的应用
- 机器学习 - 一文理解 GBDT 的原理 -20171001
- LR+FTRL 算法原理以及工程化实现
- 推荐场景中召回模型的演化过程
- 读《影响力》这本书
- 系统重构的道与术
- CTO 被裁,离职前给组了的高级开发们 8 个建议。
- 记录:tf.saved_model 模块的简单使用(TensorFlow 模型存储与恢复)
- 淘宝如何拥抱短视频时代?视频推荐算法实战
- 解密淘宝推荐实战,打造 “比你还懂你” 的个性化 APP
- 风控特征—时间滑窗统计特征体系
- 解密商业化广告投放平台技术架构
- 深入理解 AQS 之 Condition 源码
- IJCAI 2019 | 为推荐系统生成高质量的文本解释:基于互注意力机制的多任务学习模型
- Hi, xiaolongnk
- Learning to rank 基本算法小结
- 知识结构化在阿里小蜜中的应用
- 万字长文!推荐系统算法岗校招面试经验 & 学习心得
- 标签平滑 & 深度学习:Google Brain 解释了为什么标签平滑有用以及什么时候使用它 (SOTA tips)
- 经验:一个秒杀系统的设计思考
- 视频:美图个性化 push AI 探索之路
- 优酷 DSP 广告投放系统架构实践
- 浅谈微视推荐系统中的特征工程
- 知识图谱的自动构建
- 美团点评效果广告实验配置平台的设计与实现
- 腾讯信息流内容理解技术实践
- 深度 |58 商业流量排序策略优化实践
- 美团点评 Kubernetes 集群管理实践
- 张一鸣:如何应对公司变大之后的管理挑战
- 如何提升「会议效率」
- 【有赞】数据资产,赞之治理
- 搜索引擎中的 Web 数据挖掘
- 几十亿数据查询 3 秒返回,ES 性能优化实战!
- 基于多视角学习和个性化注意力机制的新闻推荐
- Walrus- 一个轻量级 olap 查询框架
- 微服务高可用利器——Hystrix 熔断降级原理 & 实践总结
- 【推荐实践】微博在线机器学习和深度学习实践
- 马蜂窝推荐排序算法模型是如何实现快速迭代的
- 在线学习在爱奇艺信息流推荐业务中的探索与实践
- 【58 同城】如何从 0 到 1 构建个性化推荐?
- 机器学习在 58 二手车估价系统实践
- 萌新想请教一下 特征选择 的问题
- 实时计算引擎在贝壳的应用与实践
- 今日头条在消息服务平台和容灾体系建设方面的实践与思考
- 推荐系统中模型训练及使用流程的标准化
- 知识图谱与语义分析技术介绍(附前沿论文解读)
- 网络图模型知识点综述
- 360 展示广告召回系统的演进
- Tensorflow 的 checkpoint 教程
- 陈曦:性能与稳定并存 Elasticsearch 调优实践
- 3000 台服务器不宕机,微博广告系统全景运维大法
- 由 Finalizer 和 SocksSocketImpl 引起的 Fullgc 问题盘点
- 爱奇艺效果广告的个性化探索与实践
- 深度学习技术在美图个性化推荐的应用实践
- UC 信息流推荐模型在多目标和模型优化方面的进展
- Facebook 面向个性化推荐系统的深度学习推荐模型
- 美团配送交付时间轻量级预估实践
- 58 招聘推荐排序算法实战与探索
- 阿里如何实现秒级百万 TPS?搜索离线大数据平台架构解读
- 会向业务“砍需求”的技术同学,该具备哪 6 点能力?
- UC 国际信息流推荐中的多语言内容理解
- 10 年 +,阿里沉淀出怎样的搜索引擎?
- Hi, 2019_nickname
- 老大难的 GC 原理及调优,这下全说清楚了
- 以 YouTube 论文学习如何在推荐场景应用强化学习
- 深度度量学习中的损失函数
- UC 信息流视频标签识别技术
- 常用学习算法
- 阿里妈妈:品牌广告中的 NLP 算法实践
- OCPC 广告算法在凤凰新媒体的实践探索
- 降低软件复杂性的一般原则和方法
- 基于 Elastic Stack 的海量日志分析平台实践
- 支付系统高可用架构设计实战,可用性高达 99.999!
- 推荐系统应该如何保障推荐的多样性?
- 浅谈 UC 国际信息流推荐
- 我在亚马逊学到的三样东西,为我的机器学习职业之路做好了准备
- 关于数据驱动的重新思考
- 头条,美团,滴滴,京东及其它公司面试经验分享!
- CCKS 2019 | 百度 CTO 王海峰详解知识图谱与语义理解
- 模型评估指标 AUC 和 ROC,这是我看到的最透彻的讲解
- GitHub 标星 8k+,最后还有什么想问的么?对面试官的灵魂 50 问!
- Andrew Ng(吴恩达) 关于机器学习职业生涯以及阅读论文的一些建议
- A/B 测试中我们都会犯的十个常见错误
- AI 在爱奇艺视频广告中的探索
- 快看漫画个性化推荐探索与实践
- 微博广告策略工程架构体系演进
- 请问 example oracle 和后面那个红框的分布是什么意思?
- 构建可解释的推荐系统
- 解读:滴滴“猜你去哪儿”功能的算法实现
- 推荐系统走向下一阶段最重要的三个问题
- 电商推荐那点事
- 风控建模流程:以京东群体感知项目为例
- 每天超 50 亿推广流量、3 亿商品展现,阿里妈妈的推荐技术有多牛?
- 聊聊 Linux IO 栈
- 阿里妈妈深度树检索技术(TDM)及应用框架的探索实践
- 推荐系统工程难题:如何做好深度学习 CTR 模型线上 Serving
- 360 搜索的百亿级网页搜索引擎架构实现
- FSICFR 或者 CFRM 算法训练后如何应用于实际的游戏中?
- 京东电商推荐系统实践
- < 机器学习实战 高清中英 源代码 > 分享
- 分布式锁用 Redis 还是 Zookeeper?
- InnoDB 事务与分布式事务中一些关键问题
- hello, 初次见面请多关注
- ESearch: 58 搜索内核设计与实践—实时索引篇
- 两万字深度介绍分布式系统原理,一文入魂
- 推荐技术随谈
- 这是我读过写得最好的【秒杀系统架构】分析与实战!
- 如果这篇文章说不清 epoll 的本质,那就过来掐死我吧!
- 最完整的 Markdown 基础教程
- 番外篇:Lucene 索引流程与倒排索引实现
- Lucene 倒排索引原理探秘 (2)
- Lucene 倒排索引原理探秘 (1)
- 推荐系统:石器与青铜时代
- 快手 HBase 在千亿级用户特征数据分析中的应用与实践
- 数据老是错误,不知道为什么
- 怎么写代码呢
- 学习代码写作怎么写
- 学习数据代码
- 深度学习在 360 搜索广告 NLP 任务中的应用
- 消息中间件—RocketMQ 消息存储(二)
- 消息中间件—RocketMQ 消息存储(一)
- 消息中间件—RocketMQ 消息消费(三)(消息消费重试)
- 消息中间件—RocketMQ 消息消费(二)(push 模式实现)
- 消息中间件—RocketMQ 消息消费(一)
- 消息中间件—RocketMQ 消息发送
- 消息中间件—RocketMQ 的 RPC 通信(二)
- 消息中间件—RocketMQ 的 RPC 通信(一)
- 阿里零售通智能导购推荐技术实践
- “看一看”推荐模型揭秘!微信团队提出实时 Look-alike 算法,解决推荐系统多样性问题
- 关于机器学习归一化
- 网易新闻推荐:深度学习排序系统及模型
- 贝壳找房一镜到底:FM 们的原理及在贝壳搜索的实践
- 淘宝从几百到千万级并发的十四次架构演进之路!
- 分布式追踪系统概述及主流开源系统对比
- 系统架构系列(四):业务架构实战下篇
- 系统架构系列 (三):业务架构实战上篇
- 系统架构系列 (二):应对这一概念的方法
- 系统架构系列(一):如何用公式定义该概念?
- 写给开发者的谷歌技术面试终极通关指南
- 流式数据处理在百度数据工厂的应用与实践
- 一文读懂深度学习:从神经元到 BERT
- 基于内容的推荐算法
- Embedding 技术在民宿推荐中的应用
- XLNet : 运行机制及和 Bert 的异同比较
- 深度学习在 Airbnb 中的探索与应用
- 【贝壳智搜】标签:月老手中那一根根红线
- Xavier 论文疑惑(论文标题:Understanding the difficulty of training deep feedforward neural networks)
- TCP 报文格式高清图
- 从 Word Embedding 到 Bert 模型—自然语言处理中的预训练技术发展史
- Bert 时代的创新(应用篇):Bert 在 NLP 各领域的应用进展
- Netflix 推荐系统模型的快速线上评估方法——Interleaving
- 【真实生产案例】消息中间件如何处理消费失败的消息?
- YC 中国创始人陆奇:人工智能时代,芯片和底层软件基本都要重做
- 从 MySQL 高可用架构看高可用架构设计
- abtest- 数据分析 - 假设检验基础
- 程序员面试最常见问题 TOP 48
- abtest 那些事儿(下)—数据跟踪和效果评估
- list1 与 list2 求交集的方法总结!
- 当你打开天猫的那一刻,推荐系统做了哪些工作?
- 高并发架构消息队列面试题解析
- Embedding 在深度推荐系统中的 3 大应用方向
- 使用 ElasticSearch 的 44 条建议
- Elasticsearch 技术分析(七): Elasticsearch 的性能优化
- 适合程序员用的笔记本电脑
- 马蜂窝 ABTest 多层分流系统的设计与实现
- ES 查询性能调优实践,亿级数据查询毫秒级返回
- 小米移动搜索中的 AI 技术
- LSTM 原理与实践,原来如此简单
- 基于 “ 滴滴 KDD 2018 论文:基于强化学习技术的智能派单模型 ” 再演绎
- 阿里妈妈:电商预估模型的发展与挑战
- Attention in RNN
- 详解 Transformer (Attention Is All You Need)
- SVM 优化出来支持向量点的不等式约束不等于 1 是为什么?
- 机器学习:K 折交叉验证的问题
- 滴滴基于 ElasticSearch 的一站式搜索中台实践
- 快手万亿级别 Kafka 集群应用实践与技术演进之路
- 微软 AB/Testing EXP 实验管理平台
- 揭开 YouTube 深度推荐系统模型 Serving 之谜
- 深度学习中不得不学的 Graph Embedding 方法
- 谷歌、阿里、微软等 10 大深度学习 CTR 模型最全演化图谱【推荐、广告、搜索领域】
- FTRL 公式推导
- 个性化推荐技术
- 分类模型与排序模型在推荐系统中的异同分析
- 阿里巴巴复杂搜索系统的可靠性优化之路
- 从 FFM 到 DeepFFM,推荐排序模型到底哪家强?
- 在 faster-RCNN 中,最后一层输出的 bbox_pred 是什么
- 有赞百亿级日志系统架构设计
- 打造工业级推荐系统(一):推荐算法工程师的成长之道
- 面试官:如果让你设计一个消息中间件,如何将其网络通信性能优化 10 倍以上?【石杉的架构笔记】
- 机器学习与深度学习常见面试题(上)
- ABtest 和假设检验、流量分配
- 【三. 推荐系统的必备要素 -2】ABtest 框架
- 复旦邱锡鹏教授公布《神经网络与深度学习》,中文免费下载
- 携程金融大数据风控算法实践
- 拯救 996 的配方
- 【一. 概述 -2】什么样的产品推荐效果明显
- 【一. 概述 -1】推荐系统简介
- 万字长文解读电商搜索——如何让你买得又快又好
- 【搜狐】新闻推荐系统的 CTR 预估模型
- 阿里妈妈新突破:深度树匹配如何扛住千万级推荐系统压力
- 计算广告中主要模块、策略及其场景(上篇)
- 有赞订单搜索 AKF 架构演进之路
- 独家解读 | 滴滴机器学习平台架构演进之路
- 前深度学习时代 CTR 预估模型的演化之路
- 知其然,知其所以然:基于多任务学习的可解释推荐系统
- [[NAACL19] 一个更好更快更强的序列标注成分句法分析器](http://www.6aiq.com/article/1...
- 一直播千万量级用户推荐系统设计之路
- 知识图谱 |298 万条三元组生成方法 (一)
- AI 下一个拐点,图神经网络带来哪些机遇?
- 人脸识别如何快速工作
- 如何强化数据集中某个特征的影响?
- 强化学习系列二——应用 AlphaGo Zero 思路优化搜索排序
- 【58 同城】中文分词技术深度学习篇
- 一图胜千言: 解读阿里的 Deep Image CTR Model
- 推荐系统召回四模型之二:沉重的 FFM 模型
- Embedding 从入门到专家必读的十篇论文
- 深度 CTR 预估模型中的特征自动组合机制演化简史
- 详解 Airbnb 之深度学习在搜索业务的探索
- 万字长文带你解读 NLP 深度学习的各类模型
- 基于深度强化学习的新闻推荐模型 DRN
- 基于 Tensorflow 高阶 API 构建大规模分布式深度学习模型系列: 开篇
- 【贝壳找房】贝壳搜索平台实时流总体架构设计
- 【贝壳网】贝壳搜索为什么能知道你想住哪?
- 百度中文纠错技术
- 版本控制工具——Git 常用操作
- 【贝壳网】ElasticSearch 相关性计算原理及实践
- 【贝壳网】Elasticsearch 在贝壳搜索的部署实践
- 【贝壳找房】读“懂”用户找房需求:贝壳语义解析技术实践
- 【贝壳网】两种简单有效的标签选择方法
- 回顾 Facebook 经典 CTR 预估模型
- 主流 CTR 预估模型的演化及对比
- 推荐系统召回四模型之:全能的 FM 模型
- 自然语言处理基础:上下文词表征入门解读
- 为什么已有 Elasticsearch,我们还要重造实时分析引擎 AresDB?
- NLP 新秀 : BERT 的优雅解读
- 详解 Embeddings at Alibaba(KDD 2018)
- 前员工揭内幕:10 年了,为何谷歌还搞不定知识图谱?
- 人机交互式机器翻译研究与应用
- 独家揭秘:微博深度学习平台如何支撑 4 亿用户愉快吃瓜?
- 爱奇艺短视频软色情识别技术解析
- 卷积有多少种?一文读懂深度学习中的各种卷积
- 深度长文:中文分词的十年回顾
- 机器学习中如何处理不平衡数据?
- 【58 同城】语言模型及其应用
- 测试机器学习降维之线性判别模型 (LDA)
- GBDT+LR 算法解析及 Python 实现
- 网易杭研 分享 图数据库基础
- 用 Flink 取代 Spark Streaming,知乎实时数仓架构演进
- 国美 11·11:大促场景下的国美智能推荐系统演进之路
- 58 精准推送实践
- 《美团机器学习实践》—— 思维导图
- 「回顾」强化学习:原理与应用
- 详解 GAN 的谱归一化(Spectral Normalization)
- 「回顾」机器学习在反欺诈中应用
- 滴滴出行基于 RocketMQ 构建企业级消息队列服务的实践
- 一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC
- HBase 写吞吐场景资源消耗量化分析及优化
- Flink 在有赞实时计算的实践
- 语义分割江湖的那些事儿——从旷视说起
- 「回顾」百度智能写作如何通过人工智能技术为媒体内容创作赋能?
- 58 技术沙龙——云搜 知乎 58 同城 搜索架构
- 「回顾」基于金融智能风控的实时指标处理技术体系
- 「回顾」阿里妈妈:定向广告新一代点击率预估主模型——深度兴趣演化网络
- 深入剖析 Netty 源码设计(二)——BIO NIO AIO Reactor 模式到底干了啥
- 「机器学习基础与趋势」系列丛书最新成员:140 页《深度强化学习入门》发布
- 毕玄:我在阿里的十年技术感悟
- 使用 Pytorch 实现 skip-gram 的 word2vec
- 「回顾」蚂蚁数据分析平台的演进及数据分析方法的应用
- 「回顾」深度学习新技术在搜狗搜索广告中的深化应用
- Google 重叠实验框架:更多,更好,更快地实验
- 58 招聘推荐系统介绍——AB 实验框架
- 深入剖析 Netty 源码设计(一)——深入理解 select poll epoll 机制
- 从 KDD 2018 Best Paper 看 Airbnb 实时搜索排序中的 Embedding 技巧
- 中文分词技术及在 58 搜索的实践
- 58 搜索列表页连接效率优化实践
- 「回顾」58 同城 综合排序框架 连接效率优化实践
- 「行知」镶嵌在互联网技术上的明珠:漫谈深度学习时代点击率预估技术进展
- 推荐系统遇上深度学习 (二十九)-- 协同记忆网络理论及实践
- 推荐系统遇上深度学习 (二十八)-- 知识图谱与推荐系统结合之 MKR 模型原理及实现
- 推荐系统遇上深度学习 (二十七)-- 知识图谱与推荐系统结合之 RippleNet 模型原理及实现
- 推荐系统遇上深度学习 (二十六)-- 知识图谱与推荐系统结合之 DKN 模型原理及实现
- 推荐系统遇上深度学习 (二十五)-- 当知识图谱遇上个性化推荐
- 推荐系统遇上深度学习 (二十四)-- 深度兴趣进化网络 DIEN 原理及实战!
- 推荐系统遇上深度学习 (二十三)-- 大一统信息检索模型 IRGAN 在推荐领域的应用
- 推荐系统遇上深度学习 (二十二)--DeepFM 升级版 XDeepFM 模型强势来袭!
- 推荐系统遇上深度学习 (二十一)-- 阶段性回顾
- 推荐系统遇上深度学习 (二十)-- 贝叶斯个性化排序(BPR) 算法原理及实战
- 推荐系统遇上深度学习 (十九)-- 探秘阿里之完整空间多任务模型 ESSM
- 推荐系统遇上深度学习 (十八)-- 探秘阿里之深度兴趣网络(DIN) 浅析及实现
- 推荐系统遇上深度学习 (十七)-- 探秘阿里之 MLR 算法浅析及实现
- 推荐系统遇上深度学习 (十六)-- 详解推荐系统中的常用评测指标
- 推荐系统遇上深度学习 (十五)-- 强化学习在京东推荐中的探索
- 推荐系统遇上深度学习 (十四)--《DRN:A Deep Reinforcement Learning Framework for News Recommendation》
- 推荐系统遇上深度学习 (十三)--linUCB 方法浅析及实现
- 推荐系统遇上深度学习 (十二)-- 推荐系统中的 EE 问题及基本 Bandit 算法
- 大众点评搜索基于知识图谱的深度学习排序实践
- 推荐系统遇上深度学习 (十)--GBDT+LR 融合方案实战
- 推荐系统遇上深度学习 (八)--AFM 模型理论和实践
- 推荐系统遇上深度学习 (七)--NFM 模型理论和实践
- 推荐系统遇上深度学习 (六)--PNN 模型理论和实践
- 推荐系统遇上深度学习 (五)--Deep&Cross Network 模型理论和实践
- 推荐系统遇上深度学习 (四)-- 多值离散特征的 embedding 解决方案
- 推荐系统遇上深度学习 (三)--DeepFM 模型理论和实践
- 深度学习时代的图模型
- 推荐系统遇上深度学习 (二)--FFM 模型理论和实践
- 推荐系统遇上深度学习 (一)--FM 模型理论和实践
- BERT 大火却不懂 Transformer?读这一篇就够了
- 图解当前最强语言模型 BERT:NLP 是如何攻克迁移学习的?
- AutoML 在推荐系统中的应用
- 一朝爆发?解读知识图谱和图数据库的 2018
- 工作中组内遇到的 elasticsearch 使用上的踩坑总结
- 深度好文:2018 年 NLP 应用和商业化调查报告
- 深度学习在金融文本情感分类中的应用
- 深入剖析 ReentrantLock 公平锁与非公平锁源码实现
- 算法工程师必须要知道的面试技能雷达图
- 美团深度学习在搜索业务中的探索与实践
- 回顾·搜索引擎算法体系简介——排序和意图篇
- 基于知识图谱的问答系统入门—NLPCC2016KBQA 数据集
- 【干货】Kafka 数据可靠性深度解读
- 回顾·CTR 预估系统实践
- 「回顾」强化学习在自然语言处理中的应用
- Spark 宽依赖 窄依赖 Job Stage Executor Task 总结
- Spark 性能调优总结
- Scala 下划线 (_) 用法汇总
- 【干货】Spark 之性能优化
- 《搜索与推荐中的深度学习匹配》之推荐篇
- 《搜索与推荐中的深度学习匹配》之搜索篇
- 「回顾」Yoo 视频底层页推荐系统 - 从 0 到 1 的实践
- 吴恩达、Yann LeCun 等大佬回顾预测 2019 年 AI 发展
- 蚂蚁金服核心技术:百亿特征实时推荐算法揭秘
- Numerical Coordinate Regression= 高斯热图 VS 坐标回归
- 「回顾」AI 如何让广告投放进入“自动驾驶”?
- 随机变量 - 统计学核心方法及其应用
- 简单聊聊特征工程
- 近期知识图谱顶会论文推荐,你都读过哪几篇?
- 半监督深度学习小结:类协同训练和一致性正则化
- 「回顾」机器学习与推荐系统实践
- 全文搜索引擎,选 ElasticSearch 还是 Solr?
- NLP-BERT 谷歌自然语言处理模型:BERT- 基于 pytorch
- 罗振宇 2018“时间的朋友”跨年演讲未删减全文
- 机器学习与数据科学决策树指南
- 「回顾」旅游知识图谱的构建和应用
- 「回顾」知乎推荐页 Ranking 经验分享
- 计算广告论文及资料 && 推荐系统论文及资料 && 基于 Spark 的 CTR 模型资料
- 万物皆 Embedding,从经典的 word2vec 到深度学习基本操作 item2vec
- 【下】YouTube 深度学习推荐系统的十大工程问题
- 【上】重读 Youtube 深度学习推荐系统论文,字字珠玑,惊为神文
- 人脸分析:数据时代的“面像学” 一文读懂用户画像的前世今生
- 「回顾」爱奇艺搜索排序模型迭代之路
- 「回顾」NLP 在网络文学领域的应用
- 清华大学图神经网络综述:模型与应用
- Netty 学习和进阶策略
- Flink 实战: 结合 Kafka 构建端到端的 Exactly-Once 处理程序
- Apache Flink 端到端(end-to-end)Exactly-Once 特性概览 (翻译)
- 《提问的智慧》中文版翻译
- NIPS2018 | 腾讯 AI Lab 入选 20 篇论文,含 2 篇 Spotlight
- 【翻译】Redis 存储揭秘
- 大话 Select、Poll、Epoll 机制
- 空间数据索引 RTree 完全解析及 Java 实现
- 建了个机器学习与深度学习的微信群
- 【美团】LruCache 在美团 DSP 系统中的应用演进
- 【美团】深入浅出排序学习:写给程序员的算法系统开发实践
- 基于 Flink 的严选实时数仓实践
- 百页机器学习书
- 基于对象特征的推荐系统
- 「回顾」让机器读懂人类:揭秘机器阅读理解技术及应用
- “IT 男等级”对照表|找找你在哪?
- 两位拯救谷歌的超级工程师的故事:计算机界最好的结对编程榜样
- 机器学习在美团配送系统的实践:用技术还原真实世界
- [[译] 支持向量机(SVM)教程](http://www.6aiq.com/article/1...
- YouTube 推荐系统改进之路
- 「干货」YouTube 基于深度神经网络推荐系统剖析
- 实时检索 6700 亿条推文,细谈 Twitter 搜索引擎的演进历程
- 【 DataFunTalk】HBase RowKey 与索引设计
- 架构拆分原理解析
- 阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景
- 我收到了斯坦福、UCL、CMU、NYU、UW 的博士 offer,这是我的经验
- BigGAN 论文解读
- 微软专家眼中个性化推荐系统的 5 大研究趋势
- 理解五个基本概念,让你更像机器学习专家
- 阿里巴巴搜索引擎平台 Ha3 揭秘
- Java 编程方法论之响应式编程系列视频
- 每日生产万亿消息数据入库,腾讯如何突破大数据分析架构瓶颈
- 这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
- 菜鸟,下一代分布式体系架构的设计理念
- 除了抖音和头条,字节跳动的 AI 实力有多强?
- 阿里妈妈大规模在线分层实验实践
- 深度学习在 Airbnb 大规模搜索排名上的实战经验
- 51 信用卡的个性化推荐体系
- 【杉枫】科技与人文
- 【杉枫】架构抽象化设计
- 机器学习人工智能学习资源导航
- 这里好冷清
- 苏宁 11.11:一种基于神经网络的智能商品税分类系统
- 有赞搜索引擎从 0 到 1 技术解析
- 【必读!!】人工智能社区公告!!
- 苏宁 11.11 :苏宁大数据离线任务开发调度平台实践
- 苏宁 11.11:苏宁易购订单搜索系统架构及实现
- 苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用
- 美团大脑:知识图谱的建模方法及其应用
- 【干货】搜索引擎技术资料整理
- 2143 亿!2018 年天猫“双 11”成交总额是这样预测的
- 一文看懂智能合约的现状与未来
- “搜你所想”之用户搜索意图识别
- 【杉枫】推荐引擎异步架构设计
- 苏宁 11.11:仓库内多 AGV 协作的全局路径规划算法研究
- Kafka 设计解析(一):Kafka 背景及架构介绍
- 「回顾」饿了么推荐算法演进及在线学习实践
- Lucene 6 数值索引以及空间索引方案
- 互联网架构,究竟为啥要做服务化?
- Lucene 倒排索引缓冲池的细节
- 【译】写给计算机专业毕业生的 22 条宝贵建议
- 深度学习在序列化推荐中的应用 (1)-GRU4REC 以及扩展
- 实时翻译的发动机:矢量语义(斯坦福大学课程解读)
- 骚操作!电影接吻镜头次数的算法实现
- 响应式编程 Rxjava 书籍视频教程
- 机器学习,模式识别,数据挖掘常用学习资源链接
- 美团深度学习系统的工程实践
- AI 大师丨 Yoshua Bengio:纯粹与理想,深度学习的 30 年
- Apache 顶级开源项目是怎样炼成的?国内开发者应该如何借鉴?
- 大数据凉了?No,流式计算浪潮才刚刚开始!
- 分布式高性能 redis 集群线上常见问题
- 58 沈剑 - 分布式事务,原来可以这么玩?
- 饿了么外卖推荐算法中有哪些机制与手段?
- 有赞搜索系统的架构演进
- 有赞搜索系统的技术内幕
- 基于 TensorFlow Serving 的深度学习在线预估
- 建了一个机器学习微信群
- 阿里巴巴为什么选择 Apache Flink?Flink——下一代大数据处理系统
- 超参数搜索不够高效?这几大策略了解一下
- Lucene 查询原理
- Lucene 解析 - 基本概念
- Elasticsearch 之 commit point | Segment | refresh | flush 索引分片内部原理
- 程序员能靠技术渡过中年危机吗?
- 码农晋升为技术管理者后,痛并快乐着的纠结内心
- 秋招报告:2019 届互联网校招薪资出炉,90 后社招被薪酬倒挂?
- 互联网思维——真正的高手,是如何判断趋势的?
- 一点做用户画像的人生经验:ID 强打通
- 如何理解区块链的共识算法?
- 推荐系统顶会 RecSys2018 最佳论文奖出炉!因果嵌入推荐与用户研究成为焦点
- 程序员进阶必读金句
- 腾讯内容平台系统的架构实践
- 58 同城推荐系统架构设计与实现
- 互联网智能广告系统简易流程与架构
- 【阿里】电商搜索算法技术的演进
- 互联网智能广告系统简易流程与架构 |
- 如何看待「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法?
- 老程序员如何避免沦落出局?
- 一次生产系统 Full GC 问题分析与排查总结
- 推荐系统遇上深度学习 (十一)-- 神经协同过滤 NCF 原理及实战
- 5 种方法求解 TopK!面试不要再问我 Topk 了~
- 【转自知乎】当下(2018 年)腾讯的技术建设是否处于落后同体量公司的状态?
- ”大脑“爆发背后是 50 年互联网架构重大变革
- 用户画像番外篇之随笔三则
- 互联网公司面试官应该如何去面试一个人?
- 机器学习论文笔记—如何利用高效的搜索算法来搜索网络的拓扑结构
- 北邮硕士、前百度工程师:能进大厂,就不用读研究生了!
- 微服务架构之事件驱动架构
- 回顾·如何构建知识图谱?
- Java GC 调优怎么做?
- 【AIQ】梁宁万字长文:美团的破局与开局
- 美团上市,开盘涨 5.7%,市值超京东!与阿里的交锋再升级
- 阿里巴巴达摩院成立一年,都做了些什么?
- 洋码头搜索应用架构
- 洋码头推荐系统重排算法实践
- 洋码头推荐系统技术架构
- 短视频如何做到千人千面?FM+GBM 排序模型深度解析
- 用户画像番外篇之用户活跃 / 用户价值度分析
- 想读 AI 研究生?你发过几篇 NIPS 一作?
- 一文剖析区块链现状:丛林法则下的胜者
- 10 秒抓人眼球的“技术类简历”怎么写?
- 应用于实时视频通信的深度学习算法研究
- 机器学习特征工程全过程
- 不到 10 个提升逼格的 Redis 命令
- MySQL 不为人知的主键与唯一索引约束
- 回顾·云上 HBase 冷热分离实践
- 冗余数据一致性,到底如何保证?
- 用机器学习怎样鉴别不可描述的网站
- “搞机器学习没前途” 2018 算法岗现状
- 深入浅出搜索架构引擎、方案与细节(上)
- 搜索引擎倒排索引的设计与实践
- 北京后厂村折叠:月薪追赶五万,生活低于五千
- 旷视、北邮等国内团队包揽六项第一,COCO&Mapillary 联合挑战赛结果公布
- 机器学习比赛大杀器 ---- 模型融合 (stacking & blending)
- 读书笔记《小群效应》
- 推荐系统遇上深度学习 (九)-- 评价指标 AUC 原理及实践
- 推荐效果线上评测:AB 测试平台的设计与实现【全】
- 【十大经典数据挖掘算法】PageRank
- NIPS 2018 丨解读微软亚洲研究院 10 篇入选论文
- 搜狐新闻推荐算法原理 | “呈现给你的,都是你所关心的”
- 强化学习在新闻推荐中的应用
- 资源 | skymind.ai 发布最新机器学习 人工智能开源数据集,
- 五八同城智能客服系统“帮帮”技术揭秘
- 微博广告分层实验平台 (Faraday) 架构实践
- 中文 NLP 用什么?中文自然语言处理的完整机器处理流程
- 互联网广告 CTR 预估新算法:基于神经网络的 DeepFM 原理解读
- 用户画像—计算用户偏好标签及数据指标与表结构设计
- 十年技术老兵总结的自我修炼之路
- 海量日志实时收集系统架构设计与 go 语言实现
- 25 个机器学习开放性面试题,没有明确答案
- 用户画像之标签权重算法
- 用户画像——标签聚类
- 用户画像——数据质量管理
- 回顾·知识图谱在贝壳找房的从 0 到 1 实践
- Google 首席决策师告诉你数据科学究竟是什么?
- 通俗解释协方差与相关系数
- AI 的思维
- 如何构建用户画像—打用户行为标签
- 比低情商更可怕的,是一个人的固执
- 科学匠人 | 微软亚洲研究院 陈薇 用数学逻辑来优化工作和人生
- AdaBoost 算法详解 原理 推导及应用
- 独家揭秘!2.5 亿用户的美团智能推荐平台是如何构建的?
- 我在机器学习踩过的坑,现在告诉你怎么跳过去
- 资本的钩子
- 观点 | 机器学习 =「新瓶装旧酒」的数据统计?No!
- 褚时健:发快财的时代过去了,年轻人要先做好这些事
- 分布式事务的实现原理 2pc 3pc XA 事务
- 大神总结的机器学习的数学基础,掌握这些足够
- KDD 2018 | 推荐系统特征构建新进展:极深因子分解机模型
- 写在博士旅程之前——前大疆创新技术总监杨硕
- 感知机 +SVM+LR
- 一位 49 岁的程序员、持续创业者教会我的宝贵经验
- 马云:如果事情都准备好了再做,那我就不会成功了
- Google 十年,我的认知被彻底颠覆
- 回顾·HBase 在贝壳找房的实践经验
- 神马搜索技术演进之路
- 如何将知识图谱特征学习应用到推荐系统?
- AIQ | 十多年前的那些 IT 工程师都去哪里了?
- 租客的至暗时刻:昨天买不起房,今天租不起房
- 资源 | Python 技巧 101:这 17 个骚操作你都 Ok 吗
- IT 公司 全能 CTO 的必备要素
- 被“伪兴趣”毁掉的年轻人
- 机器学习第三篇——分类决策树
- 机器学习第二篇——逻辑回归
- 美团在 O2O 场景下的广告营销
- 美团 | 写给工程师的十条精进原则
- AIQ | 诺奖得主点评:人工智能其实就是统计学,用了一个很华丽的辞藻
- 推荐引擎中规则以及策略
- AIQ | 陆奇去向最终敲定!带领 YC 孵化器进军中国
- 聊聊阿里社招面试,谈谈“野生”Java 程序员学习的道路
- 一文解说 Scala Trait 所有用法
- Scala 面向对象编程之类和对象
- Spark 三种提交模式:Standalone | yarn-client | yarn-cluster
- 【干货】机器学习中的五种回归模型及其优缺点
- SparkSQL 大数据实战:shuffle hash join、broadcast hash join 以及 sort merge join 三种 join 大揭秘
- 【区块链】一文看懂区块链【详解区块链】
- 观点 | 博士离开学术界算不算失败?牛津大学博士有话要说
- 春风十里不如你
- 深度学习必备的几款流行网络与数据集
- 为什么程序员一言不合就重构代码?
- KDD2018 | 电商搜索场景中的强化排序学习:形式化、理论分析以及应用
- 我们该如何学习机器学习中的数学
- 拼多多为什么崛起?这是目前解读最深刻的一篇
- 腾讯联合创始人张志东:发光的人要能拿得起,放得下
- VIPKID 一二面面经 (算法工程师)
- 一条数据的 HBase 之旅,简明 HBase 入门教程 -Flush 与 Compaction
- 一条数据的 HBase 之旅,简明 HBase 入门教程 -Write 全流程
- 一条数据的 HBase 之旅,简明 HBase 入门教程 - 开篇
- 30 张地图看懂世界格局,用大数据说话
- 面向机器学习:数据平台的设计与搭建
- 雷军最不待见,刘强东深恶痛绝,宁愿解散团队,这 7 类人也绝不能留
- 刷爆朋友圈的高赞演讲:为什么最棒的员工往往没有完美的简历?
- 神经网络的激活函数总结
- 赵大伟 | 区块链通证经济的本质与落地路径
- 雷军:小米创业 8 年内部影像首次公开 看完我心里边都是一团火
- 雷军,黄峥,王兴,互联网 2018 年的夏天
- 拼多多上市,80 后 CEO 创业 3 年身价 800 亿,背后这 3 个字最值得深思
- 基于内容的图像检索技术综述 传统经典方法
- AIQ - 百度深度学习图像识别决赛代码分享 (OCR)
- AIQ - 区块链 | 浅谈区块链技术与阿里云的探索实践
- 工业数据采集方法深度学习
- AIQ - AI | 快手 AI 技术副总裁郑文:为什么说 AI 是短视频平台的核心能力
- AIQ- 深度 | 碧桂园的鸡血、狗血和人血
- 随机森林概述
- 关于感受野的总结
- AIQ - 区块链 | AI+ 区块链深度解析,美国 VC 大咖:这是未来十年的趋势 | 33 页 PPT
- 流形学习概述
- AIQ - 深度 | 网易云音乐王诗沐:我们是如何四年时间做到 4 亿用户的
- AIQ - AI | 32 篇论文、7 大事业群,这是腾讯在斯德哥尔摩的 AI 之夜
- 罗辑思维 CEO 脱不花:关于工作和成长,这是我的 121 条具体建议
- AIQ - 深度 | 中关村风云 40 年
- 基于深度负相关学习的人群计数方法
- AIQ | Elasticsearch 史上最全最常用工具清单
- AIQ -【干货】模型验证的常用“武器”—ROC 和 AUC
- AIQ - deeplearning.ai 全套吴恩达老师的深度学习课程笔记及资源在线阅读
- 人脸检测算法之 S3FD
- AIQ - 有赞的面试经历,被虐的有点惨
- AIQ - 从损失函数的角度详解机器学习算法之逻辑回归
- AIQ - 架构 | 优秀架构师必须掌握的架构思维
- AIQ - 个人发展和职业规划的理论性叙述
- 理解计算 从根号 2 到 AlphaGo 第 3 季神经网络的数学模型
- AIQ - 学界 | SIGIR 2018 最佳论文:基于流行度推荐系统有效性的概率分析
- AIQ - Solr 与 ES(ElasticSearch)的对比
- AIQ - 机器学习近年来之怪现状
- 怎样成为一名优秀的算法工程师
- AIQ - 深度 | 学会为自己工作
- AIQ - 干货 | 1400 篇机器学习的论文中,这 10 篇是最棒的!
- AIQ - 干货 | Elasticsearch 趋势科技实战分享笔记
- AIQ - 深度 | 市值 465 亿美元的小米八年往事
- AIQ - | NLP 领域的 ImageNet 时代:词嵌入已死,语言模型当立
- AIQ - 区块链 | 国内区块链项目技术全面解析
- 机器学习算法地图
- 反向传播算法推导 - 全连接神经网络
- AIQ - NLP | CNN 也能用于 NLP 任务,一文简述文本分类任务的 7 个模型
- AIQ - 语音识别 | 微软亚研自动语法纠错系统达到人类水平
- AIQ - 人工智能 | 人工智能军备竞赛:一文尽览全球主要国家 AI 战略
- AIQ - 架构 | 软件服务架构的一些感悟
- AIQ - 人工智能 | “照骗”难逃 Adobe 的火眼金睛——用机器学习让 P 图无所遁形
- AIQ - 架构 | 知乎服务化的实践与思考
- AIQ - 深度 | 知乎高赞:久居一线城市都有什么错觉?
- 发布 AI 芯片昆仑和百度大脑 3.0、L4 自动驾驶巴士量产下线,这是百度 All in AI 一年后的最新答卷
- AIQ - 架构 | SpringBoot 开发案例从 0 到 1 构建分布式秒杀系统
- AIQ - 架构 | 京东推荐系统架构揭秘:大数据时代下的智能化改造
- AIQ - 架构 | Java 程序员该如何突破瓶颈,阿里小马哥十年架构师经验之谈(文末送书)
- AIQ - 架构 | Kafka 服务端 网络层 reactor 架构
- AIQ - 干货 | 从零到一学习知识图谱的技术与应用
- AIQ - 基础 | 深度学习之基础知识详解
- AIQ - 深度 | 排队离婚、落户、上天台,所有人都在赌明天
- 深度神经网络(DNN)模型与前向传播算法
- 深度神经网络(DNN)反向传播算法 (BP)
- 深度神经网络(DNN)损失函数和激活函数的选择
- AI 发展越来越快, 十年或二十年后哪些工作不会被替代?
- 到底该不该去创业公司?
- 真正的高手都是悄无声息的摆渡人
- 棚改 - 三四线楼市再无未来
- 你毕业几年了,混成什么鬼样子了?看看这些年轻人怎么说
- 知乎高赞:家里在一二线城市有很多套房是怎么的一种体验?答案太颠覆
- 美团点评 - 深度学习在计算机视觉中的应用
- AIQ 干货 | 蚂蚁金服科技一篇文章带你学习分布式事务
- 深度学习在美团搜索广告排序的应用实践是怎么样的?
- AIQ - 为什么要使用交叉验证?
- AIQ|【供应链】十张图帮你理解供应链 IT 名词!(上篇)
- AIQ|【学界】吴恩达 Deep Learning Specialization 课程刷后感(附课程视频,字幕,全套 PPT,作业)
- AIQ|【供应链】供应链、物流、采购到底有什么区别?
- AIQ |【供应链】2018 年中国智慧物流行业市场前景研究报告
- AIQ | 阿里是如何应对超大规模集群资源管理挑战的?
- AIQ | 优秀的算法工程师都是不用深度学习的
- AIQ | Coursera 吴恩达深度学习教程中文笔记最新版
- AIQ | 吴恩达课程从未失望,斯坦福 CS230 深度学习课程全套资料放出(附下载)
- AIQ | NLP 算法工程师的学习、成长和实战经验
- AIQ| 深醒首席科学家张钹院士:深度学习优势与短板,中国 AI 机遇和挑战
- AIQ| 出轨大数据新出炉,暴露一个惊人真相
- AIQ | 44 篇论文强势进击 CVPR 2018,商汤科技的研究员都在做哪些研究?
- AIQ | 面试经验·机器学习、深度学习、算法工程师(校招)
- AIQ | Spark 及 Spark Streaming 核心原理及实践
- AIQ | Spark 团队开源新作:全流程机器学习平台 MLflow
- AIQ 教程 |「川言川语」:用神经网络 RNN 模仿特朗普的语言风格
- AIQ | 求生之路:博士生涯的 17 条简单生存法则
- 面试了 8 家公司,社招机器学习面试题
- 人工智能入门书单推荐,学习 AI 的请收藏好(附 PDF 下载)
- 互联网降维打击是一个什么概念?
- 今日头条算法原理(全文)
- 机器学习新手必须掌握的十大算法指南
- 近期 GitHub 上最热门的开源项目(附链接)
- 深度 | 可视化 LSTM 网络:探索「记忆」的形成