滴滴主题研究计划
滴滴希望通过开放业务场景,与学术界发现与定义问题,合作共赢解决领域难题,构建高水平跨境知识与研究网络,构筑产学研合作共同体。
2018年秋季期主题研究计划包含机器学习、计算机视觉、语音信号处理、地理信息技术和能源与汽车五大研究方向的15个来自滴滴真实业务场景。诚邀全球顶尖的学者与滴滴研究员共同探讨前沿技术在出行领域的落地应用,以真实场景驱动技术革新。
2018年秋季期提交申报书截止日期8月19日。请您关注项目关键时间节点,选定申报命题后提前完成申报工作。
主题研究计划官方网址:
https://outreach.didichuxing.com/RFP
本期我们将介绍机器学习方向课题,希望大家可以找到与自己研究方向匹配的申报方向。
机器学习
一. 供需预测
1.技术方向
时空数据 人群转移分析 城市出行
2.课题背景
出行领域的核心在于连接司机和乘客。如何有效利用这些信息通过大数据和机器学习的技术方案,对供给和需求进行描述和建模,实现高频出行下的供需平衡,是提升整个平台效率和服务的关键。通过建立一个统一的供需实时预测系统,通过基础能力的建设和打磨,能赋能订单分配、司机调度、导流、定价、产品策略等业务场景,提升整个出行平台的效率。
3.研究目标
针对上述关键问题,研究目标包括不限于:
1. 时空数据预测
构建出行场景下时空数据预测能力,其中涉及数据集组织、特征工程、模型训练和验证。对于时空数据的分析和研究一直是业界热议的方向之一,而时空数据预测也一直是业界的一大难题,我们拟建立科学的评估体系,对输出的预测能力提出以下要求:提供实时预测能力,达到数据可用性,适配节假日、极端天气、突发事件等异常情况。
2. 人群转移分析
出行场景的根本是人群的转移,只有深入挖掘人群属性及行为特征,才能对城市出行规律做出更加科学的解读。
二.拼车算法研究
1.技术方向
研究拼车合乘算法,提升拼车系统的效率
2.课题背景
网约车的快速发展和普及,极大地提升了出行服务的体验和效率。同时,车辆共享使得交通拥堵得到缓解,基于大数据的供需匹配与优化技术也助力于智慧城市的建设。其中拼车通过行程共享,致力于进一步提升车辆利用效率,以提供低价、高效、绿色的出行服务产品。
在更少的体验损失下,将更多的订单组合在一起,也将极大提升拼车效率。拼车效率的实现依赖于定价能力, 需求结构及分单能力, 且各部分作用相互耦合。定价模型灵活支持不同业务目标下的基础定价及补贴发放策略。出行需求结构在不同城市差异巨大: 在相似体验约束下,达到同等效率所需的订单数量在不同时空域上迥异。给定供需集合,分单模块负责将需求与需求,供给与需求进行实时匹配,并通过匹配算法及时序决策的优化提升拼车效率。
三个部分的综合影响最终决定了拼车效率的实现,而各独立部分影响面的量化及相互作用关系的描述,对整体策略能力进化必不可少。
针对上述关键问题,研究目标包括不限于:
1. 拼车分单时序决策优化
实时拼车业务的一个主要特征是分单系统对出行需求的即时响应,意味着匹配决策需要在极短的时间内完成。对某一订单来说,在其生命周期中往往能参与多个订单组合,且该订单组合的集合随时间变化并决定了此订单匹配效率的优化空间。因此,匹配决策需在当前轮次的优化力度及未来需求的随机性之间做权衡。即不仅提升每一轮次的匹配效率,同时需考虑订单在时序上所能参加的匹配轮次组合并决策最佳分配点。
2. 需求结构与分单耦合关系建模
分单框架中的各要素如基础匹配算法,时序决策优化,体验参数控制等,在不同的需求结构下,对于拼车效率的影响也相应变化。因此,在不同的需求结构下,需灵活地根据相适应关系调整分单框架,从而使各要素的组合能更好地实现拼车效率。
3. 需求结构建模
在同一城市中需求结构是异质化的,而基于业务目标,去有向地调整需求结构十分重要。为不同时空域内的需求建立属性,可增强对输入订单集合的把控能力。如动态泛线路的挖掘,及线路间影响关系的建模等 。
4. 绕路识别
拼车绕路的实时识别,包括拼车子单内送驾绕路,拼友接驾绕路,全拼单整体绕路,相邻单绕路等的识别。一般来说,这个过程涉及异常问题定义,用户反馈收集和清洗,特征数据集构建,模型训练和验证。其中,问题的拆解和建模是最困难的。拼车绕路场景有着丰富的内涵,完成机器学习建模应该满足以下三个要求:
1)内聚性
每个子问题场景都有一个清晰的定义,任何两个子场景之间的边界尽可能清晰。每个子场景的拆分定义具有较强的内聚性。
2)全局性
各子问题场景间的相关性及子场景与总场景的关系,对问题的发现和早期问题的及时解决有较强的影响,需要统筹考虑。
3)模型指标
模型需要通盘考虑准确率、召回率对成本和用户体验的平衡,同时兼顾模型判责的可解释性。
5. 成单调度
根据订单时间、费用、里程、路况、空余座位、司机属性、乘客属性等特征,结合成本收益体验等建设基于深度学习、强化学习的拼单调度策略,从而提升资源利用率和司乘体验。
1) 多目标优化
充分考虑司机、乘客利益和约束,实现司乘体验的优化,体验和效率、平台长期增长的均衡。
2) 模型指标
在充分理解业务和数据的基础上,分场景建设通用的灵活可配置的调度模型。实现拼成率、顺路率等核心业务指标的明显提升。
三 . 派单算法研究
1.技术方向
组合优化、强化学习、多目标优化、在线系统
2.课题背景
网约车服务在近年来得到了广泛的普及和长足的发展。与传统的巡游出租车相比,网约车的优势之一在于其存在中心化的决策机制,可按需在线地撮合乘客和司机间的匹配,从而达到提升平台效率和司乘体验的效果。订单分配(或派单)算法作为连接司机和乘客的桥梁,是网约车平台中最核心的问题之一。
在实际应用中,一个可用的订单分配算法需要满足几下几个要求:
1. 实时计算、运行效率高
以滴滴平台为例,每天平台日订单3000万,这对算法的实时性和复杂度有了很高的要求;
2. 平衡效率、体验等多个目标
在订单分配算法中,平台不仅要考虑整体的匹配效率,还需要满足司乘体验的要求、公平性、可解释性以及平台长期增长的诉求。如何将这些目标有机地结合在一起是一大难题。
从上述分析可知,派单任务无法简单地由人工配置进行,其对机器算法有着很强的依赖。从另一个角度来说,派单算法也是人工智能、机器学习、运筹优化等研究领域很好的实验土壤。综上,派单问题可以作为学术和工业界结合的重要应用之一。
3.研究目标
针对上述关键问题,研究目标包括不限于:
1. 匹配算法框架
在订单分配问题中,一个重要的特性是其存在网络效应和时序效应。具体来说,网约车为一个司乘的双边市场,司乘间的匹配皆不是互相独立的,其在时间和空间上组成了一个网络状的结构。同时,派单中需要考虑平台效率、司乘体验、公平性等多种因素,形成了多目标优化的问题。因此,设计一个可满足以上条件的匹配框架,平衡优化目标和约束,并综合时间序列和空间匹配要求,非常有研究价值。
2. 个性化派单
根据用户实时状态以及用户特性的不同,进行个性化的分单,以提升司乘和效率。
3. 派单公平性和可解释性
滴滴的线上分单系统每天为大量的司机和乘客服务,其服务对象均为有感情有诉求的个体,故算法的可解释性和公平性往往与平台效率、体验处于同样重要的作用。如何把公平性引入优化目标或约束中,并生成可解释可回溯的匹配标准,也是算法必须要考虑的问题。
注意
更多项目信息
请关注主题研究计划官方主页:
https://outreach.didichuxing.com/RFP
本文来自 滴滴学术合作 微信号。