还有2天,CCTC 2017就要在北京朝阳门悠唐皇冠假日酒店召开,大会召开在即,今天笔者就盘点了参会者不可错过的20场干货分享。
当然,本次CCTC 2017 现场将有近60场技术分享上演,每场都各具特点,参会者可以根据需要,选择自己最希望听到的技术分享。
不多说,请看下面:
讲师介绍: 涂威威,第四范式机器学习算法研发工程师,从事机器学习算法、大规模分布式机器学习计算框架研发,前百度商务搜索部资深研发工程师,从事凤巢系统广告CTR预估,基于MPI设计开发大规模分布式并行GBDT,百度最高奖Trinity项目发起人之一,设计开发百度大规模分布式计算框架ELF,并将FPGA硬件应用于凤巢线上CTR预估系统。
议题名称:大规模分布式机器学习系统设计和应用经验分享
议题简介:本议题介绍工业界大规模分布式机器学习系统,主要介绍机器学习计算框架设计的核心目标,并分享第四范式大规模分布式机器学习计算框架设计经验,最后,分享机器学习系统在实际应用中需要注意的常见问题。
讲师简介:孙健(花名千诀),2002年毕业于北京邮电大学,博士。2008年5月加入阿里巴巴,孙健主导的自然语言处理基础组件有力支撑和服务了阿里集团的电商搜索、神马网页搜索、高德地图搜索、阿里妈妈广告平台等核心业务,已经成为集团的基础设施和平台基础算法。孙健目前是阿里iDST自然语言人机对话方向的负责人,资深技术专家,主导了阿里巴巴自然交互平台(Natural User Interface, NUI)。NUI平台的使命就是连接人-智能设备-互联网服务,让用户与设备进行更自然更智能的交互,从而让用户随时随地更便捷的享受到互联网服务。目前NUI平台广泛应用于天猫魔盒、YUNOS手机、智能音箱、汽车智能后视镜、ET机器人、pepper机器人、智能客服等各种设备和场景中。
议题名称:智能人机对话面临的机遇、进展和挑战
议题简介:该演讲主要分享阿里在智能人机对话方向的思考、工作进展、应用场景和未来的挑战。
讲师简介:黄文坚,PPmoney大数据算法总监,负责集团的风控、理财、互联网证券等业务的数据挖掘工作。Google TensorFlow Contributor。前明略数据技术合伙人。曾就职于阿里巴巴搜索引擎算法团队,负责天猫个性化搜索系统。曾参加阿里巴巴大数据推荐算法大赛,于7000多只队伍中获得前10名。本科、研究生就读于香港科技大学,在顶级会议和期刊SIGMOBILE MobiCom、IEEE Transactions on Image Processing发表论文。
议题名称:深度学习、TensorFlow在金融科技领域的应用
议题简介:深度学习中卷积神经网络和循环神经网络对于时间序列的数据有很好的学习能力,而金融数据中大量的数据都是时间序列的格式,包括:银行流水、股票日线、交易日志,乃至金融分析报告中的文本信息等。因此,应用深度学习到金融数据挖掘中,会有先天的优势,而TensorFlow是目前深度学习中最成熟最主流的框架,它有Google提供强大的研发能力作保障,对各种最新的深度神经网络结构都有非常好的支持。在FinTech中,应用深度学习我们可以用来作很多方面的工作:自动报告生成、舆情分析、知识图谱、量化交易、金融风控等。
听众收益:
讲师简介:陈宇,现任京东集团,感知识别方向研发总监,从事计算机视觉方向研发。加入京东前曾在新加坡信息与通信研究院和阿里巴巴就职,有超过7年的电商领域项目经验。
陈宇在计算机视觉和机器学习方向有十多年研发经验,研发和工作方向主要集中在基于深度学习,增强学习,非监督学习的多媒体人工智能领域,包括:人脸识别,虹膜识别,图像搜索,电商图像处理等。陈宇拥有美国弗罗里达国际(州立)大学电子工程博士学位。
议题名称:智能感知助力品质京东
议题简介:介绍智能感知技术,包括图像,视频语音如何在京东的业务场景中落地,并且产生业务价值。
听众收益:
1、计算机视觉和深度学习落地经验 2、人工智能在电商,物流,金融等领域的落地前瞻3,技术研发经验总结
讲师简介: Yanbo is an Apache Spark Committer working at Hortonworks. His main interests center around implementing effective machine learning algorithms and building machine learning applications based on scalable distributed system. He is an active Apache Spark contributor, delivered the implementation of some major MLlib algorithms. Prior to Hortonworks, he was a software engineer at Yahoo!, Meituan and France Telecom working on machine learning and distributed system.
演讲议题:基于Spark的面向十亿级别特征的大规模机器学习
议题简介: Apache Spark MLlib provides scalable implementation of popular machine learning algorithms, which lets users train models from big dataset and iterate fast. The existing implementations assume that the number of parameters is small enough to fit in the memory of a single machine. However, many applications require solving problems with billions of parameters on a huge amount of data such as Ads CTR prediction and deep neural network. This requirement far exceeds the capacity of exisiting MLlib algorithms many of which use L-BFGS as the underlying solver. In order to fill this gap, we developed Vector-free L-BFGS for MLlib. It can solve optimization problems with billions of parameters in the Spark SQL framework where the training data are often generated. The algorithm scales very well and enables a variety of MLlib algorithms to handle a massive number of parameters over large datasets. In this talk, we will illustrate the power of Vector-free L-BFGS via logistic regression with real-world dataset and requirement. We will also discuss how this approach could be applied to other ML algorithms.
讲师简介:李扬,现任滴滴出行资深软件开发工程师。2015年加入滴滴出行基础平台部,主要负责HBase和Phoenix以及相关分布式存储技术。开发了基于HBase的地理位置索引程序,解决了key-value数据库对于查询给定地理范围内所有用户GPS轨迹困难的场景。在滴滴之前,曾在新浪担任数据工程师,专注于分布式计算和存储。
演讲议题:HBase在滴滴出行的应用场景和最佳实践
议题简介:随着滴滴在业务上的迅猛发展,如何在分布式存储上满足用户对海量数据的实时查询是日常工作的重要内容。在这种多租户场景下,如何资源分配,风险管理,成本控制,监控及运维面临着各种挑战。本议题将介绍HBase在滴滴出行针对各种典型应用场景及解决方案。
听众收益:将了解HBase在多租户场景下各种使用场景,及管理解决方案。
讲师简介:刘君,科大讯飞大数据实时计算方向负责人,2012年加入讯飞以来主要从事大数据实时分析及大数据平台构建相关的工作,为公司提供企业级的大数据能力输出平台,通读过jstorm源码并做过部分二次开发,有多年的实时计算、Hadoop、Spark的开发经验。
演讲议题:讯飞语音云实时分析架构及实践
议题简介:当前讯飞语音云每日会话量30亿,在线会话量5亿,如何实时感知语音云服务质量至关重要。讯飞语音云实时分析平台支撑着线上几十项任务,从各个层面支撑了语音云的实时服务质量和实时报表的稳定运行。本次分享,着重介绍讯飞语音云实时分析的架构选型、如何解决异地数据分析问题、如何采用disruptor提高Flume吞吐量、如何解决语音云数据窗口聚合问题、以及如何保障高效、稳定的集群工作状态。
听众收益:
讲师简介:陈萌辉,阿里云高级专家,阿里云飞天系统早期的重要参与者,在分布式调度、大规模数据处理方面有很多经验。目前主要关注容器云的集群管理与容器编排,尤其是基于Swarm的方案,贡献了解决Swarm规模问题的多个方案。
演讲议题:Swarm的进化与大规模应用
议题简介: Swarm是Docker 官方推出的容器编排方案,以其简单的架构、友好且兼容Docker的API、丰富的资源约束语法,深受开发者的喜爱,成为容器编排领域三分天下之一。而Docker1.12推出的Swarm Mode,还进一步集成了KV存储、服务API、路由等功能,把上述优点推向了极致。本话题将介绍Swarm的演进历史,并介绍它在阿里巴巴大规模应用的情况。
听众收益:了解容器编排领域的现状,Swarm的技术优势与不足,以及大规模使用时可能遇到的问题。
讲师简介:何浩祥,思杰大中华区高级技术经理,负责思杰大中华区应用交付产品线,带领大中华区技术团队协助客户构建以及导入应用交付解决方案, 在互联网、金融, 制造, 运营商, 零售, 教育与政府等行业应用交付规划方向拥有大量的实践经验。
何浩祥于2011年加入思杰,拥有超过14年的IT行业经验,在应用服务传递、加速优化、网络虚拟化、应用网络架构规划、信息安全规划、云网络架构规划等领域有丰富的经验,对Openstack、Kubernates、SDN、SDWAN等技术方向有深入的研究。
议题名称:容器架构下,多云平台的运维实践
议题简介:容器技术的快速发展,给企业带来了诸多好处,但是在企业实际运维过程中,往往需要面对公有云、私有云及既有数据中心等多个平台,同时,开发人力不足、需要满足法规遵从的要求等,都给运维人员带来诸多压力。Citrix NetScaler作为Gartner应用交付魔力象限第一象限的领导者和业内领先的 Web 和应用交付控制器,可以最大限度地提高所有应用和数据的性能及可用性,同时通过任何类型的设备提供对任何应用的安全远程接入, 協助企业将应用快速的运行在各平台上,並确保高可用、安全与可视化管理。
听众收益:有效管理多种云架构,降低运维风险,在多云平台架构中保证统一的IT安全,提升运维效率
讲师简介:曹高晋,中国移动苏州研发中心云计算产品部PaaS产品产品经理、PaaS产品研发工程师。
演讲议题:中国移动PaaS平台技术选型和实践经验分享
议题简介:中国移动构建PaaS的实践与经验总结,内容涉及基于Kubernetes/OpenStack的PaaS选型和建设、中国移动PaaS规划目标与架构,以及移动现网的案例分享。
听众收益:中国移动构建PaaS的实践与经验总结,内容涉及基于Kubernetes/OpenStack的PaaS选型和建设、中国移动PaaS规划目标与架构,以及移动现网的案例分享。
讲师简介: 徐磊,去哪儿网平台事业部运维开发工程师。2015年加入去哪儿网,负责实时日志相关的开发与运维工作。有多年电信、云计算行业经验,曾供职于红帽中国。
演讲议题:基于Mesos/Docker构建数据处理平台
议题简介:介绍去哪儿网内部两年来利用Mesos和Docker构建私有云服务,从无状态应用向有状态应用逐步过度的的经验与心得。
听众收益:了解Mesos与Docker的适用领域,以及有状态应用如何迁移到Mesos和Docker的体系上,逐步建立公司内部的私有云服务。
讲师简介: 徐年刚,深圳睿云智合 CTO,2002年通过香港专才计划,加盟中信国际电讯集团,先后任职集团首席系统架构师和国际业务系统技术总监, 集团MIS高级部门总监。后期负责集团云计算规划和建设,以及利用云计算进行业务创新。
2011 年加入美国Eucalyptus。先后任职美国研发团队架构师和中国区技术总监,参与国内外多个云平台项目的交付和管理。2015年,加入中电科华云, 任职云计算产品总监。推动电科华云加入了openstack 基金会。2016年以联合创始人身份加入睿云智合科技有限公司,任职公司技术总监。全面负责睿云的技术路线规划、产品设计与研发管理。
演讲议题:容器化引领IT新常态
议题简介:容器技术给云计算带来创新的理念,区别与过去的虚拟化技术,Application Centirc 的容器技术带来一些列理念,标准和规范; 分享对介绍容器技术的本质理解; 结合过去在金融保险行业容器技术推广和落地案例, 详细分析容器技术在企业传统应用自动化部署平台,CI/CD,混合云以及PAAS平台的应用思路,方法和具体实践
听众收益:理解容器技术的本质,结合企业实际情况合理应用容器技术解决实际问题
讲师简介:郑坤,美团点评容器平台负责人,中科院计算技术研究所博士,2015年加入美团,设计并开发美团点评容器平台,在美团点评内大规模使用,推动美团点评业务的容器化进程。
演讲议题:美团点评业务容器化实战分享
议题简介:美团点评容器平台是基于美团云平台设计实现,承载美团点评海量的线上服务,推动公司业务的容器化进程。演讲将分享容器平台的设计思路,在业务容器化实战中所遇到的问题和解决方案。演讲的内容包括容器平台的架构、网络、容器调度、业务编排、弹性伸缩、容器监控等方面。
听众收益:美团云、Docker、容器、编排、容器监控、调度、弹性伸缩
讲师简介:陈泽,苏宁云商IT总部高级技术经理。苏宁云商大数据离线计算平台的计算方向负责人,目前主要从事Yarn,Hive,Spark,Druid等计算组件研发工作。曾就职于百度,有多年的Spark大数据方向的研发经验,精通Spark SQL,Druid等内核原理,有丰富的任务故障诊断和性能调优经验。
演讲议题:Spark App自动化故障分析与诊断
议题简介:对于托管在大数据平台上的Spark/MR任务,在任务计算过程中,会因为业务数据倾斜,平台资源竞争,以及框架参数设置不合理等问题,导致任务的计算效率低下,甚至失败。在苏宁,我们将平台运维过程中的各种故障诊断以及性能调优经验落地为平台,提供任务异常报警和状态评分,给任务开发者提供自动化的故障诊断和性能调优能力。分享大纲:
听众收益:大数据平台开发人员,运维人员以及大数据应用开发人员。
讲师简介:吴磊,微博算法平台高级工程师。曾任职于IBM、联想研究院,从事数据库、数据仓库、大数据分析相关工作;现就职于新浪微博,主要负责以Spark为核心的大数据计算框架、机器学习平台的设计和实现。日常生活中热衷并善于利用数据分析生活中的点点滴滴,创办公众号《小生活与大数据》,提倡“玩转数据,乐享生活”。
演讲议题:基于Spark的大规模机器学习在微博的应用
议题简介:
听众收益:
讲师简介:李昆,华为大数据平台设计部部长。2004年加入华为,长期从事电信协议、管道智能化、数据可视化、用户行为分析等系统研究和开发工作。近年致力于数据管理和处理技术研究,参与Hadoop,Spark,Alluxio等开源社区,2016年作为CarbonData PMC成员参与Apache CarbonData项目孵化,寻求大数据与一站式分析平台的创新机会点。
演讲议题:CarbonData大数据高性能交互式分析实践
议题简介: Apache CarbonData是一种新的高性能数据存储格式,针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支持“任意维度组合的过滤查询、快速扫描、详单查询等”多种应用场景,实现百亿数据级秒级响应。
听众收益:听众可了解到:
讲师简介:赵宏尧,七牛云数据技术与产品部高级大数据开发工程师,曾就职于唯品会从事大数据平台相关的开发工作,目前聚焦于大数据流式处理平台的研发,对主流的分布式大数据流式处理框架有比较深刻的理解和实践经验。
演讲议题:基于Spark的流式处理引擎在Pandora大数据产品中的应用
议题简介:主要介绍了如何使用Spark Streaming为Pandora大数据产品添加流式处理服务。具体将会分享构建这样一个流式处理服务过程中遇到的一些技术问题以及我们解决方案,同时也会简单分享一下我们在Structured Streaming上做的一些尝试。
听众收益:听众可以通过这次分享,了解Spark Streaming在生产环境的使用过程中可能遇到的常见的问题和处理方法,让生产环境中使用Spark Streaming更加顺畅,同时对于想尝试Spark 2.1.0中的Structured Streaming功能的同学,也会得到一些建议。
讲师简介:范文臣,Databricks软件工程师。Apache Spark Committer,Spark SQL 开发团队核心成员。2013年从浙江大学毕业后,一直在进行分布式系统相关的工作。2014年开始接触 Spark,并成为最活跃的代码贡献者之一。2015年正式加入 databricks,成为 databricks 中国分部(筹建中)的第一名员工,主要负责开源社区方面的工作。
演讲议题:Deep Dive: How Spark use Memory
议题简介:此次演讲的目标听众主要是高级 Spark 用户和 Spark 内核开发人员。演讲会深入一些 Spark 技术细节,向大家解释 Spark作一个内存计算框架,具体是如何高效使用内存的。包括: Spark的主要内存使用点,数据在 Spark 内存中的表现形式,Spark 如何利用内存的层次特点实现 cache-aware 算法,以及一些未来的展望。
听众收益:了解这些技术细节后,高级 Spark 用户能对自己的 Spark 的应用程序的内存使用情况有更清楚的认识,方便后续的调优。Spark 内核开发者能对 Spark 整体架构有更深入的了解。
讲师简介:人民保险信息技术工程师。从事信息技术工作,致力于区块链在保险业的应用研究,在行业内学术期刊发表多篇文章,对集团层面的信息化建设有丰富经验。
演讲议题:区块链原理及保险业应用思考
议题简介:针对目前区块链知识进行一次较为体系化的讲解,使得初学者能迅速抓住区块链技术的核心思想与应用技巧,对区块链应用和智能合约有一个快速的、由浅入深的了解,同时讲解在保险业的一些可能的应用,对区块链应用者产生一定的启发,并对未来进行展望。
听众收益
1、 让开发者能快速理解区块链,并找到切入点
2、 让应用者把握区块链应用的核心理念
3、 介绍一些行业特色及案例
4、 了解最新的发展方向
讲师简介:分布科技CTO&创始人。区块链技术和计算机安全专家,CISA信息系统审计师。具备区块链底层协议架构和开发能力,dBFT共识机制的作者,独立原创实现了小蚁全部的核心代码。
演讲议题:区块链智能资产开发实践
议题简介:详细介绍什么是区块链,区块链的作用是什么,数字资产是什么概念,如果将资产登记到区块链上进行数字化,智能合约是什么,智能合约与区块链的关系是什么,如何将数字资产与智能合约相结合,从而成为区块链上的智能资产。最后,介绍我国最早的区块链项目——小蚁,以及如何基于小蚁来进行智能资产的项目开发。
听众收益
对于普通人,可以通俗易懂地理解区块链、数字资产、智能合约这些概念;对于开发者,可以学习到如何进行智能合约或智能资产的应用开发。
微信报名通道,请用手机微信扫描下方二维码,快速完成报名: