2018第九届中国数据库技术大会(DTCC2018)SecondDay

一、前言

今天是DTCC大会第二天,给我更多反思的是如何真正从自身业务出发实现企业自身的大数据落地的刚需。数据的价值如何推进企业未来的发展,究其问题本质是企业自身拥有丰富的行业建设背景与经验而缺乏数据建设及推进的能力,很多企业不能像阿里那样拥有“双十一”这样的大数据行业承载背景,但是数据推动业务的发展已经成为各行业都在思考与苦恼的问题。

马云在每次IT峰会总是会说到“行业危机”,阿里已经从传统电商转向数据服务类巨头。我想对于我们自身来说应该也不算晚,利用好现存的大数据技术思考业务背后的价值才是未来很长时间大家探索的方向。

二、行程规划

结合自身行业及研发实力,今天的会议行程主要围绕“大数据云服务”、“机器学习与深度学习”。之所以选择这两个专题,出于当前业务背景考虑,我们能在大数据云服务中用到什么、用到什么程度、客户价值如何构建等。

1】上午是大会议室专题(公共类),一个专业名词印象深刻——“HTAP”,于是私底下查看了其释义:

“可同时支持OLTP和OLAP场景,基于创新的计算存储框架,在一份数据上保证事务的同时支撑实时分析,省去了费时的ETL过程“——Gtarner.

其中以阿里云数据库总架构师的专题讲座尤为印象深刻,以下为其演讲现场:


其中阿里新一代关系型数据库POLARDB尤其引起界内的关注,其主要特性包括存储计算的分离及并行RAFT,且结合了新的硬件RDMA,还有一些其他新的优化与业内领先的技术(软件及硬件)。

2】下午专场

行程规划如下:


大数据云服务专题中各位专家分别围绕轻量云业务场景、业务实际场景痛点及OLAP问题展开论述。

1、企业级大数据轻量化实践中主要围绕将公有云20+管控服务轻量化、高可用、可升级及可扩展,支撑小体量数据应用背景下的大数据实践。具体工作围绕原有大数据海量数据处理平台的功能调整、白屏化运维等工作,为一些数据体量不是很大的业务场景进行大数据应用落地。后期发展方向为——DataWorks(数据工作台)的智能运维。

2、基于Apache Kylin的云上大数据交互分析实践中主要介绍了Apache中开源OLAP分析工作Kylin,适用于复杂分析场景60+维度数、雪花模型、子查询等,支持ANSI SQL查询接口且可直接与BI工具进行对接。大量数据的查询分析性能上表现也是十分优秀的,其所有查询均控制在1s左右,其技术关键核心在于数据集合的预计算。但Kylin还是存在一些问题,主要表现在增量计算及多表联查等方面。

3、很多公司对于业务场景现存数据或大量埋点数据已经开展了机器学习与深度学习方面相关工作,对用户行为或业务场景进行建模及深度学习,从多维度及相关性等方面对业务进行正向驱动。如:阿里的内容产业AI应用及思考,他们基于当前多媒体产业场景下对媒体内容(内容本身及周边生态)进行内容分类、信息多维度分析并结合深度学习算法对媒体内容素材进行推荐;京东的基于机器学习的智能揽客营销,是构建用户、产品间的关系,对用户行为进行深度机器学习,从而达到形成目标用户群预测集,推荐给商户进行商品推荐进行精准营销。

会议现场场景如下:

2018第九届中国数据库技术大会(DTCC2018)SecondDay_第1张图片


2018第九届中国数据库技术大会(DTCC2018)SecondDay_第2张图片

三、会议感受

个人认为利用好现存大数据技术与上层业务数据建模引导产业方向是未来企业深入思考的问题。对于数据体量级不够的情况下,应该把重心放在成为本行业领域的专家,而不是为了去做大数据而去做大数据,毕竟业务场景的差异性决定了数据体量的差异性。利用好OLAP层技术与数据建模才是未来大部分非互联网背景下企业的大数据应用发展思路与方向。

以上仅为个人观点,非喜勿喷!

​ GodBlessToNo1

​ 20180511

你可能感兴趣的:(产品学习,数据库相关)