摘要: 大数据在医疗行业应用,Hive/ElasticSearch新版本特性,Spark欧洲峰会
E-Mapreduce产品即将发布的版本信息如下:
1.5.2版本
1.6.0版本
干货报告丨医疗大数据的行业应用研究
报告从医疗大数据的概念、政策财政支持、发展背景以及现状,到相关具体的应用场景进行了详细介绍,该领域具有广阔的前景。
大数据的价值:找到别人的“集体智慧”
作者为数据咨询师车品觉,文章主要内容:①大数据行业正在发生三大颠覆性变化;②大数据变成企业的洞察力、行动力;③大数据的创新依靠集体智慧;④考量“好数据”的六把标尺。
八个国家级的大数据中心已经或即将启动建设
为了响应号召,国家部委、地方政府、基础电信运营商、互联网巨头、信息通信设备制造商纷纷投资建设自己的大数据中心帝国。目前,八个国家级的大数据中心已经或即将启动建设,包括国家化学品数据中心、国家化学品数据中心、全国精准扶贫精准脱贫大数据平台、全国精准扶贫精准脱贫大数据平台、生态环境大数据平台、国土资源大数据平台、国家政务信息共享交换平台、国家交通运输物流公共信息平台。
Spark Submit Europe 2016
Spark 2016欧洲峰会10月25~27在布鲁塞尔召开,议题包括工业界的Spark开发者的分享(FaceBook/Microsoft等)、Spark实践(TensorFlow on Spark/Struct Streaming等)、学术界的研究(AMP Lab UC Berkeley/Purdue University等),可以下载一些ppt。
(技术)Apache Hive走向内存计算,性能提升26倍
Apache Hive 2.1已于几个月前发布,它引入了内存计算,这使得Hive计算性能得到极大提升,这将会影响SQL On Hadoop目前的竞争局面。据测试,其性能提高约26倍。
(技术)架构师特刊:Apache Kylin实践
InfoQ做的麒麟特刊,看了几个互联网公司的案例,从业务出发来规避麒麟的问题,也能达到很好的效果。有一篇说麒麟的好处是把前台查询和大数据平台放在一起,但后续很多case都是麒麟的hbase单独搭建一个集群做查询,感觉还是很割裂。
(技术)物联网大数据平台TIZA STAR架构解析
万物互联的时代正逐步到来,据权威报告预测,2020年全球物联网连接的终端数将达到500亿,数据呈现爆发式增长,从数据中提取价值也更加有挑战。TIZA STAR是一个企业级的物联网大数据平台,文章介绍了TIZA STAR的架构,涉及数据接入、存储、处理、交换等流程处理,以及安全、监控、具体应用场景等。
(技术)机器学习通用框架总结
每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调