2017年2月大数据精华文章集锦

快讯

  1. Apache Beam的前世今生:谷歌已经不再使用MapReduce了
  2. 在新的一年里,选个关注热度上升的大数据工具学习下吧
  3. 下一代大数据处理平台Apache Beam成为Apache顶级项目
  4. 大中型企业的天网Apache Geode,毕业为Apache顶级项目
  5. Apache CarbonData 1.0.0 发布及其新特性介绍

Spark

  1. 基于Alluxio系统的Spark DataFrame高效存储管理技术
  2. Apache Spark的承诺及所面临的挑战
  3. 用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)
  4. 关键七步,用Apache Spark构建实时分析Dashboard]
  5. 用Spark机器学习数据流水线进行广告检测

Flink

  1. Flink可查询状态Queryable State:替换你的数据库
  2. Apache Flink 1.2.0 正式发布及其功能介绍
  3. Flink运行时之合久必分的特定任务
  4. Flink运行时之流处理程序生成流图
  5. Stream Analytics with SQL on Apache Flink
  6. 投行交易系统的定海神针——金融市场数据平台的架构设计之道

P.K.

万亿级日志与行为数据存储查询技术剖析

实战演练

  1. 大数据平台Docker应用之路
  2. 百度第三代 Spider 背后的万亿量级实时数据处理系统
  3. 乐刻大数据平台架构实践

大·数·据

查询

如何在不增加投入的情况下让你的数据库快上200倍

分析

  1. 创业公司做数据分析(一)开篇
  2. 创业公司做数据分析(二)运营数据系统
  3. 创业公司做数据分析(三)用户行为数据采集系统
  4. 创业公司做数据分析(四)ELK日志系统
  5. 创业公司做数据分析(五)微信分享追踪系统
  6. 条条大道通罗马:大数据分析工具的十条学习路径

运营

从零开始,构建数据化运营体系

产品

  1. 因特睿CEO张颖博士:燕云DaaS打破信息孤岛
  2. 星环科技创始人兼CTO孙元浩:后Hadoop时代,分布式计算已成为主流计算方式

你可能感兴趣的:(2017年2月大数据精华文章集锦)