开源大数据周刊-第10期

摘要: 云上Hadoop之最佳实践

阿里云E-Mapreduce动态

E-Mapreduce团队 
1.3.2版本(已经发布):

  • Master HA功能

1.3.3版本 (已经发布)

  • 商业化发布,用户无需申请即可使用E-MapReduce服务

1.3.4版本 (正在研发)

  • 升级jdk到1.8
  • 升级Hadoop到2.7.2
  • 添加python2.7.1及python3.4版本
  • 添加numpy库
  • 支持Presto、phoenix、jstorm、oozie
  • 支持Hadoop跟Hbase混合部署
  • 支持深圳、上海机房

1.4版本(正在研发):

  • 用户执行计划及集群运行状态自定义报警

1.4.1版本

  • 集群整体运行情况的仪表盘
  • 集群状态监控报警

资讯

  • 云上Hadoop之最佳实践
    本篇是实践篇,主要讲述hadoop的一些处理场景,特别是在云上的一些最佳实践。
  • 李开复清华演讲:为什么今天是人工智能的黄金时代?
    6月8日,应清华大学交叉信息研究院院长、世界著名计算机科学家姚期智院士邀请,向清华大学“姚班”的同学们做了名为《人工智能的黄金时代》的演讲。姚教授是计算机界最负盛名的图灵奖得主,2005年他与微软亚洲研究院合作在清华大学创办计算机科学实验班(简称“姚班”),十多年来培养了一批批拔尖的创新人才。
  • 在应用Hadoop时,了解其应用特点尤为重要
    Hadoop的优势是低成本、高效性、可靠性、扩展性,您的应用是否适合用Hadoop可以看下。
  • 大数据即服务(BDaaS):大数据行业的下一个热门
    我们有软件即服务(SaaS)、平台即服务(PaaS)和数据即服务(DaaS),现在把它们全部揉杂在一起,再将所涉及的数据量大幅增加,就有了大数据即服务(BDaaS)。
  • CaffeOnSpark解决了三大问题 ——对话雅虎机器学习平台负责人
    Andy Feng是Apache Storm的Committer,同时也是雅虎公司负责大数据与机器学习平台的副总裁。他带领雅虎机器学习团队基于开源的Spark和Caffe开发了深度学习框架CaffeOnSpark,以支持雅虎的业务团队在Hadoop和Spark集群上无缝地完成大数据处理、传统机器学习和深度学习任务,并在CaffeOnSpark较为成熟之后将其开源。
  • E-MapReduce集群如何使用Phoenix on HBase
    Phoenix是一个提供hbase的sql操作的框架,Phoenix是构建在HBase之上的一个SQL中间层。此教程教程演示E-MapReduce支持Phoenix集群
  • 用引导操作给E-MapReduce集群安装presto组件 
    Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。此教程演示E-MapReduce支持presto集群

你可能感兴趣的:(云栖社区开源大数据周刊)