摘要: 阿里云E-MapReduce实践 云HBase建设之开篇阿里云云HBase团队在2月份推出了云HBase产品,此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化,本系列将会为用户详细介绍这些点。
阿里云E-MapReduce实践
- 云HBase建设之开篇
阿里云云HBase团队在2月份推出了云HBase产品,此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化,本系列将会为用户详细介绍这些点。
资讯
- 自助式大数据分析时代正在来临
对于大数据而言,更多企业和机构在存储和处理各种形态和规模的数据,并从中提取有价值的信息。Gartner在其2017年《商业智能和分析平台魔力象限》中提到的Tableau预测:随着数据管控和保护系统以及大数据分析系统的日趋成熟,人们将要迎来自助式大数据分析时代。
- 云计算与移动化成为新型智慧城市"助推器"
在今年两会上,智慧城市成为一个高频词。两会代表指出:新型智慧城市已经成为未来城市进化的方向,要充分利用云计算、大数据等新一代信息技术,形成具备可持续、内生动力的安全、便捷、高效、绿色的智慧宜居新形态。那么,在推动新型智慧城市落地方面,需要具备哪些关键的能力呢?
- 告别盲目建设大数据,国家即将出台两项大数据重要标准
企业用户如何避免在大数据建设中“东一榔头西一锤子”?或者完全被厂商牵着鼻子走?如何能真正获取大数据的价值?这都是企业用户在大数据建设中真正关注的问题。现在,能帮助企事业机构更系统、更科学地建设和使用大数据的参考标准来了。
- (技术)SparkSQL的3种Join实现
Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。SparkSQL作为大数据领域的SQL实现,自然也对Join操作做了不少优化,今天主要看一下在SparkSQL中对于Join,常见的3种实现。
- (技术)Hadoop生态安全管理框架Apache Ranger升级为顶级项目
Apache Hadoop生态系统中的安全管理框架Apache Ranger晋升为顶级项目。Range是一种定义和管理安全策略的集中式组件,这些安全策略在受支持的Hadoop组件间强制执行,包括Apache HBase、Hadoop(HDFS和YARN)、Apache Hive、Apache Kafka、Apache Solr等。
- (技术)获得PCC性能大赛背后的RocksDB引擎:5分钟全面了解其原理
在 3 月 4 日举办的高可用架构 PCC 性能挑战赛上(PCC 是 Performance Challenge Championship 的缩写),以 RocksDB 为存储的队伍获得了显著的优势。在另外一方面,RocksDB 被存储相关架构师在各种讨论中反复提及,高可用架构翻译了官方的 rocksdb 基础说明,让读者 5 分钟可以全面了解。PCC 大赛的获奖作品将会另文介绍。。
- (技术)Apache Kylin - 大数据时代的OLAP利器
ApacheKylin 是一个Hadoop生态圈下的MOLAP系统,是eBay大数据部门从2014年开始研发并开源的支持TB到PB级别数据量的分布式OLAP分析引擎。