BehandTheTime

开源大数据利器汇总

类别	名称	官网	备注
查询引擎	Phoenix	https://phoenix.apache.org/	Salesforce公司出品，Apache HBase之上的一个SQL中间层，完全使用Java编写
	Kylin	http://kylin.io	eBay开源的基于Hadoop的分布式OLAP分析引擎，旨在减少Hadoop在10亿行以上数据级别的情况下的查询延迟
	Stinger	http://hortonworks.com/labs/stinger/ http://hortonworks.com/hadoop/tez/	原叫Tez，下一代Hive,Hortonworks主导开发，运行在YARN上的DAG计算框架
	Presto	http://prestodb.io/	Facebook开源
	Shark	http://shark.cs.berkeley.edu/	Spark上的SQL执行引擎，已演化成Spark-SQL和Hive on Spark
	Pig	http://pig.apache.org/	基于Hadoop MapReduce的脚本语言
	Cloudera Impala	http://www.cloudera.com/content/cloudera/en/products-and-services/cdh/impala.html	参照Google Dremel实现，能运行在HDFS或HBase上，使用C++开发
	Apache Drill	https://drill.apache.org/	参照Google Dremel实现
	Apache Tajo	http://tajo.apache.org/	一个运行在YARN上支持SQL的分布式数据仓库
	Hive	http://hive.apache.org/	基于Hadoop MapReduce的SQL查询引擎
流式计算	Facebook Puma		实时数据流分析
	Twitter Rainbird		分布式实时统计系统，如网站的点击统计
	Yahoo S4	http://incubator.apache.org/s4/	Java开发的一个通用的、分布式的、可扩展的、分区容错的、可插拔的无主架构的流式系统
	jStrom	https://github.com/alibaba/jstorm	阿里开源的经过优化的Java版Storm
	Twitter Storm	http://storm.incubator.apache.org/	使用Java和Clojure实现
迭代计算	Apache Hama	https://hama.apache.org/	建立在Hadoop上基于BSP（Bulk Synchronous Parallel）的计算框架，模仿了Google的Pregel。
	Apache Giraph	https://giraph.apache.org/	建立在Hadoop上的可伸缩的分布式迭代图处理系统，灵感来自BSP（bulk synchronous parallel）和Google的Pregel
	HaLoop	https://code.google.com/p/haloop/	迭代的MapReduce
	Twister	http://www.iterativemapreduce.org/	迭代的MapReduce
离线计算	Hadoop MapReduce	http://hadoop.apache.org/	经典的大数据批处理系统
	Berkeley Spark	http://spark.apache.org/ http://shark.cs.berkeley.edu/	使用Scala语言实现，和MapReduce有较大的竞争关系，性能强于MapReduce
	Flink	https://flink.apache.org/	和Spark类似的
	Apache Ignite	http://ignite.apache.org/	内存数据组织框架是一个高性能、集成化和分布式的内存计算和事务平台
	DataTorrent	http://www.datatorrent.com/	基于Hadoop2.X构建的实时流式处理和分析平台，每秒可以处理超过10亿个实时事件
嵌入式DB	Firebird	http://www.firebirdsql.org/	从Interbase派生出来的，支持SQL，支持事务
键值存储	LevelDB	https://code.google.com/p/leveldb/	Google开源的高效KV编程库，注意它只是个库
	RocksDB	http://rocksdb.org/	Facebook开源的，基于Google的LevelDB，但提高了扩展性可以运行在多核处理器上
	HyperDex	http://hyperdex.org/	下一代KV存储系统，支持strings、integers、floats、lists、maps和sets等丰富的数据类型
	TokyoCabinet	http://fallabs.com/tokyocabinet/	日本人Mikio Hirabayashi（平林干雄）开发的一款DBM数据库，注意它只是个库（大名鼎鼎的DBM数据库qdbm就是Mikio Hirabayashi开发的）,读写非常快
	Voldemort	http://www.project-voldemort.com/voldemort/	一个分布式键值存储系统，是Amazon Dynamo的一个开源克隆，LinkedIn开源
	Amazon Dynamo	https://github.com/dynamo/dynamo	亚马逊的KV模式的存储平台，无主架构
	Tair	http://tair.taobao.org/	淘宝出品的高性能、分布式、可扩展、高可靠的KV结构存储系统，专为小文件优化，并提供简单易用的接口（类似Map），Tair支持Java和C版本的客户端
	Apache Accumulo	https://accumulo.apache.org/	一个可靠的、可伸缩的、高性能的排序分布式的KV存储系统，参照Google Bigtable而设计，建立在Hadoop、Thrift和Zookeeper之上。
	Redis	http://redis.io/	使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、单机版KV数据库。从2010年3月15日起，Redis的开发工作由VMware主持
表格存储	OceanBase	https://github.com/alibaba/oceanbase	支持海量数据的高性能分布式数据库系统，实现了数千亿条记录、数百TB数据上的跨行跨表事务
	Amazon SimpleDB	http://aws.amazon.com/cn/simpledb/	一个可大规模伸缩、用 Erlang 编写的高可用数据存储
	Vertica	http://www.vertica.com/	惠普2011收购Vertica，Vertica是传统的关系型数据库，基于列存储，同时支持MPP，使用标准的SQL查询,可以和Hadoop/MapReduce进行集成
	Cassandra	http://cassandra.apache.org/	Hadoop成员，Facebook于2008将Cassandra开源，基于O(1)DHT的完全P2P架构
	HyperTable	http://hypertable.org/	搜索引擎公司Zvents针对Bigtable的C++开源实现
	FoundationDB	https://foundationdb.com/	支持ACID事务处理的NoSQL数据库，提供非常好的性能、数据一致性和操作弹性
	MemSQL	http://www.memsql.com/	前Facebook工程师创办的，号称世界上最快的分布式关系型数据库，兼容MySQL但快30倍，能实现每秒150万次事务，原理是仅用内存并将SQL预编译为C++。
	HBase	http://hbase.apache.org/	Bigtable在Hadoop中的实现，最初是Powerset公司为了处理自然语言搜索产生的海量数据而开展的项目
文件存储	CouchDB	http://couchdb.apache.org/	面向文档的数据存储
	MongoDB	https://www.mongodb.org/	文档数据库
	Tachyon	http://tachyon-project.org/ https://github.com/amplab/tachyon	加州大学伯克利分校的AMPLab基于Hadoop的核心组件开发出一个更快的版本Tachyon，它从底层重构了Hadoop平台。
	KFS	http://code.google.com/p/kosmosfs/	GFS的C++开源版本
	HDFS	http://hadoop.apache.org/	GFS在Hadoop中的实现
资源管理	Twitter Mesos	http://mesos.apache.org/	Google Borg的翻版
资源管理	Hadoop Yarn	http://hadoop.apache.org/	类似于Mesos
日志收集系统	Facebook Scribe	https://github.com/facebook/scribe	Facebook开源的日志收集系统，能够从各种日志源上收集日志，存储到一个中央存储系统（可以是NFS，分布式文件系统等）上，以便于进行集中统计分析处理，常与Hadoop结合使用，Scribe用于向HDFS中Push日志
	Cloudera Flume	http://flume.apache.org/	Cloudera提供的日志收集系统，支持对日志的实时性收集
	logstash	http://www.logstash.net/	日志管理、分析和传输工具，可配合kibana、ElasticSearch组建成日志查询系统
	kibana	http://www.elasticsearch.org/overview/kibana/	为日志提供友好的Web查询页面
消息系统	StormMQ	http://stormmq.com/
	ZeroMQ	http://zeromq.org/	很底层的高性能网络库
	RabbitMQ	https://www.rabbitmq.com/	在AMQP基础上完整的，可复用的企业消息系统
	Apache ActiveMQ	http://activemq.apache.org/	能力强劲的开源消息总线
	Jafka	http://kafka.apache.org/	开源的、高性能的、跨语言分布式消息系统，最早是由Apache孵化的Kafka（由LinkedIn捐助给Apache）克隆而来
	Apache Kafka	http://kafka.apache.org/	Linkedin于2010年12月份开源的分布式消息系统，它主要用于处理活跃的流式数据，由Scala写成
分布式服务	ZooKeeper	http://zookeeper.apache.org/	分布式锁服务，PoxOS算法的实现，对应Google的Chubby
	rethinkdb	https://github.com/rethinkdb/rethinkdb
	etcd	https://github.com/coreos/etcd	一个高可用的键值存储系统，主要用于共享配置和服务发现。etcd是由CoreOS开发并维护的，灵感来自于 ZooKeeper 和 Doozer，它使用Go语言编写，并通过Raft一致性算法处理日志复制以保证强一致性。
RPC	Apache Avro	http://avro.apache.org/	Hadoop中的RPC
	grpc	http://www.grpc.io/ https://github.com/grpc/grpc	一个高性能、通用的开源RPC框架，其由Google主要面向移动应用开发并基于HTTP/2协议标准而设计，基于ProtoBuf(Protocol Buffers)序列化协议开发，且支持众多开发语言。
	Facebook Thrift	http://thrift.apache.org/	RPC，支持C++/Java/PHP等众多语言
集群管理	Nagios	http://www.nagios.org/	监视系统运行状态和网络信息的监视系统
	Ganglia	http://ganglia.sourceforge.net/	UC Berkeley发起的一个开源集群监视项目，设计用于测量数以千计的节点。
	Apache Ambari	http://ambari.apache.org/	Hadoop成员，管理和监视Apache Hadoop集群的开源框架
基础设施	SSTable		源于Google，orted String Table
	RecordIO		源于Google
	Flat Buffers	https://github.com/google/flatbuffers	针对游戏开发的，高效的跨平台序列化库，相比Proto Buffers开销更小，因为Flat Buffers没有解析过程
	Protocol Buffers	http://code.google.com/p/protobuf/	Google公司开发的一种数据描述语言，类似于XML能够将结构化数据序列化，可用于数据存储、通信协议等方面。它不依赖于语言和平台并且可扩展性极强。
	Consistent Hashing		1997年由麻省理工学院提出,目标是为了解决因特网中的热点（Hot spot）问题，初衷和CARP十分类似，基本解决了在P2P环境中最为关键的问题——如何在动态的网络拓扑中分布存储和路由。
	Netty	http://netty.io/	JBOSS提供的一个java开源框架，提供异步的、事件驱动的网络应用程序框架，用以快速开发高性能、高可靠性的网络服务器和客户端程序。
	BloomFilter		布隆过滤器，1970年由布隆提出，是一个很长的二进制矢量和一系列随机映射函数，可以用于检索一个元素是否在一个集合中，优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。
搜索引擎	Nutch	https://nutch.apache.org/	开源Java 实现的搜索引擎，诞生Hadoop的地方。
	Lucene	http://lucene.apache.org/	一套信息检索工具包，但并不包含搜索引擎系统，它包含了索引结构、读写索引工具、相关性工具、排序等功能。
	SolrCloud		基于Solr和Zookeeper的分布式搜索， Solr4.0 的核心组件之一，主要思想是使用 Zookeeper 作为集群的配置信息中心
	Solr	https://lucene.apache.org/solr/	Solr是基于Lucene的搜索。
	ElasticSearch	http://www.elasticsearch.org/ http://www.elasticsearch.cn/	开源的（Apache2协议），分布式的，RESTful的，构建在Apache Lucene之上的的搜索引擎。
	Sphinx	http://sphinxsearch.com	一个基于SQL的全文检索引擎，可结合MySQL、PostgreSQL做全文检索，可提供比数据库本身更专业的搜索功能，单一索引可达1亿条记录，1000万条记录情况下的查询速度为0.x秒（毫秒级）。
	SenseiDB	http://senseidb.com	Linkin公司开发的一个开源分布式实时半结构化数据库，在全文索引的基础封装了Browse Query Language (BQL，类似SQL)的查询语法。
数据挖掘	Mahout	http://mahout.apache.org/	Hadoop成员，目标是建立一个可扩展的机器学习库
Iaas	OpenStack	https://www.openstack.org/	美国国家航空航天局和Rackspace合作研发的，以Apache许可证授权云平台管理的项目，它不是一个软件。这个项目由几个主要的组件组合起来完成一些具体的工作，旨在为公共及私有云的建设与管理提供软件的开源项目。6个核心项目：Nova（计算，Compute），Swift（对象存储，Object），Glance（镜像，Image），Keystone（身份，Identity），Horizon（自助门户，Dashboard），Quantum & Melange（网络&地址管理），另外还有若干社区项目，如Rackspace（负载均衡）、Rackspace（关系型数据库）。
	Docker	http://www.docker.io/	应用容器引擎，让开发者可打包应用及依赖包到一个可移植的容器中，然后发布到Linux机器上，也可实现虚拟化。
	Kubernetes	https://github.com/GoogleCloudPlatform/kubernetes/	Google开源的容器集群管理系统
	Imctfy	https://github.com/google/Imctfy/	Google开源的Linux容器

类别	名称	官网	备注
查询引擎	Phoenix	https://phoenix.apache.org/	Salesforce公司出品，Apache HBase之上的一个SQL中间层，完全使用Java编写
	Kylin	http://kylin.io	eBay开源的基于Hadoop的分布式OLAP分析引擎，旨在减少Hadoop在10亿行以上数据级别的情况下的查询延迟
	Stinger	http://hortonworks.com/labs/stinger/ http://hortonworks.com/hadoop/tez/	原叫Tez，下一代Hive,Hortonworks主导开发，运行在YARN上的DAG计算框架
	Presto	http://prestodb.io/	Facebook开源
	Shark	http://shark.cs.berkeley.edu/	Spark上的SQL执行引擎，已演化成Spark-SQL和Hive on Spark
	Pig	http://pig.apache.org/	基于Hadoop MapReduce的脚本语言
	Cloudera Impala	http://www.cloudera.com/content/cloudera/en/products-and-services/cdh/impala.html	参照Google Dremel实现，能运行在HDFS或HBase上，使用C++开发
	Apache Drill	https://drill.apache.org/	参照Google Dremel实现
	Apache Tajo	http://tajo.apache.org/	一个运行在YARN上支持SQL的分布式数据仓库
	Hive	http://hive.apache.org/	基于Hadoop MapReduce的SQL查询引擎
流式计算	Facebook Puma		实时数据流分析
	Twitter Rainbird		分布式实时统计系统，如网站的点击统计
	Yahoo S4	http://incubator.apache.org/s4/	Java开发的一个通用的、分布式的、可扩展的、分区容错的、可插拔的无主架构的流式系统
	jStrom	https://github.com/alibaba/jstorm	阿里开源的经过优化的Java版Storm
	Twitter Storm	http://storm.incubator.apache.org/	使用Java和Clojure实现
迭代计算	Apache Hama	https://hama.apache.org/	建立在Hadoop上基于BSP（Bulk Synchronous Parallel）的计算框架，模仿了Google的Pregel。
	Apache Giraph	https://giraph.apache.org/	建立在Hadoop上的可伸缩的分布式迭代图处理系统，灵感来自BSP（bulk synchronous parallel）和Google的Pregel
	HaLoop	https://code.google.com/p/haloop/	迭代的MapReduce
	Twister	http://www.iterativemapreduce.org/	迭代的MapReduce
离线计算	Hadoop MapReduce	http://hadoop.apache.org/	经典的大数据批处理系统
	Berkeley Spark	http://spark.apache.org/ http://shark.cs.berkeley.edu/	使用Scala语言实现，和MapReduce有较大的竞争关系，性能强于MapReduce
	Flink	https://flink.apache.org/	和Spark类似的
	Apache Ignite	http://ignite.apache.org/	内存数据组织框架是一个高性能、集成化和分布式的内存计算和事务平台
	DataTorrent	http://www.datatorrent.com/	基于Hadoop2.X构建的实时流式处理和分析平台，每秒可以处理超过10亿个实时事件
嵌入式DB	Firebird	http://www.firebirdsql.org/	从Interbase派生出来的，支持SQL，支持事务
键值存储	LevelDB	https://code.google.com/p/leveldb/	Google开源的高效KV编程库，注意它只是个库
	RocksDB	http://rocksdb.org/	Facebook开源的，基于Google的LevelDB，但提高了扩展性可以运行在多核处理器上
	HyperDex	http://hyperdex.org/	下一代KV存储系统，支持strings、integers、floats、lists、maps和sets等丰富的数据类型
	TokyoCabinet	http://fallabs.com/tokyocabinet/	日本人Mikio Hirabayashi（平林干雄）开发的一款DBM数据库，注意它只是个库（大名鼎鼎的DBM数据库qdbm就是Mikio Hirabayashi开发的）,读写非常快
	Voldemort	http://www.project-voldemort.com/voldemort/	一个分布式键值存储系统，是Amazon Dynamo的一个开源克隆，LinkedIn开源
	Amazon Dynamo	https://github.com/dynamo/dynamo	亚马逊的KV模式的存储平台，无主架构
	Tair	http://tair.taobao.org/	淘宝出品的高性能、分布式、可扩展、高可靠的KV结构存储系统，专为小文件优化，并提供简单易用的接口（类似Map），Tair支持Java和C版本的客户端
	Apache Accumulo	https://accumulo.apache.org/	一个可靠的、可伸缩的、高性能的排序分布式的KV存储系统，参照Google Bigtable而设计，建立在Hadoop、Thrift和Zookeeper之上。
	Redis	http://redis.io/	使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、单机版KV数据库。从2010年3月15日起，Redis的开发工作由VMware主持
表格存储	OceanBase	https://github.com/alibaba/oceanbase	支持海量数据的高性能分布式数据库系统，实现了数千亿条记录、数百TB数据上的跨行跨表事务
	Amazon SimpleDB	http://aws.amazon.com/cn/simpledb/	一个可大规模伸缩、用 Erlang 编写的高可用数据存储
	Vertica	http://www.vertica.com/	惠普2011收购Vertica，Vertica是传统的关系型数据库，基于列存储，同时支持MPP，使用标准的SQL查询,可以和Hadoop/MapReduce进行集成
	Cassandra	http://cassandra.apache.org/	Hadoop成员，Facebook于2008将Cassandra开源，基于O(1)DHT的完全P2P架构
	HyperTable	http://hypertable.org/	搜索引擎公司Zvents针对Bigtable的C++开源实现
	FoundationDB	https://foundationdb.com/	支持ACID事务处理的NoSQL数据库，提供非常好的性能、数据一致性和操作弹性
	MemSQL	http://www.memsql.com/	前Facebook工程师创办的，号称世界上最快的分布式关系型数据库，兼容MySQL但快30倍，能实现每秒150万次事务，原理是仅用内存并将SQL预编译为C++。
	HBase	http://hbase.apache.org/	Bigtable在Hadoop中的实现，最初是Powerset公司为了处理自然语言搜索产生的海量数据而开展的项目
文件存储	CouchDB	http://couchdb.apache.org/	面向文档的数据存储
	MongoDB	https://www.mongodb.org/	文档数据库
	Tachyon	http://tachyon-project.org/ https://github.com/amplab/tachyon	加州大学伯克利分校的AMPLab基于Hadoop的核心组件开发出一个更快的版本Tachyon，它从底层重构了Hadoop平台。
	KFS	http://code.google.com/p/kosmosfs/	GFS的C++开源版本
	HDFS	http://hadoop.apache.org/	GFS在Hadoop中的实现
资源管理	Twitter Mesos	http://mesos.apache.org/	Google Borg的翻版
资源管理	Hadoop Yarn	http://hadoop.apache.org/	类似于Mesos
日志收集系统	Facebook Scribe	https://github.com/facebook/scribe	Facebook开源的日志收集系统，能够从各种日志源上收集日志，存储到一个中央存储系统（可以是NFS，分布式文件系统等）上，以便于进行集中统计分析处理，常与Hadoop结合使用，Scribe用于向HDFS中Push日志
	Cloudera Flume	http://flume.apache.org/	Cloudera提供的日志收集系统，支持对日志的实时性收集
	logstash	http://www.logstash.net/	日志管理、分析和传输工具，可配合kibana、ElasticSearch组建成日志查询系统
	kibana	http://www.elasticsearch.org/overview/kibana/	为日志提供友好的Web查询页面
消息系统	StormMQ	http://stormmq.com/
	ZeroMQ	http://zeromq.org/	很底层的高性能网络库
	RabbitMQ	https://www.rabbitmq.com/	在AMQP基础上完整的，可复用的企业消息系统
	Apache ActiveMQ	http://activemq.apache.org/	能力强劲的开源消息总线
	Jafka	http://kafka.apache.org/	开源的、高性能的、跨语言分布式消息系统，最早是由Apache孵化的Kafka（由LinkedIn捐助给Apache）克隆而来
	Apache Kafka	http://kafka.apache.org/	Linkedin于2010年12月份开源的分布式消息系统，它主要用于处理活跃的流式数据，由Scala写成
分布式服务	ZooKeeper	http://zookeeper.apache.org/	分布式锁服务，PoxOS算法的实现，对应Google的Chubby
	rethinkdb	https://github.com/rethinkdb/rethinkdb
	etcd	https://github.com/coreos/etcd	一个高可用的键值存储系统，主要用于共享配置和服务发现。etcd是由CoreOS开发并维护的，灵感来自于 ZooKeeper 和 Doozer，它使用Go语言编写，并通过Raft一致性算法处理日志复制以保证强一致性。
RPC	Apache Avro	http://avro.apache.org/	Hadoop中的RPC
	grpc	http://www.grpc.io/ https://github.com/grpc/grpc	一个高性能、通用的开源RPC框架，其由Google主要面向移动应用开发并基于HTTP/2协议标准而设计，基于ProtoBuf(Protocol Buffers)序列化协议开发，且支持众多开发语言。
	Facebook Thrift	http://thrift.apache.org/	RPC，支持C++/Java/PHP等众多语言
集群管理	Nagios	http://www.nagios.org/	监视系统运行状态和网络信息的监视系统
	Ganglia	http://ganglia.sourceforge.net/	UC Berkeley发起的一个开源集群监视项目，设计用于测量数以千计的节点。
	Apache Ambari	http://ambari.apache.org/	Hadoop成员，管理和监视Apache Hadoop集群的开源框架
基础设施	SSTable		源于Google，orted String Table
	RecordIO		源于Google
	Flat Buffers	https://github.com/google/flatbuffers	针对游戏开发的，高效的跨平台序列化库，相比Proto Buffers开销更小，因为Flat Buffers没有解析过程
	Protocol Buffers	http://code.google.com/p/protobuf/	Google公司开发的一种数据描述语言，类似于XML能够将结构化数据序列化，可用于数据存储、通信协议等方面。它不依赖于语言和平台并且可扩展性极强。
	Consistent Hashing		1997年由麻省理工学院提出,目标是为了解决因特网中的热点（Hot spot）问题，初衷和CARP十分类似，基本解决了在P2P环境中最为关键的问题——如何在动态的网络拓扑中分布存储和路由。
	Netty	http://netty.io/	JBOSS提供的一个java开源框架，提供异步的、事件驱动的网络应用程序框架，用以快速开发高性能、高可靠性的网络服务器和客户端程序。
	BloomFilter		布隆过滤器，1970年由布隆提出，是一个很长的二进制矢量和一系列随机映射函数，可以用于检索一个元素是否在一个集合中，优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。
搜索引擎	Nutch	https://nutch.apache.org/	开源Java 实现的搜索引擎，诞生Hadoop的地方。
	Lucene	http://lucene.apache.org/	一套信息检索工具包，但并不包含搜索引擎系统，它包含了索引结构、读写索引工具、相关性工具、排序等功能。
	SolrCloud		基于Solr和Zookeeper的分布式搜索， Solr4.0 的核心组件之一，主要思想是使用 Zookeeper 作为集群的配置信息中心
	Solr	https://lucene.apache.org/solr/	Solr是基于Lucene的搜索。
	ElasticSearch	http://www.elasticsearch.org/ http://www.elasticsearch.cn/	开源的（Apache2协议），分布式的，RESTful的，构建在Apache Lucene之上的的搜索引擎。
	Sphinx	http://sphinxsearch.com	一个基于SQL的全文检索引擎，可结合MySQL、PostgreSQL做全文检索，可提供比数据库本身更专业的搜索功能，单一索引可达1亿条记录，1000万条记录情况下的查询速度为0.x秒（毫秒级）。
	SenseiDB	http://senseidb.com	Linkin公司开发的一个开源分布式实时半结构化数据库，在全文索引的基础封装了Browse Query Language (BQL，类似SQL)的查询语法。
数据挖掘	Mahout	http://mahout.apache.org/	Hadoop成员，目标是建立一个可扩展的机器学习库
Iaas	OpenStack	https://www.openstack.org/	美国国家航空航天局和Rackspace合作研发的，以Apache许可证授权云平台管理的项目，它不是一个软件。这个项目由几个主要的组件组合起来完成一些具体的工作，旨在为公共及私有云的建设与管理提供软件的开源项目。6个核心项目：Nova（计算，Compute），Swift（对象存储，Object），Glance（镜像，Image），Keystone（身份，Identity），Horizon（自助门户，Dashboard），Quantum & Melange（网络&地址管理），另外还有若干社区项目，如Rackspace（负载均衡）、Rackspace（关系型数据库）。
	Docker	http://www.docker.io/	应用容器引擎，让开发者可打包应用及依赖包到一个可移植的容器中，然后发布到Linux机器上，也可实现虚拟化。
	Kubernetes	https://github.com/GoogleCloudPlatform/kubernetes/	Google开源的容器集群管理系统
	Imctfy	https://github.com/google/Imctfy/	Google开源的Linux容器

分类: 大数据

浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
Hadoop windows intelij 跑 MR WordCount piziyang12138
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
Hadoop学习第三课（HDFS架构--读、写流程）小小程序员呀~ 数据库 hadoop 架构 big data
1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
hadoop启动HDFS命令 m0_67401228 java 搜索引擎 linux 后端
启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
spark常用命令我是浣熊的微笑 spark
查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
spark启动命令学不会又听不懂 spark 大数据分布式
hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购计算机编程指导师 Java实战集 Python实战集大数据实战集课程设计 hadoop 数据分析 spring boot java 进货 python
✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
Hadoop Common 之序列化机制小解猫君之上 #Apache Hadoop
1.JavaSerializable序列化该序列化通过ObjectInputStream的readObject实现序列化，ObjectOutputStream的writeObject实现反序列化。这不过此种序列化虽然跨病态兼容性强，但是因为存储过多的信息，但是传输效率比较低，所以hadoop弃用它。（序列化信息包括这个对象的类，类签名，类的所有静态，费静态成员的值，以及他们父类都要被写入）publ
深入理解hadoop(一)----Common的实现----Configuration maoxiao_jsd 深入理解----hadoop
属本人个人原创，转载请注明,希望对大家有帮助！！一,hadoop的配置管理a,hadoop通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml");conf.addResource("core-site.xml");后者会覆盖前者中未final标记的相同配置项b
hadoop 0.22.0 部署笔记 weixin_33701564 大数据 java 运维
为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
深入解析HDFS：定义、架构、原理、应用场景及常用命令 CloudJourney hdfs 架构 hadoop
引言Hadoop分布式文件系统（HDFS，HadoopDistributedFileSystem）是Hadoop框架的核心组件之一，它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨，帮助读者全面深入地了解HDFS。1.HDFS的定义1.1什么是HDFSHDFS是Hadoop生态系统中的一个分布式文件系
Hadoop的搭建流程 lzhlizihang hadoop 大数据分布式
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步：2、第二步：3、第三步：4、第四步：5、第五步：七、安装hadoop1、上传2、解压3、重命名4、开始配置环境变量5、刷新配置文件6、验证hadoop命令是否可以识别八、全分布搭建7、修改配置文件core-site.xml8、修改配置文件hdfs-site.xml9、修改配置文件hadoop-en
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
Hadoop之mapreduce -- WrodCount案例以及各种概念 lzhlizihang hadoop mapreduce 大数据
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法（自定义分区器）4、reducer方法5、driver（main方法）6、Writable（手机流量统计案例的实体类）三、关于片和块1、什么是片，什么是块？2、mapreduce启动多少个MapTask任务？四、MapReduce的原理五、Shuffle过
IAAS: IT公司去IOE-Alibaba系统构架解读 wishchin 心理学/职业 BigDataMini Spark PaaS
从Hadoop到自主研发，技术解读阿里去IOE后的系统架构原地址：......................云计算阿里飞天摘要：从IOE时代，到Hadoop与飞天并行，再到飞天单集群5000节点的实现，阿里一直摸索在技术衍变的前沿。这里，我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及，智能终端的增加，大数据时代悄然而至。在这个数据为王的时代，数十倍、数百倍的数据给各
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

开源大数据利器汇总

你可能感兴趣的:(Hadoop)