Hadoop的学习笔记（Hive|pig|zookeeper|hbase）

hadoop笔记本

	海量数据
　　　　那些年Google公开的大数据领域论文
　　　　大数据量，海量数据 处理方法总结
　　　　布隆过滤器应用
　　　　Google Dremel 原理 – 如何能3秒分析1PB
 　　　 Google Spanner原理- 全球级的分布式数据库
 
 
　　　　悉数那些“巨型”数据仓库
　　　　Hadoop在业界的使用情况
　　　　淘宝Hadoop集群的概况
　　　　淘宝数据魔方技术架构解析
 
　　　　Facebook的实时Hadoop系统
　　　　Apache Hadoop Goes Realtime at Facebook(译) 
数据统计
　　网站统计中的数据收集原理及实现
数据挖掘
　　一个电商数据分析师的经验总结
 
　　五个免费开源的数据挖掘软件
　　Google推出Prediction API
 
　　K Nearest Neighbor 算法(归类)
　　K-Means 算法(聚类)
　　kmeans算法java版本
　　
hadoop2
　　hadoop2升级的那点事情(详解)
 
hadoop
　　介绍
　　　　Hadoop分布式文件系统：架构和设计要点
　　　　mapreduce作业流程概论
　　　　Hadoop使用场景
　　管理
　　　　hadoop集群部署
　　　　hadoop部署注意项
　　　　hadoop配置文件说明
　　　　hadoop集群默认配置和常用配置
 　　　  hadoop集群测量
　　　　Hadoop管理员的十个最佳实践
　　　　Hadoop 权限管理
 
　　　　Hadoop FS Shell
　　　　Hadoop Shell 讲解
　　　　hadoop fs -count的结果含义
 
　　　　Hadoop添加节点datanode
　　　　Hadoop删除节点
　　　　hadoop SecondaryNameNode和NameNode
　　　　hadoop 根据SecondaryNameNode恢复Namenode
　　　　hadoop机架感知
 
　　　　HDFS 安全模式
　　　　hadoop的dfs.replication
　　　　Hadoop回收站trash
　　　　hadoop升级
 
　　　　Hadoop计算能力调度器算法解析
　　　　Hadoop计算能力调度器应用和配置
　　　　hadoop mapred-queue-acls 配置
 
　　　　hadoop和kerberos的整合总结
　　　　hadoop的dfs.umask
 
　　　　NFS服务对Hadoop（hdfs）集群影响测试
　　　　Facebook团队关于Hadoop/HBase在SSD上的实验和讨论
 
　　　　HADOOP动态加载配置
　　　　基于计算机资源分析hadoop的默认counter
　　调优
　　　　hadoop作业调优参数整理及原理
　　原理实现
　　　　序
　　　　HDFS的基本概念
　　　　HDFS 读写流程
　　　　HDFS namenode源码分析 
　　　　HDFS datanode源码分析
 　　　  HDFS dfsclient读文件过程 源码分析
 　　　  HDFS dfsclient写文件过程 源码分析
　　　　How MapReduce Works 
　　　　MapReduce源码分析总结
 
 　　　  eclipse下编译hadoop源代码
　　　　基于hadoop的crc校验谈hadoop的离线设计思想
　　　　Hadoop在MapReduce中使用压缩详解
　　　　HDFS数据的Checksum
　　　　Hadoop开发常用的InputFormat和OutputFormat
　　　　Hadoop之failed task和killed task
　　　　Hadoop的调度器总结
hive
　　Hive体系架构
　　应用
　　　　Hadoop和Hive的数据处理流程
　　管理
　　　　hive部署手册
　　　　hive元数据中utf8的修改
 　　　  hive并发调用的运行方式-个人经验篇
 　　　　
　　　　hive Cli常用操作(翻译自Hive wiki)
　　　　hive数据类型(翻译自Hive Wiki)
 
　　　　hive 创建/删除/截断 表(翻译自Hive wiki)
　　　　hive数据操作(翻译自Hive wiki+实例讲解)
　　　　hive原生和复合类型的数据加载和使用
 　　　  hive修改 表/分区语句
 
　　　　hive select操作(翻译自Hive wiki)
　　　　hive GroupBy操作(翻译自Hive wiki)
　　  　 hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法
 　　　　Hive Join(翻译自Hive wiki)
　　　　 hive lateral view语句(翻译自Hive wiki)
 　　　　Hive Union(翻译自Hive wiki)
 　　　　Hive子查询(翻译自Hive wiki)
　　　　 hive实例讲解实现in和not in子句
 　　　　Hive Explain(翻译自Hive wiki)
 　　　　Hive虚拟列(翻译自Hive wiki)
 　　　　hive 锁定(翻译自Hive wiki)
 
　　　   hive函数(Hive wiki)
　　　　hive udf开发流程(Hive wiki)
　　　　hive udaf开发入门和运行过程详解
　　　　hive中UDTF编写和使用
　　　　hive属性(Hive wiki)
 
　　　　hive中分组取前N个值的实现
 
　　　　hive sql遇到的问题
　　优化
　　　　hive大数据倾斜总结
　　　　hive join详解
 　　　　
　　　　hive文件存储格式
 
　　　　hive怎样决定reducer个数
　　　　hive的hive.exec.parallel参数说明
　　　　hive local hadoop特性　　　　
pig
　　介绍入门
　　　　Apache Pig入门 –介绍/基本架构/与Hive对比
　　管理
　　　　pig部署手册
　　教程
　　　　Apache Pig中文教程集合
zookeeper
　　ZooKeeper概述
　　部署与管理ZooKeeper
　　ZooKeeper典型应用场景
　　ZooKeeper程序员指南
　　Zookeeper Api(java)入门与应用
　　zookeeper java例子(官网)
　　zookeeper 生产者与消费者(官网)
　　zookeeper 应用场景与方案(官网)
 
　　ZooKeeper 会话超时
　　Watcher使用的注意事项
　　zookeeper 权限控制
 
　　Paxos在大型系统中常见的应用场景
　　Zookeeper全解析——Paxos作为灵魂
　　Zookeeper全解析——Client端
　　zookeeper系列之通信模型
 
hbase
　　HBase体系结构
　　hbase数据模型
 　  HBase使用场景和成功案例
 
　　Hbase配置手册
　　hbase shell(官方)
　　hbase shell基础和常用命令详解
　　Hive HBase集成(官网)
 
　　HBase Java API类介绍 
　　通过Java Api与HBase交互
　　HBase二级索引与Join
　　HBase配置性能调优
　　HBase设计与开发性能优化
　　
　　HBase 在淘宝的应用和优化
 
　　(H2与HBase)面向行or面向列的存储模型
　　HBase查询一条数据的过程
 
 
 
  
 
   


 
  

    « 上一篇： Hadoop在MapReduce中使用压缩详解 
   
 » 下一篇： hadoop升级 
   
 
  



	posted on 2012-04-22 22:52 ggjucheng 阅读(35337) 评论(11)  编辑 收藏

 
    
   
 
    
    评论 
    				
		
			#1楼
				
					 2013-04-20 01:29
				
			mojunbin  
		
		
			很不错的收集，顶！
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#2楼
				
					 2013-11-18 11:26
				
			twlkyao  
		
		
			很不错的系统学习的资料
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#3楼
				
					 2014-03-05 11:26
				
			it_blog_zpt  
		
		
			很好的集合
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#4楼
				
					 2014-04-03 20:38
				
			fenglife  
		
		
			很系统性的学习资料，非常感谢
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#5楼
				
					 2014-04-23 21:14
				
			whdugh  
		
		
			楼主的学习精神值得敬佩
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#6楼
				
					 2014-09-05 11:45
				
			任心愿  
		
		
			太感谢博主啦！！灰常不错的学习资料！！
支持(0)反对(0)
http://pic.cnblogs.com/face/653419/20170329222620.png
		
        
		  回复引用
        
	
	


				
		
			#7楼
				
					 2015-02-19 00:25
				
			鲍礼彬  
		
		
			真心感谢博主
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#8楼
				
					 2016-12-30 21:12
				
			沙漠有痕  
		
		
			非常有条理 看着很不错 谢谢博主！
支持(0)反对(0)
		
        
		  回复引用
        
	
	


				
		
			#9楼
				
					 2017-04-13 00:19
				
			老妖仔  
		
		
			感谢博主的整理！
支持(0)反对(0)
http://pic.cnblogs.com/face/1116425/20170302142428.png
		
        
		  回复引用
        
	
	


				
		
			#10楼
				
					 2018-02-11 15:38
				
			大牛笔记  
		
		
			http://www.daniubiji.cn/archives/596
HDFS读写流程
支持(0)反对(0)
http://pic.cnblogs.com/face/u352072.gif?id=18105439
		
        
		  回复引用
        
	
	


				
		
			#11楼40993082018/10/26 15:02:16
				
					 2018-10-26 15:02
				
			jjjjkk  
		
		
			作者深度好文，深受感慨，想要继续交流学习的小伙伴可以加大数据群：824762628，进群可向管理员免费获取hadoop大数据资料一份
支持(0)反对(0)
		
        
		  回复引用
        
	
	

 
    
  
 
    
    
  

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(Hadoop)
        
            
                
                    浅谈MapReduce
                        Android路上的人
Hadoop分布式计算mapreduce分布式框架hadoop
                        从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
                    
                    Hadoop
                        傲雪凌霜，松柏长青
后端大数据hadoop大数据分布式
                        ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
                    
                    Hadoop架构
                        henan程序媛
hadoop大数据分布式
                        一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
                    
                    分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT)
                        计算机源码社
Python项目大数据大数据pythonhadoop计算机毕业设计选题计算机毕业设计源码数据分析spark毕设
                        作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
                    
                    hbase介绍
                        CrazyL-
云计算+大数据hbase
                        hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
                    
                    大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏 租房推荐系统 58同城租房爬虫 房源推荐系统 房价预测系统 计算机毕业设计 机器学习 深度学习 人工智能
                        2401_84572577
程序员大数据hadoop人工智能
                        做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
                    
                    Spark集群的三种模式
                        MelodyYN
#Sparksparkhadoopbigdata
                        文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
                    
                    月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线
                        「已注销」
个人总结hadoop
                        一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
                    
                    HBase介绍
                        mingyu1016
数据库
                        概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
                    
                    Java中的大数据处理框架对比分析
                        省赚客app开发者
java开发语言
                        Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
                    
                    Hadoop windows intelij 跑 MR WordCount
                        piziyang12138

                        一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
                    
                    Hadoop学习第三课（HDFS架构--读、写流程）
                        小小程序员呀~
数据库hadoop架构bigdata
                        1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
                    
                    hadoop启动HDFS命令
                        m0_67401228
java搜索引擎linux后端
                        启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
                    
                    【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现
                        程序员-石头山
大数据实战案例大数据hadoop毕业设计毕设
                        博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
                    
                    分布式离线计算—Spark—基础介绍
                        测试开发abbey
人工智能—大数据
                        原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
                    
                    spark常用命令
                        我是浣熊的微笑
spark
                        查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
                    
                    spark启动命令
                        学不会又听不懂
spark大数据分布式
                        hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
                    
                    编程常用命令总结
                        Yellow0523
LinuxBigData大数据
                        编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
                    
                    Hadoop常见面试题整理及解答
                        叶青舟
Linuxhdfs大数据hadooplinux
                        Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
                    
                    2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购
                        计算机编程指导师
Java实战集Python实战集大数据实战集课程设计hadoop数据分析springbootjava进货python
                        ✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
                    
                    Hadoop Common 之序列化机制小解
                        猫君之上
#ApacheHadoop
                        1.JavaSerializable序列化该序列化通过ObjectInputStream的readObject实现序列化，ObjectOutputStream的writeObject实现反序列化。这不过此种序列化虽然跨病态兼容性强，但是因为存储过多的信息，但是传输效率比较低，所以hadoop弃用它。（序列化信息包括这个对象的类，类签名，类的所有静态，费静态成员的值，以及他们父类都要被写入）publ
                    
                    深入理解hadoop(一)----Common的实现----Configuration
                        maoxiao_jsd
深入理解----hadoop
                        属本人个人原创，转载请注明,希望对大家有帮助！！一,hadoop的配置管理a,hadoop通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml");conf.addResource("core-site.xml");后者会覆盖前者中未final标记的相同配置项b
                    
                    hadoop 0.22.0 部署笔记
                        weixin_33701564
大数据java运维
                        为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
                    
                    解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4)
                        2401_84160087
大数据面试学习
                        网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
                    
                    解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3)
                        2401_84160087
大数据面试学习
                        网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
                    
                    深入解析HDFS：定义、架构、原理、应用场景及常用命令
                        CloudJourney
hdfs架构hadoop
                        引言Hadoop分布式文件系统（HDFS，HadoopDistributedFileSystem）是Hadoop框架的核心组件之一，它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨，帮助读者全面深入地了解HDFS。1.HDFS的定义1.1什么是HDFSHDFS是Hadoop生态系统中的一个分布式文件系
                    
                    Hadoop的搭建流程
                        lzhlizihang
hadoop大数据分布式
                        文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步：2、第二步：3、第三步：4、第四步：5、第五步：七、安装hadoop1、上传2、解压3、重命名4、开始配置环境变量5、刷新配置文件6、验证hadoop命令是否可以识别八、全分布搭建7、修改配置文件core-site.xml8、修改配置文件hdfs-site.xml9、修改配置文件hadoop-en
                    
                    hive搭建 -----内嵌模式和本地模式
                        lzhlizihang
hivehadoop
                        文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
                    
                    Hadoop之mapreduce -- WrodCount案例以及各种概念
                        lzhlizihang
hadoopmapreduce大数据
                        文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法（自定义分区器）4、reducer方法5、driver（main方法）6、Writable（手机流量统计案例的实体类）三、关于片和块1、什么是片，什么是块？2、mapreduce启动多少个MapTask任务？四、MapReduce的原理五、Shuffle过
                    
                    IAAS: IT公司去IOE-Alibaba系统构架解读
                        wishchin
心理学/职业BigDataMiniSparkPaaS
                        从Hadoop到自主研发，技术解读阿里去IOE后的系统架构原地址：......................云计算阿里飞天摘要：从IOE时代，到Hadoop与飞天并行，再到飞天单集群5000节点的实现，阿里一直摸索在技术衍变的前沿。这里，我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及，智能终端的增加，大数据时代悄然而至。在这个数据为王的时代，数十倍、数百倍的数据给各
                    
                                ios内付费
                                    374016526
ios内付费
                                    近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。 
  
具体使用如下: 
这里的sender其实就是调用者，这里主要是为了回调使用。 
[KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
                                
                                20 款优秀的 Linux 终端仿真器
                                    brotherlamp
linuxlinux视频linux资料linux自学linux教程
                                      
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。） 
你能从开源世界中找到大量的终端仿真器，它们
                                
                                Solr Deep Paging(solr 深分页)
                                    eksliang
solr深分页solr分页性能问题
                                    转载请出自出处：http://eksliang.iteye.com/blog/2148370 
作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述 
长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
                                
                                数据库面试题
                                    18289753290
面试题 数据库
                                    1.union ,union all 
网络搜索出的最佳答案： 
union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 
Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； 
Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 
2.索引有哪些分类？作用是
                                
                                Android TV屏幕适配
                                    酷的飞上天空
android
                                    先说下现在市面上TV分辨率的大概情况 
两种分辨率为主 
1.720标清，分辨率为1280x720. 
屏幕尺寸以32寸为主，部分电视为42寸 
2.1080p全高清，分辨率为1920x1080 
屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有 
  
适配遇到问题，已1080p尺寸为例： 
分辨率固定不变，屏幕尺寸变化较大。 
如：效果图尺寸为1920x1080，如果使用d
                                
                                Timer定时器与ActionListener联合应用
                                    永夜-极光
java
                                    功能:在控制台每秒输出一次 
  
代码: 
package Main;
import javax.swing.Timer;
 import java.awt.event.*;

 public class T {
    private static int count = 0; 

    public static void main(String[] args){

                                
                                Ubuntu14.04系统Tab键不能自动补全问题解决
                                    随便小屋
Ubuntu 14.04
                                    Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 
  
1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） 
sudo vi /etc/bash.bashrc 
 接下来会提示输入密码 
2、找到文件中的下列代码 
#enable bash completion in interactive shells
#if
                                
                                学会人际关系三招 轻松走职场
                                    aijuans
职场
                                    要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。 
　　第一，多汇报 
 最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。 
　　第二，勤沟通 
 团队的力
                                
                                《O2O：移动互联网时代的商业革命》读书笔记
                                    aoyouzi
读书笔记
                                    移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 
  
O2O：Online to OffLine 线上线下活动 
O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。 
  
手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。 
  
线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
                                
                                js实现图片随鼠标滚动的效果
                                    百合不是茶
JavaScript滚动属性的获取图片滚动属性获取页面加载
                                    1,获取样式属性值 
top  与顶部的距离
left  与左边的距离
right 与右边的距离
bottom 与下边的距离
zIndex 层叠层次 
  
  例子:获取左边的宽度,当css写在body标签中时 
<div id="adver" style="position:absolute;top:50px;left:1000p
                                
                                ajax同步异步参数async
                                    bijian1013
jqueryAjaxasync
                                            开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。 
        格式： 
$.ajax({ type: 'POST', ur
                                
                                Webx3框架（1）
                                    Bill_chen
eclipsespringmaven框架ibatis
                                    Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发； 
采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 
Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
                                
                                【MongoDB学习笔记五】MongoDB概述
                                    bit1129
mongodb
                                    MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
                                
                                spring/hibernate/struts2常见异常总结
                                    白糖_
Hibernate
                                     
 Spring 
 
①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 
缺少aspectjweaver.jar，该jar包常用于spring aop中 
  
②java.lang.ClassNotFoundException: org.sprin
                                
                                jquery easyui表单重置(reset)扩展思路
                                    bozch
formjquery easyuireset
                                    在jquery easyui表单中 尚未提供表单重置的功能，这就需要自己对其进行扩展。 
扩展的时候要考虑的控件有： 
 combo,combobox,combogrid,combotree,datebox,datetimebox 
需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。 
在所有的reset方法添加完毕之后，就需要对fo
                                
                                编程之美-烙饼排序
                                    bylijinnan
编程之美
                                    
package beautyOfCoding;

import java.util.Arrays;

/*
 *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。
 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码：
 */

                                
                                Struts1.X 源码分析之ActionForm赋值原理
                                    chenbowen00
struts
                                    struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。 
 
如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
                                
                                [空天防御与经济]在获得充足的外部资源之前,太空投资需有限度
                                    comsci
资源
                                     
      这里有一个常识性的问题: 
 
      地球的资源,人类的资金是有限的,而太空是无限的..... 
 
      就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... 
 
&
                                
                                ORACLE临时表—ON COMMIT PRESERVE ROWS
                                    daizj
oracle临时表
                                    ORACLE临时表 转 
临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前 
会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。 
创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
                                
                                基于Nginx XSendfile+SpringMVC进行文件下载
                                    denger
应用服务器Webnginx网络应用lighttpd
                                        在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 
 
   @RequestMapping("/courseware/{id}") 
   public void download(@PathVariable("id") String courseID, HttpServletResp
                                
                                scanf接受char类型的字符
                                    dcj3sjt126com
c
                                    /*
	2013年3月11日22:35:54
	目的：学习char只接受一个字符
*/
# include <stdio.h>

int main(void)
{
	int i;
	char ch;

	scanf("%d", &i);
	printf("i = %d\n", i);
	scanf("%
                                
                                学编程的价值
                                    dcj3sjt126com
编程
                                    发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助 
  
像这位朋友学习:   
http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html 
  
 
  VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
                                
                                二维数组（矩阵）对角线输出
                                    飞天奔月
二维数组
                                    今天在BBS里面看到这样的面试题目, 
  
1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组  
{ 1 2 3 4 }
{ 5 6 7 8 }
{ 9 10 11 12 }
{13 14 15 16 } 
打印顺序  
4
3 8
2 7 12
1 6 11 16
5 10 15
9 14
13 
要
                                
                                Ehcache（08）——可阻塞的Cache——BlockingCache
                                    234390216
并发ehcacheBlockingCache阻塞
                                    可阻塞的Cache—BlockingCache 
  
       在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
                                
                                mysqldiff对数据库间进行差异比较
                                    jackyrong
mysqld
                                      mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构 
   如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 
 
1） 基本用法 
   mysqldiff --server1=admin:12345
                                
                                spring data jpa 方法中可用的关键字
                                    lawrence.li
javaspring
                                    spring data jpa 支持以方法名进行查询/删除/统计。 
查询的关键字为find 
删除的关键字为delete/remove (>=1.7.x) 
统计的关键字为count (>=1.7.x) 
  
修改需要使用@Modifying注解 
@Modifying
@Query("update User u set u.firstna
                                
                                Spring的ModelAndView类
                                    nicegege
spring
                                    项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ 
/*
 * Copyright 2002-2010 the original author or authors.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * yo
                                
                                搭建 CentOS 6 服务器(13) - rsync、Amanda
                                    rensanning
centos
                                    （一）rsync 
 
Server端 
 
# yum install rsync
# vi /etc/xinetd.d/rsync
    service rsync
    {
        disable = no
        flags           = IPv6
        socket_type     = stream
        wait    
                                
                                Learn Nodejs 02
                                    toknowme
nodejs
                                    （1）npm是什么   
npm is the package manager for node 
官方网站：https://www.npmjs.com/ 
npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作 
在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 
&nb
                                
                                Spring MVC 拦截器
                                    xp9802
spring mvc
                                    Controller层的拦截器继承于HandlerInterceptorAdapter 
 
 HandlerInterceptorAdapter.java   1  public   abstract   class  HandlerInterceptorAdapter  implements  HandlerIntercep
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.