泪痕残

Centos7+Hadoop2.7.7+Hive2.3.0+Hbase2.0.2+spark2.4+zookeeper3.4.10搭建分布式大数据集群

虚拟机准备3台，分别是hadoop01 hadoop02 hadoop03，所装系统为centos7
1.修改主机名

vim /etc/sysconfig/network
	NETWORKING=yes
	HOSTNAME=hadoop01
	NETWORKING_IPV6=no
	PEERNTP=no
vim /etc/hostname
	hadoop01

2.主机名映射

vim /etc/hosts（3台机子都改）
	192.168.133.xxx hadoop01
	192.168.133.xxx hadoop02
	192.168.133.xxx hadoop03
修改C:\Windows\System32\drivers\etc\hosts 文件（便于后期本机用主机名访问集群服务）
	192.168.133.xxx hadoop01
	192.168.133.xxx hadoop02
	192.168.133.xxx hadoop03

3.设置静态ip(3台机子都改)

vim /etc/sysconfig/network-scripts/ifcfg-ens33 
	TYPE="Ethernet"
	PROXY_METHOD="none"
	BROWSER_ONLY="no"
	BOOTPROTO="static"
	DEFROUTE="yes"
	IPV4_FAILURE_FATAL="no"
	IPV6INIT="yes"
	IPV6_AUTOCONF="yes"
	IPV6_DEFROUTE="yes"
	IPV6_FAILURE_FATAL="no"
	IPV6_ADDR_GEN_MODE="stable-privacy"
	NAME="ens33"
	UUID="bfaae4ba-2275-4a2c-85db-c94585096a42"
	DEVICE="ens33"
	ONBOOT="yes"
	IPADDR="192.168.133.xxx"
	NETMASK="255.255.255.0"
	GATEWAY="192.168.133.x"
	DNS1="192.168.133.x"
service network restart

4.关闭防火墙（设置开机禁用）

查看状态：systemctl status firewalld
开启： systemctl start firewalld.service
重启：systemctl restart firewalld.service
关闭：systemctl stop firewalld.service
开机禁用：systemctl disable firewalld.service

5.关闭selinux

vim /etc/sysconfig/selinux
	修改内容SELINUX=disabled

6.ssh无密码访问

ssh-keygen -t rsa(主节点上输入回车到结束)
ssh-copy-id hadoop01(根据提示输入密码)
ssh-copy-id hadoop02(根据提示输入密码)
ssh-copy-id hadoop03(根据提示输入密码)

7.Linux系统最大打开文件数量设置

查看命令
	ulimit -a ## 查看所有
	ulimit -n ##查看同时打开的文件数量
	ulimit -u ##查看同时的进程数量
修改命令
	vim /etc/security/limits.conf（添加下面的内容）
		*       soft    nofile  32768
		*       hard    nofile  1048576
		*       soft    nproc   65536
		*       hard    nproc   65536
		*       soft    memlock unlimited
		*       hard    memlock unlimited
	vim /etc/security/limits.d/90-nproc.conf（添加下面的内容）
		*          soft    nproc     65536

8.时钟同步

选择一台机器作为时间服务器: hadoop01
		hadoop01进行操作：
			 修改ntpd服务的配置参数：
				vim /etc/ntp.conf （添加下面的内容）
					server 127.127.0.1
					fudge 127.127.0.1 stratum 8
			启动ntpd服务：
				service ntpd restart
				systemctl enable ntpd.service ## 开机启动服务
			创建同步脚本：
				vim /opt/date_sync.sh
					service ntpd stop
					/usr/sbin/ntpdate -u hadoop01
					service ntpd start
				修改权限：
					chmod  u+x /opt/date_sync.sh
				运行shell脚本：
					cd /opt
					 ./date_sync.sh
				同步到其他机器：
					scp date_sync.sh hadoop02:/opt
					scp date_sync.sh hadoop03:/opt
				启动定时任务（所有机器）
					crontab -e
						0-59/5 * * * * /opt/date_sync.sh

9.重启机器
10.集群搭建准备工作（所有机器）

在 /opt 下创建两个目录 softwares 和module
softwares 中放所有的包
module中放解压后的文件

11.安装jdk（所有机器）

需要卸载系统中已有的jdk，然后重新安装对应版本的jdk
查看已有的jdk
rpm -qa | grep java ## 查看到包含java的服务
	java-1.7.0-openjdk-1.7.0.45-2.4.3.3.el6.x86_64
	java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
	tzdata-java-2013g-1.el6.noarch
卸载jdk
	rpm -e --nodeps python-javapackages-3.4.1-11.el7.noarch java-1.8.0-openjdk-1.8.0.161-2.b14.el7.x86_64 
	javassist-3.16.1-10.el7.noarch javamail-1.4.6-8.el7.noarch java-1.8.0-openjdk-headless-1.8.0.161-2.b14.el7.x86_64 
	tzdata-java-2018c-1.el7.noarch javapackages-tools-3.4.1-11.el7.noarch
安装jdk
	cd /opt/softwares/
	rpm -ivh jdk-8u11-linux-x64.rpm 
配置JAVA_HOME环境变量
	vim /etc/profile
		export PATH=$PATH:/usr/java/jdk1.8.0_11/bin（不配置jsp命令不可用）
source /etc/profile

12.ZooKeeper-3.4.10集群安装

选择MySQL作为数据存在的容器，默认使用postgresql
解压：
tar -zxvf /opt/softwares/zookeeper-3.4.10.tar.gz -C /opt/modules/
cd /opt/modules/zookeeper-3.4.10/conf
cp zoo_sample.cfg zoo.cfg
修改zoo.cfg
	vim zoo.cfg
		# The number of milliseconds of each tick
		tickTime=2000
		# The number of ticks that the initial 
		# synchronization phase can take
		initLimit=10
		# The number of ticks that can pass between 
		# sending a request and getting an acknowledgement
		syncLimit=5
		# the directory where the snapshot is stored.
		# do not use /tmp for storage, /tmp here is just 
		# example sakes.
		dataDir=/opt/modules/zookeeper-3.4.10/data
		# the port at which the clients will connect
		clientPort=2181
		server.1=hadoop01:2888:3888
		server.2=hadoop02:2888:3888
		server.3=hadoop03:2888:3888
		# the maximum number of client connections.
		# increase this if you need to handle more clients
		#maxClientCnxns=60
		#
		# Be sure to read the maintenance section of the 
		# administrator guide before turning on autopurge.
		#
		# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
		#
		# The number of snapshots to retain in dataDir
		#autopurge.snapRetainCount=3
		# Purge task interval in hours
		# Set to "0" to disable auto purge feature
		#autopurge.purgeInterval=1
设置myid
	在/opt/module/zookeeper-3.4.10/data 目录下创建一个 myid 的文件
		touch myid
	添加 myid 文件，注意一定要在 linux 里面创建，在 notepad++里面很可能乱码
	 在文件中添加与 server 对应的编号：如 1
各节点分发：将配置好的文件拷贝到其他机器
	scp -r /opt/modules/zookeeper-3.4.10/ root@hadoop02:/opt/modules/
	scp -r /opt/modules/zookeeper-3.4.10/ root@hadoop03:/opt/modules/
	并分别修改 myid 文件中内容为 2,3
配置环境变量
	export ZOOKEEPER_HOME=/opt/modules/zookeeper-3.4.10
	export PATH=$PATH:$ZOOKEEPER_HOME/bin
修改日志输出路径为指定目录：
	修改zkEnv.sh中的
		if [ "x${ZOO_LOG_DIR}" = "x" ]
		then
				ZOO_LOG_DIR="/opt/modules/zookeeper-3.4.10/log"
		fi

		if [ "x${ZOO_LOG4J_PROP}" = "x" ]
		then
		    ZOO_LOG4J_PROP="INFO,ROLLINGFILE"
		fi
	修改log4j.properties中的
		zookeeper.root.logger=INFO,ROLLINGFILE
常用操作命令
	（1）启动 zookeeper
   			zkServer.sh start
 	（2）查看状态
    			zkServer.sh status
	（3）停止zookeeper
   			zkServer.sh stop
   启动若报错：java.net.NoRouteToHostException: No route to host
		一般是防火墙没关闭

13.搭建hadoop集群的HA

解压：
	tar -zxvf /opt/softwares/hadoop-2.7.7.tar.gz -C /opt/modules/
修改hadoo-env.sh
	export JAVA_HOME=/root/training/jdk1.8.0_144
修改core-site.xml
	
		
			fs.defaultFS
			hdfs://ns1
		
		
			hadoop.tmp.dir
			/opt/modules/hadoop-2.7.7/data/tmp
		
		
			ha.zookeeper.quorum
			hadoop01:2181,hadoop02:2181,hadoop03:2181
		
		
    			io.file.buffer.size
   	 			131072
		
		
				hadoop.proxyuser.root.hosts
				*
		
		
				hadoop.proxyuser.root.groups
				*
		
	
修改hdfs-site.xml
	 
		
			dfs.nameservices
			ns1
		
		
			dfs.ha.namenodes.ns1
			nn1,nn2
		
		
			dfs.namenode.rpc-address.ns1.nn1
			hadoop01:8020
		
		
			dfs.namenode.http-address.ns1.nn1
			hadoop01:50070
		
		
			dfs.namenode.rpc-address.ns1.nn2
			hadoop02:8020
		
		
			dfs.namenode.http-address.ns1.nn2
			hadoop02:50070
		

		
			dfs.namenode.shared.edits.dir
			qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns1
		
		
			dfs.journalnode.edits.dir
			/opt/modules/hadoop-2.7.7/journal
		

		
			dfs.ha.automatic-failover.enabled
			true
		
		
			dfs.client.failover.proxy.provider.ns1
			org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
		
		
			dfs.ha.fencing.methods
			
				sshfence
				shell(/bin/true)
			
		
		
			dfs.ha.fencing.ssh.private-key-files
			/root/.ssh/id_rsa
		
		
			dfs.ha.fencing.ssh.connect-timeout
			30000
		
		
			dfs.namenode.name.dir
			file:/opt/modules/hadoop-2.7.7/data/tmp/dfs/name
		
		
			dfs.datanode.data.dir
			file:/opt/modules/hadoop-2.7.7/data/tmp/dfs/data
		
		
			dfs.replication
			3
		
		
			dfs.webhdfs.enabled
			true
		
		
			dfs.journalnode.http-address
			0.0.0.0:8480
		
		
			dfs.journalnode.rpc-address
			0.0.0.0:8485
		
		
			ha.zookeeper.quorum
			hadoop01:2181,hadoop02:2181,hadoop03:2181
		
	
修改mapred-site.xml
	
		
			mapreduce.framework.name
			yarn
		
		 
			mapreduce.jobhistory.address
			 0.0.0.0:10020 
		 
		 
			mapreduce.jobhistory.webapp.address 
			0.0.0.0:19888 
		 
	
修改yarn-site.xml
	
		
			yarn.resourcemanager.connect.retry-interval.ms
			2000
		
		
  			 yarn.resourcemanager.ha.enabled
  			 true
		
		
		  	yarn.resourcemanager.cluster-id
   			yrc
		
		
   			yarn.resourcemanager.ha.rm-ids
  			 rm1,rm2
		
		
				ha.zookeeper.quorum
				hadoop01:2181,hadoop02:2181,hadoop03:2181
		
		
				yarn.resourcemanager.ha.automatic-failover.enabled
				true
		
		
   			yarn.resourcemanager.hostname.rm1
 			  hadoop01
		
		
  			 yarn.resourcemanager.hostname.rm2
   			hadoop02
		
		
				yarn.resourcemanager.recovery.enabled
				true
		
		
   			yarn.resourcemanager.zk-address
   			hadoop01:2181,hadoop02:2181,hadoop03:2181
		
		
				yarn.resourcemanager.zk-state-store.address
				hadoop01:2181,hadoop02:2181,hadoop03:2181
		
		
			yarn.resourcemanager.store.class
			org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore
		 
		
				yarn.resourcemanager.cluster-id
				ns1-yarn  	 
		
		 
				yarn.app.mapreduce.am.scheduler.connection.wait.interval-ms
				5000
		
		
				yarn.resourcemanager.address.rm1
				hadoop01:8132
		
		
				yarn.resourcemanager.scheduler.address.rm1
				hadoop01:8130
		
		
				yarn.resourcemanager.webapp.address.rm1
				hadoop01:23188
		
		
				yarn.resourcemanager.resource-tracker.address.rm1
				hadoop01:8131
		
		
				yarn.resourcemanager.admin.address.rm1
				hadoop01:8033
		
		
				yarn.resourcemanager.ha.admin.address.rm1
				hadoop01:23142
		 
		
				yarn.resourcemanager.address.rm2
				hadoop02:8132
		
		
				yarn.resourcemanager.scheduler.address.rm2
				hadoop02:8130
		
		
				yarn.resourcemanager.webapp.address.rm2
				hadoop02:23188
		
		
				yarn.resourcemanager.resource-tracker.address.rm2
				hadoop02:8131
		
		
				yarn.resourcemanager.admin.address.rm2
				hadoop02:8033
		
		
				yarn.resourcemanager.ha.admin.address.rm2
				hadoop02:23142
		
		
				yarn.nodemanager.aux-services
    			mapreduce_shuffle
		
		
				yarn.nodemanager.aux-services.mapreduce.shuffle.class
				org.apache.hadoop.mapred.ShuffleHandler
		
		
				yarn.nodemanager.local-dirs
				/opt/modules/hadoop-2.7.7/yarn
		
		
				yarn.nodemanager.log-dirs
				/opt/modules/hadoop-2.7.7/logs
		
		
				mapreduce.shuffle.port
				23080
		
		
				yarn.client.failover-proxy-provider 
				org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider
		
		
				yarn.resourcemanager.ha.automatic-failover.zk-base-path
				/yarn-leader-election
				Optional setting. The default value is /yarn-leader-election
		 


xml配置文件中不能有汉字
修改slaves
	hadoop01
	hadoop02
	hadoop03
将配置好的hadoop拷贝到其他节点
	scp -r /opt/modules/hadoop-2.7.7/ root@hadoop02:/opt/modules/hadoop-2.7.7
	scp -r /opt/modules/hadoop-2.7.7/ root@hadoop03:/opt/modules/hadoop-2.7.7
配置hadoop环境变量：
	export HADOOP_HOME=/opt/modules/hadoop-2.7.7
	export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
启动测试集群
	启动Zookeeper集群
		分别在hadoop001，hadoop002，hadoop003上执行
			zkServer.sh start 启动zookeeper
		然后查看状态 zkServer.sh status
		（一个leader，两个follower）zookeeper正常启动
	格式化HDFS的Zookeeper存储目录
		在 hadoop01上执行（ 只需在一个 zookeeper 节点执行即可 ）：hdfs zkfc –formatZK
	启动 JournalNode 集群
		所有 journalnode 节点上分别执行：hadoop-daemon.sh start journalnode
	格式化并启动第一个 NameNode
		选择 hadoop01
			格式化当前节点的 namenode 数据:hdfs namenode -format
			格式化 journalnode 的数据，这个是 ha 需要做的:hdfs namenode -initializeSharedEdits
			启动当前节点的 namenode 服务：hadoop-daemon.sh start namenode
	格式化并启动第二个 NameNode
		在 hadoop02执行：
			 hadoop001已经格式化过，然后hadoop01上data目录下的内容同步至 hadoop002
			 hdfs namenode -bootstrapStandby
			 hadoop-daemon.sh start namenode
	启动所有DataNode
		每个 datanode 上执行：hadoop-daemon.sh start datanode
	启动 ZooKeeperFailoverController
		所有 namenode 节点分别执行：hadoop-daemon.sh start zkfc
	登陆 namenode 服务器 web 端查看服务器状态
		此时登陆 http://hadoop001:50070与 http://haoop002:50070（windows中没配置ip则用ip访问）
		其中一个为 active 另一个为 standby 状态。
	启动YARN
		在hadoop01上执行：start-yarn.sh
	启动resourcemanager
		hadoop02 上启动 resourcemanager：yarn-daemon.sh start resourcemanager
		登陆 resourcemanager 服务器 web 端查看服务器状态
		此时登陆 http://hadoop001:23188与 http://haoop002:23188
		其中一个为 active 另一个为 standby 状态。活跃节点可以正常访问，备用节点会自动跳转至活跃节点的 web 地址。
		http://resourcemanager_ipaddress:23188
	
	启动Hadoop集群也可用（start-all.sh）
	停止Hadoop集群也可用（stop-all.sh）

14.安装mysql（hadoop01上）

选择MySQL作为数据存在的容器，默认使用postgresql
mysql的安装采用源码编译的方式
http://dev.mysql.com/doc/refman/5.6/en/linux-installation.html
mysql安装：
	选择mysql安装的机器： hadoop01
		实际环境中是一个高配的机器，而且数据磁盘做过冗余
	上传mysql安装需要的文件
	采用源码安装(15-20分钟左右)
		 解压：
		 	 cd /opt/modules
			 tar -zxvf /opt/softwares/mysql-5.6.26.tar.gz
		安装必要的服务：
			yum -y install gcc gcc-c++ gdb cmake ncurses-devel bison bison-devel
		进行编译：
			cd /opt/modules/mysql-5.6.26/
			命令如下;
				cmake \
				-DCMAKE_INSTALL_PREFIX=/usr/local/mysql \
				-DMYSQL_DATADIR=/usr/local/mysql/data \
				-DSYSCONFDIR=/etc \
				-DWITH_INNOBASE_STORAGE_ENGINE=1 \
				-DWITH_PARTITION_STORAGE_ENGINE=1 \
				-DMYSQL_UNIX_ADDR=/tmp/mysql.sock \
				-DMYSQL_TCP_PORT=3306 \
				-DDEFAULT_CHARSET=utf8 \
				-DDEFAULT_COLLATION=utf8_general_ci
			参数含义：
				CMAKE_INSTALL_PREFIX： mysql服务的安装路径，也就是最终mysql位于的地方
				MYSQL_DATADIR: mysql数据存储目录，同时一些日志文件也会存储在这儿
				MYSQL_TCP_PORT： 端口号
				DEFAULT_CHARSET/DEFAULT_COLLATION： 字符集
			编译
				make 需要20分钟
				make install
mysql配置:
	主要配置开机启动mysql服务，需要配置一些常用的配置项
		添加mysql用户组和用户
			groupadd mysql
			useradd -r -g mysql mysql
		 id mysql ## 查看
		mysql初始化
			 cd /usr/local/mysql/scripts/
			 ./mysql_install_db --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data  --user=mysql
		期望使用service命令管理mysql
			cp /opt/modules/mysql-5.6.26/support-files/mysql.server /etc/init.d/mysql
		开机启动mysql
				 chkconfig mysql on 
		把文件内容改成和mysql根目录下的my.cnf文件内容一致
		启动服务
			service mysql start（可能会报/etc/init.d/mysql没权限，赋执行权限即可）
配置环境变量：
	为了方便操作，把mysql的命令添加到PATH中去
		vim /etc/profile
			export MYSQL_HOME=/usr/local/mysql
			export PATH=$PATH:$MYSQL_HOME/bin
		source /etc/profile
设置密码：
	mysql
		mysql> set password=password("123456"); ## 设置密码
		Query OK, 0 rows affected (0.01 sec)
		mysql> flush privileges; ## 刷新
		Query OK, 0 rows affected (0.00 sec)
		mysql> exit
		Bye
	mysql -uroot -p123456（登录测试）
Windows  Navicat连接mysql
	mysql -u root -proot 
	mysql>GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root的连接密码' WITH GRANT OPTION;
	如果报错，无法连接，则执行下面语句查看是否合适
	查看网络端口信息：
		netstat -ntpl
	查看防火墙的状态，发现3306端口的数据包是否是丢弃状态
		iptables -vnL
	清除防火墙中链中的规则
		iptables -F

15.搭建hive集群

	解压：
		tar -zxvf /opt/softwares/apache-hive-2.3.0-bin.tar.gz -C /opt/modules/
	修改文件夹名称：
		cd /opt/modules/
		mv apache-hive-2.3.0-bin  hive-2.3.0
	配置环境变量：
		/etc/profile 中配置
			export HIVE_HOME=/opt/modules/hive-2.3.0 
			export PATH=$PATH:$HIVE_HOME/bin 
	修改hive-env.xml文件：
		将hive-env.sh.template文件复制为hive-env.sh, 编辑hive-env.xml文件（添加下面内容）
		JAVA_HOME=/usr/java/jdk1.8.0_11
		HADOOP_HOME=/opt/modules/hadoop-2.7.7
		HIVE_HOME=/opt/modules/hive-2.3.0
		export  HIVE_CONF_DIR=$HIVE_HOME/conf
		export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$HADOOP_HOME/lib:$HIVE_HOME/lib
		export HADOOP_OPTS="-Dorg.xerial.snappy.tempdir=/tmp 	
		-Dorg.xerial.snappy.lib.name=libsnappyjava.jnilib $HADOOP_OPTS"
	编辑hive-site.xml文件：
		将hive-default.xml.template文件拷贝为hive-site.xml, 并编辑hive-site.xml文件(删除所有内容，添加下面内容）
			
			
			
		
			
				 javax.jdo.option.ConnectionURL
				 jdbc:mysql://hadoop01:3306/metastore?createDatabaseIfNotExist=true
					JDBC connect string for a JDBC metastore
			
			 
					javax.jdo.option.ConnectionDriverName
				 com.mysql.jdbc.Driver
				 Driver class name for a JDBC metastore
			 
			  
				 javax.jdo.option.ConnectionUserName
				  root
					username to use against metastore database
			 
			  
				  javax.jdo.option.ConnectionPassword
				  123456
				  password to use against metastore database
			  
			  
				 datanucleus.autoCreateSchema
				 true
			
			
					datanucleus.autoCreateTables
					true
			
			
					datanucleus.autoCreateColumns
 				true
			
			
					hive.metastore.warehouse.dir
				 /user/hive/warehouse
				 location of default database for the warehouse
			 
			 
				 hive.downloaded.resources.dir
					/opt/modules/hive-2.3.0/tmp/resources
					Temporary local directory for added resources in the remote file system.
			 
			 
					hive.exec.dynamic.partition
					true
			 
 			 
					hive.exec.dynamic.partition.mode
					nonstrict
			
			
					hive.exec.local.scratchdir
					/opt/modules/hive-2.3.0/tmp/HiveJobsLog
					Local scratch space for Hive jobs
			
			
					hive.downloaded.resources.dir
					/opt/modules/hive-2.3.0/tmp/ResourcesLog
					Temporary local directory for added resources in the remote file system.
			
			
					hive.querylog.location
					/opt/modules/hive-2.3.0/tmp/HiveRunLog
					Location of Hive run time structured log file
			
			
					hive.server2.logging.operation.log.location
					/opt/modules/hive-2.3.0/tmp/OpertitionLog
					Top level directory where operation tmp are stored if logging functionality is enabled
			
			
					hive.server2.thrift.bind.host
					hadoop01
			
			
					hive.server2.thrift.port
					10000
			
			
					hive.server2.thrift.http.port
					10001
			
			
					hive.server2.thrift.http.path
					cliservice
			
			
					hive.server2.webui.host
					hadoop01
			
			
					hive.server2.webui.port
					10002
			
			
					hive.scratch.dir.permission
					755
			
			
					hive.server2.enable.doAs
					false
			
			
					hive.auto.convert.join
					false
			
			
					spark.dynamicAllocation.enabled
					true
			
			
					spark.driver.extraJavaOptions
					-XX:PermSize=128M -XX:MaxPermSize=512M
 			
			
  				hive.cli.print.header
  				true
  				Whether to print the names of the columns in query output.
			
			
				  hive.cli.print.current.db
				  true
				  Whether to include the current database in the Hive prompt.
			
			
			    hive.metastore.schema.verification
			    false
			    
 						 Enforce metastore schema version consistency.
  						True: Verify that version information stored in is compatible with one from Hive jars.  Also disable automatic schema migration attempt. Users are required to manually migrate schema after Hive upgrade which ensures proper metastore schema migration. (Default)
  						False: Warn if the version information stored in metastore doesn't match with one from in Hive jars.
				
 			
		
	拷贝JDBC包
		将JDBC的jar包放入$HIVE_HOME/lib目录下：
			cp /opt/softwares/mysql-connector-java-5.1.26-bin.jar /opt/modules/hive-2.3.0/lib/
	拷贝jline扩展包
			将$HIVE_HOME/lib目录下的jline-2.12.jar包拷贝到$HADOOP_HOME/share/hadoop/yarn/lib目录下,并删除$HADOOP_HOME/share/hadoop/yarn/lib目录下旧版本的jline包
	拷贝tools.jar包
			复制$JAVA_HOME/lib目录下的tools.jar到$HIVE_HOME/lib下
	执行初始化Hive操作
			选用MySQLysql和Derby二者之一为元数据库
			注意:先查看MySQL中是否有残留的Hive元数据,若有,需先删除
			schematool -dbType mysql -initSchema   ## MySQL作为元数据库
			其中mysql表示用mysql做为存储hive元数据的数据库, 
			若不用mysql做为元数据库, 则执行
			schematool -dbType derby -initSchema   ## Derby作为元数据库
			脚本hive-schema-1.2.1.mysql.sql会在配置的Hive元数据库中初始化创建表
	启动Metastore服务：	
		 执行Hive前, 须先启动metastore服务, 否则会报错
		 	./hive --service metastore
	然后打开另一个终端窗口,之后再启动Hive进程
	搭建hive遇见的问题：
		message:Version information not found in metastore
			修改conf/hive-site.xml 中的 “hive.metastore.schema.verification”值为 false  即可解决
		Access denied for user 'root'@'hadoop01' (using password: YES)
			grant all privileges on *.* to root@hadoop01 identified by '123456';
			flush privileges;

16.搭建hbase集群

解压：
	tar -zxvf /opt/softwares/hbase-2.0.0-bin.tar.gz -C /opt/modules/
配置环境变量：
	/etc/profile 中配置
		export HBASE_HOME=/opt/modules/hbase-2.0.0 
		export PATH=$PATH:$HBASE_HOME/bin 
配置hbase-env.sh
	开启JAVA_HOME配置
			export JAVA_HOME=/usr/java/jdk1.8.0_11
	关闭HBase自带的zookeeper，使用zookeeper集群
		export HBASE_MANAGES_ZK=false
配置hbase-site.xml	
	 
		 
			hbase.rootdir 
			hdfs://hadoop01:8020/hbase 
		 
		 
			hbase.cluster.distributed 
			true 
		 
		 
			hbase.zookeeper.quorum 
			hadoop01,hadoop02,hadoop03 
		 
		 
			hbase.temp.dir 
			/opt/modules/hbase-2.0.0/tmp 
		 
		 
			hbase.zookeeper.property.dataDir 
			/opt/modules/hbase-2.0.0/tmp/zookeeper 
		 
		 
			hbase.master.info.port 
			60010 
		 
	
配置regionservers
	hadoop01
	hadoop02
	hadoop03
配置backup-masters
	(conf目录下)
	vim backup-masters
	hadoop02
复制Hadoop配置文件hdfs-site.xml到HBase的conf目录
	cp $HADOOP_HOME/etc/hadoop/hdfs-site.xml $HBASE_HOME/conf/
复制文件到所有的regionservers服务器中
	scp -r /opt/modules/hbase-2.0.0/  root@hadoop02:/opt/modules/
	scp -r /opt/modules/hbase-2.0.0/  root@hadoop03:/opt/modules/
启动命令：
	启动HBase start-hbase.sh
	停止HBase stop-hbase.sh
查看web页面：http://192.168.133.160:60010/master-status#userTables

17.搭建spark集群

解压 ：
	tar -zxvf /opt/softwares/spark-2.4.0-bin-hadoop2.7.tgz -C /opt/modules
修改spark-env.sh
	export JAVA_HOME=/usr/java/jdk1.8.0_11
	HADOOP_CONF_DIR=/opt/modules/hadoop-2.7.7/etc/hadoop
	SPARK_LOCAL_IP=hadoop01（节点主机名）
	export SPARK_LIBRARY_PATH=${SPARK_HOME}/lib
	export SCALA_LIBRARY_PATH=${SPARK_HOME}/lib
	export SPARK_MASTER_HOST=192.168.133.160
	export SPARK_MASTER_PORT=7077
	export SPARK_MASTER_WEBUI_PORT=8080
	export SPARK_WORKER_CORES=3
	export SPARK_WORKER_MEMORY=3G
	export SPARK_WORKER_PORT=7078
	export SPARK_WORKER_WEBUI_PORT=8081
	export SPARK_WORKER_INSTANCES=1
	export SPARK_WORKER_MEMORY=1G
	export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://hadoop01/spark/job/history"
修改spark-defaults.conf
	spark.eventLog.enabled           true
	spark.eventLog.dir               hdfs://hadoop01/spark/job/history
修改slaves
	hadoop01
	hadoop02
	hadoop03
节点分发
	scp -r /opt/modules/spark-2.4.0-bin-hadoop2.7/  root@hadoop02:/opt/modules/
	scp -r /opt/modules/spark-2.4.0-bin-hadoop2.7/  root@hadoop03:/opt/modules/
配置SPARK_HOME
	export SPARK_HOME=/opt/modules/spark-2.4.0-bin-hadoop2.7
	export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
hdfs创建目录：
	/spark/job/history
查看/spark/job/history文件：
	hdfs dfs -chmod -R 755 /spark（授权）
启动master：start-master.sh
启动slave： start-slave.sh spark://192.168.133.xxx:7077
启动spark-shell：spark-shell
测试：run-example SparkPi  查看是否输出：Pi is roughly 3.14374
查看web页面;http://192.168.133.160:8080/

大数据环境搭建（4）——Ubuntu启用root用户祁峰sunny 大数据学习
前面博文我已已经安装好Ubuntu操作系统看到图形界面了。但Ubuntu的默认登陆是使用安装时配置的普通用户，没有管理员权限，下面我们开始配置启动权限，分为四个步骤：1.启用root用户设置密码2.修改50-ubuntu.conf文件3.修改gdm-autologin和gdm-passwd文件4.修改/root/.profile文件一、启用root用户设置密码首先，新安装的操作系统没有启用root
大数据环境搭建(一)-Hive xfchn多多学习学习大数据大数据 hive hadoop
1hive介绍由Facebook开源的,用于解决海量结构化日志的数据统计的项目本质上是将HQL转化为MapReduce、Tez、Spark等程序Hive表的数据是HDFS上的目录和文件Hive元数据metastore，包含Hive表的数据库、表名、列、分区、表类型、表所在目录等。根据Hive部署模式(嵌入、本地、远程)的不同，元数据存储的位置也不同，一般是远程方式多用户访问，元数据存储MySQL中
大数据环境搭建(一)-Hadoop xfchn多多学习学习 #Hadoop 大数据大数据 hadoop 分布式
1.服务器环境准备Linux镜像:centos7.9JDK:jdk1.8.0_212Hadoop:apache-hadoop-3.3.4创建虚拟Linux服务器配置虚拟机，每台主机名与ip如下主机名ipbd-centos01192.168.159.101bd-centos02192.168.159.102bd-centos03192.168.159.103修改网络配置文件（以bd-centos01
河北省技能大赛-大数据赛项环境搭建阿龙的代码在报错大数据
河北省技能大赛大数据环境搭建环境准备映射（在每个节点操作）vi/etc/hosts#进入文件#在文件最后面添加以下内容192.168.88.154master192.168.88.156slave1192.168.88.155slave2设置免密#生成公钥（一直回车确认就可以）ssh-keygen#将免密配置到各个节点ssh-copy-idmasterssh-copy-idslave1ssh-co
大数据环境搭建 yulishi12 大数据框架大数据 linux 运维 hadoop hive
大数据环境搭建linux环境安装VM虚拟机centos创建用户并赋予权限ssh免密登录配置编写集群分发脚本xsync安装jdk集群所有进程查看脚本hadoop环境配置Hadoop集群Hadoop环境hadoop集群节点核心配置文件core-site.xml配置hdfs-site.xml配置yarn-site.xmlMapReduce配置文件mapred-site.xml配置workers配置历史服
【2024大数据专业毕业设计必过选题】100个大数据专业毕设选题免费详细讲解，大数据毕业生必看毕设选题、创新点，hadoop/spark/hive/实时数据分析选题指导奶糖小果冻大数据 hadoop 课程设计毕业设计毕设
2024年大数据专业毕设必过选题选题注意事项：（1）数据是否能够获取（2）工作量是否满足毕设要求（3）代码是否通俗易懂，能否在短期内掌握（4）选题是否具有现实意义，创新点（5）个人电脑硬件是否支持运行大数据项目大数据毕设项目主要流程：（1）大数据环境搭建：虚拟机搭建（分布式、伪分布式）、Hadoop、Hbase、Zookeeper、Hive、Hbase、Kafka、Flume等组件的安装（2）数据
大数据环境搭建-Hadoop伪分布式安装-spark安装-kafka安装神秘人� 大数据大数据 hadoop java centos linux
1、所需安装包CentOS-7-x86_64-DVD-1908.isoVMware-workstation-full-15.1.0-13591040.exeFileZilla_3.43.0_win64_sponsored-setup.exejdk1.8.0_171hadoop-2.7.3scala-2.12.1spark-2.3.0-bin-hadoop2.72、修改主机名2.1主机名修改为had
大数据环境搭建-基础配置钴槿大数据 big data hive hadoop hbase
前言：大数据比赛的环境是在三台虚拟机上，虚拟机的操作系统是centos7，一种linux操作系统，centos7没有图形操作界面，进入它之后是完全的命令行操作系统。很多代码、操作都是一些单词的组合，花点心思记一下很容易就能记住。修改虚拟机名字一方面是为了更方便的分辨三台虚拟机，三台虚拟机后面的工作职责是不一样的，另一方面也为了配置hosts文件打基础。配置hosts文件，是为了实现虚拟机名字和ip
大数据环境搭建------基础环境配置 dieqian3911 java 运维大数据
准备材料：操作系统：Centos7（最好有网络）软件：JDK：jdk-8u171-linux-x64.tar.gz（最好使用JDK1.8以上）在虚拟机中搭建三个linux系统，分别代表三个节点{主节点：master从节点：slave1、slave2}此次操作均在root用户下进行1.修改主机名称（三台机器均修改）（1）临时修改命令：hostnamectlset-hostnamemaster(以主节
大数据环境搭建及zookeeper学习笔记爱咘叮的米粉
一、搭建环境常用命令：1.设置ip地址、子网掩码、网关：vim/etc/sysconfig/network-scripts/ifcfg-eth02.重启网络servicenetworkrestart3.修改主机和ip地址映射关系vim/etc/hosts4.修改机器网卡设置vim/etc/udev/rules.d/70-persistent-net.rules5.修改主机名称vim/etc/sys
大数据hadoop组件下载、windows环境搭建、官方文档查看详细步骤 ryan_spark 大数据 hadoop
hadoop组件下载路径hadoop下载路径：http://hadoop.apache.org/第一步：进入官网后点击Download第二步：点击Apachereleasearchive（意思是：Apache的版本存档）第三步：选择自己需要的版本进行下载第四步：进去之后下载(注意：第一个是源码(看自己需求，需要就下载)，第二个才是组件)大数据环境搭建(windows环境搭建，linux这里不讲)注
大数据环境搭建编程届的学渣 hadoop 分布式 mysql hive
一、准备工作1.安装好虚拟机VMware.Pro2.安装好操作系统CentOSCentOS的安装_编程届的学渣的博客-CSDN博客3.安装好远程控制虚拟机的终端Finallshell下载地址：http://www.hostbuf.com/t/988.html虚拟机输入ifconfig查找IP地址远程连接连接成功。如果再次登录时无法连接，可能是IP地址发生改变，改一下自己的IP地址即可二、Hadoo
大数据环境搭建:基于cenotos8 你很棒滴数据挖掘
环境的搭建配置静态ip;设置ssh免密登录linux分发脚本centos8同步上海时间centos8安装mysql5.7hadoop安装与配置centos8安装rediscentos8安装flume
大数据环境搭建 Hadoop+Hive+Flume+Sqoop+Azkaban JM1307hhh 环境搭建 hadoop 大数据 hive flume sqoop
目录零：版本说明一、安装CentOS二、Hadoop单机配置三、Hive安装部署零：版本说明Hadoop：3.1.0CentOS：7.6JDK：1.8一、安装CentOS这里网上教程很多，就不贴图了【内存可以尽量大一些，不然Hive运行时内存不够】二、Hadoop单机配置创建tools目录，用于存放文件安装包将Hadoop和JDK的安装包上传上去创建server目录，存放解压后的文件解压jdk配置
一次完整的大数据环境搭建——Hbase 安装 lg的精神食粮
所用软件版本号hbasehbase-1.2.4-bin.tar.gz1、Hbase安装（1）同样先建立工作路径/usr/hbase，然后将/opt/soft（跟本系列原来文章一样需要安装的文件均放在该路径下）下的hbase解压到工作路径中mkdir-p/usr/hbasetar-zxvf/opt/soft/hbase-1.2.4-bin.tar.gz-C/usr/hbase（2）修改配置文件：hb
【大数据环境搭建（三）】在Centos7上搭建Hadoop集群（完全分布式） Feng-licong 大数据大数据分布式 hadoop linux centos
【大数据环境搭建（三）】在Centos7上搭建Hadoop集群（完全分布式）集群配置使用三节点，master、slave1、slave2，jdk1.8.0_171zookeeper-3.4.10hadoop-2.7.3一、基础配置首先使用Xshell连接虚拟机，不知道怎么连接的同学可以参考文章底下的系列文章链接。更改主机名hostnamectlset-hostnamemaster（在master执
大数据入门学习框架 Lansonli 大数据入门核心技术大数据大数据 big data hadoop hive
文章目录大数据入门学习框架前言一、大数据基础二、大数据必学Java基础三、ZooKeeper四、大数据环境搭建五、Hadoop六、Hive七、HBase八、Kafka九、Scala十、Spark十一、Flink十二、核心面试题最后要重塑认知穷困一生的五个毛病大数据入门学习框架前言利用框架的力量，看懂游戏规则，才是入行的前提大多数人不懂，不会，不做，才是你的机会，你得行动，不能畏首畏尾选择才是拉差距
小白起步-大数据环境搭建-系统搭建皇棠个人 Centos
大数据环境搭建-系统搭建未经允许，不得转载本文有github链接，图片无法加载的的可以下载原文档查看：点击这里，前往GitHub链接https://github.com/SKJ-Huangtang/Hadoop如果你需要相关软件和咨询一些问题,可以加入交流群和大家一起交流:1046893943文章目录大数据环境搭建-系统搭建大数据环境搭建-linux系统搭建有一个良好的系统是环境运行的基石！废话不
大数据环境搭建系列【六】Elasticsearch集群搭建 AI-0 Elasticsearch elasticsearch 搜索引擎大数据
ES集群搭建前言集群规划JDK环境关闭防火墙、hosts配置ES安装ES配置创建ES用户修改权限启动集群启动异常解决查看集群的状态前言本文记录搭建ES集群的过程，系统使用centos7集群规划本文通过三个节点搭建ES集群，集群规划如下hostnameIPES1192.168.88.60ES2192.168.88.61ES3192.168.88.62JDK环境安装ES需要jdk环境，首先每台机器都需
【大数据环境搭建（四）】在Centos7上搭建Hive集群（Mysql远程模式） Feng-licong 大数据 hive mysql hadoop 大数据
【大数据环境搭建（四）】在Centos7上搭建Hive集群（Mysql远程模式）集群配置使用三节点，master(客户端)、slave1(服务器)、slave2(元数据)，jdk1.8.0_171zookeeper-3.4.10hadoop-2.7.3hive-2.1.1mysql5.7一、slave2上安装Mysql下载wget：yum-yinstallwget1、配置下载源下载依赖包：wget
“红亚杯”-大数据环境搭建与数据采集技能线上专题赛赛题慕铭yikm hadoop hadoop hive big data
系列文章目录集群安装搭建赛题解析构建数据仓库赛题解析目录“红亚杯”-大数据环境搭建与数据采集技能线上专题赛赛题前言在此鸣谢资料链接一、集群安装搭建（70/70分）1.比赛框架2.比赛内容3.版本说明core-site.xml参数配置详情hdfs-site.xml参数配置详情yarn-site.xml参数配置详情mapred-site.xml参数配置详情二、构建数据仓库（30/30分）1.比赛框架2
大数据学习之路（电脑配置） Li&&Tao 大数据学习 mapreduce
大数据学习之路第一天：大数据环境搭建（电脑配置）一想到大数据，我们可能想到的是大数据可视化平台，展示的有多么的炫酷，可是你可能没有想到的是大数据中数据的存储，数据的计算（mapreduce）会是有多么的漫长，下面我们来看图这里就表示的是用时间为11分钟50秒还没有结束的意思。所以我整个程序的实现，从每一插入数据，选择数据，清洗数据，每次都要10多甚至二十多分钟，于是我就可以自动化办公了。每次点击运
大数据环境搭建 —— CentOS 安装繁依Fanyi 大数据 centos linux 运维
大数据系列文章：目录文章目录一、环境准备1.虚拟机准备2.镜像准备二、镜像安装1.虚拟环境准备2.硬件配置3.CentOS镜像安装一、环境准备1.虚拟机准备目前常见的虚拟机有VMwareWorkstation、VritualBox等等，在这里我们使用VMwareWorkstation。VMwareWorkstation详细安装教程在下面的文章里。内容链接虚拟机安装大数据环境搭建——VMwareWo
大数据环境搭建之Hbase集群搭建 supermapsupport 大数据 supermap supermap 大数据 hbase
作者：Neshoir HBase是基于GoogleBigTable论文设计的具有高可靠性，高性能，可伸缩的开源分布式数据库，其具有松散表结构、高效查询、高吞吐低延迟、多版本等特点，可应用于丰富的场景中，如用户画像、实时报表、股票K线、时空轨迹数据等。HBase底层存储是基于HDFS之上，所以使用HBase之前先搭建好HadoopHDFS的环境，同时也需要搭建zookeeper集群服务。本文主要介
Geoserver+Geomesa+HBase时空大数据环境搭建峥嵘37 gis hbase big data 大数据
1.技术栈介绍随着互联网技术日益发展，庞大的数据量，传统关系型数据库已无法满足业务需求，需结合Nosql型数据库来应对时空海量数据和业务发展。针对日前互联网外出交通出行，位置点实时监控与轨迹播放等场景，提供一套有效的技术方案来满足需求。本文选型Geomesa+HBase技术栈，教大家搭建一套属于自己的单机版时空大数据环境，自下而上的技术组件介绍，希望能使大家清晰的掌握该组合技术栈。1.1Hadoo
用户画像大数据环境搭建——从零开始搭建实时用户画像(四) 大数据流动
image本章我们开始正式搭建大数据环境，目标是构建一个稳定的可以运维监控的大数据环境。我们将采用Ambari搭建底层的Hadoop环境，使用原生的方式搭建Flink，Druid，Superset等实时计算环境。使用大数据构建工具与原生安装相结合的方式，共同完成大数据环境的安装。Ambari搭建底层大数据环境ApacheAmbari是一种基于Web的工具，支持ApacheHadoop集群的供应、管
【转载】GeoServer+GeoMesa+HBase 时空大数据环境搭建阿群1986
文章标签：javanosqlhadoopgis版权：CC4.0BY-SA版权声明：本文为CSDN博主「yangdengxian」的原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接及本声明。文章版权分类.png原文链接：https://blog.csdn.net/yangdengxian/article/details/113727936GeoServer+GeoMesa+HBas
Hadoop大数据环境搭建保姆级教程（完整版） Jancydc Hadoop hadoop 大数据 linux mapreduce jdk1.8
文章目录1、准备工作2、静态IP地址配置3、关闭防火墙4、修改主机名称5、编辑hosts文件6、虚拟机克隆7、SSH免密登陆8、搭建虚拟机上的Hadoop环境9、配置jdk和Hadoop10、scp、xsync集群分发脚本11、修改核心配置文件12、启动集群13、Hadoop环境检测前言：找了全网关于mac配置Hadoop大数据框架，很多都不不全面，有的还没有效果，对于新手小白来说极其不友好，因此
大数据环境搭建hadoop，hive，spark，Python，anaconda 君_临_天_下学习之路 python hadoop hive spark 大数据
大数据环境搭建hadoop对于一些想从事大数据工作的童鞋们，在自己的电脑搭建一个大数据环境是很有必要的，直接开始吧。如何在自己的电脑搭建一个虚拟的集群环境：1、安装虚拟机（包括linux系统：笔者使用ubantu16.04）http://dblab.xmu.edu.cn/blog/2760-2/#more-27602、安装hadoop2.X（伪分布式）包括java环境（笔者使用hadoop版本：2
2020_CDH_hadoop3_大数据环境搭建花沐人搭建CDH 大数据 hadoop hdfs
文章目录一.标题安装Centos_6.9二.环境检查三.安装jdk_1.8四.安装zookeeper_3.4.9五.安装hadoop_3.1.1一.标题安装Centos_6.9二.环境检查三.安装jdk_1.8四.安装zookeeper_3.4.9五.安装hadoop_3.1.1文章尚未完成
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

Centos7+Hadoop2.7.7+Hive2.3.0+Hbase2.0.2+spark2.4+zookeeper3.4.10搭建分布式大数据集群

你可能感兴趣的:(大数据环境搭建)