CentOS 7 环境下Hadoop2.9.1以及Hive2.3.3安装

本文记录的是部署的3节点的分布式Hadoop集群的过程，环境是CentOS 7.4，1个NameNode，2个DataNode。并在此Hadoop环境基础上完成Hive的安装。

Hadoop，Apache软件基金会旗下的一个开源分布式计算平台，是一个运行和处理海量数据的软件平台。以Hadoop分布式文件系统 HDFS 和 MapReduce 为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。

Hive，基于Hadoop的数据仓库解决方案，可以将结构化的数据文件映射为一张数据库表，并提供类SQL（HQL）查询功能。其设计目标是使Hadoop上的数据操作与传统SQL结合，让熟悉SQL编程的开发人员能够轻松向Hadoop平台转移。

- Hadoop - 安装准备
  - 一、添加Hadoop用户、创建相关目录并分配权限
  - 二、安装Java环境
    - 第一步卸载系统自带的OpenJDK以及相关的java文件
    - 第二步安装JDK
    - 第三步关闭防火墙并配置主机别名
    - 第四步配置集群节点间的免密登录
- Hadoop - 安装和配置（下述步骤在hadoop用户下执行）
  - 下载和安装Hadoop
- Hive - 安装准备
  - 安装MySQL
- 安装Hive
  - 下载Hive和环境准备
  - 执行安装
  - 配置Hive
  - 初始化启动和测试Hive

Hadoop - 安装准备

一、添加Hadoop用户、创建相关目录并分配权限

在CentOS 7下新建hadoop用户，官方推荐的是hadoop、mapreduce、yarn分别用不同的用户安装，本文相关环境全部在hadoop用户下安装。首先需要添加Hadoop用户，为了方便部署，并为其分配管理员权限：

[root@localhost ~]# groupadd hadoop
[root@localhost ~]# useradd -m hadoop -G hadoop -s /bin/bash
[root@localhost ~]# passwd hadoop
[root@localhost ~]# visudo

使用 visudo 命令后找到 root ALL=(ALL) ALL 这一行（应该在90到100行之间，vi命令模式下输入 :set nu 就会显示行号，可以输入例如 :92 回车跳转到92行。），然后在这行下面增加一行内容：hadoop ALL=(ALL) ALL （当中的间隔为tab），然后保存退出。

在 /usr/local/ 目录下创建目录：java、hadoop、hive三个目录并分配权限给hadoop用户：

[root@localhost local]# chown -R hadoop:hadoop /usr/local/java
[root@localhost local]# chown -R hadoop:hadoop /usr/local/hadoop
[root@localhost local]# chown -R hadoop:hadoop /usr/local/hive

二、安装Java环境

第一步卸载系统自带的OpenJDK以及相关的java文件

一些开发版的CentOS会自带jdk，我们一般用自己的jdk，把自带的删除。先看看有没有安装java -version。
关于OpenJDK和JDK的区别可以查看：http://www.cnblogs.com/sxdcgaq8080/p/7487369.html

先看看有没有安装java -version

[root@localhost ~]# java -version
openjdk version "1.8.0_101"
OpenJDK Runtime Environment (build 1.8.0_101-b13)
OpenJDK 64-Bit Server VM (build 25.101-b13, mixed mode)

如果没有可以略过第一步，如果有（如上图），则找到它们的安装位置：

[root@localhost ~]# rpm -qa | grep java
java-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64
tzdata-java-2016f-1.el7.noarch
java-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64
javapackages-tools-3.4.1-11.el7.noarch
java-1.7.0-openjdk-headless-1.7.0.111-2.6.7.2.el7_2.x86_64
java-1.7.0-openjdk-1.7.0.111-2.6.7.2.el7_2.x86_64
python-javapackages-3.4.1-11.el7.noarch

删除全部，noarch文件可以不用删除

[root@localhost ~]# rpm -e --nodeps java-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64
[root@localhost ~]# rpm -e --nodeps java-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64
[root@localhost ~]# rpm -e --nodeps java-1.7.0-openjdk-headless-1.7.0.111-2.6.7.2.el7_2.x86_64
[root@localhost ~]# rpm -e --nodeps java-1.7.0-openjdk-1.7.0.111-2.6.7.2.el7_2.x86_64

检查有没有删除

[root@localhost ~]# java -version
-bash: /usr/bin/java: 没有那个文件或目录

如果还没有删除，则用yum -y remove去删除他们。

第二步安装JDK

1.下载JDK安装包

如果系统没有wget命令则先使用 yum install wget 安装wget命令。
然后下载JDK安装包：cd /usr/local/java，然后下载JDK：

[root@localhost java]# wget http://download.oracle.com/otn-pub/java/jdk/8u181-b13/96a7b8442fe848ef90c96a2fad6ed6d1/jdk-8u181-linux-x64.tar.gz

下载完成之后执行解压命令：tar -zxvf jdk-8u181-linux-x64.tar.gz

2.配置Java环境变量

执行 vim /etc/profile，打开文件添加如下内容:

# set java environment
JAVA_HOME=/usr/local/java/jdk1.8.0_181
JRE_HOME=$JAVA_HOME/jre
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export JAVA_HOME JRE_HOME PATH CLASSPATH

保存并退出，然后使用命令 source /etc/profile 使环境变量生效，并验证Java环境是否成功配置：

[root@localhost java]# java -version
java version "1.8.0_181"
Java(TM) SE Runtime Environment (build 1.8.0_181-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.181-b13, mixed mode)
[root@localhost java]#

到此，需要在每一台 Hadoop 节点上依次配置如上安装准备步骤内容

第三步关闭防火墙并配置主机别名

1.执行如下命令关闭防火墙，并禁用开机启动:

[root@localhost ~]# systemctl stop firewalld.service
[root@localhost ~]# systemctl disable firewalld.service

2.修改主机名

在Master主机上执行： hostnamectl set-hostname master
在Slave01主机上执行：hostnamectl set-hostname slave01
在Slave02主机上执行：hostnamectl set-hostname slave02

注意： 尽量不要在主机别名中含有任何特殊字符，这可能导致后面的Hadoop和Hive的配置出现问题！

3.配置相关网络

以master主机为例，演示如何配置静态网络及host文件。
首先使用 ifconfig 命令查看本地网卡及IP：

然后打开配置文件：

[root@master ~]# vim /etc/sysconfig/network-scripts/ifcfg-ens33

根据节点网络相关信息，修改或添加如下内容：

ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.188.8
NETMASK=255.255.255.0
GATEWAY=182.168.188.2
DNS1=114.114.114.114
DEFROUTE=yes
IPV6INIT=no
IPV4_FAILURE_FATAL=yes

依次在各个节点中配置上述网络信息

4.修改hosts文件

vim /etc/hosts

在各个节点主机上添加所有节点其静态IP和主机别名：

192.168.188.8   master
192.168.188.9   slave01
192.168.188.10  slave02

配置完成后使用ping命令检查这3个机器是否相互ping得通，以master为例：

ping -c 3 slave01

第四步配置集群节点间的免密登录

1.对于每一台机器，su - hadoop 切换到hadoop用户，在hadoop用户下执行以下指令，以master节点为例，在hadoop用户home目录下生成密钥文件

[hadoop@master ~]$ ssh-keygen -t rsa -P ''

一直Enter到底。

2.对于每台机器，首先将自己的公钥加到authorized_keys中，保证ssh localhost无密码登录：

cat id_rsa.pub >> authorized_keys

3.然后将自己的公钥添加至其他每台机器的authorized_keys中，在此过程中需要输入其他机器的密码：

master:

scp /home/hadoop/.ssh/id_rsa.pub hadoop@slave01:/home/hadoop/.ssh/id_rsa_master.pub
scp /home/hadoop/.ssh/id_rsa.pub hadoop@slave02:/home/hadoop/.ssh/id_rsa_master.pub

slave01:

scp /home/hadoop/.ssh/id_rsa.pub hadoop@master:/home/hadoop/.ssh/id_rsa_slave01.pub
scp /home/hadoop/.ssh/id_rsa.pub hadoop@slave02:/home/hadoop/.ssh/id_rsa_slave01.pub

slave02:

scp /home/hadoop/.ssh/id_rsa.pub hadoop@master:/home/hadoop/.ssh/id_rsa_slave02.pub
scp /home/hadoop/.ssh/id_rsa.pub hadoop@slave01:/home/hadoop/.ssh/id_rsa_slave02.pub

4.分别进每一台主机的/home/hadoop/.ssh/目录下，将除本机产生的公钥（id_rsa.pub）之外的其他公钥使用cat命令添加至authorized_keys中。添加完毕之后使用chmod命令给authorized_keys文件设置权限，然后使用rm命令删除所有的公钥：

master:

cat id_rsa_slave01.pub >> authorized_keys
cat id_rsa_slave02.pub >> authorized_keys
chmod 600 authorized_keys
rm id_rsa*.pub

slave01:

cat id_rsa_master.pub >> authorized_keys
cat id_rsa_slave02.pub >> authorized_keys
chmod 600 authorized_keys
rm id_rsa*.pub

slave02:

cat id_rsa_master.pub >> authorized_keys
cat id_rsa_slave01.pub >> authorized_keys
chmod 600 authorized_keys
rm id_rsa*.pub

完成上述步骤，就可以实现从任意一台机器通过ssh命令免密码登录任意一台其他机器了。

Hadoop - 安装和配置（下述步骤在hadoop用户下执行）

下载和安装Hadoop

本文采用的是Hadoop 2.9.1版本，下载Hadoop：

1.进入 /usr/local/hadoop/ 目录，下载hadoop-2.9.1.tar.gz文件并解压：

wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/hadoop-2.9.1.tar.gz

tar -zxvf hadoop-2.9.1.tar.gz

2.生成Hadoop相关数据目录

在master上，首先/home/hadoop/目录下创建以下目录：

mkdir -p /usr/local/hadoop/hadoop-2.9.1/hadoopdir/name
mkdir -p /usr/local/hadoop/hadoop-2.9.1/hadoopdir/data
mkdir -p /usr/local/hadoop/hadoop-2.9.1/hadoopdir/temp
mkdir -p /usr/local/hadoop/hadoop-2.9.1/hadoopdir/logs
mkdir -p /usr/local/hadoop/hadoop-2.9.1/hadoopdir/pids

3.配置Hadoop脚本文件

hadoop-env.sh

export JAVA_HOME=/usr/local/java/jdk1.8.0_181
export HADOOP_LOG_DIR=/usr/local/hadoop/hadoop-2.9.1/hadoopdir/logs
export HADOOP_PID_DIR=/usr/local/hadoop/hadoop-2.9.1/hadoopdir/pids

mapred-env.sh

export JAVA_HOME=/usr/local/java/jdk1.8.0_181
export HADOOP_MAPRED_LOG_DIR=/usr/local/hadoop/hadoop-2.9.1/hadoopdir/logs
export HADOOP_MAPRED_PID_DIR=/usr/local/hadoop/hadoop-2.9.1/hadoopdir/pids

yarn-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_112
YARN_LOG_DIR=/usr/local/hadoop/hadoop-2.9.1/hadoopdir/logs

Slaves文件

#localhost
slave1
slave2

注意： 如果slaves文件里面不注释localhost，意思是把本机也作为一个DataNode节点

4.配置Hadoop相关XML文件

core-site.xml

<configuration>
    <property>
    <name>fs.defaultFSname>
        <value>hdfs://master:9000value>
    property>
    <property>
        <name>io.file.buffer.sizename>
        <value>131072value>
    property>
    <property>
        <name>hadoop.tmp.dirname>
        <value>file:///usr/local/hadoop/hadoop-2.9.1/hadoopdir/tempvalue>
    property>
configuration>

hdfs-site.xml

<configuration>
    <property>
        <name>dfs.namenode.name.dirname>
        <value>file:///usr/local/hadoop/hadoop-2.9.1/hadoopdir/namevalue>
    property>
    <property>
        <name>dfs.datanode.data.dirname>
        <value>file:///usr/local/hadoop/hadoop-2.9.1/hadoopdir/datavalue>
    property>
    <property>
        <name>dfs.replicationname>
        <value>2value>
    property>
    <property>
        <name>dfs.blocksizename>
        <value>64mvalue>
    property>
    <property>
        <name>dfs.namenode.secondary.http-addressname>
        <value>master:9001value>
    property>
    <property>
        <name>dfs.webhdfs.enabledname>
        <value>truevalue>
    property>
configuration>

mapred-site.xml

cp mapred-site.xml.template mapred-site.xml
vi mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
        <final>truefinal>
    property>
    <property>
        <name>mapreduce.jobhistory.addressname>
        <value>master:10020value>
    property>
    <property>
        <name>mapreduce.jobtracker.http.addressname>
        <value>master:50030value>
    property>
    <property>
        <name>mapred.job.trackername>
        <value>http://master:9001value>
    property>
    <property>
        <name>mapreduce.jobhistory.webapp.addressname>
        <value>master:19888value>
    property>
configuration>

yarn-site.xml

<property>
    <name>yarn.nodemanager.aux-servicesname>
    <value>mapreduce_shufflevalue>
property>
<property>
    <name>yarn.nodemanager.aux-services.mapreduce_shuffle.classname>
    <value>org.apache.hadoop.mapred.ShuffleHandlervalue>
property>
<property>
    <name>yarn.resourcemanager.hostnamename>
    <value>mastervalue>
property>
<property>
    <name>yarn.resourcemanager.scheduler.addressname>
    <value>master:8030value>
property>
<property>
    <name>yarn.resourcemanager.resource-tracker.addressname>
    <value>master:8031value>
property>
<property>
    <name>yarn.resourcemanager.addressname>
    <value>master:8032value>
property>
<property>
    <name>yarn.resourcemanager.admin.addressname>
    <value>master:8033value>
property>
<property>
    <name>yarn.resourcemanager.webapp.addressname>
    <value>master:8088value>
property>

5.master节点下，将/usr/local/hadoop/hadoop-2.9.1目录里面所有内容拷贝至其他节点

scp -r /usr/local/hadoop/ hadoop@slave01:/usr/local/hadoop/
scp -r /usr/local/hadoop/ hadoop@slave02:/usr/local/hadoop/

6.进入/usr/local/hadoop/hadoop-2.9.1/bin目录，格式化文件系统：

./hdfs namenode -format

格式化文件系统会产生一系列的终端输出，在输出最后几行看到STATUS=0表示格式化成功，如果格式化失败请详细查看日志确定错误原因。

7.进入/usr/local/hadoop/hadoop-2.9.1/sbin目录：

./start-dfs.sh
./start-yarn.sh

上述命令就启动了hdfs和yarn。hadoop集群就跑起来了，如果要关闭，在sbin目录下执行以下命令：

./stop-yarn.sh
./stop-dfs.sh

8.HDFS启动示例

可以在master:50070网页上看到如下结果，可以看到集群信息和DataNode相关信息：

Hive - 安装准备

Hive 内置了derby数据库，Hive默认使用内嵌的Derby数据库来存储它的元数据，但由于Derby数据库只支持单会话，所以，通常会使用MySQL作为它的外置存储引擎，方便多用户同时访问，这里以MySQL 5.7为例。

安装MySQL

1.下载MySQL Yum 包

wget http://repo.mysql.com/mysql57-community-release-el7-10.noarch.rpm

2.安转软件源

rpm -Uvh mysql57-community-release-el7-10.noarch.rpm

3.安装mysql服务端

yum install  -y  mysql-community-server

4.启动MySQL，并设置开机启动

service mysqld start
systemctl start mysqld.service

5.检查mysql 的运行状态

service mysqld status
systemctl status mysqld.service

6.修改MySQL密码

为了加强安全性，MySQL5.7为root用户随机生成了一个密码，在error log中，关于error log的位置，如果安装的是RPM包，则默认是/var/log/mysqld.log。
只有启动过一次mysql才可以查看临时密码

（1）通过以下命令可以看到初始密码：

grep 'temporary password' /var/log/mysqld.log

（2）使用默认密码登陆并修改密码

mysql -uroot -p

用默认密码登录到服务端后，必须马上修改密码，不然会报如下错误：

mysql> select @@log_error;
ERROR 1820 (HY000): You must reset your password using ALTER USER statement before executing this statement.
mysql>

修改密码:

ALTER USER 'root'@'localhost' IDENTIFIED BY 'root123456';

授权其他机器登陆:

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root123456' WITH GRANT OPTION;
FLUSH  PRIVILEGES;

安装Hive

下载Hive和环境准备

Hive官网地址：http://hive.apache.org/index.html

Hive下载地址：https://mirrors.tuna.tsinghua.edu.cn/apache/hive/

注意： 在安装Hive之前，需要保证你的Hadoop集群已经正常启动，Hive只需在Hadoop集群的NameNode节点上安装即可，无需在DataNode节点上安装。

本文安装的是 apache-hive-2.3.3-bin.tar.gz 其下载地址为：
https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.3/apache-hive-2.3.3-bin.tar.gz

执行安装

# 切换到hive压缩包的下载目录
cd /usr/local/hive/
# 据自己的实际需要下载相应版本的 hive 压缩包
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.3/apache-hive-2.3.3-bin.tar.gz
--2018-08-12 13:53:31--  https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.3/apache-hive-2.3.3-bin.tar.gz
Resolving mirrors.tuna.tsinghua.edu.cn (mirrors.tuna.tsinghua.edu.cn)... 101.6.8.193, 2402:f000:1:408:8100::1
Connecting to mirrors.tuna.tsinghua.edu.cn (mirrors.tuna.tsinghua.edu.cn)|101.6.8.193|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 232229830 (221M) [application/octet-stream]
Saving to: ‘apache-hive-2.3.3-bin.tar.gz’

100%[==============================================================================>] 232,229,830 1.54MB/s   in 1m 52s

2018-08-12 13:55:24 (1.97 MB/s) - ‘apache-hive-2.3.3-bin.tar.gz’ saved [232229830/232229830]

# 将下载好的 hive 压缩包解压到
tar zxvf apache-hive-2.3.3-bin.tar.gz
# 之前已经将 /usr/local/hive/ 目录权限分配给hadoop用户

配置Hive

1.执行 sudo vim /etc/profile 命令配置环境变量，在 /etc/profile 配置文件中添加 Hive 环境变量，内容如下：

export HIVE_HOME=/usr/local/hive/apache-hive-2.3.3
export HIVE_CONF_DIR=$HIVE_HOME/conf

PATH=$HIVE_HOME/bin:$PATH

然后使用命令 source /etc/profile 使环境变量生效。

2.创建hive-site.xml

# 在开始配置Hive之前，先执行如下命令，切换到Hive的操作账户，我的是 hadoop 
su - hadoop
cd $HIVE_CONF_DIR
# 以 hive-default.xml.template 为模板，创建 hive-site.xml
cp hive-default.xml.template  hive-site.xml

3.在HDFS中创建Hive所需目录

因为在hive-site.xml中有以下配置：

<property>
    <name>hive.metastore.warehouse.dirname>
    <value>/user/hive/warehousevalue>
    <description>location of default database for the warehousedescription>
property>
<property>
    <name>hive.exec.scratchdirname>
    <value>/tmp/hivevalue>
    <description>HDFS root scratch dir for Hive jobs which gets created with write all (733) permission. description>
property>

所以需要在HDFS中创建好相应的目录，操作命令如下：

[hadoop@master conf]$ hdfs dfs -mkdir -p /user/hive/warehouse
[hadoop@master conf]$ hdfs dfs -chmod -R 777 /user/hive/warehouse
[hadoop@master conf]$ hdfs dfs -mkdir -p /tmp/hive
[hadoop@master conf]$ hdfs dfs -chmod -R 777 /tmp/hive
[hadoop@master conf]$ hdfs dfs -ls /
Found 2 items
drwx------   - hadoop supergroup          0 2018-08-12 11:53 /tmp
drwxr-xr-x   - hadoop supergroup          0 2018-08-12 14:31 /user
[hadoop@master conf]$ hdfs dfs -ls /tmp/
Found 1 items
drwxrwxrwx   - hadoop supergroup          0 2018-08-12 11:53 /tmp/hive
[hadoop@master conf]$ hdfs dfs -ls /user/hive
Found 1 items
drwxrwxrwx   - hadoop supergroup          0 2018-08-12 14:31 /user/hive/warehouse

4.配置hive-site.xml

(1) 配置hive本地临时目录

将hive-site.xml文件中的${system:java.io.tmpdir}替换为hive的本地临时目录，例如我使用的是 /usr/local/hive-2.3.3/tmp ，如果该目录不存在，需要先进行创建，并且赋予读写权限：

[hadoop@master conf]$ cd $HIVE_HOME
[hadoop@master hive-2.3.3]$ mkdir tmp/
[hadoop@master hive-2.3.3]$ chmod -R 777 tmp/
[hadoop@master hive-2.3.3]$ cd $HIVE_CONF_DIR
[hadoop@master conf]$ vim hive-site.xml

在vim命令模式下执行如下命令完成替换：

:%s#${system:java.io.tmpdir}#/usr/local/hive-2.3.3/tmp#g

例如：

<property>
    <name>hive.exec.local.scratchdirname>
    <value>${system:java.io.tmpdir}/${system:user.name}value>
    <description>Local scratch space for Hive jobsdescription>
property>

替换为：

<property>
    <name>hive.exec.local.scratchdirname>
    <value>/usr/local/hive-2.3.3/tmp/${system:user.name}value>
    <description>Local scratch space for Hive jobsdescription>
property>

(2) 配置Hive用户名

将hive-site.xml文件中的 ${system:user.name} 替换为操作Hive的账户的用户名，例如我的是 hadoop 。在vim命令模式下执行如下命令完成替换：

:%s#${system:user.name}#hadoop#g

例如：

<property>
    <name>hive.exec.local.scratchdirname>
    <value>/usr/local/hive-2.3.3/tmp/${system:user.name}value>
    <description>Local scratch space for Hive jobsdescription>
property>

替换为：

<property>
    <name>hive.exec.local.scratchdirname>
    <value>/usr/local/hive-2.3.3/tmp/hadoopvalue>
    <description>Local scratch space for Hive jobsdescription>
property>

(3) 修改Hive数据库配置

属性名称	描述
javax.jdo.option.ConnectionDriverName	数据库的驱动类名称
javax.jdo.option.ConnectionURL	数据库的JDBC连接地址
javax.jdo.option.ConnectionUserName	连接数据库所使用的用户名
javax.jdo.option.ConnectionPassword	连接数据库所使用的密码

Hive默认的配置使用的是Derby数据库来存储Hive的元数据信息，其配置信息如下：

<property>
    <name>javax.jdo.option.ConnectionDriverNamename>
    <value>org.apache.derby.jdbc.EmbeddedDrivervalue>
    <description>Driver class name for a JDBC metastoredescription>
property>
<property>
    <name>javax.jdo.option.ConnectionURLname>
    <value>jdbc:derby:;databaseName=metastore_db;create=truevalue>
    <description>
      JDBC connect string for a JDBC metastore.
      To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.
      For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.
    description>
property>
<property>
    <name>javax.jdo.option.ConnectionUserNamename>
    <value>APPvalue>
    <description>Username to use against metastore databasedescription>
property>
<property>
    <name>javax.jdo.option.ConnectionPasswordname>
    <value>minevalue>
    <description>password to use against metastore databasedescription>
property>

需要将Derby数据库切换为MySQL数据库的话，只需要修改以上4项配置，例如，我的是：

<property>
    <name>javax.jdo.option.ConnectionDriverNamename>
    <value>com.mysql.cj.jdbc.Drivervalue>
    <description>Driver class name for a JDBC metastoredescription>
property>
<property>
    <name>javax.jdo.option.ConnectionURLname>
    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&useSSL=falsevalue>
    <description>
      JDBC connect string for a JDBC metastore.
      To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.
      For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.
    description>
property>
<property>
    <name>javax.jdo.option.ConnectionUserNamename>
    <value>rootvalue>
    <description>Username to use against metastore databasedescription>
property>
<property>
    <name>javax.jdo.option.ConnectionPasswordname>
    <value>root123456value>
    <description>password to use against metastore databasedescription>
property>

在配置 javax.jdo.option.ConnectionURL 的时候，使用useSSL=false，禁用MySQL连接警告，而且可能会导致Hive初始化MySQL元数据失败。

此外，还需要将MySQL的驱动包拷贝到Hive的lib目录下：

因为MySQL官方强烈建议使用MySQL Connector/J 8.0与MySQL Server 8.0、5.7、5.6和5.5一起使用。所以使用mysql-connector-java-8.0.12.jar，上面配置文件中的驱动名称是 com.mysql.cj.jdbc.Driver

cp /home/hadoop/mysql-connector-java-8.0.12.jar $HIVE_HOME/lib/

5.配置 hive-env.sh

[hadoop@master conf]$ cd $HIVE_CONF_DIR
[hadoop@master conf]$ cp hive-env.sh.template hive-env.sh
[hadoop@master conf]$ vim hive-env.sh
# 编辑 hive-env.sh 增加下面3行内容
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.9.1
export HIVE_CONF_DIR=/usr/local/hive/hive-2.3.3/conf
export HIVE_AUX_JARS_PATH=/usr/local/hive/hive-2.3.3/lib

初始化启动和测试Hive

1.Hive数据库初始化

[hadoop@master conf]$ cd $HIVE_HOME/bin
# 初始化mysql数据库
[hadoop@master bin]$ schematool -initSchema -dbType mysql
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/usr/local/hive-2.3.3/lib/log4j-slf4j-impl-2.6.2.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/usr/local/hadoop-2.9.1/share/hadoop/common/lib/slf4j-log4j12-1.7.25.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]
Metastore connection URL:     jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&;useSSL=false
Metastore Connection Driver :     com.mysql.cj.jdbc.Driver
Metastore connection User:     root
Starting metastore schema initialization to 2.3.0
Initialization script hive-schema-2.3.0.mysql.sql
Initialization script completed
schemaTool completed

数据库初始化完成之后，会在MySQL数据库里生成如下metadata表用于存储Hive的元数据信息：

2.启动Hive

[hadoop@master bin]$ cd $HIVE_HOME/bin
# 使用 hive 命令启动Hive
[hadoop@master bin]$ ./hive
which: no hbase in (/usr/local/hive-2.3.3/bin:/usr/local/jdk1.8.0_144/bin:/usr/local/jdk1.8.0_144/bin:/usr/lib64/qt-3.3/bin:/usr/local/hive-2.3.3/bin:/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/usr/local/zookeeper-3.4.12/bin:/home/hadoop/.local/bin:/home/hadoop/bin:/usr/local/hadoop-2.9.1/bin:/usr/local/hadoop-2.9.1/sbin:/home/hadoop/.local/bin:/home/hadoop/bin:/home/hadoop/.local/bin:/home/hadoop/bin:/usr/local/hadoop-2.9.1/bin:/usr/local/hadoop-2.9.1/sbin:/usr/local/zookeeper-3.4.12/bin:/home/hadoop/.local/bin:/home/hadoop/bin:/usr/local/hadoop-2.9.1/bin:/usr/local/hadoop-2.9.1/sbin)
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/usr/local/hive-2.3.3/lib/log4j-slf4j-impl-2.6.2.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/usr/local/hadoop-2.9.1/share/hadoop/common/lib/slf4j-log4j12-1.7.25.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]

Logging initialized using configuration in jar:file:/usr/local/hive-2.3.3/lib/hive-common-2.3.3.jar!/hive-log4j2.properties Async: true
Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive 1.X releases.
hive> show databases;
OK
Time taken: 5.682 seconds, Fetched: 0 row(s)
hive> desc function sum;
OK
sum(x) - Returns the sum of a set of numbers
Time taken: 0.008 seconds, Fetched: 1 row(s)
hive>

THE END

你可能感兴趣的:(Hadoop)

浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
Hadoop windows intelij 跑 MR WordCount piziyang12138
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
Hadoop学习第三课（HDFS架构--读、写流程）小小程序员呀~ 数据库 hadoop 架构 big data
1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
hadoop启动HDFS命令 m0_67401228 java 搜索引擎 linux 后端
启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
spark常用命令我是浣熊的微笑 spark
查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
spark启动命令学不会又听不懂 spark 大数据分布式
hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购计算机编程指导师 Java实战集 Python实战集大数据实战集课程设计 hadoop 数据分析 spring boot java 进货 python
✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
Hadoop Common 之序列化机制小解猫君之上 #Apache Hadoop
1.JavaSerializable序列化该序列化通过ObjectInputStream的readObject实现序列化，ObjectOutputStream的writeObject实现反序列化。这不过此种序列化虽然跨病态兼容性强，但是因为存储过多的信息，但是传输效率比较低，所以hadoop弃用它。（序列化信息包括这个对象的类，类签名，类的所有静态，费静态成员的值，以及他们父类都要被写入）publ
深入理解hadoop(一)----Common的实现----Configuration maoxiao_jsd 深入理解----hadoop
属本人个人原创，转载请注明,希望对大家有帮助！！一,hadoop的配置管理a,hadoop通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml");conf.addResource("core-site.xml");后者会覆盖前者中未final标记的相同配置项b
hadoop 0.22.0 部署笔记 weixin_33701564 大数据 java 运维
为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
深入解析HDFS：定义、架构、原理、应用场景及常用命令 CloudJourney hdfs 架构 hadoop
引言Hadoop分布式文件系统（HDFS，HadoopDistributedFileSystem）是Hadoop框架的核心组件之一，它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨，帮助读者全面深入地了解HDFS。1.HDFS的定义1.1什么是HDFSHDFS是Hadoop生态系统中的一个分布式文件系
Hadoop的搭建流程 lzhlizihang hadoop 大数据分布式
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步：2、第二步：3、第三步：4、第四步：5、第五步：七、安装hadoop1、上传2、解压3、重命名4、开始配置环境变量5、刷新配置文件6、验证hadoop命令是否可以识别八、全分布搭建7、修改配置文件core-site.xml8、修改配置文件hdfs-site.xml9、修改配置文件hadoop-en
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
Hadoop之mapreduce -- WrodCount案例以及各种概念 lzhlizihang hadoop mapreduce 大数据
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法（自定义分区器）4、reducer方法5、driver（main方法）6、Writable（手机流量统计案例的实体类）三、关于片和块1、什么是片，什么是块？2、mapreduce启动多少个MapTask任务？四、MapReduce的原理五、Shuffle过
IAAS: IT公司去IOE-Alibaba系统构架解读 wishchin 心理学/职业 BigDataMini Spark PaaS
从Hadoop到自主研发，技术解读阿里去IOE后的系统架构原地址：......................云计算阿里飞天摘要：从IOE时代，到Hadoop与飞天并行，再到飞天单集群5000节点的实现，阿里一直摸索在技术衍变的前沿。这里，我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及，智能终端的增加，大数据时代悄然而至。在这个数据为王的时代，数十倍、数百倍的数据给各
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl