桔子66

Hadoop、Slurm平台详细安装配置步骤

大数据Hadoop、Slurm平台

安装配置手册

河北科技大学理学院

王子元

2018年6月

绪论

本人本科毕业设计选的是《数学系大数据环境建设》课题，实验集群采用四台惠普工作站做为节点服务器，采用一台虚拟机和3台真机作为实验环境，下文的整个配置记录全部真实有效，虽说这只是我的本科毕业设计的附件，但没有半点水分。系统完全按照刀片式服务器集群来部署，更加真实的模拟了华为刀片服务器集群的运行环境。另外有两个主要的创新之处：一、配置了时间服务器，使集群对时精准到0.05秒，精确度远远高于集群要求的时间误差3秒。二、制作了一个基于Python的自动化脚本，将绝大多数的集群操作命令集合在其中，实现半自动化集群管理操作，极大地降低的普通用户对集群操作学习的成本。感谢周长杰老师的提供的参考依据，感谢李国刚老师、阎晨光老师的对硬件设备的支持，为我实验的顺利进行保驾护航，感谢白晓刚学长对我Slurm过程的帮助。我的本科毕业设计，虽然最后仅以4分之差没有拿到优秀，但是在公开答辩时，我得到了答辩组所有老师的认可，能够做到这样我也算满足了，这三个月的努力没白费。本人作为数学系信息与计算科学专业的学生，我感觉目前自己对整个计算机生态的理解并不比计算机系的差，而我个人认为未来的计算机发展方向是人工智能、机器学习，所以我又选择的了攻读数学系的研究生，我相信未来会在数学和计算机这个交叉方向取得一些成绩。

hadoop web管理地址... 3

Linux篇... 3

HDFS篇... 7

MapReduce篇... 14

zookeeper篇... 24

Hbase篇... 25

Hive篇... 36

Slurm篇... 41

NTP时间服务器篇... 43

Python脚本篇... 45

hadoop web管理地址

1 HDFS的Web管地址

http://192.168.1.201:50070/

2 MapReduce的Web管理地址

http://192.168.1.201:8088/

3 HBase的Web管理地址

http://192.168.1.201:16010/

4 Hive的Web管理地址

http://192.168.1.201:9999/hwi/

Linux篇

一常用命令

which java which查看文件所在位置

which javac

rm -rf /usr/bin/java rm-rf 强制删除

rm -rf /usr/bin/javac

ln -s $JAVA_HOME/bin/javac /usr/bin/java 链接位置

ln -s $JAVA_HOME/bin/javac /usr/bin/javac

netstat -an | grep 10000

ps -aux | grep 'metastore'

ifconfig 查看ip

hostname

service iptables stop

chkconfig iptables off

service network restart 重启网卡

source /etc/profile

scp

reboot

poweroff

二操作系统安装配置

1 规划IP地址：

Router 192.168.1.1

Linux

master 192.168.1.200

slave01 192.168.1.201

slave02 192.168.1.202

slave03 192.168.1.203

2.制作U盘启动盘

2.1通过软碟通制作好U盘启动工具

准备 U盘（8G）、rhel-server-7.0-x86_64-dvd.iso、UltraISO软碟通软件

2.2 在电脑上安装上UltraISO软碟通软件

2.3 将准备好的U盘插入电脑，双击UltraISo图标，选择继续试用

2.4 选择文件--打开

2.5 启动--写入映像..

2.6 选择自己U盘，点击写入（在写入之前，系统先格式化U盘，请提前做好备份），等待一段时间（等待时间由电脑配置决定）

2.linux 7.0 安装步骤

2.1选择界面第一个(Install Red Hat Enterprise Linux 7.0)开始安装

2.2 选择中文和简体中文（中国），点击继续

2.3.1 选择软件选择，选择左侧带GUI的服务器。右侧为系统自带的的环境附加选项，若有需要，可以自行选择。之后，点击完成

2.3.2点击安装位置，选择硬盘，点击完成。然后会弹出对话框，点击回收空间——全部删除——回收空间

2.3.3点击网络和主机名，输入主机名（如master，slave01,slave02,slave03)点击完成;第二步，

配置网络

选择自动连接、允许所有用户使用

选择IPV4设置

方法选择手动

添加网卡并配置:地址192.168.1.xxx 掩码255.255.255.0 网关192.168.1.1

DNS 192.168.1.1,114.114.114.114

应用

3.3点击网络和主机名，输入主机名（如master，slave01,slave02,slave03)点击完成。

3.4点击开始安装，选择root密码，输入hadoop

3.5安装完成后重启，选择为许可信息，同意许可协议，完成，点击完成配置

3.6点击前进

3.7输入hadoop密码，进入界面化linux系统，等待弹出对话框，点击前进——前进——点击 Start using Red Hat Enterprise Linux Server 此时安装完成。

4 配置终端快捷方式

选择应用程序—系统工具—设置—键盘—快捷键—自定义快捷键，点击“+”号，名字：terminal

命令：gonme-terminal ，应用。点击terminal，按ctrl+t，关掉窗口。自己键盘输入：ctrl+t，弹出命令窗口，设置完成

6 配置Red Hat 7.0防火墙（需要切换到root帐户）

查看防火墙状态 systemctl status firewalld

关闭防火墙 systemctl stop firewalld

永久关闭防火墙 systemctl disable firewalld

7 检查网络互通是否正常

ping 192.168.1.1

ping 192.168.1.20x

8 查看Red Hat系列的系统版本

cat /etc/redhat-release

9 配置Red Hat hosts （需要切换到root帐户）

vim /etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.1.200 master

192.168.1.201 slave01

192.168.1.202 slave02

192.168.1.203 slave03

用ping命令检查主机名通讯是否正常（e.g. ping master）

三配置 ssh 互信

1 生成密钥 ·····

ssh1-keygen

一路回车

2 把公钥发给所有机器

ssh-copy-id master

ssh-copy-id slave01

…

中间要输入yes和密码hadoop

3 用ssh命令检查是否互信成功

ssh master

ssh slave01

…

不要求输入密码则成功

4 备注：

生成的密钥在/home/hadoop/.ssh中，其中.ssh是隐藏的

authorized_keys为已经互信的机器公钥信息

四安装xShell、xFtp

1 在windows下安装，选择免费版本

在session管理窗口中，建立一个与linux主机同名的链接名，并配置主机IP

连接，输入用户名并保存，输入密码并保存，生成验证信息并保存

此时已经连接到Linux主机，可以用命令行操作我们安装好的CentOS了

2 安装 xFtp

在windows下安装，选择免费版本

不需要启动，我们使用时在xShell中用右数第八个图标启动，不需要用户名密码

五安装配置 Redhat JDK

1在hadoop用户的根目录（/home/hadooop）创建文件夹app

2 从xShell启动xFtp

3 从windows本地上传jdk-8u121-linux-x64.tar.gz到app下

4 解压jdk-8u65-linux-x64.tar.g到app下

cd app

tar –zxvf jdk-8u65-linux-x64.tar.gz

cd ~

5配置环境变量（需要切换到root帐户）

5.1 gedit /etc/profile

5.2在最后增加两行

JAVA_HOME=/home/hadoop/app/jdk1.8.0_121

export PATH=$PATH:$JAVA_HOME/bin

6 把修改的环境变量生效

source /etc/profile

7 检测并配置jdk

7.1 检测jdk版本，应该为java version "1.8.0_121"，javac 1.8.0_121

java –version

javac –version

7.2 检查jdk位置，应该为~/app/jdk1.8.0_121/bin/java,~/app/jdk1.8.0_121/bin/javac

which java

which javac

7.3 如果不正确，则删除原有的java/javac,链接新的

rm -rf /usr/bin/java

rm -rf /usr/bin/javac

ln –s $JAVA_HOME/bin/java /usr/bin/java

ln –s $JAVA_HOME/bin/javac /usr/bin/javac

六 Eclipse安装配置

1 在windows下解压eclipse-jee-mars-2-win32-x86_64.zip

2 配置workspace

七常用配置文件位置

1 主机名

/etc/sysconfig/network

2 主机IP配置信息

/etc/sysconfig/network-scripts/ifcfg-eth0

3 环境变量配置信息

/etc/profile

4 静态路由配置信息

/etc/hosts

HDFS篇

一安装配置

1.1 从xShell启动xFtp

1.2 从windows本地上传hadoop-2.6.0.tar.gz到app下

1.3 解压hadoop-2.6.0.tar.gz到app下

cd app

tar –zxvf hadoop-2.6.0.tar.gz

cd ~

1.4修改配置文件app/hadoop-2.6.0/etc/hadoop/hadoop-env.sh，

找到

export JAVA_HOME=${JAVA_HOME}

替换为

export JAVA_HOME=/home/hadoop/app/jdk1.8.0_121

1.5修改配置文件app/hadoop-2.6.0/etc/hadoop/core-site.xml

fs.defaultFS

hdfs://master:9000

io.file.buffer.size

131072

hadoop.tmp.dir

/home/hadoop/appdata/hadoop/tmp

1.6修改配置文件hadoop-2.6.0/etc/hadoop/hdfs-site.xml

dfs.namenode.secondary.http-address

master:9001

dfs.namenode.name.dir

/home/hadoop/appdata/hadoop/dfs/name

dfs.datanode.data.dir

/home/hadoop/appdata/hadoop/dfs/data

dfs.replication

1.7 修改修改配置文件hadoop-2.6.0/etc/hadoop/mapred-site.xml

1.7.1复制mapred-site.xml.template，更名为mapred-site.xml

1.7.2 配置

mapreduce.framework.name

yarn

mapreduce.jobhistory.address

master:10020

mapreduce.jobhistory.webapp.address

master:19888

1.8修改配置文件hadoop-2.6.0/etc/hadoop/yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

yarn.resourcemanager.address

master:8032

yarn.resourcemanager.scheduler.address

master:8030

yarn.resourcemanager.resource-tracker.address

master:8035

yarn.resourcemanager.admin.address

master:8033

yarn.resourcemanager.webapp.address

master:8088

1.9修改配置文件hadoop-2.6.0/etc/hadoop/slaves

slave01

slave02

slave03

1.10 如果集群中其他机器没有配置，可以直接复制

scp –r app/hadoop-2.6.0 slave01:~/app/

二 HDFS 系统操作

2.1 格式化

~/app/hadoop-2.6.0/bin/hdfs namenode –format

注意：格式化只能操作一次并且在主节点格式化,如果需要再次格式化，需要把appdata/hadoop目录清空或者直接删除所有节点的appdata文件

2.2 启动

~/app/hadoop-2.6.0/sbin/start-all.sh

2.3 查看是否启动正确

2.3.1 查看日至输出

2.3.2 查看进程jps

2.3.2.1 master节点

NameNode

SecondaryNameNode

ResourceManager

2.3.2.2 datanode节点

DataNode

NodeManager

2.4 停止

app/hadoop-2.6.0/sbin/stop-all.sh

2.5 复制

scp –r ~/app/hadoop-2.6.0 slave01:~/app/

三 HDFS Shell操作

3.1创建目录

3.1.1创建单级目录

bin/hadoop dfs -mkdir /abc

3.1.2 创建多级目录

bin/hadoop dfs -mkdir -p /a/b/c

3.2查看目录的内容

bin/hadoop dfs -ls /

3.3上传文件，从linux系统把文件上传到HDFS

bin/hadoop dfs -put etc/hadoop/core-site.xml /

3.4 下载文件，从HDFS把文件下载到linux系统

bin/hadoop dfs -get /core-site.xml .

3.5 查看HDFS文件内容

bin/hadoop dfs -cat /core-site.xml

3.6 删除HDFS上的文件或目录

3.6.1 删除空的目录

bin/hadoop dfs -rmdir /a/b/c

3.6.2 删除文件

bin/hadoop dfs -rm /core-site.xml

bin/hadoop dfs -rm -r /a

3.7 安全模式

bin/hdfs dfsadmin -safemode

hdfs dfsadmin [-safemode enter | leave | get | wait]

3.8检查整个文件系统的健康状况

bin/hdfs fsck /

Usage: fsck [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]

检查这个目录中的文件是否完整

-move 破损的文件移至/lost+found目录

-delete 删除破损的文件

-openforwrite 打印正在打开写操作的文件

-files 打印正在check的文件名

-blocks 打印block报告（需要和-files参数一起使用）

-locations 打印每个block的位置信息（需要和-files参数一起使用）

-racks 打印位置信息的网络拓扑图（需要和-files参数一起使用）

四 WEB操作

4.1 HDFS的Web管理地址

http://192.168.1.201:50070/

4.2 集群状态

4.3 集群DataNode状态

4.3 集群文件浏览

4.4 集群文件属性

五 API操作

5.1 启动eclipse

windows下双击eclipse图标

5.2 创建工程(testHadoop)

File->new-java project

5.3 在testHadoop工程下创建文件夹lib

5.4 导入hadoop hdfs api访问需要的jar包

5.4.1 windows本地winrar解压hadoop-2.6.0.tar.gz

5.4.2 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\common\*.jar，粘贴到lib

5.4.3 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\common\lib\*.jar，粘贴到lib

5.4.4 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\common\sources\*.jar，粘贴到lib

5.4.5 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\hdfs\*.jar，粘贴到lib

5.4.6 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\hdfs\lib\*.jar，粘贴到lib

5.4.7 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\hdfs\sources\*.jar，粘贴到lib

5.4.8 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\mapreduce\*.jar，粘贴到lib

5.4.9 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\mapreduce\lib\*.jar，粘贴到lib

5.4.10 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\mapreduce\sources\*.jar，粘贴到lib

5.4.11 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\yarn\*.jar，粘贴到lib

5.4.12 复制hadoop-2.6.0\ hadoop-2.6.0\share\hadoop\yarn\lib\*.jar，粘贴到lib

5.4.13 复制hadoop-2.6.0\hadoop-2.6.0\share\hadoop\yarn\sources\*.jar，粘贴到lib

5.5 选择lib下的所有 .jar文件，右击鼠标选择build path->add to build path，会在工程下自动生成Referenced Libraries

5.6 写API读写程序

5.6.1 在src上右击鼠标->new->Package，输入包名testHDFS

5.6.2 在testHDFS上右击鼠标->new->Class，输入类名TestHDFSAPI，选择 public static void main(String[] args)，完成。

5.6.3 编写读文件程序

import java.io.IOException;

import java.io.InputStream;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.junit.Test;

public class TestHDFSAPI {

public static void main(String[] args){

Configuration conf=new Configuration();

try {

URI uri=new URI("hdfs://192.168.1.201:9000");

FileSystem fs= FileSystem.get(uri,conf);

InputStream inputStream=fs.open(new Path("/core-site.xml"));

int i;

while((i=inputStream.read())!=-1)

{

System.out.print((char)i);

}

fs.close();

}

catch (Exception e) {

e.printStackTrace();

}

5.6.4 编写上传文件程序

Configuration conf=new Configuration();

try {

URI uri=new URI("hdfs://192.168.1.201:9000");

FileSystem fs= FileSystem.get(uri,conf);

Path src=new Path("d:/logwzy.txt");

Path dest=new Path("/");

fs.copyFromLocalFile(false, true,src,dest);

fs.close();

}

catch (Exception e) {

e.printStackTrace();

}

5.6.5 编写浏览HDFS根目录程序

Configuration conf=new Configuration();

try {

URI uri=new URI("hdfs://192.168.1.201:9000");

FileSystem fs= FileSystem.get(uri,conf);

FileStatus[] fileStatus=fs.listStatus(new Path("/"));

for(int i=0;i

{

FileStatus status=fileStatus[i];

System.out.println("文件名称:"+status.getPath());

System.out.println("复制因子:"+status.getReplication());

System.out.println("文件长度:"+status.getLen());

System.out.println("--------------------------");

}

fs.close();

}

catch (Exception e) {

e.printStackTrace();

}

5.7 运行程序

鼠标右击TestHDFSAPI类代码空白处，Run As->Java Application

MapReduce篇

MapReduce Web管理

1.1 mapreduce的Web管理地址

http://192.168.1.201:8088/

1.2 mapreduce的Web管理界面

1.2.1集群信息

1.2.2 节点信息

1.2.3 所有任务

1.2.4 已提交任务

1.2.5 已接受任务

1.2.6 正在运行的任务

1.2.7 已结束的任务

1.2.8 失败的任务

二 MapReduce程序开发准备工作

2.1 运行环境准备

2.1.1 windows本地winrar解压hadoop-2.6.0.tar.gz

2.1.2 设置HADOOP_HOME环境变量，为刚才的解压目录

2.1.3 把winutils.exe文件放到%HADOOP_HOME%的bin目录中

2.1.4 把hadoop.dll文件放到c:/windows/System32目录下，否则会报错

2.1.5 解压hadoop-2.6.0\share\hadoop\common\sources\hadoop-common-2.6.0-sources.jar文件，在解压后的文件中找到org\apache\hadoop\io\nativeio\NativeIO.java文件，把它复制到对应的eclipse的testHadoop project中src的文件夹下，NativeIO.java文件还要在原来的包名下(即project工程下，文件路径应为src\org\apache\hadoop\io\nativeio.java)

2.1.6 修改NativeIO.java文件的557行，替换为return true;

2.1.7 用管理员身份启动eclipse，修改错误级别

鼠标右击项目->Properties->Java Compiler->Errors/Warnings，勾选Enable project specific settings，把Deprecated and restricted API下的Forbidden reference的值设置为Warning

2.2本地模式处理的文件和运算都在本地执行

2.2.1 准备数据

在d盘创建文件佳testhadoop，在testhadoop下创建input，在input下创建文件test.txt，并写入如下内容

good good study

day day up

2.2.2 配置运行参数

2.2.2.1鼠标右击WCRunner类代码空白处->Run As->Run Configurations

2.2.2.2 选择Arguments页

2.2.2.3 在Program arguments中写入运行参数

d:/testhadoop/input d:/testhadoop/output

2.2.3 运行

鼠标右击WCRunner类代码空白处->Run As->Java Application

2.3半本地模式处理的文件在HDFS，运算在本地进行

2.3.1 准备数据

2.3.1.1 在linux /home/hadoop/testhadoop下创建test文件，内容如下

good good study

day day up

2.3.1.2 在集群上创建文件夹/testhadoop/input

bin/hadoop dfs -mkdir -p /testhadoop/input

2.3.1.2 把test文件上传到/testhadoop/input中

bin/hadoop dfs -put /home/hadoop/testhadoop/test / testhadoop/input

2.3.2 配置运行参数

2.3.2.1鼠标右击WCRunner类代码空白处->Run As->Run Configurations

2.3.2.2 选择Arguments页

2.3.2.3 在Program arguments中写入运行参数

hdfs://master:9000/input hdfs://master:9000/output

2.3.2.4 在VM arguments中写入运行参数

-DHADOOP_USER_NAME=hadoop

2.3.3 运行

鼠标右击WCRunner类代码空白处->Run As->Java Application

2.4集群模式 jar形式运行，在linux中提交

2.4.1 准备数据

2.4.1.1 在linux /home/hadoop/testhadoop下创建test文件，内容如下

good good study

day day up

2.4.1.2 在集群上创建文件夹/testhadoop/input

bin/hadoop dfs -mkdir -p /testhadoop/input

2.4.1.2 把test文件上传到/testhadoop/input中

bin/hadoop dfs -put /home/hadoop/testhadoop/test / testhadoop/input

2.4.2 导出jar包wc.jar

2.4.3 把wc.jar传到linux的/home/hadoop/testhadoop下

2.4.4 运行

bin/hadoop jar ~/testhadoop/wc.jar testMR.WCRunner /testhadoop/input /testhadoop/

output

注意：输出目录必须是不存在的

三 MapReduce程序开发

3.1 分词统计wordcount

3.1.1 新建testMR包

在src上右击鼠标->new->Package，输入包名testMR

3.1.2 新建WCMapper类，并编写代码

3.1.2.1 在testMR上右击鼠标->new->Class，输入类名WCMapper，不选择 public static void main(String[] args)，完成。

3.1.2.2 代码

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

public class WCMapper extends Mapper {

@Override

protected void map(LongWritable key, Text value,

org.apache.hadoop.mapreduce.Mapper.Context context)

throws IOException, InterruptedException {

String line = value.toString();

String words[] = line.split(" ");

for(String word:words)

context.write(new Text(word), new LongWritable(1));

}

3.1.3 新建WCReducer类，并编写代码

3.1.3.1 在testMR上右击鼠标->new->Class，输入类名WCReducer，不选择 public static void main(String[] args)，完成。

3.1.3.2 代码

import java.io.IOException;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

public class WCReducer extends Reducer{

@Override

protected void reduce(Text key, Iterable values,

Reducer.Context context)throws IOException, InterruptedException {

long sum=0;

for(LongWritable value:values)

sum+=value.get();

context.write(key, new LongWritable(sum));

}

3.1.4 新建WCRunner类，并编写代码

3.1.4.1 在testMR上右击鼠标->new->Class，输入类名WCRunner，选择 public static void main(String[] args)，完成。

3.1.4.2 代码

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WCRunner {

public static void main(String[] args) {

Configuration conf=new Configuration();

try{

Job job=Job.getInstance(conf);

job.setJobName("zcjJob");

job.setJarByClass(WCRunner.class);

job.setMapperClass(WCMapper.class);

job.setReducerClass(WCReducer.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(LongWritable.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(LongWritable.class);

FileInputFormat.addInputPath(job, new Path(args[0]));

FileOutputFormat.setOutputPath(job, new Path(args[1]));

job.waitForCompletion(true);

}

catch(Exception e){

e.printStackTrace();

}

3.2 倒排索引invertindex

3.2.1新建invertindex包

3.2.2 新建map1类，不选择main方法，并编写代码

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.lib.input.FileSplit;

public class map1 extends Mapper {

@Override

protected void map(LongWritable key, Text value,

org.apache.hadoop.mapreduce.Mapper.Context context)

throws IOException, InterruptedException {

// TODO Auto-generated method stub

FileSplit fileSplit = (FileSplit) context.getInputSplit();

String fileName = fileSplit.getPath().getName();

String line = value.toString();

String words[] = line.split(" ");

for (String word : words) {

context.write(new Text(word + "\t" + fileName), new LongWritable(1));

}

3.2.3 新建Reduce1类，不选择main方法，并编写代码

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Reducer;

public class Reduce1 extends Reducer{

@Override

protected void reduce(Text key, Iterable values,

Reducer.Context context)

throws IOException, InterruptedException {

// TODO Auto-generated method stub

long sum=0;

for(LongWritable value:values){

sum+=value.get();

}

context.write(key,new LongWritable(sum));

}

3.2.4 新建map2类，不选择main方法，并编写代码

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

public class Map2 extends Mapper{

@Override

protected void map(LongWritable key, Text value,

Mapper.Context context)

throws IOException, InterruptedException {

// TODO Auto-generated method stub

String line= value.toString();

String[] strs=line.split("\t");

if(strs!=null && strs.length==3){

String word=strs[0];

String filename=strs[1];

String count=strs[2];

context.write(new Text(word), new Text(filename+"---"+count));

}

3.2.5 新建Reduce2类，不选择main方法，并编写代码

import java.io.IOException;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Reducer;

public class Reduce2 extends Reducer{

@Override

protected void reduce(Text key, Iterable values,

Reducer.Context context)

throws IOException, InterruptedException {

String result="";

for(Text value:values){

if(result.length()>0){

result+=",";

}

result+=value;

}

context.write(key, new Text(result));

}

3.2.6 新建InvertIndexRunner类，选择main方法，并编写代码

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class InvertIndexRunner {

public static void main(String[] args) {

Configuration conf=new Configuration();

try{

Job job=Job.getInstance(conf);

job.setJobName("zcj-invertIndex 1");

job.setJarByClass(InvertIndexRunner.class);

job.setMapperClass(map1.class);

job.setReducerClass(Reduce1.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(LongWritable.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(LongWritable.class);

FileInputFormat.addInputPath(job, new Path(args[0]));

FileOutputFormat.setOutputPath(job, new Path(args[1]));

job.waitForCompletion(true);

Job job2=Job.getInstance(conf);

job2.setJobName("zcj-invertIndex 2");

job2.setJarByClass(InvertIndexRunner.class);

job2.setMapperClass(Map2.class);

job2.setReducerClass(Reduce2.class);

job2.setMapOutputKeyClass(Text.class);

job2.setMapOutputValueClass(Text.class);

job2.setOutputKeyClass(Text.class);

job2.setOutputValueClass(Text.class);

FileInputFormat.addInputPath(job2, new Path(args[1]));

FileOutputFormat.setOutputPath(job2, new Path(args[2]));

job2.waitForCompletion(true);

}

catch(Exception e){

e.printStackTrace();

}

zookeeper篇

一安装配置

1.1 从windows本地上传zookeeper-3.4.6.tar.gz到app下

2.2 解压zookeeper-3.4.6.tar.gz到app下

cd app

tar –zxvf zookeeper-3.4.6.tar.gz

cd ~

2.3配置zookeeper

2.3.1 复制zoo_sample.cfg，更名为zoo.cfg

2.3.2配置zoo.cfg

tickTime=2000

initLimit=5

syncLimit=2

dataDir=/home/hadoop/zkdata/data

dataLogDir=/home/hadoop/zkdata/logs

clientPort=2181

server.1=192.168.1.200:8881:7771

server.2=192.168.1.201:8881:7771

server.3=192.168.1.202:8881:7771

server.4=192.168.1.203:8881:7771

2.4 创建输出文件夹

2.4.1 创建zkdata文件夹

/home/hadoop/zkdata

2.4.2 创建data文件夹

/home/hadoop/zkdata/data

2.4.3 创建log文件夹

/home/hadoop/zkdata/log

2.5 创建myid文件

2.5.1 在/home/hadoop/zkdata/data下创建myid文件

2.5.2 在myid文件中写入该机器在zoo.cfg中配置的序号

二时间同步（需要切换到root帐户）

2.1 打开日期/时间属性对话框

系统->管理->日期和时间

2.2 时区设置

2.2.1 选择时区tab页

2.2.2 用鼠标选取，上海亚洲

2.2.3 取消系统时间使用UTC时间选择

2.3 时间设置

2.3.1 在网络上同步日期和时间选择

2.3.2 选择正确的日期

2.3.3 在时分秒输入框中，输入比正确时间早1分分钟的整点时间，等待时间到时所有机器同时操作点击确定

2.4 调整位置

2.4.1 点击右上角日期时间显示区域

2.4.2 点击编辑，选择位置页

2.4.3 填加或者编辑，选择上海中国

2.5 调整时钟显示秒

2.4.1 点击右上角日期时间显示区域

2.4.2 点击编辑，选择位常规

2.4.3 设置时间格式24小时制

2.4.4 面板显示，勾选显示秒

三启停操作

3.1 zookeeper启动

app/zookeeper-3.4.6/bin/zkServer.sh start

注意：多台机器尽量同时启动，减少时间误差

3.2 查看启动是否正常

3.2.1 jps

QuorumPeerMain

3.2.2 app/zookeeper-3.4.6/bin/zkServer.sh status

stand-alone Leader Follower

3.3 zookeeper停止

app/zookeeper-3.4.6/bin/zkServer.sh stop

Hbase篇

一安装配置

1.1 从windows本地上传hbase-1.0.1.1-bin.tar.gz到app下

2.2 解压hbase-1.0.1.1-bin.tar.gz到app下

cd app

tar – zxvf hbase-1.0.1.1-bin.tar.gz

cd hbase-1.0.1.1-bin.tar.gz/

2.3配置/home/hadoop/app/hbase-1.0.1.1/conf/hbase-env.sh

复制zoo_sample.cfg，更名为zoo.cfg

export JAVA_HOME=/home/hadoop/app/jdk1.8.0_121

export HBASE_CLASSPATH=/home/hadoop/app/hadoop-2.6.0/etc/hadoop

export HBASE_MANAGES_ZK=false

2.3配置/home/hadoop/app/hbase-1.0.1.1/conf/hbase-site.xml

hbase.zookeeper.quorum

slave01:2181,slave02:2181,slave03:2181

hbase.zookeeper.property.dataDir

/home/hadoop/zkdata/data

hbase.cluster.distributed

true

hbase.rootdir

hdfs://master:9000/hbase

hbase.master.info.port

16010

hbase.regionserver.port

16201

hbase.regionserver.info.port

16301

2.4 配置backup-masters

创建app/hbase-1.0.1.1/conf/backup-masters

向backup-masters中写入内容备份主节点主机名

2.5 配置regionservers

向regionservers中写入regionserver主机名，每行一个

slave02

slave03

二启停操作

2.1 启动hbase

~/app/hbase-1.0.1.1/bin/start-hbase.sh

2.2 使用jps命令查看运行状态

2.2.1 master节点

HMaster

2.2.2 bakup-master节点

HMaster

2.2.3 region节点

HRegionServer

2.3停止hbase

~/app/home/hadoop/app/hbase-1.0.1.1/bin/stop-hbase.sh

三 Shell操作

3.1 shell启动

~app/hbase-1.0.1.1/bin/hbase shell

3.2 shell退出

exit;

3.3 shell常用命令

3.3.1 创建表

create 'users', 'cf1','cf2'

create 'usersx',{NAME=>'cf1',VERSIONS>=3},'cf2'

3.3.2 列出所有表

list

3.3.3 获取表描述信息

dscribe 'users'

3.3.4 写或更新入数据

3.3.4.1 添加纪录

put 'users','xiaoming','cf1:Age','24';

put 'users','xiaoming','cf1:Sex','male';

put 'users','xiaoming','cf2:Address','shi jia zhuang yu hua qu';

3.3.4.2 更新纪录

put 'users','xiaoming','cf1:Age','25';

3.3.4.3 增加版本数据

put 'usersx','xiaoming','cf1:Age' ,'29'

3.3.5 读数据

3.3.5.1 获取某行数据

get 'users','xiaoming'

3.3.5.2 获取某行某列族数据

get 'users','xiaoming','cf1'

3.3.5.3 获某单元格数据

get 'users','xiaoming','cf1:age'

3.3.5.4 获取单元格数据的版本数据，其中N为想要获取的版本个数

get 'usersx','xiaoming',{COLUMN=>'cf1:age',VERSIONS=>N}

3.3.5.5获取单元格数据的时间戳数据

get 'usersx','xiaoming',{COLUMN=>'cf1:age',TIMESTAMP=>1364874937056}

3.3.6 删除某行某列

delete 'users','xiaoming','cf1:age'

3.3.7 删除行

deleteall ‘users’,’xiaoming’

3.3.8 统计表行数

count 'users'

3.3.9 全表扫描

scan 'users'

3.3.10 清空表

truncate 'users'

3.3.11 停用表

disable 'users'

3.3.12 启用表

Enable 'users'

3.3.13删除表

disable 'users'

drop 'users

备注：向前删除需要按ctrl键，否则无效

四 API操作

4.1 开发用到的jar包

windows本地winrar解压hbase-1.0.1.1-bin.tar.gz

hbase-1.0.1.1\lib\hbase-*.jar

netty-all-4.0.23.Final.jar

htrace-core-3.1.0-incubating.jar

4.2 Hbase增删改查

4.2.1 新建testHbase包

在src上右击鼠标->new->Package，输入包名testHbase

4.2.2 新建HbaseCRUD类，并编写代码

在testHive上右击鼠标->new->Class，输入类名HbaseCRUD，不选择 public static void main(String[] args)，完成。

4.2.3 代码

import java.io.IOException;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.Cell;

import org.apache.hadoop.hbase.CellUtil;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.TableName;

import org.apache.hadoop.hbase.client.Connection;

import org.apache.hadoop.hbase.client.ConnectionFactory;

import org.apache.hadoop.hbase.client.Delete;

import org.apache.hadoop.hbase.client.Get;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.client.Result;

import org.apache.hadoop.hbase.client.ResultScanner;

import org.apache.hadoop.hbase.client.Row;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.client.Table;

import org.apache.hadoop.hbase.util.Bytes;

import org.junit.After;

import org.junit.Before;

import org.junit.Test;

public class HbaseCRUD {

private Configuration conf;

private Connection conn;

@Before

public void init()

{

conf = HBaseConfiguration.create();

conf.set("hbase.zookeeper.quorum", "slave2:2181,slave3:2181,slave4:2181");

conf.set("hbase.rootdir", "hdfs://master:9000/hbase");

try {

conn = ConnectionFactory.createConnection(conf);

}

catch (IOException e) {

e.printStackTrace();

}

@After

public void end() {

try {

conn.close();

}

catch (IOException e) {

e.printStackTrace();

}

@Test

public void testPut()

{

try {

Table table=conn.getTable(TableName.valueOf("test"));

Put put=new Put(Bytes.toBytes("zcj"));

put.addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("age"), Bytes.toBytes(22));

put.addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("address"), Bytes.toBytes("TianJin"));

table.put(put);

table.close();

}

catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

@Test

public void testGet() {

try {

Table table = conn.getTable(TableName.valueOf("test"));

Get get = new Get(Bytes.toBytes("xiaohong"));

get.setMaxVersions(5);

Result result = table.get(get);

List cells = result.getColumnCells(Bytes.toBytes("cf1"), Bytes.toBytes("address"));

for (Cell cell : cells)

System.out.println(Bytes.toString(CellUtil.cloneValue(cell)));

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void testDelete() {

try {

Table table = conn.getTable(TableName.valueOf("test"));

Delete delete = new Delete(Bytes.toBytes("xiaohong"));

delete.addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("age"));

table.delete(delete);

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void testBatch() {

try {

Table table = conn.getTable(TableName.valueOf("test"));

List actions = new ArrayList();

actions.add(new Put(Bytes.toBytes("xiaohong1")).addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("age"), Bytes.toBytes("22")));

actions.add(new Put(Bytes.toBytes("xiaohong2")).addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("age"), Bytes.toBytes("23")));

actions.add(new Delete(Bytes.toBytes("xiaohong1")));

Object[] results = new Object[actions.size()];

table.batch(actions, results);

for (int i = 0; i < results.length; i++) {

System.out.println("Result[" + i + "]: type = " +

results[i].getClass().getSimpleName() + "; " + results[i]);

}

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void testScan() {

try {

Table table = conn.getTable(TableName.valueOf("test"));

Scan scan =new Scan();

ResultScanner resultScanner = table.getScanner(scan);

Iterator iter = resultScanner.iterator();

while(iter.hasNext()) {

Result result = iter.next();

List cells=result.listCells();

for(Cell cell:cells)

System.out.println(Bytes.toString(CellUtil.cloneRow(cell))+"---"+ Bytes.toString(CellUtil.cloneValue(cell)));

}

resultScanner.close();

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

4.2.4 运行

选择要运行的测试单元函数，右击鼠标->run as->JUnit test

4.3 Hbase过滤器

4.3.1 新建testFilter类，并编写代码

在testHive上右击鼠标->new->Class，输入类名testFilter，不选择 public static void main(String[] args)，完成。

4.3.2 代码

import java.io.IOException;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.Cell;

import org.apache.hadoop.hbase.CellUtil;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.TableName;

import org.apache.hadoop.hbase.client.Connection;

import org.apache.hadoop.hbase.client.ConnectionFactory;

import org.apache.hadoop.hbase.client.Result;

import org.apache.hadoop.hbase.client.ResultScanner;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.client.Table;

import org.apache.hadoop.hbase.filter.BinaryComparator;

import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp;

import org.apache.hadoop.hbase.filter.Filter;

import org.apache.hadoop.hbase.filter.FilterList;

import org.apache.hadoop.hbase.filter.PageFilter;

import org.apache.hadoop.hbase.filter.QualifierFilter;

import org.apache.hadoop.hbase.filter.RegexStringComparator;

import org.apache.hadoop.hbase.filter.RowFilter;

import org.apache.hadoop.hbase.filter.SingleColumnValueFilter;

import org.apache.hadoop.hbase.filter.ValueFilter;

import org.apache.hadoop.hbase.util.Bytes;

import org.junit.After;

import org.junit.Before;

import org.junit.Test;

public class testFilter {

private Configuration conf;

private Connection conn;

@Test

public void TestFilterList(){

try {

Table table = conn.getTable(TableName.valueOf("test2"));

Scan scan =new Scan();

List filters = new ArrayList();

Filter filter1 = new RowFilter(CompareOp.GREATER_OR_EQUAL,new BinaryComparator(Bytes.toBytes("zcj2")));

filters.add(filter1);

Filter filter2 = new RowFilter(CompareOp.LESS_OR_EQUAL,new BinaryComparator(Bytes.toBytes("zcj5")));

filters.add(filter2);

Filter filter3 = new QualifierFilter(CompareOp.EQUAL,new RegexStringComparator("age"));

filters.add(filter3);

FilterList filterList = new FilterList(filters);

scan.setFilter(filterList);

ResultScanner resultScanner = table.getScanner(scan);

Iterator iter = resultScanner.iterator();

while(iter.hasNext())

{

Result result = iter.next();

List cells=result.listCells();

for(Cell cell:cells)

System.out.println(Bytes.toString(CellUtil.cloneRow(cell))+"---"+ Bytes.toString(CellUtil.cloneValue(cell)));

}

resultScanner.close();

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void TestPageFilter(){

try {

byte[] POSTFIX=new byte[]{0x0};

byte[] row=null;

Table table = conn.getTable(TableName.valueOf("test"));

Scan scan =new Scan();

Filter filter=new PageFilter(1);

while(true){

if(row!=null){

row=Bytes.add(row, POSTFIX);

scan.setStartRow(row);

}

scan.setFilter(filter);

ResultScanner resultScanner = table.getScanner(scan);

Iterator iter = resultScanner.iterator();

int index=0;

while(iter.hasNext()){

Result result=iter.next();

if(!result.isEmpty())

{

row=result.getRow();

List cells=result.listCells();

for(Cell cell:cells)

System.out.println(Bytes.toString(CellUtil.cloneRow(cell))+"---"+ Bytes.toString(CellUtil.cloneValue(cell)));

}

index++;

}

if(index==0)

break;

resultScanner.close();

}

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void TestSingleValueFilter(){

try {

Table table = conn.getTable(TableName.valueOf("test"));

Scan scan =new Scan();

Filter filter=new SingleColumnValueFilter(Bytes.toBytes("cf1"), Bytes.toBytes("address"),CompareOp.EQUAL,new BinaryComparator(Bytes.toBytes("tianjin")));

scan.setFilter(filter);

ResultScanner resultScanner = table.getScanner(scan);

Iterator iter = resultScanner.iterator();

while(iter.hasNext())

{

Result result = iter.next();

List cells=result.listCells();

for(Cell cell:cells)

System.out.println(Bytes.toString(CellUtil.cloneRow(cell))+"---"+ Bytes.toString(CellUtil.cloneValue(cell)));

}

resultScanner.close();

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void TestValueFilter(){

try {

Table table = conn.getTable(TableName.valueOf("test"));

Scan scan =new Scan();

Filter filter=new ValueFilter(CompareOp.EQUAL,new BinaryComparator(Bytes.toBytes("tianjin")));

scan.setFilter(filter);

ResultScanner resultScanner = table.getScanner(scan);

Iterator iter = resultScanner.iterator();

while(iter.hasNext()) {

Result result = iter.next();

List cells=result.listCells();

for(Cell cell:cells)

System.out.println(Bytes.toString(CellUtil.cloneRow(cell))+"---"+ Bytes.toString(CellUtil.cloneValue(cell)));

}

resultScanner.close();

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Test

public void TestRowFilter(){

try {

Table table = conn.getTable(TableName.valueOf("test"));

Scan scan =new Scan();

Filter filter=new RowFilter(CompareOp.EQUAL,new BinaryComparator(Bytes.toBytes("xiaohong")));

scan.setFilter(filter);

ResultScanner resultScanner = table.getScanner(scan);

Iterator iter = resultScanner.iterator();

while(iter.hasNext()) {

Result result = iter.next();

List cells=result.listCells();

for(Cell cell:cells)

System.out.println(Bytes.toString(CellUtil.cloneRow(cell))+"---"+ Bytes.toString(CellUtil.cloneValue(cell)));

}

resultScanner.close();

table.close();

}

catch (Exception e) {

e.printStackTrace();

}

@Before

public void init()

{

conf = HBaseConfiguration.create();

conf.set("hbase.zookeeper.quorum", "slave2:2181,slave3:2181,slave4:2181");

conf.set("hbase.rootdir", "hdfs://master:9000/hbase");

try {

conn = ConnectionFactory.createConnection(conf);

}

catch (IOException e) {

e.printStackTrace();

}

@After

public void end() {

try {

conn.close();

}

catch (IOException e) {

e.printStackTrace();

}

4.3.3 运行

选择要运行的测试单元函数，右击鼠标->run as->JUnit test

4.4 Hbase MapReduce

4.4.1 新建testHbase包

在src上右击鼠标->new->Package，输入包名testHbase.mr

4.4.2 新建ImportData类，并编写代码

在testHbase.mr上右击鼠标->new->Class，输入类名ImportData，选择 public static void main(String[] args)，完成。

4.4.3 代码

import java.io.IOException;

import org.apache.commons.codec.digest.DigestUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.Mutation;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

import org.apache.hadoop.hbase.mapreduce.TableOutputFormat;

import org.apache.hadoop.hbase.util.Bytes;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

public class ImportData {

public static void main(String[] args) {

Configuration conf = HBaseConfiguration.create();

try {

Job job = Job.getInstance(conf);

job.setJarByClass(ImportData.class);

job.setMapperClass(ImportDataMapper.class);

job.setOutputKeyClass(ImmutableBytesWritable.class);

job.setOutputValueClass(Mutation.class);

job.setOutputFormatClass(TableOutputFormat.class);

job.getConfiguration().set(TableOutputFormat.OUTPUT_TABLE, "test3");

FileInputFormat.addInputPath(job, new Path(args[0]));

job.setNumReduceTasks(0);

job.waitForCompletion(true);

}

catch (Exception e) {

e.printStackTrace();

}

class ImportDataMapper extends Mapper{

@Override

protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

String line = value.toString();

byte[] rowKey = DigestUtils.md5(line);

Put put = new Put(rowKey);

put.addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("content"), Bytes.toBytes(line));

context.write(new ImmutableBytesWritable(rowKey), put);

}

4.4.4 运行

鼠标右击ImportData类代码空白处，Run As->Java Application

Hive篇

一 mysql安装(需要切换到root帐户)

1.1 下载并安装mysql

yum install mysql-server mysql mysql-devel

具体步骤：

（1）下载：wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm

（2）安装：rpm -ivh mysql-community-release-el7-5.noarch.rpm -y

(3) 配置：vim /etc/my.cnf

1.2 启动mysql服务

service mysqld start

1.3 查看mysql运行状态

systemctl status mysql.service

1.4 设置mysql管理用户密码

mysqladmin -u root password 'root'

1.5 设置mysql开机启动

chkconfig mysqld on

1.6 启动mysql命令行

mysql -u root -p 'root'

1.7 创建数据库

mysql> create database hive;

1.8 查询数据库是否创建成功

mysql> show databases;

1.9 设置root用户对hive库的访问权限

mysql> GRANT all ON hive.* TO 'root'@'%' IDENTIFIED BY 'root';

1.10刷新mysql的系统权限相关表

mysql> flush privileges;

1.11 退出mysql

mysql> exit;

二 hive安装配置

2.1 从windows本地上传apache-hive-1.2.1-bin.tar.gz到app下

2.2 解压apache-hive-1.2.1-bin.tar.gz到app下

cd app

tar –zxvf apache-hive-1.2.1-bin.tar.gz

cd ~

2.3 替换文件

jline-2.12.jar 从hive/lib ->hadoop/share/hadoop/yarn/lib

tools.jar 从jdk1.8.0_121/lib -> apache-hive-1.2.1-bin/lib

mysql-connector-java-5.0.8-bin.jar 从本地 -> apache-hive-1.2.1-bin/lib

2.4 配置hive

2.4.1 hive-env.sh

2.4.1.1复制hive-env.sh.template，更名为hive-env.sh

2.4.1.2配置

export HADOOP_HEAPSIZE=1024

HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0

2.4.2 hive-site.xml

2.4.2.1 复制hive-default.xml.template，更名为hive-site.xml

2.4.2.2 配置

javax.jdo.option.ConnectionURL

jdbc:mysql://192.168.1.201:3306/hive

javax.jdo.option.ConnectionDriverName

com.mysql.jdbc.Driver

hive.metastore.warehouse.dir

/user/hive/warehouse

javax.jdo.option.ConnectionUserName

root

javax.jdo.option.ConnectionPassword

root

datanucleus.autoCreateSchema

true

hive.exec.local.scratchdir

/home/hadoop/appdata/hivetmp/iotmp

hive.downloaded.resources.dir

/home/hadoop/appdata/hivetmp/iotmp

hive.querylog.location

/home/hadoop/appdata/hivetmp/iotmp

注意：master节点

javax.jdo.option.ConnectionURL

jdbc:mysql:127.0.0.1:3306/hive

JDBC connect string for a JDBC metastore

三 CLI

3.1 cli启动

~app/apache-hive-1.2.1-bin/bin/hive

3.2 cli退出

exit

3.3 cli常用命令

create database test_dw;

show databases;

create table zcjhive (name String,Age int);

show tables;

describe zcjhive;

select * from zcjhive;

insert into zcjhive (name,age) values ('zcj',42);

load data local inpath '/home/hadoop/mydata/hive.txt' into table zcjhive;

insert overwrite local directoy '/home/hadoop/mydata/output_hive' select * from zcjhive;

import export（只能集群操作）

四 Metastore

启动元数据服务

~app/apache-hive-1.2.1-bin/bin/hive --service metastore

~app/apache-hive-1.2.1-bin/bin/hive --service metastore & (进入后台运行)

五 HWI安装配置

5.1 hwi文件安装

5.1.1下载hive源码

http://archive.apache.org/dist/下载源码apach-hive-1.2.1-src.tar.gz

5.1.2解压apach-hive-1.2.1-src.tar.gz

tar -zxvf apach-hive-1.2.1-src.tar.gz

5.1.3 切换目录

cd apache-hive-1.2.1-src/hwi

5.1.4 打war包

jar cvM hive-hwi-1.2.1.war -C web/ .

5.1.5 拷贝hive-hwi-1.2.1.war到apache-hive-1.2.1-bin/lib/下

5.2 hwi配置，修改hive-site.xml

hive.hwi.listen.host

192.168.1.201

hive.hwi.listen.port

9999

hive.hwi.war.file

/lib/hive-hwi-1.2.1.war

5.3 启动hwi服务

~app/apache-hive-1.2.1-bin/bin/hive --service hwi

~app/apache-hive-1.2.1-bin/bin/hive --service hwi & (进入后台运行)

5.4 hive web管理

5.4.1 hive的Web管理地址

http://192.168.1.201:9999/hwi/

5.4.2 hive的Web管理界面

5.4.3 查看数据库

5.4.4 创建会话

5.4.4 会话管理

5.4.5 执行语句

提示：hwi result file 在master hadoop用户根下

六 API操作

6.1 API配置，修改hive-site.xml

hive.server2.thrift.bind.host

192.168.1.200

hive.server2.thrift.port

10000

hive.server2.long.polling.timeout

5000

6.2 启动server2

~app/apache-hive-1.2.1-bin/bin/hive --service hiveserver2

6.3 开发用到的jar包

windows本地winrar解压apache-hive-1.2.1-bin.tar.gz

apache-hive-1.2.1-bin\lib\hive-*.jar

apache-hive-1.2.1-bin\lib\lib*.jar

6.4 编写程序

6.4.1 新建testHive包

在src上右击鼠标->new->Package，输入包名testHive

6.4.2 新建JDBCToHive类，并编写代码

6.4.2.1 在testHive上右击鼠标->new->Class，输入类名JDBCToHive，不选择 public static void main(String[] args)，完成。

6.4.2.2 代码

private static Connection conn=JDBCToHive.getConnnection();

private static PreparedStatement ps;

private static ResultSet rs;

private static String driverName ="org.apache.hive.jdbc.HiveDriver";

private static String Url="jdbc:hive2://192.168.1.200:10000/default";

private static Connection conn;

public static Connection getConnnection()

{

try{

Class.forName(driverName);

conn = DriverManager.getConnection(Url,"hadoop","hadoop");

}

catch(ClassNotFoundException e){

e.printStackTrace();

}

catch (SQLException e) {

e.printStackTrace();

}

return conn;

}

public static PreparedStatement prepare(Connection conn, String sql)

{

PreparedStatement ps = null;

try {

ps = conn.prepareStatement(sql);

}

catch (SQLException e) {

e.printStackTrace();

}

return ps;

}

6.4.3 新建QueryHive类，并编写代码

6.4.3.1 在testHive上右击鼠标->new->Class，输入类名QueryHive，不选择 public static void main(String[] args)，完成。

6.4.3.2 代码

public static void getAll(String tablename)

{

String sql="select * from "+tablename;

System.out.println(sql);

try {

ps=JDBCToHive.prepare(conn, sql);

rs=ps.executeQuery();

int columns=rs.getMetaData().getColumnCount();

while(rs.next())

{

for(int i=1;i<=columns;i++)

{

System.out.print(rs.getString(i));

System.out.print("\t");

}

System.out.println();

}

catch (SQLException e) {

e.printStackTrace();

}

6.4.4 新建QueryHiveRun类，并编写代码

6.4.4.1 在testHive上右击鼠标->new->Class，输入类名QueryHiveRun，选择 public static void main(String[] args)，完成。

6.4.4.2 代码

String tablename="zlhtest";

QueryHive.getAll(tablename);

6.4.5 运行程序

鼠标右击QueryHiveRun类代码空白处，Run As->Java Application

Slurm篇

1、安装MUNGE,需要munge-munge-0.5.13.tar.gz munge-0.5.13.tar.xz两个文件

安装解析文件的工具

yum -y install bzip2-devel openssl-devel zlib-devel

yum install -y rpm-build

解压

rpmbuild -tb --clean munge-munge-0.5.13.tar.gz

编译

cd /root/rpmbuild/RPMS/x86_64

安装munge

rpm -ivh munge*.rpm

设置互通秘钥为：helloeveryone,I'ammungekeyonkvmcluster.

echo "helloeveryone,I'ammungekeyonkvmcluster." > /etc/munge/munge.key

修改文件夹属性

chown munge:munge /etc/munge/munge.key

chmod 400 /etc/munge/munge.key

chmod -Rf 700 /etc/munge

chmod -Rf 711 /var/lib/munge

chmod -Rf 700 /var/log/munge

chmod -Rf 755 /var/run/munge

删除其他之前之前的秘钥（若之前也做过这种操作）

ssh slave02 rm -f /etc/munge/munge.key

ssh slave03 rm -f /etc/munge/munge.key

将生成的秘钥复制给其他节点

scp /etc/munge/munge.key root@slave01:/etc/munge/munge.key

scp /etc/munge/munge.key root@slave03:/etc/munge/munge.key

munge的基本操作命令

systemctl enable munge

systemctl disable munge

systemctl status munge

systemctl start munge

systemctl restart munge

systemctl stop munge

munge -n | ssh master unmunge

munge -n | ssh slave01 unmunge

munge -n | ssh slave02 unmunge

5、安装SLURM

安装解析文件的工具

yum -y install readline-devel pam-devel

yum install perl-ExtUtils-CBuilder perl-ExtUtils-MakeMaker

重新清理文件

rpmbuild -tb --clean slurm-17.02.9.tar.bz2

cd /root/rpmbuild/RPMS/x86_64

安装

rpm -ivh slurm*.rpm

6、配置SLURM

配置slurm用户

useradd slurm

passwd slurm

配置文件

vim /etc/slurm/slurm.conf

ClusterName=bxg_cluster

ControlMachine=master

ControlAddr=192.168.2.2

SlurmUser=slurm

SlurmctldPort=6817

SlurmdPort=6818

AuthType=auth/munge

StateSaveLocation=/var/spool/slurm/ctld

SlurmdSpoolDir=/var/spool/slurm/d

SwitchType=switch/none

MpiDefault=none

SlurmctldPidFile=/var/run/slurmctld.pid

SlurmdPidFile=/var/run/slusrmd.pid

ProctrackType=proctrack/pgid

ReturnToService=0

SlurmctldTimeout=300

SlurmdTimeout=300

InactiveLimit=0

MinJobAge=300

KillWait=30

Waittime=0

SchedulerType=sched/backfill

FastSchedule=1

SlurmctldDebug=3

SlurmctldLogFile=/var/log/slurmctld.log

SlurmdDebug=3

SlurmdLogFile=/var/log/slurmd.log

JobCompType=jobcomp/none

NodeName=master,slave0[1-2] Procs=1 State=UNKNOWN

PartitionName=control Nodes=master Default=NO MaxTime=INFINITE State=UP

PartitionName=compute Nodes=slave0[1-2] Default=YES MaxTime=INFINITE State=UP

:wq

将配置文件复制到其他节点

scp /etc/slurm/slurm.conf root@slave02:/etc/slurm/slurm.conf

scp /etc/slurm/slurm.conf root@slave03:/etc/slurm/slurm.conf

创建指定文件夹

mkdir /var/spool/slurm/d

mkdir /var/spool/slurm/ctld

增加权限

chown -R slurm:slurm /var/spool

主节点命令

systemctl enable slurmctld

systemctl disable slurmctld

systemctl status slurmctld

systemctl start slurmctld

systemctl restart slurmctld

systemctl stop slurmctld

主节点和从节点命令

systemctl enable slurmd

systemctl disable slurmd

systemctl status slurmd

systemctl start slurmd

systemctl restart slurmd

systemctl stop slurmd

7、简单测试SLURM

sinfo

scontrol show slurm reports

scontrol show config

scontrol show partition

scontrol show node

scontrol show jobs

srun hostname

srun -N 2 -l hostname

srun sleep 60 &

squeue -a

scancel

NTP时间服务器篇

搭建内网的NTP时间服务器的具体操作步骤

需求：搭建一台时间服务器，使得无外网的服务器可以同步时间。

一、环境

1. [root@master ~]# cat /etc/redhat-release

Red Hat Enterprise Linux Server release 7.0 (Maipo)

3. [root@ master ~]# hostname -I

4. 查看内网ip命令：ifconfig –a

192.168.1.200

5. 查看外网ip命令：curl ifconfig.me

124.236.148.6

二、安装ntp并检查是否安装成功

1.安装ntp包

yum install ntp

2.开机启用NTP服务：

systemctl enable ntpd

3. 启动ntp服务：

systemctl start ntpd

4. 查看ntp服务状态

systemctl status ntpd

三、配置可用时间服务器

配置NTP时间同步文件：# vi /etc/ntp.conf，添加时间源，如：

server 10.100.2.5 # local clock

fudge 10.100.2.5 stratum 10

四、启动ntp服务器

查看时间同步进程：# ntpq –p

查看时间服务器状态：

systemctl status ntpd

手动同步：

ntpdate –u 192.168.1.200

查看当前时间：

date

Python脚本篇

一、python2.x的源码

自动化脚本就是PyCharm开发环境来编写的，使用的语言是python2.x版本，通过pip引入paramiko模块，运行该脚本文件，实现对集群的自动化、一键式管理。

# -*- coding: UTF-8 -*-

# !/bin/python

# 运行程序前，要安装pip和paramiko

# 此程序为Python2.X程序

import subprocess

import os, commands, string, sys, time, paramiko

def out_progress():

for i in range(50):

sys.stdout.write("\033[0;32m%s\033[0m" % ".")

sys.stdout.flush()

time.sleep(0.5)

print("\n")

print("\033[0;32m%s\033[0m" % "开机成功！\n")

def start_all():

os.system("wol f4:4d:30:94:30:ad")

os.system("wol f4:4d:30:94:1c:3d")

os.system("wol f4:4d:30:94:1c:92")

def ssh_conn(_hostname, _port, _username, _password, *args):

# shclient对象

ssh = paramiko.SSHClient()

# 允许将信任的主机自动加入到host_allow 列表，此方法必须放在connect方法的前面

ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())

# 调用connect方法连接服务器

ssh.connect(hostname=_hostname, port=_port, username=_username, password=_password)

for i in range(len(args)):

stdin, stdout, stderr = ssh.exec_command(args[i])

# 结果放到stdout中，如果有错误将放到stderr中

if "ntpdate" in args[0]:

print("slave0%s节点对时：" % _hostname[-1])

#print(_hostname[-1])

print(stdout.read().decode("utf-8"))

print("成功！")

print(stdout.read().decode("utf-8"))

ssh.close()

def test_process(_commands, *args):

output = commands.getoutput(_commands)

return output

def ssh_conn_return(_hostname, _port, _username, _password, *args):

# shclient对象

ssh = paramiko.SSHClient()

# 允许将信任的主机自动加入到host_allow 列表，此方法必须放在connect方法的前面

ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())

# 调用connect方法连接服务器

ssh.connect(hostname=_hostname, port=_port, username=_username, password=_password)

for i in range(len(args)):

stdin, stdout, stderr = ssh.exec_command(args[i])

# 结果放到stdout中，如果有错误将放到stderr中

if "zookeeper" in args[0]:

print("slave0%s：" % _hostname[-1])

# print(_hostname[-1])

print(stdout.read().decode("utf-8"))

print("成功！")

print(stdout.read().decode("utf-8"))

ssh.close()

while True:

print("\033[0;34m%s\033[0m" % "\n请输入您想要的操作代号: ")

print("s. 一键开机!\t\t a. 启动集群！\t\t b. 停止集群！\t\t d. 启动时间服务器")

#print("a. 启动集群！")

print("t. 集群自动对时！\t sz.启动zookeeper \t pz.停止zookeeper \t szs.查看zookeeper状态")

print("c. 一键清屏！\t \t j. 查看当前进程！\t p.一键关机")

print("exit. 退出运行的脚本！")

in_put=raw_input("请输入：")

if in_put=='a':

os.system("~/app/hadoop-2.6.0/sbin/start-all.sh")

print("\n")

print("\033[0;32m%s\033[0m" % "集群启动成功！")

#print("\n")

elif in_put=='sz':

#查看集群有无启动

#多台机器同时启动

# os.system("app/zookeeper-3.4.6/bin/zkServer.sh start")

# print("\n\033[0;32m%s\033[0m" % "master zookeeper 启动成功！")

ssh_conn_return("192.168.1.201", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh start")

ssh_conn_return("192.168.1.202", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh start")

ssh_conn_return("192.168.1.203", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh start")

elif in_put=='szs':

#停止zookeep

ssh_conn_return("192.168.1.201", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh status")

ssh_conn_return("192.168.1.202", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh status")

ssh_conn_return("192.168.1.203", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh status")

elif in_put=='pz':

# os.system("app/zookeeper-3.4.6/bin/zkServer.sh status")

ssh_conn_return("192.168.1.201", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh stop")

ssh_conn_return("192.168.1.202", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh stop")

ssh_conn_return("192.168.1.203", 22, "hadoop", "hadoop", "app/zookeeper-3.4.6/bin/zkServer.sh stop")

elif in_put=='s':

start_all()

out_progress()

elif in_put=='b':

#判断zookeep有没有停止

os.system("app/hadoop-2.6.0/sbin/stop-all.sh")

print("\033[0;32m%s\033[0m" % "集群停止成功！")

elif in_put=="c":

os.system("clear")

elif in_put=="d":

ssh_conn("192.168.1.200", 22, "root", "hadoop", "systemctl restart ntpd")

t = test_process("systemctl status ntpd.service")

if ("SUCCESS" and "running") in t:

print("\n\033[0;32m%s\033[0m" % "master节点的时间服务启动成功")

elif in_put=='j':

#打印salve节点的 jps 信息

print("\n\033[0;32m%s\033[0m" % "当前master进程为：")

os.system("jps")

elif in_put=="p":

ssh_conn("192.168.1.201",22,"root","hadoop","poweroff")

print("slave01正在关机.....")

ssh_conn("192.168.1.202",22,"root","hadoop","poweroff")

print("slave02正在关机.....")

ssh_conn("192.168.1.203",22,"root","hadoop","poweroff")

print("slave03正在关机.....")

time.sleep(7)

print("\033[0;32m%s\033[0m" % "集群所有从节点已经关机!")

elif in_put=="t":

ssh_conn("192.168.1.201",22,"root","hadoop","ntpdate -u 192.168.1.200")

ssh_conn("192.168.1.202",22,"root","hadoop","ntpdate -u 192.168.1.200")

ssh_conn("192.168.1.203",22,"root","hadoop","ntpdate -u 192.168.1.200")

elif in_put=="exit":

break

二、脚本运行示例图

国家地理信息公共服务平台的天地图 gys9895 百度地图 js
文章目录一、国家地理信息公共服务平台的天地图二、地图转换1.GIS数据格式坐标转换（地球坐标WGS84、GCJ-02、火星坐标、百度坐标BD-09、国家大地坐标系CGCS2000）2.读入数据总结一、国家地理信息公共服务平台的天地图三大地图付费后，仍可用的免费商用地图APIFailedtoresolveloader:sass-loader如果是本地测试，那么对应的白名单设置为null第一步，在Vu
快速方便地在Linux上安装Chrome XyScala linux chrome 服务器
在Linux系统上安装Chrome是许多用户的常见需求之一。Chrome是一款功能强大的网络浏览器，提供了快速、安全和稳定的浏览体验。本文将为您提供一种快速便捷的方法来安装Chrome浏览器。以下是在Linux系统上安装Chrome的步骤：步骤1：打开终端首先，打开终端。您可以通过在应用程序菜单中搜索"终端"来找到它。步骤2：添加GoogleChrome存储库在终端中，使用以下命令添加Google
Eureka 介绍与原理详解 AllenBright #Eureka eureka 云原生
在微服务架构中，服务发现（ServiceDiscovery）是一个至关重要的组件。随着服务数量的增加，手动管理服务的地址和端口变得不切实际。Eureka是Netflix开源的一款服务发现工具，旨在解决微服务架构中的服务注册与发现问题。本文将详细介绍Eureka的基本概念、工作原理以及如何在微服务架构中使用它。1.什么是Eureka？Eureka是Netflix开源的一个基于REST的服务发现组件，
神经网络中常用语言特性（python）（待完善）邪恶的贝利亚 python 开发语言
1.元类在Python中，abc模块（AbstractBaseClasses，抽象基类）提供了创建抽象基类的机制，这些抽象基类可以用来定义接口，强制子类实现特定的方法，有助于实现多态性和代码的可维护性。下面从多个方面详细介绍abc元类相关内容。ABCMeta是abc模块中的元类，ABC类实际上就是使用ABCMeta作为元类创建的。你也可以直接使用ABCMeta来创建抽象基类。classShape(
深入解析ADC寄存器：从原理到实战配置 Electron-er 嵌入式硬件单片机架构 stm32
目录引言一、ADC寄存器核心作用与分类1.寄存器在ADC中的角色2.寄存器典型分类二、STM32ADC寄存器深度解析1.关键寄存器映射表2.寄存器级ADC配置实战三、TIADS1115配置寄存器详解1.16位配置寄存器结构（I2C从地址0x48）2.**I2C配置代码示例（Arduino平台）**四、寄存器操作中的常见陷阱与解决方案1.典型问题排查表2.**调试技巧**五、寄存器优化设计趋势1.自
深入解析STM32时钟树：从原理到实战配置 Electron-er stm32 单片机嵌入式硬件
目录引言一、STM32时钟树体系架构解析1.1时钟树全景图1.2核心时钟源详解二、时钟信号流向与控制逻辑2.1主时钟路径2.2关键分频系数2.3时钟门控机制三、CubeMX实战配置3.1配置步骤演示3.2代码生成分析四、调试技巧与常见问题4.1时钟诊断方法4.2典型故障排查五、高级应用技巧5.1动态时钟切换5.2时钟安全系统(CSS)5.3超频实践（风险提示）结语引言在嵌入式系统开发中，时钟系统堪
PHP火山引擎API签名方法蚊子爱喝水 PHP 火山引擎
一、前置准备在开始签名之前，需要准备以下信息：AccessKeyID（AK）：请求火山引擎OpenAPI的安全凭证之一。SecretAccessKey（SK）：与AK成对使用，用于签名计算。请求参数：包括HTTP请求方法、URI、查询参数、请求头等。二、签名流程(文档地址)火山引擎API签名流程大致分为以下几个步骤：创建规范请求：将请求参数进行规范化处理，形成CanonicalRequest。创建
三分钟掌握音视频信息查询 | 在 Rust 中优雅地集成 FFmpeg Yeauty 音视频 rust ffmpeg
前言在音视频处理领域，开发者常常需要获取媒体文件的详细信息，如时长、格式、元数据，以及音视频流的编码参数等。这些信息对于媒体管理、转码调度、播放控制等场景至关重要。然而，直接使用FFmpeg命令行工具或其原生API存在以下挑战：命令行工具的复杂性：FFmpeg的命令行参数众多且复杂，使用不当可能导致错误。例如，处理包含空格的文件名时，需要特别注意正确的转义和引用方式，否则可能导致无法识别文件名的问
移远通信Wi-Fi 7模组产品获创新大奖：以前沿技术重新定义无线通信新篇章移远通信 WiFi
近日，2024年信息通信业高质量发展硬核力量榜单发布。全球领先的物联网整体解决方案供应商移远通信凭借其在2024年推出的两款支持Wi-Fi7技术的通信模组FGE576Q和FGE573Q荣获产品创新奖。此次活动由ICT行业领先的全媒体传播与服务平台——C114通信网特别策划举办，聚焦2024年度信息通信业最值得关注的企业、产品和解决方案，激励技术创新与应用，助力物联网技术与各行业融合及规模化应用，并
再添殊荣！移远通信工业智能品牌宝维塔™斩获AI创新应用奖移远通信算力人工智能工业智能
12月24日，2024中国物联网产业大会暨第21届慧聪品牌盛会在深圳圆满落幕。会上，移远通信凭借其工业智能品牌宝维塔™在推动AI技术落地与应用创新方面的卓越贡献，获颁“AI创新应用奖”。作为科技发展的前沿力量，AI技术正深刻改变着各行各业的生产模式和效率，尤其在工业领域，展现出了巨大潜力。宝维塔™是移远通信精心打造的工业智能品牌，专注于将人工智能、边缘计算、机器视觉、深度学习、软件算法平台等前沿技
Kubernetes集群版本升级后端java
集群升级注意事项升级集群版本建议逐步升级，比如v1.20.1–>v1.21.1–>v1.22.1–>v1.23.1–>v1.24.1，不能跨度过大，否则会报错。升级步骤查看集群版本[root@hadoop102~]#kubectlgetnodesNAMESTATUSROLESAGEVERSIONhadoop102Ready,SchedulingDisabledcontrol-plane,maste
一文搞懂MCU和SoC的核心差异：从架构到应用场景全解析 Electron-er 单片机架构嵌入式硬件
目录引言一、从“芯片大脑”看本质：架构设计的哲学差异1.MCU：单一任务的执行专家2.SoC：系统级集成的超级平台二、实战对比：六大维度拆解差异1.性能指标对比2.开发模式对比三、选型指南：如何选择MCU或SoC？1.选择MCU的场景2.选择SoC的场景四、技术演进：MCU与SoC的融合趋势1.MCU的进化方向2.SoC的突破方向五、开发者避坑指南结语标签：MCUvsSOC、嵌入式系统、芯片选型、
DeepSeek R1 本地部署实战教程来了，带可视化界面，非常详细！ java
大家好，我是R哥。虽然DeepSeek官方提供了可视化聊天界面，但稳定性实在太差了，动不动就服务繁忙，根本没办法正常使用。另外，对于一些对数据隐私、实时性能要求较高的场景，本地部署也是不可避免的选择。那么，如何本地部署DeepSeekR1的模型？本篇，开干！相关阅读：DeepSeek-R1本地部署配置清单DeepSeek-R11.5b、7b、8b、14b、32b、70b、671b都是什么鬼？如何部
【推荐】爽，在 IDE 中做 LeetCode 题目的插件 ideleetcode
大家好，我是V哥。今天给大家推荐一款神器插件，废话不多说，马上开整。leetcode-editor是一个可以在IDE中做LeetCode题目的插件仓库，以下是对该仓库的详细介绍：来看一下这个神器是啥基本信息名称：LeetcodeEditor支持平台：理论上支持IntelliJIDEA、PhpStorm、WebStorm、PyCharm、RubyMine、AppCode、CLion、GoLand、D
鸿蒙 NEXT 开发中，使用公共事件进行进程间通信
大家好，我是V哥，在鸿蒙NEXT开发中，使用公共事件进行进程间通信（IPC）是一种常见的做法。下面我将提供一个完整的业务代码示例，并解释逻辑关系，以便即使是初学者也能按照步骤进行实操，废话不多说，直接上干货。业务场景假设我们有两个应用，应用A和应用B。应用A需要在电量低时通知应用B执行一些操作，比如降低功耗或提醒用户充电。步骤1：导入必要的模块首先，我们需要导入鸿蒙提供的公共事件管理模块和其他必要
SpringBoot项目集成分布式任务调度平台XXL-JOB 樱花语分布式开发 SpringBoot XXL-JOB
一、概述XXL-JOB是一个轻量级分布式任务调度平台，其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线，开箱即用。二、特性1、简单：支持通过Web页面对任务进行CRUD操作，操作简单，一分钟上手；2、动态：支持动态修改任务状态、启动/停止任务，以及终止运行中任务，即时生效；3、调度中心HA（中心式）：调度采用中心式设计，“调度中心”自研调度组件并支持集群部
深入理解Tomcat：Java Web服务器的安装与配置杨凯凡 JavaWeb java tomcat
大家好！今天我们来聊聊JavaWeb开发中最重要的工具之一——ApacheTomcat。Tomcat是一个开源的JavaServlet容器和Web服务器，它是运行JavaWeb应用程序的核心环境。无论是开发、测试还是部署JavaWeb应用，Tomcat都是不可或缺的工具。本文将详细介绍Tomcat的安装、配置以及常见问题的解决方法，帮助你快速上手并深入理解Tomcat的工作原理。准备好了吗？让我们
c++基础详解我要进步！ c++
C++是一种功能强大且灵活的编程语言，用于系统编程、应用程序开发、游戏开发等多个领域。下面我将详细讲解C++的基础知识，涵盖以下几个方面：目录c++基础详解1.基本语法2.变量和数据类型3.运算符4.控制流5.函数6.数组和字符串7.指针和引用8.面向对象编程1.基本语法C++程序的基本结构如下：#include//包含输入输出流库intmain(){ std::cout：包含标准输入输出库。
Websoft9：为开发者打造的高效 Linux 服务器面板 linuxlinux运维运维
Websoft9作为一款以开源应用部署与管理为核心的服务器面板，其平台设计与运行环境深度耦合，形成了“环境即服务”的独特模式。这种关系体现在环境标准化、自动化配置、安全融合及资源管理等多个维度。以下从四个核心层面详细阐述二者的协同机制：一、运行环境标准化：平台能力的基石Websoft9的运行环境并非孤立存在，而是平台功能实现的底层支撑。多语言与框架的预集成•平台内置PHP、Python、Java、
python任务调度平台界面_分布式任务调度平台XXL-JOB weixin_39572764 python任务调度平台界面
以前带我的人说过，最好的学习就是看官方文档，个人也有4个T的学习视频，但是会发现讲的都是入门，有的也比较浅。官方文档比较官方，也比较权威，打开xxl-job的官网，写的贼详细，有些人喜欢收博客，不喜欢看官网，因此就直接复制过来了，过段时间会参考文档，自己来一遍。一、简介1.1概述XXL-JOB是一个分布式任务调度平台，其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司
用js搞清策略模式和责任链模式的区别技术蹭蹭蹭策略模式责任链模式 javascript
策略模式和责任链模式都是常用的设计模式，它们的目的都是为了解耦和提高代码的可维护性。但是，它们的应用场景不同，下面对它们进行详细的比较和介绍。策略模式策略模式是一种定义一系列算法的方法，从概念上来看，所有这些算法完成的都是相同的工作，只是实现不同。它可以让算法的变化独立于使用它的客户端（也就是上下文），从而可以在不修改客户端的情况下，增加或替换算法。策略模式主要包含三个角色：上下文（Context
AI大模型推理加速：技术与实践详解 AI大模型学习者人工智能
近年来，AI大模型在自然语言处理、计算机视觉等领域取得了突破性进展。然而，大模型的推理速度却成为其落地应用的瓶颈。本文将详细探讨AI大模型推理加速的技术手段和实践经验，并结合具体案例进行分析。一、挑战与机遇1.1挑战庞大的参数量:大模型通常拥有数十亿甚至数千亿个参数，例如GPT-3拥有1750亿个参数。如此庞大的参数量导致模型文件体积巨大，加载和推理都需要消耗大量的内存和计算资源。复杂的计算图:大
掌握Visual C++ 2019 Build Tools的高效开发方法心言星愿
本文还有配套的精品资源，点击获取简介：VisualStudioBuildTools中的VisualC++2019BuildTools是针对C++开发的关键组件，提供了编译和构建项目的轻量级解决方案。本文详细介绍了VisualC++2019BuildTools的核心组件，如MSVC编译器、C++运行时库、WindowsSDK等，以及如何进行安装配置、使用场景、实践应用和最佳实践。通过本文的学习，读者
micropython入门指南电子版_MicroPython入门指南 EchiTie
Python是一种脚本语言，是一款非常容易使用的脚本语言，语法简介、使用简单、功能强大、容易扩展。有非常多的库可以使用。网络功能和计算功能也很强。方便的和其他语言配合使用。完全开源，受到原来越多的开发者青睐。不过由于受到硬件成本、运行性能、开发习惯等原因。没有在通用嵌入式方面得到太多应用。所以microPython应运而生。MicroPython可以在多种嵌入式硬件平台上运行,目前已经有STM32
C# JIEBA.NET分词器开发指南老胖闲聊 C#c#.net 开发语言
JIEBA.NET是Jieba分词器的.NET实现版本。Jieba是一个流行的中文分词工具，最初是用Python编写的，而JIEBA.NET将其移植到了.NET平台。它的核心功能是将连续的中文文本切分成有意义的词语（分词），并支持关键词提取、词性标注等功能。以下将通过JIEBA.NET的工作原理、分词过程拆解和案例实战三部分来进行详细讲解：一、工作原理1.分词的基本原理中文分词是将连续的中文字符序
Go语言入门基础详解老胖闲聊 go golang 开发语言后端
一、语言历史背景Go语言由Google工程师RobertGriesemer、RobPike和KenThompson于2007年设计，2009年正式开源。设计目标：兼具Python的开发效率与C的执行性能内置并发支持（goroutine/channel）简洁的类型系统现代化的包管理跨平台编译能力//经典HelloWorld示例packagemain//声明包名import"fmt"//导入标准库fu
【玩转正则表达式】一套万能的针对所有场景都适用的写出正则表达式的步骤 ThisIsClark 玩转正则表达式正则表达式
正则表达式作为一个强力的文本模式匹配工具，在功能强大的另一面是不低的使用门槛。对于很多开发者或者使用者来说，最大的问题就是面对一串待匹配的字符串，不知道如何正确的写出正则表达式。我因为是公司正则表达式相关功能的开发者，所以用户使用正则相关的功能时经常都会来找我问一个问题：我有一个xxx的字符串，想提取某某元素，应该怎么写正则表达式。于是在这个过程中，我不光积累了对正则表达式语法的熟练程度，更是对如
同花顺软件中的哪些功能可以帮助投资者更好地分析市场？股票量化量化投资量化交易程序化交易量化交易 python 量化炒股券商接口 QMT 量化投资 PTrade
推荐阅读：《【最全攻略】券商交易接口API申请：从数据获取到下单执行》同花顺软件中的哪些功能可以帮助投资者更好地分析市场？在股票市场中，投资者需要借助各种工具和功能来分析市场趋势、评估股票价值和制定投资策略。同花顺软件作为中国领先的金融信息服务提供商之一，提供了丰富的功能来帮助投资者更好地分析市场。本文将详细介绍同花顺软件中的一些核心功能，以及如何利用这些功能来提高投资决策的质量。1.实时行情查看
Node.js Web 模块详解 froginwe11 开发语言
Node.jsWeb模块详解引言Node.js作为一款流行的JavaScript运行环境，以其高性能、事件驱动和非阻塞I/O模型而闻名。在Node.js中，模块是构建应用程序的基础，也是其强大的关键所在。本文将详细介绍Node.js的Web模块，包括其基本概念、常用模块及其应用。模块的概念在Node.js中，模块是一种组织代码的方式，它将代码分割成独立的、可复用的部分。模块不仅可以减少代码的冗余，
验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

Hadoop、Slurm平台详细安装配置步骤

大数据Hadoop、Slurm平台

安 装 配 置 手 册

绪论

hadoop web管理地址

Linux篇

HDFS篇

MapReduce篇

zookeeper篇

Hbase篇

Hive篇

Slurm篇

NTP时间服务器篇

Python脚本篇

你可能感兴趣的:(Hadoop、Slurm平台详细安装配置步骤)

安装配置手册