Amorji

Docker下的Apache-Atlas元数据治理组件安装

一、Docker镜像制作
- 组件版本
- 一、安装JDK
- 二、安装MAVEN
- 安装zookeeper
- 安装hadoop
- 安装hbase，在hive之前
- 安装hive
- 安装Kafka
- 安装solr
- 三、安装atlas
- 集成hbase
- 完结撒花！！！
二、Docker镜像启动
- - 1. 加载镜像
  - 2. 创建容器
  - 3. 快速启动
  - 4. 访问端口
附录
- 1. 常用命令集合

操作环境：

操作系统：Windows10

Docker Desktop：4.10.1

Docker version： 20.10.17, build 100c701

一、Docker镜像制作

组件版本

组件名称组件版本

Hadoop 3.2.1
Hive 3.1.2
Hbase 2.3.4
Zookeeper 3.5.9
Kafka 2.6.2
Solr 7.4.0
Atlas 2.1.0
jdk 1.8
python 2.7
Maven 3.6.3

步骤一
在三个节点中执行下面命令，生产密钥文件

ssh-keygen

执行命令后会要求确认密钥文件的存储位置（默认~/.ssh/），这个过程直接按“Enter”键即可，id_rsa是本机私钥文件，id_rsa.pub是本机公钥文件

步骤二
分别在三个节点中执行下面命令：

ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop03

这个过程会要求输入yes或者no，这里直接输入yes，然后输入主机密码

步骤三
在各节点用以下命令测试ssh免密登录

ssh hadoop01
ssh hadoop02
ssh hadoop03

安装noded
1.下载解压
wget https://cdn.npm.taobao.org/dist/node/v12.16.2/node-v12.16.2-linux-x64.tar.xz
tar -xf node-v12.16.2-linux-x64.tar.xz
cd node-v12.16.2-linux-x64/bin
./node -v

2.添加环境变量
export PATH= $P A T H :$ NODE_HOME/bin

一、安装JDK

# 1.下载解压jdk到指定目录（先创建好目录）
tar -zxvf {file-dir}/jdk-8u341-linux-x64.tar.gz -C /root/environments/ # {file-dir}为存放安装包的目录

# 2.配置环境变量
vim /etc/profile
export JAVA_HOME=/root/environments/jdk1.8.0_341
export PATH=$PATH:$JAVA_HOME/bin

# 3.刷新使环境变量生效
source /etc/profile

# 4.验证
java -version

二、安装MAVEN

maven下载地址：https://dlcdn.apache.org/maven/maven-3/

# 1.下载解压maven到指定目录（先创建好目录）
tar -zxvf {file-dir}/apache-maven-3.6.3-bin.tar.gz -C /root/environments/ # {file-dir}为存放安装包的目录

# 2.配置环境变量
export MVN_HOME=/root/environments/apache-maven-3.6.3
export PATH=$PATH:$MVN_HOME/bin

# 3.刷新使环境变量生效
source /etc/profile

# 4.验证
mvn -version 

# 5.配置maven仓库地址
vim $MVN_HOME/conf/settings.xml


	<mirror>
    	<id>alimavenid>
    	<name>aliyun mavenname>
    	<url>http://maven.aliyun.com/nexus/content/groups/public/url>
    	<mirrorOf>centralmirrorOf>
	mirror>

    <mirror>
        <id>repo1id>
        <mirrorOf>centralmirrorOf>
        <name>Human Readable Name for this Mirror.name>
        <url>https://repo1.maven.org/maven2/url>
    mirror>

    <mirror>
        <id>repo2id>
        <mirrorOf>centralmirrorOf>
        <name>Human Readable Name for this Mirror.name>
        <url>https://repo2.maven.org/maven2/url>
    mirror>

maven在调配置文件的时候优先调用的是/root/.m2/(隐藏目录)下的内容，创建/root/.m2目录一个然后将配置文件复制过去

mkdir /root/.m2
cp $MVN_HOME/conf/settings.xml /root/.m2/

安装顺序zookeeper ，hadoop，hbase，hive，kafka，solr，atlas

安装zookeeper

所有组件版本可在apache的仓库中找到https://archive.apache.org/dist/hbase/，国内镜像缺少很多版本，多为稳定版

 
tar -zxvf {file-dir}/apache-zookeeper-3.5.9-bin.tar.gz -C /root/environments/ # {file-dir}为存放安装包的目录

cd /root/environments/zookeeper-3.4.6/conf
将zoo_sample.cfg拷贝一份
cp zoo_sample.cfg zoo.cfg

vim zoo.cfg

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
dataDir=/root/environments/zookeeper-3.4.6/data
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1
server.1=hadoop01:2888:3888
server.2=hadoop02:2888:3888
server.3=hadoop03:2888:3888

创建环境变量

export ZK_HOME=/root/environments/zookeeper-3.4.6
export PATH=$PATH:$ZK_HOME/bin
source /etc/profile

创建data文件
mkdir /root/environments/zookeeper-3.4.6/data
cd /root/environments/zookeeper-3.4.6/data
touch myid && echo "1" > myid

然后将/root/environments/zookeeper-3.4.6整个文件夹拷贝到hadoop02、hadoop03并配置环境变量

scp -r /root/environments/zookeeper-3.4.6 hadoop02:/root/environments/
scp -r /root/environments/zookeeper-3.4.6 hadoop03:/root/environments/

并修改hadoop02、hadoop03机器上的/root/environments/zookeeper-3.4.6/data/myid文件（#不一样 ---------- 01≠02≠03）

hadoop02   2
hadoop03   3

3台机器上分别启动zk
zkServer.sh start

zkServer.sh status 查看状态

安装hadoop

1.解压

tar -zxvf {file-dir}/hadoop-3.1.1.tar.gz  -C /root/environments/ # {file-dir}为存放安装包的目录

2.加入环境变量

vi /etc/profile
#tip:在文件末尾追加
export HADOOP_HOME=/root/environments/hadoop-3.1.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

# 使配置文件生效
source /etc/profile

#测试
hadoop version

3.需要编辑的文件都在/root/environments/hadoop-3.1.1/etc/hadoop目录下



<configuration>
    
    <property>
        <name>fs.defaultFSname>
        <value>hdfs://myclustervalue>
    property>

    
    <property>
        <name>hadoop.tmp.dirname>
        <value>/data/hadoopvalue>
    property>

    
    <property>
        <name>hadoop.http.staticuser.username>
        <value>rootvalue>
    property>

    
    <property>
        <name>ha.zookeeper.quorumname>
        <value>hadoop01:2181,hadoop02:2181,hadoop03:2181value>
    property>
    <property>
        <name>dfs.permissions.enabledname>
        <value>falsevalue>
    property>

    <property>
        <name>hadoop.proxyuser.root.hostsname>
        <value>*value>
    property>

    <property>
        <name>hadoop.proxyuser.root.groupsname>
        <value>*value>
    property>
configuration>

vi hadoop-env.sh

export JAVA_HOME=/root/environments/jdk1.8.0_341
export HDFS_NAMENODE_USER="root"
export HDFS_DATANODE_USER="root"
export HDFS_ZKFC_USER="root"
export HDFS_JOURNALNODE_USER="root"

hdfs-site.xml
其中还设置hadoop01，hadoop02为NN（）

<configuration>
	<property>
       <name>dfs.replicationname>
       <value>2value>
   property>
   <property>
        <name>dfs.permissions.enabledname>
        <value>falsevalue>
   property>
   
   <property>
       <name>dfs.nameservicesname>
       <value>myclustervalue>
   property>
   
   <property>
        <name>dfs.ha.namenodes.myclustername>
        <value>nn1,nn2value>
   property>
   
   <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1name>
        <value>hadoop01:8020value>
   property>
   <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2name>
        <value>hadoop02:8020value>
   property>
 
   <property>
        <name>dfs.namenode.http-address.mycluster.nn1name>
        <value>hadoop01:9870value>
   property>
   <property>
        <name>dfs.namenode.http-address.mycluster.nn2name>
        <value>hadoop02:9870value>
   property>
   
   <property>
        <name>dfs.namenode.shared.edits.dirname>
        <value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/myclustervalue>
   property>
   
   <property>
        <name>dfs.journalnode.edits.dirname>
        <value>/data/hadoop/ha-hadoop/journaldatavalue>
   property>
	
   <property>
        <name>dfs.ha.automatic-failover.enabledname>
        <value>truevalue>
   property>
   
   <property>
        <name>dfs.client.failover.proxy.provider.myclustername>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvidervalue>
   property>
   
   <property>
        <name>dfs.ha.fencing.methodsname>
        <value>
                sshfence
                shell(/bin/true)
        value>
   property>
   
   <property>
        <name>dfs.ha.fencing.ssh.private-key-filesname>
        <value>/root/.ssh/id_rsavalue>
   property>
   
   <property>
        <name>dfs.ha.fencing.ssh.connect-timeoutname>
        <value>30000value>
   property>
configuration>

mapred-env.sh

export JAVA_HOME=/root/environments/jdk1.8.0_341

mapred-site.xml

<configuration>
     
    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>

    
    <property>
        <name>mapreduce.jobhistory.addressname>
        <value>hadoop01:10020value>
    property>

    
    <property>
        <name>mapreduce.jobhistory.webapp.addressname>
        <value>hadoop01:19888value>
    property>

    <property>
      <name>mapreduce.application.classpathname>
      <value>
                /root/environments/hadoop-3.1.1/etc/hadoop,
                /root/environments/hadoop-3.1.1/share/hadoop/common/*,
                /root/environments/hadoop-3.1.1/share/hadoop/common/lib/*,
                /root/environments/hadoop-3.1.1/share/hadoop/hdfs/*,
                /root/environments/hadoop-3.1.1/share/hadoop/hdfs/lib/*,
                /root/environments/hadoop-3.1.1/share/hadoop/mapreduce/*,
                /root/environments/hadoop-3.1.1/share/hadoop/mapreduce/lib/*,
                /root/environments/hadoop-3.1.1/share/hadoop/yarn/*,
                /root/environments/hadoop-3.1.1/share/hadoop/yarn/lib/*
      value>
    property>
configuration>

yarn-env.sh

export JAVA_HOME=/root/environments/jdk1.8.0_341

yarn-site.xml
其中还设置hadoop01，hadoop02为RM

<configuration>

    
    <property>
        <name>yarn.resourcemanager.ha.enabledname>
        <value>truevalue>
    property>

    
    <property>
        <name>yarn.resourcemanager.cluster-idname>
        <value>cluster1value>
    property>

    
    <property>
        <name>yarn.resourcemanager.ha.rm-idsname>
        <value>rm1,rm2value>
    property>

    
    <property>
        <name>yarn.resourcemanager.hostname.rm1name>
        <value>hadoop01value>
    property>

    <property>
        <name>yarn.resourcemanager.hostname.rm2name>
        <value>hadoop02value>
    property>

    <property>
        <name>yarn.resourcemanager.webapp.address.rm1name>
        <value>hadoop01:8088value>
    property>

    <property>
        <name>yarn.resourcemanager.webapp.address.rm2name>
        <value>hadoop02:8088value>
    property>

    
    <property>
        <name>yarn.resourcemanager.zk-addressname>
        <value>hadoop01:2181,hadoop02:2181,hadoop03:2181value>
    property>
    <property>
        <name>yarn.nodemanager.aux-servicesname>
        <value>mapreduce_shufflevalue>
    property>

    <property>
        <name>yarn.log-aggregation-enablename>
        <value>truevalue>
    property>

    <property>
        <name>yarn.log-aggregation.retain-secondsname>
        <value>86400value>
    property>

    
    <property>
        <name>yarn.resourcemanager.recovery.enabledname>
        <value>truevalue>
    property>

    
    <property>
        <name>yarn.resourcemanager.store.classname>
        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStorevalue>
    property>

    
    <property>
        <name>yarn.nodemanager.vmem-check-enabledname>
        <value>falsevalue>
    property>

    <property>
        <name>yarn.nodemanager.vmem-pmem-rationame>
        <value>5value>
    property>

configuration>

workers

hadoop01
hadoop02
hadoop03

hadoop3有权限问题，为避免因权限问题造成的启动失败，在如下文件添加指定用户

vim /root/environments/hadoop-3.1.1/sbin/start-dfs.sh
vim /root/environments/hadoop-3.1.1/sbin/stop-dfs.sh

添加
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs # 已过时系统建议使用 HADOOP_SECURE_DN_USER
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HDFS_JOURNALNODE_USER=root
HDFS_ZKFC_USER=root

vim /root/environments/hadoop-3.1.1/sbin/start-yarn.sh
vim /root/environments/hadoop-3.1.1/sbin/stop-yarn.sh

添加
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn # 已过时系统建议使用 HADOOP_SECURE_DN_USER
YARN_NODEMANAGER_USER=root

启动Zookeeper->JournalNode->格式化NameNode->创建命名空间zkfs->NameNode->Datanode->ResourceManager->NodeManager

3台机器上启动JournalNode

3台机器上启动JournalNode
cd /root/environments/hadoop-3.1.1/sbin/
./hadoop-daemon.sh start journalnode  启动journalnode

在hadoop01上执行格式化namenode
同步hadoop02的配置（#不一样 ---------- 01=02≠03）

#在hadoop01上执行
hadoop namenode -format
#将/data/hadoop/dfs/name目录下的内容拷贝到备用namenode主机
 
#如果备用namenode主机没有该目录就创建一个
scp -r /data/hadoop/dfs/name hadoop02:/data/hadoop/dfs/name/

格式化zkfc，在两个namenode主机上进行zkfc的格式化（#不一样 ---------- 01=02≠03）

./hdfs zkfc -formatZK

关闭JournalNode

#3台机器上关闭JournalNode
cd /root/environments/hadoop-3.1.1/sbin/
./hadoop-daemon.sh stop journalnode

启动hadoop

#在hadoop01机器上执行：
start-all.sh

安装hbase，在hive之前

tar -xzvf hbase-2.0.2-bin.tar.gz -C /root/environments/

hbase-env.sh

export JAVA_HOME=/root/environments/jdk1.8.0_341
export HBASE_CLASSPATH=/root/environments/hadoop-3.1.1/etc/hadoop
export HBASE_MANAGES_ZK=false # 使用自己安装的zookeeper。 一定要加这个，不使用自带的zookeeper，否则自己的zookeeper就无法启动了

hbase-site.xml

<configuration>
	
	<property>
	        <name>hbase.rootdirname>
	        <value>hdfs://mycluster/hbasevalue>
	property>
	<property>
	        <name>hbase.mastername>
	        <value>8020value>
	property>
	
	<property>
	        <name>hbase.zookeeper.quorumname>
	        <value>hadoop01,hadoop02,hadoop03value>
	property>
	<property>
	        <name>hbase.zookeeper.property.clientProtname>
	        <value>2181value>
	property>
	<property>
	        <name>hbase.zookeeper.property.dataDirname>
	        <value>/root/environments/zookeeper-3.4.6/confvalue>
	property>
	<property>
	        <name>hbase.tmp.dirname>
	        <value>/var/hbase/tmpvalue>
	property>
	<property>
	        <name>hbase.cluster.distributedname>
	        <value>truevalue>
	property>
	<property>
	    <name>hbase.cluster.distributedname>
	    <value>truevalue>
	property>
	
	
configuration>

regionservers

hadoop01
hadoop02
hadoop03

Hbase启动高可用需要编辑文件backup-masters(里面添加备用的HMaster的主机)

vim backup-masters

hadoop03

配置环境变量

export HBASE_HOME=/root/environments/hbase-2.0.2
export PATH=$PATH:$HBASE_HOME/bin
source /etc/profile

拷贝到其他节点

scp /etc/profile hadoop02:/etc/
scp /etc/profile hadoop03:/etc/
scp -r /root/environments/hbase-2.0.2 hadoop02:/root/environments/
scp -r /root/environments/hbase-2.0.2 hadoop03:/root/environments/

在 HMaster 节点启动，想让谁做HMaster 就在谁上面启动，本例中适合在hadoop01或hadoop02上启动。因为hadoop03是备用HMaster

start-hbase.sh

yarn rmadmin -getAllServiceState
查看http://hadoop03:16010/master-status

安装hive

mysql安装
略

tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /app
mv apache-hive-3.1.2-bin apache-hive-3.1.2

需要编辑的文件都在/root/environments/apache-hive-3.1.0/conf目录下

vi hive-env.sh
export HADOOP_HOME=/root/environments/hadoop-3.1.1
export HIVE_CONF_DIR=/root/environments/apache-hive-3.1.0/conf

hive-site.xml

<configuration>
	
	<property>
		<name>javax.jdo.option.ConnectionURLname>
		<value>jdbc:mysql://mysql57:3307/hive?createDatabaseIfNotExist=true&useSSL=falsevalue>
	property>
	
	
	<property>
		<name>javax.jdo.option.ConnectionDriverNamename>
		<value>com.mysql.jdbc.Drivervalue>
	property>
	
	
	<property>
		<name>javax.jdo.option.ConnectionUserNamename>
		<value>rootvalue>
	property>
	<property>
		<name>javax.jdo.option.ConnectionPasswordname>
		<value>123456value>
	property>
	
	<property>
		<name>hive.metastore.warehouse.dirname>
		<value>/user/hive/warehousevalue>
	property>
	
	<property>
		<name>hive.exec.scratchdirname>
		<value>/user/hive/tmpvalue>
	property>
	
	
	<property>
		<name>hive.querylog.locationname>
		<value>/user/hive/logvalue>
	property>
	
	
	
	<property>
	  <name>hive.metastore.localname>
	  <value>falsevalue>
	property>
	<property>
		<name>hive.metastore.urisname>
		<value>thrift://hadoop01:9083value>
	property>
	
	<property>
		<name>hive.server2.thrift.portname>
		<value>10000value>
	property>
	<property>
		<name>hive.server2.thrift.bind.hostname>
		<value>0.0.0.0value>
	property>
	<property>
		<name>hive.server2.webui.hostname>
		<value>0.0.0.0value>
	property>
	
	
	<property>
		<name>hive.server2.webui.portname>
		<value>10002value>
	property>
	
	<property>
		<name>hive.server2.long.polling.timeoutname>
		<value>5000value>
	property>
	
	<property>
		<name>hive.server2.enable.doAsname>
		<value>truevalue>
	property>
	
	<property>
		<name>datanucleus.autoCreateSchemaname>
		<value>falsevalue>
	property>
	
	<property>
		<name>datanucleus.fixedDatastorename>
		<value>truevalue>
	property>
	
	<property>
		<name>hive.execution.enginename>
		<value>mrvalue>
	property>
configuration>

将mysql的驱动jar包上传到hive的lib目录下
https://mvnrepository.com/artifact/mysql/mysql-connector-java/8.0.20

配置环境变量

export HIVE_HOME=/root/environments/apache-hive-3.1.0
export PATH=$PATH:$HIVE_HOME/bin

刷新

source /etc/profile

初始化hive的元数据库

schematool -dbType mysql -initSchema

启动hive的matestore（重要不知道为什么依赖hbase，应该是我看错了）

hive --service metastore 
hive --service metastore & #后台启动

使用ps查看metastore服务是否起来

ps -ef | grep metastore # ps -ef表示查看全格式的全部进程。 -e 显示所有进程。-f 全格式。-h 不显示标题。-l 长格式。-w 宽输出

进入hive进行验证

hive
命令： create database filetest;
show databases;
切换filetest数据库：use filetest;

将/app/hive目录进行分发（目的是所有机器都可以使用hive，不需要修改任何配置）

scp /etc/profile hadoop02:/etc/
scp /etc/profile hadoop03:/etc/
scp -r /root/environments/apache-hive-3.1.0  hadoop02:/root/environments/
scp -r /root/environments/apache-hive-3.1.0  hadoop03:/root/environments/

并刷新

source /etc/profile

安装Kafka

 tar -xzvf kafka_2.12-2.0.0.tgz -C /root/environments/
 #需要编辑的文件都在/app/kafka/config目录下

修改server.properties中的

broker.id=1
zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181

修改zookeeper.properties（未做修改）

dataDir=/home/hadoop/data/zookeeper/zkdata
clientPort=2181

修改consumer.properties（未做修改）

zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181

修改producer.properties（未做修改）

metadata.broker.list=hadoop01:9092,hadoop02:9092,hadoop03:9092

配置环境变量

export KAFKA_HOME=/root/environments/kafka_2.12-2.0.0
export PATH=$PATH:$KAFKA_HOME/bin

刷新

source /etc/profile

将/app/kafka文件分发到其余的机器并修改kafka_2.12-2.0.0/config/server.properties文件中的broker.id的值（#不一样 ---------- 01≠02≠03）

scp /etc/profile hadoop02:/etc/
scp /etc/profile hadoop03:/etc/
scp -r /root/environments/kafka_2.12-2.0.0 hadoop02:/root/environments/
scp -r /root/environments/kafka_2.12-2.0.0 hadoop03:/root/environments/

并刷新

source /etc/profile

vim /root/environments/kafka_2.12-2.0.0/config/server.properties
hadoop02    2
hadoop03    3

kafka 群起脚本

for i in hadoop102 hadoop103 hadoop104
do
echo "========== $i ==========" 
ssh $i '/opt/module/kafka/bin/kafka-server-start.sh -daemon 
/opt/module/kafka/config/server.properties'
done

各自三台机器启动kafka

#3台机器分别启动kafka
后台启动：
kafka-server-start.sh -daemon /root/environments/kafka_2.12-2.0.0/config/server.properties

http://hadoop01:8048

1）查看当前服务器中的所有 topic

kafka-topics.sh --zookeeper hadoop01:2181 --list

2）创建 topic（后面分发部署好集群后会同步消息）

kafka-topics.sh --zookeeper hadoop01:2181,hadoop02:2181,hadoop03:2181 --create --replication-factor 3 --partitions 3 --topic _HOATLASOK
kafka-topics.sh --zookeeper hadoop01:2181,hadoop02:2181,hadoop03:2181 --create --replication-factor 3 --partitions 3 --topic ATLAS_ENTITIES
kafka-topics.sh --zookeeper hadoop01:2181,hadoop02:2181,hadoop03:2181 --create --replication-factor 3 --partitions 3 --topic ATLAS_HOOK

Alienware^Kafka基础笔记

kafka-topics.sh --zookeeper hadoop01:2181 --create --replication-factor 3 --partitions 1 --topic first #

选项说明：
–topic 定义 topic 名
–replication-factor 定义副本数
–partitions 定义分区数

3）删除 topic

[root@hadoop102 kafka]$ bin/kafka-topics.sh --zookeeper hadoop102:2181 --delete --topic first

需要 server.properties 中设置 delete.topic.enable=true 否则只是标记删除。

4）发送消息

[root@hadoop102 kafka]$ bin/kafka-console-producer.sh --broker-list hadoop102:9092 --topic first
>hello world

5）消费消息

[root@hadoop102 kafka]$ bin/kafka-console-consumer.sh --zookeeper hadoop102:2181 --topic first
[root@hadoop102 kafka]$ bin/kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --topic first
[root@hadoop102 kafka]$ bin/kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --from-beginning --topic first
--from-beginning：会把主题中以往所有的数据都读取出来。

6）查看某个 Topic 的详情

[root@hadoop102 kafka]$ bin/kafka-topics.sh --zookeeper hadoop102:2181 --describe --topic first

7）修改分区数

[root@hadoop102 kafka]$ bin/kafka-topics.sh --zookeeper hadoop102:2181 --alter --topic first --partitions 6

安装solr

解压

 tar -xzvf solr-7.5.0.tgz -C /root/environments/

需要编辑的文件都在/app/solr/bin目录下

solr.in.sh

ZK_HOST="hadoop01:2181,hadoop02:2181,hadoop03:2181"
SOLR_HOST="hadoop01"

export SOLR_HOME=/root/environments/solr-7.5.0
export PATH=$PATH:$SOLR_HOME/bin
source /etc/profile

注：配置环境变量会出大问题！！！！！

# 别人的
16:42:39.035 INFO  (main) [   ] o.a.s.c.SolrResourceLoader Using system property solr.solr.home: /opt/xxx/solr-6.5.1/server/solr
16:42:39.099 INFO  (main) [   ] o.a.s.s.SolrDispatchFilter Loading solr.xml from SolrHome (not found in ZooKeeper)
16:42:39.100 INFO  (main) [   ] o.a.s.c.SolrXmlConfig Loading container configuration from /opt/xxx/solr-6.5.1/server/solr/solr.xml
16:42:39.413 INFO  (main) [   ]

# 我的
2022-07-23 10:55:51.469 INFO  (main) [   ] o.a.s.c.SolrResourceLoader Using system property solr.solr.home: /root/environments/solr-7.5.0
2022-07-23 10:55:51.638 INFO  (zkConnectionManagerCallback-2-thread-1) [   ] o.a.s.c.c.ConnectionManager zkClient has connected
2022-07-23 11:29:34.848 INFO  (main) [   ] o.a.s.s.SolrDispatchFilter Loading solr.xml from SolrHome (not found in ZooKeeper)
2022-07-23 11:29:34.854 INFO  (main) [   ] o.a.s.c.SolrXmlConfig Loading container configuration from /root/environments/solr-7.5.0/solr.xml
2022-07-23 11:29:34.859 ERROR (main) [   ] o.a.s.s.SolrDispatchFilter Could not start Solr. Check solr/home property and the logs
2022-07-23 11:29:34.903 ERROR (main) [   ] o.a.s.c.SolrCore null:org.apache.solr.common.SolrException: solr.xml does not exist in /root/environments/solr-7.5.0 cannot start Solr

将/root/environments/solr-7.5.0文件分发到其余的机器并修改/root/environments/solr-7.5.0/bin/solr.in.sh文件中的SOLR_HOST的值

scp -r /root/environments/solr-7.5.0 hadoop02:/root/environments/
scp -r /root/environments/solr-7.5.0 hadoop03:/root/environments/

修改/root/environments/solr-7.5.0/bin/solr.in.sh文件中的SOLR_HOST的值（#不一样 ---------- 01≠02≠03）

vim /root/environments/solr-7.5.0/bin/solr.in.sh
hadoop02    hadoop02
hadoop03    hadoop03

3台机器分别启动solr

# 一定要到目录执行，不要设置环境变量！！会导致后面的solr.solr.home目录错误“/root/environments/solr-7.5.0/”，变成你设置的环境变量，而对的是/root/environments/solr-7.5.0/server/solr
cd /root/environments/solr-7.5.0/bin
./solr start -force
# 或者
/root/environments/solr-7.5.0/bin/solr start -force

# 查看状态
cd /root/environments/solr-7.5.0/bin
./solr status
# 或者
/root/environments/solr-7.5.0/bin/solr status
#

下面就成功了

“cloud”:{
“ZooKeeper”:“hadoop01:2181,hadoop02:2181,hadoop03:2181”,
“liveNodes”:“3”,
“collections”:“3”}}
或者访问 http://localhost:8983/solr/ ，有cloud菜单说明集群成功

三、安装atlas

atlas下载地址：https://atlas.apache.org/#/Downloads

# 解压atlas压缩包
tar -zxvf {file-dir}/apache-atlas-2.1.0-sources.tar.gz  -C /root/environments/ # {file-dir}为存放安装包的目录

编辑项目的顶级pom.xml文件，修改各个组件的版本，

# 进入atlas根目录,修改pom.xml文件
cd /root/environments/apache-atlas-sources-2.1.0/
vim pom.xml

主要修改如下安装组件对应版本，由于本此安装均是对照这里定义的版本安装的，因此不做修改

这里是引用需要修改的代码部分（网上资料说需要修改该部分代码，我已修改并成功运行，目前只测试了hive的hook，没有遇到任何问题，不知道不修改会怎样,）

反正我没改这里

vim /root/environments/apache-atlas-sources-2.1.0/addons/hive-bridge/src/main/java/org/apache/atlas/hive/bridge/HiveMetaStoreBridge.java

577行
将:
String catalogName = hiveDB.getCatalogName() != null ? hiveDB.getCatalogName().toLowerCase() : null;
改为：
String catalogName = null;

vim /root/environments/apache-atlas-sources-2.1.0/addons/hive-bridge/src/main/java/org/apache/atlas/hive/hook/AtlasHiveHookContext.java

81行
将：
this.metastoreHandler = (listenerEvent != null) ? metastoreEvent.getIHMSHandler() : null;
改为：
this.metastoreHandler = null;

进行编译

cd /root/environments/apache-atlas-sources-2.1.0/

打包：（使用外部hbase和solr的打包方式，这里不考虑使用atlas自带的）
mvn clean -DskipTests package -Pdist -X

注：编译过程中可能会遇到报错，基本都是因为网络的问题，重试即可解决，如若重试也没有解决jar包的下载问题，可手动下载缺失的jar，放到本地maven仓库后重新打包。

遇到问题一：nodejs下载失败
收到拷贝到下载目录C:\Users\shuch\Downloads\node-12.16.0-linux-x64.tar.gz hadoop01:/root/.m2/repository/com/github/eirslett/node/12.16.0/
问题二：依赖于GitHub上面的包下载失败
设置代理或者修改hosts

# localhost name resolution is handled within DNS itself.# 127.0.0.1 localhost# ::1 localhost20.205.243.166 github.com

# GitHub Start
140.82.114.4 github.com
199.232.69.194 github.global.ssl.fastly.net
199.232.68.133 raw.githubusercontent.com
# GitHub End

编译完成后的atlas存放位置

cd /root/environments/apache-atlas-sources-2.1.0/distro/target

apache-atlas-2.1.0-bin.tar.gz 就是我们所需要的包

解压

 tar -xzvf apache-atlas-2.1.0-bin.tar.gz

需要编辑的文件在/root/environments/apache-atlas-2.1.0/conf

cd /root/environments/apache-atlas-2.1.0/conf

atlas-env.sh

#indicates whether or not a local instance of HBase should be started for Atlas
export MANAGE_LOCAL_HBASE=false

# indicates whether or not a local instance of Solr should be started for Atlas
export MANAGE_LOCAL_SOLR=false

# indicates whether or not cassandra is the embedded backend for Atlas
export MANAGE_EMBEDDED_CASSANDRA=false

# indicates whether or not a local instance of Elasticsearch should be started for Atlas
export MANAGE_LOCAL_ELASTICSEARCH=false
export JAVA_HOME=/root/environments/jdk1.8.0_341
export HBASE_CONF_DIR=/root/environments/hbase-2.0.2/conf

atlas-application.properties (这里给出全部内容，只集成了hive作为测试，如若有其他组件的需要，进行组件的安装与atlas hook的配置即可)

#
# Licensed to the Apache Software Foundation (ASF) under one
# or more contributor license agreements.  See the NOTICE file
# distributed with this work for additional information
# regarding copyright ownership.  The ASF licenses this file
# to you under the Apache License, Version 2.0 (the
# "License"); you may not use this file except in compliance
# with the License.  You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#

#########  Graph Database Configs  #########

# Graph Database

#Configures the graph database to use.  Defaults to JanusGraph
#atlas.graphdb.backend=org.apache.atlas.repository.graphdb.janus.AtlasJanusGraphDatabase

# Graph Storage
# Set atlas.graph.storage.backend to the correct value for your desired storage
# backend. Possible values:
#
# hbase
# cassandra
# embeddedcassandra - Should only be set by building Atlas with  -Pdist,embedded-cassandra-solr
# berkeleyje
#
# See the configuration documentation for more information about configuring the various  storage backends.
#
atlas.graph.storage.backend=hbase2
atlas.graph.storage.hbase.table=apache_atlas_janus

#Hbase
#For standalone mode , specify localhost
#for distributed mode, specify zookeeper quorum here
atlas.graph.storage.hostname=hadoop01:2181,hadoop02:2181,hadoop03:2181
atlas.graph.storage.hbase.regions-per-server=1
atlas.graph.storage.lock.wait-time=10000

#In order to use Cassandra as a backend, comment out the hbase specific properties above, and uncomment the
#the following properties
#atlas.graph.storage.clustername=
#atlas.graph.storage.port=

# Gremlin Query Optimizer
#
# Enables rewriting gremlin queries to maximize performance. This flag is provided as
# a possible way to work around any defects that are found in the optimizer until they
# are resolved.
#atlas.query.gremlinOptimizerEnabled=true

# Delete handler
#
# This allows the default behavior of doing "soft" deletes to be changed.
#
# Allowed Values:
# org.apache.atlas.repository.store.graph.v1.SoftDeleteHandlerV1 - all deletes are "soft" deletes
# org.apache.atlas.repository.store.graph.v1.HardDeleteHandlerV1 - all deletes are "hard" deletes
#
#atlas.DeleteHandlerV1.impl=org.apache.atlas.repository.store.graph.v1.SoftDeleteHandlerV1

# Entity audit repository
#
# This allows the default behavior of logging entity changes to hbase to be changed.
#
# Allowed Values:
# org.apache.atlas.repository.audit.HBaseBasedAuditRepository - log entity changes to hbase
# org.apache.atlas.repository.audit.CassandraBasedAuditRepository - log entity changes to cassandra
# org.apache.atlas.repository.audit.NoopEntityAuditRepository - disable the audit repository
#
atlas.EntityAuditRepository.impl=org.apache.atlas.repository.audit.HBaseBasedAuditRepository

# if Cassandra is used as a backend for audit from the above property, uncomment and set the following
# properties appropriately. If using the embedded cassandra profile, these properties can remain
# commented out.
# atlas.EntityAuditRepository.keyspace=atlas_audit
# atlas.EntityAuditRepository.replicationFactor=1


# Graph Search Index
atlas.graph.index.search.backend=solr

#Solr
#Solr cloud mode properties
atlas.graph.index.search.solr.mode=cloud
atlas.graph.index.search.solr.zookeeper-url=hadoop01:2181,hadoop02:2181,hadoop03:2181
atlas.graph.index.search.solr.zookeeper-connect-timeout=60000
atlas.graph.index.search.solr.zookeeper-session-timeout=60000
atlas.graph.index.search.solr.wait-searcher=true

#Solr http mode properties
#atlas.graph.index.search.solr.mode=http
#atlas.graph.index.search.solr.http-urls=http://localhost:8983/solr

# ElasticSearch support (Tech Preview)
# Comment out above solr configuration, and uncomment the following two lines. Additionally, make sure the
# hostname field is set to a comma delimited set of elasticsearch master nodes, or an ELB that fronts the masters.
#
# Elasticsearch does not provide authentication out of the box, but does provide an option with the X-Pack product
# https://www.elastic.co/products/x-pack/security
#
# Alternatively, the JanusGraph documentation provides some tips on how to secure Elasticsearch without additional
# plugins: https://docs.janusgraph.org/latest/elasticsearch.html
#atlas.graph.index.search.hostname=localhost
#atlas.graph.index.search.elasticsearch.client-only=true

# Solr-specific configuration property
atlas.graph.index.search.max-result-set-size=150

#########  Import Configs  #########
#atlas.import.temp.directory=/temp/import

#########  Notification Configs  #########
# atlas.notification.embedded=true 使用内嵌的kafka
atlas.notification.embedded=false
atlas.kafka.data=${sys:atlas.home}/data/kafka
atlas.kafka.zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181
atlas.kafka.bootstrap.servers=hadoop01:9092,hadoop02:9092,hadoop03:9092
atlas.kafka.zookeeper.session.timeout.ms=400
atlas.kafka.zookeeper.connection.timeout.ms=200
atlas.kafka.zookeeper.sync.time.ms=20
atlas.kafka.auto.commit.interval.ms=1000
atlas.kafka.hook.group.id=atlas

atlas.kafka.enable.auto.commit=true
atlas.kafka.auto.offset.reset=earliest
atlas.kafka.session.timeout.ms=30000
atlas.kafka.offsets.topic.replication.factor=1
atlas.kafka.poll.timeout.ms=1000

atlas.notification.create.topics=true
atlas.notification.replicas=1
atlas.notification.topics=ATLAS_HOOK,ATLAS_ENTITIES
atlas.notification.log.failed.messages=true
atlas.notification.consumer.retry.interval=500
atlas.notification.hook.retry.interval=1000
# Enable for Kerberized Kafka clusters
#atlas.notification.kafka.service.principal=kafka/[email protected]
#atlas.notification.kafka.keytab.location=/etc/security/keytabs/kafka.service.keytab

## Server port configuration
#atlas.server.http.port=21000
#atlas.server.https.port=21443

#########  Security Properties  #########

# SSL config
atlas.enableTLS=false

#truststore.file=/path/to/truststore.jks
#cert.stores.credential.provider.path=jceks://file/path/to/credentialstore.jceks

#following only required for 2-way SSL
#keystore.file=/path/to/keystore.jks

# Authentication config

atlas.authentication.method.kerberos=false
atlas.authentication.method.file=true

#### ldap.type= LDAP or AD
atlas.authentication.method.ldap.type=none

#### user credentials file
atlas.authentication.method.file.filename=${sys:atlas.home}/conf/users-credentials.properties

### groups from UGI
#atlas.authentication.method.ldap.ugi-groups=true

######## LDAP properties #########
#atlas.authentication.method.ldap.url=ldap://:389
#atlas.authentication.method.ldap.userDNpattern=uid={0},ou=People,dc=example,dc=com
#atlas.authentication.method.ldap.groupSearchBase=dc=example,dc=com
#atlas.authentication.method.ldap.groupSearchFilter=(member=uid={0},ou=Users,dc=example,dc=com)
#atlas.authentication.method.ldap.groupRoleAttribute=cn
#atlas.authentication.method.ldap.base.dn=dc=example,dc=com
#atlas.authentication.method.ldap.bind.dn=cn=Manager,dc=example,dc=com
#atlas.authentication.method.ldap.bind.password=
#atlas.authentication.method.ldap.referral=ignore
#atlas.authentication.method.ldap.user.searchfilter=(uid={0})
#atlas.authentication.method.ldap.default.role=


######### Active directory properties #######
#atlas.authentication.method.ldap.ad.domain=example.com
#atlas.authentication.method.ldap.ad.url=ldap://:389
#atlas.authentication.method.ldap.ad.base.dn=(sAMAccountName={0})
#atlas.authentication.method.ldap.ad.bind.dn=CN=team,CN=Users,DC=example,DC=com
#atlas.authentication.method.ldap.ad.bind.password=
#atlas.authentication.method.ldap.ad.referral=ignore
#atlas.authentication.method.ldap.ad.user.searchfilter=(sAMAccountName={0})
#atlas.authentication.method.ldap.ad.default.role=

#########  JAAS Configuration ########

#atlas.jaas.KafkaClient.loginModuleName = com.sun.security.auth.module.Krb5LoginModule
#atlas.jaas.KafkaClient.loginModuleControlFlag = required
#atlas.jaas.KafkaClient.option.useKeyTab = true
#atlas.jaas.KafkaClient.option.storeKey = true
#atlas.jaas.KafkaClient.option.serviceName = kafka
#atlas.jaas.KafkaClient.option.keyTab = /etc/security/keytabs/atlas.service.keytab
#atlas.jaas.KafkaClient.option.principal = atlas/[email protected]

#########  Server Properties  #########
atlas.rest.address=http://hadoop01:21000
# If enabled and set to true, this will run setup steps when the server starts
atlas.server.run.setup.on.start=false

#########  Entity Audit Configs  #########
atlas.audit.hbase.tablename=apache_atlas_entity_audit
atlas.audit.zookeeper.session.timeout.ms=1000
atlas.audit.hbase.zookeeper.quorum=hadoop01:2181,hadoop02:2181,hadoop03:2181


#########  High Availability Configuration ########
atlas.server.ha.enabled=false
#### Enabled the configs below as per need if HA is enabled #####
#atlas.server.ids=id1
#atlas.server.address.id1=localhost:21000
#atlas.server.ha.zookeeper.connect=localhost:2181
#atlas.server.ha.zookeeper.retry.sleeptime.ms=1000
#atlas.server.ha.zookeeper.num.retries=3
#atlas.server.ha.zookeeper.session.timeout.ms=20000
## if ACLs need to be set on the created nodes, uncomment these lines and set the values ##
#atlas.server.ha.zookeeper.acl=:
#atlas.server.ha.zookeeper.auth=:



######### Atlas Authorization #########
atlas.authorizer.impl=simple
atlas.authorizer.simple.authz.policy.file=atlas-simple-authz-policy.json

#########  Type Cache Implementation ########
# A type cache class which implements
# org.apache.atlas.typesystem.types.cache.TypeCache.
# The default implementation is org.apache.atlas.typesystem.types.cache.DefaultTypeCache which is a local in-memory type cache.
#atlas.TypeCache.impl=

#########  Performance Configs  #########
#atlas.graph.storage.lock.retries=10
#atlas.graph.storage.cache.db-cache-time=120000

#########  CSRF Configs  #########
atlas.rest-csrf.enabled=true
atlas.rest-csrf.browser-useragents-regex=^Mozilla.*,^Opera.*,^Chrome.*
atlas.rest-csrf.methods-to-ignore=GET,OPTIONS,HEAD,TRACE
atlas.rest-csrf.custom-header=X-XSRF-HEADER

############ KNOX Configs ################
#atlas.sso.knox.browser.useragent=Mozilla,Chrome,Opera
#atlas.sso.knox.enabled=true
#atlas.sso.knox.providerurl=https://:8443/gateway/knoxsso/api/v1/websso
#atlas.sso.knox.publicKey=

############ Atlas Metric/Stats configs ################
# Format: atlas.metric.query..
atlas.metric.query.cache.ttlInSecs=900
#atlas.metric.query.general.typeCount=
#atlas.metric.query.general.typeUnusedCount=
#atlas.metric.query.general.entityCount=
#atlas.metric.query.general.tagCount=
#atlas.metric.query.general.entityDeleted=
#
#atlas.metric.query.entity.typeEntities=
#atlas.metric.query.entity.entityTagged=
#
#atlas.metric.query.tags.entityTags=

#########  Compiled Query Cache Configuration  #########

# The size of the compiled query cache.  Older queries will be evicted from the cache
# when we reach the capacity.

#atlas.CompiledQueryCache.capacity=1000

# Allows notifications when items are evicted from the compiled query
# cache because it has become full.  A warning will be issued when
# the specified number of evictions have occurred.  If the eviction
# warning threshold <= 0, no eviction warnings will be issued.

#atlas.CompiledQueryCache.evictionWarningThrottle=0


#########  Full Text Search Configuration  #########

#Set to false to disable full text search.
#atlas.search.fulltext.enable=true

#########  Gremlin Search Configuration  #########

#Set to false to disable gremlin search.
atlas.search.gremlin.enable=false


########## Add http headers ###########

#atlas.headers.Access-Control-Allow-Origin=*
#atlas.headers.Access-Control-Allow-Methods=GET,OPTIONS,HEAD,PUT,POST
#atlas.headers.=


#########  UI Configuration ########

atlas.ui.default.version=v1


######### Hive Hook Configs #######
atlas.hook.hive.synchronous=false
atlas.hook.hive.numRetries=3
atlas.hook.hive.queueSize=10000
atlas.cluster.name=primary

集成hbase

注册hook 编辑 hbase-site.xml

vi /root/environments/hbase-2.0.2/conf/hbase-site.xml

添加以下配置

<property>
    <name>hbase.coprocessor.master.classesname>
    <value>org.apache.atlas.hbase.hook.HBaseAtlasCoprocessorvalue>
property>

同步其他节点

scp /root/environments/hbase-2.0.2/conf/hbase-site.xml hadoop02:/root/environments/hbase-2.0.2/conf/
scp /root/environments/hbase-2.0.2/conf/hbase-site.xml hadoop03:/root/environments/hbase-2.0.2/conf/

引入依赖

# 将文件atlas-application.properties压缩进atlas下的hook/hbase/hbase-bridge-shim-2.1.0.jar包里
zip -u /root/environments/apache-atlas-2.1.0/hook/hbase/hbase-bridge-shim-2.1.0.jar  /root/environments/apache-atlas-2.1.0/conf/atlas-application.properties

# 然后将atlas的hook/hbase/* 拷贝至所有节点安装的hbase的lib目录下
cp  -r /root/environments/apache-atlas-2.1.0/hook/hbase/* /root/environments/hbase-2.0.2/lib/
scp -r /root/environments/apache-atlas-2.1.0/hook/hbase/* hadoop02:/root/environments/hbase-2.0.2/lib/
scp -r /root/environments/apache-atlas-2.1.0/hook/hbase/* hadoop03:/root/environments/hbase-2.0.2/lib/

引入配置
atlas-application.properties文件添加配置

vi /root/environments/apache-atlas-2.1.0/conf/atlas-application.properties

######### hbase Hook Configs #######
atlas.hook.hbase.synchronous=false 
atlas.hook.hbase.numRetries=3 
atlas.hook.hbase.queueSize=10000

然后将atlas-application.properties文件拷贝到hbase/conf/

# 然后将atlas-application.properties拷贝至所有节点安装的hbase的conf目录下，一行一行地运行，不要全部复制，会出问题！！！
cd  /root/environments/apache-atlas-2.1.0/conf/ # !!不要忘了进到这个目录
cp  ./atlas-application.properties /root/environments/hbase-2.0.2/conf/
scp ./atlas-application.properties hadoop02:/root/environments/hbase-2.0.2/conf/
scp ./atlas-application.properties hadoop03:/root/environments/hbase-2.0.2/conf/

# 编辑atlas属性文件
vi atlas-application.properties

# 修改atlas存储数据主机
atlas.graph.storage.hostname=hadoop01:2181,hadoop02:2181,hadoop03:2181

# 建立软连接
ln -s /root/environments/hbase-2.0.2/conf/ /root/environments/apache-atlas-2.1.0/conf/hbase/
cp /root/environments/hbase-2.0.2/conf/* /root/environments/apache-atlas-2.1.0/conf/hbase/ # 看不懂这操作

# 添加HBase配置文件路径
vi /root/environments/apache-atlas-2.1.0/conf/atlas-env.sh

export HBASE_CONF_DIR=/root/environments/hbase-2.0.2/conf

集成solr

cp  -r /root/environments/apache-atlas-2.1.0/conf/solr  /root/environments/solr-7.5.0/
cd /root/environments/solr-7.5.0/
mv solr/  atlas-solr
scp -r ./atlas-solr/  hadoop02:/root/environments/solr-7.5.0/
scp -r ./atlas-solr/  hadoop03:/root/environments/solr-7.5.0/


# 重启solr
./solr stop -force
./solr start -force

# 查看状态
./solr status
# 或者访问 http://localhost:8983/solr/ ，有cloud菜单说明集群成功

在solr中创建索引
./solr create -c vertex_index -d /root/environments/solr-7.5.0/atlas-solr/ -shards 3 -replicationFactor 2 -force
./solr create -c edge_index -d /root/environments/solr-7.5.0/atlas-solr/ -shards 3 -replicationFactor 2 -force
./solr create -c fulltext_index -d /root/environments/solr-7.5.0/atlas-solr/ -shards 3 -replicationFactor 2 -force

如果以上创建错误，可以使用命令“solr delete -c ${collection_name}”删除重新创建。

kafka相关操作

在kafka中创建相关topic
kafka-topics.sh --zookeeper hadoop01:2181,hadoop02:2181,hadoop03:2181 --create --replication-factor 3 --partitions 3 --topic _HOATLASOK
kafka-topics.sh --zookeeper hadoop01:2181,hadoop02:2181,hadoop03:2181 --create --replication-factor 3 --partitions 3 --topic ATLAS_ENTITIES
kafka-topics.sh --zookeeper hadoop01:2181,hadoop02:2181,hadoop03:2181 --create --replication-factor 3 --partitions 3 --topic ATLAS_HOOK

集成hive

# 将文件atlas-application.properties压缩进atlas下的hook/hive/hive-bridge-shim-2.1.0.jar包里
zip -u /root/environments/apache-atlas-2.1.0/hook/hive/hive-bridge-shim-2.1.0.jar  /root/environments/apache-atlas-2.1.0/conf/atlas-application.properties

# 然后将atlas的hook/hive/* 拷贝至所有节点安装的hive的lib目录下
cp  -r /root/environments/apache-atlas-2.1.0/hook/hive/* /root/environments/apache-hive-3.1.0/lib/
scp -r /root/environments/apache-atlas-2.1.0/hook/hive/* hadoop02:/root/environments/apache-hive-3.1.0/lib/
scp -r /root/environments/apache-atlas-2.1.0/hook/hive/* hadoop03:/root/environments/apache-hive-3.1.0/lib/
# 然后将atlas-application.properties拷贝至所有节点安装的hive的conf目录下，一行一行地运行，不要全部复制，会出问题！！！
cd  /root/environments/apache-atlas-2.1.0/conf/ # !!不要忘了进到这个目录
cp  ./atlas-application.properties /root/environments/apache-hive-3.1.0/conf/
scp ./atlas-application.properties hadoop02:/root/environments/apache-hive-3.1.0/conf/
scp ./atlas-application.properties hadoop03:/root/environments/apache-hive-3.1.0/conf/

hive相关配置

#3台机器均需要配置
cd /root/environments/apache-hive-3.1.0/conf/

#hive-env.sh中添加
export JAVA_HOME=/root/environments/jdk1.8.0_341
export HIVE_AUX_JARS_PATH=/root/environments/apache-hive-3.1.0/lib/

#hive-site.xml中添加：
<property>
      <name>hive.exec.post.hooks</name>
      <value>org.apache.atlas.hive.hook.HiveHook</value>
</property>

启动atlas

cd /root/environments/apache-atlas-2.1.0/bin
./atlas_start.py

说明：第一次启动atlas需要经过漫长的等待，即使显示启动完成了也需要等待一段时间才能访问atlas web ui
可以在/app/atlas/logs目录下进行日志的查看以及报错情况

启动完成后导入hive元数据

cd /root/environments/apache-atlas-2.1.0/bin
./import-hive.sh

导入hbase数据

/root/environments/apache-atlas-2.1.0/hook-bin/import-hbase.sh

----------------------恭喜------------------Error报错！！！！------------------------------------

org.apache.atlas.AtlasException: Failed to load application properties
at org.apache.atlas.ApplicationProperties.get(ApplicationProperties.java:147)
at org.apache.atlas.ApplicationProperties.get(ApplicationProperties.java:100)
at org.apache.atlas.hive.bridge.HiveMetaStoreBridge.main(HiveMetaStoreBridge.java:123)
Caused by: org.apache.commons.configuration.ConversionException: 
'atlas.graph.index.search.solr.wait-searcher' doesn't map to a List object: true, a java.lang.Boolean

解释： 这个问题主要是由于hbase使用的commons-configuration包是1.6的，而atlas使用的是1.10的，函数返回类型不一致起了冲突。

apache-atlas-2.1.0/hook/hbase/atlas-hbase-plugin-impl/commons-configuration-1.10.jar
hbase-2.0.2/lib/commons-configuration-1.6.jar

解决办法：

方法一： 在import-hbase.sh脚本中调整一下CP的加载顺序，将atlas调整在最前，这样根据jvm的类加载的最先机制，就可以优先使用atlas hive-hook中的版本，同时还不会影响hive自己的版本。
```
# 将import-hbase.sh中的ATLASCPPATH调整在最前
vi  /root/environments/apache-atlas-2.1.0/hook-bin/import-hbase.sh
```
将import-hbase.sh文件的 CP 变量改为如下
```
CP="${ATLASCPPATH}:${HIVE_CP}:${HADOOP_CP}"
```
不好意思，失败了！ 虽然这个异常解决了，但是又出现了新的异常，出现了NoClassDefFoundError: com/fasterxml/jackson/core/exc/InputCoercion 。后续还会出现很多依赖找不到。

方法二： 使用atlas的1.10包替换hbase自带的1.6包，操作步骤如下：

#删除hbase的commons-configuration-1.6,
#拷贝atlas下的1.10到hbase的lib下
cd /root/environments/hbase-2.0.2/lib 
rm -f commons-configuration-1.6.jar 
cp /root/environments/apache-atlas-2.1.0/hook/hbase/atlas-hbase-plugin-impl/commons-configuration-1.10.jar /root/environments/hbase-2.0.2/lib

注：这里解决办法只需要处理hadoop01机器，因为另外两个节点机器不需要执行这个导入，也没有安装atlas。

完成后就可查看正常的血缘关系了
http://hadoop01:21000

完结撒花！！！

二、Docker镜像启动

1. 加载镜像

# 进入到镜像文件路径，运行：
docker load -i mysql-5.7.tar # 加载hadoop01节点的镜像
docker load -i hadoop01-1.0.tar # 加载hadoop01节点的镜像
docker load -i hadoop02-1.0.tar # 加载hadoop02节点的镜像
docker load -i hadoop03-1.0.tar # 加载hadoop03节点的镜像

2. 创建容器

# 创建网络
docker network create -d bridge --subnet 192.168.0.0/24 --gateway 192.168.0.1 network_hadoop 
# 创建mysql容器
docker run -dit --name mysql5.7 -p 3306:3306 --hostname mysql57 --net network_hadoop --ip 192.168.0.2  -e MYSQL_ROOT_PASSWORD="123456" mysql:5.7 
# 创建节点容器
docker run -dit --name hadoop01 --privileged --hostname hadoop01 --net network_hadoop --ip 192.168.0.11 --add-host mysql57:192.168.0.1 --add-host hadoop02:192.168.0.12 --add-host hadoop03:192.168.0.13 -p 8042:8042 -p 8088:8088 -p 9870:9870 -p 9864:9864 -p 10002:10002 -p 16010:16010 -p 16000:16000 -p 8048:8048 -p 8983:8983 -p 21000:21000 -p 9868:9868 -p 10000:10000 -p 2181:2181 -p 9092:9092 hadoop01:1.0 /usr/sbin/init
docker run -dit --name hadoop02 --privileged --hostname hadoop02 --net network_hadoop --ip 192.168.0.12 --add-host mysql57:192.168.0.1 --add-host hadoop01:192.168.0.11 --add-host hadoop03:192.168.0.13 hadoop02:1.0 /usr/sbin/init
docker run -dit --name hadoop03 --privileged --hostname hadoop03 --net network_hadoop --ip 192.168.0.13 --add-host mysql57:192.168.0.1 --add-host hadoop01:192.168.0.11 --add-host hadoop02:192.168.0.12 hadoop03:1.0 /usr/sbin/init

3. 快速启动

注意：

hadoop01 & hadoop02 & hadoop03 中 & 指都要启动。

hadoop01 | hadoop02 | hadoop03 中 | 指启动任意一个或多个

hadoop01 ⊕ hadoop02 ⊕ hadoop03 中 ⊕ 指启动其中一个

（1）启动 Zookeeper hadoop01 & hadoop02 & hadoop03

zkServer.sh start # 启动zkServer，多台会自动集群，因此至少在两台机器启动

（2）启动 Hadoop hadoop01 ⊕ hadoop02

start-all.sh #启动hadoop集群，只需在集群主节点启动即可

（3）启动 Hive hadoop01 | hadoop02 | hadoop03

初始化hive元数据（首次安装hive或mysql才需要！！）

schematool -dbType mysql -initSchema # ，存mysql，一台机器运行就够了！！！！

启动hive元数据映射服务（后续启动只用开这个就行）

hive --service metastore & #后台启动单台机器hive元数据服务，一定要加 “&”
hiveserver2 & #启动hiveserver2，支持JDBC和WebUI

注：schematool -dbType mysql -initSchema 初始化hive元数据(首次启动才需要或者mysql被重置了) ! !

（4）启动 Hbase hadoop01 ⊕ hadoop02

 start-hbase.sh # 在哪个节点启动那个就成为HMaster节点执。
 # 本例中hadoop03是备用HMaster，启动后将有两个HMaster节点。如果从hadoop03启动，就只有一个HMaster。

（5）启动 Kafka hadoop01 & hadoop02 & hadoop03

kafka-server-start.sh -daemon /root/environments/kafka_2.12-2.0.0/config/server.properties

（6）启动 Solr hadoop01 & hadoop02 & hadoop03

/root/environments/solr-7.5.0/bin/solr start -force

（7）启动 Atlas hadoop01

/root/environments/apache-atlas-2.1.0/bin/atlas_start.py

（8）批量导入元数据（可选） hadoop01

# 导入hive元数据
/root/environments/apache-atlas-2.1.0/bin/import-hive.sh

# 导入hbase元数据
/root/environments/apache-atlas-2.1.0/hook-bin/import-hbase.sh

4. 访问端口

WEB UI	访问地址	作用
haddop: Node UI	8042
haddop: YARN UI	8088	yarn的管理界面，查看hadoop集群信息
haddop: HDFS NN UI	9870
haddop: DataNode UI	9864
hiveserver2: webui	10002
hbase	16010，16000	使用16010访问！
kafka eagle(未安装)	8048
sorl	8983
atlas	21000
SecondaryNameNode (高可用集群下未使用)	9868

Web Server	连接端口	作用
hdfs	9000
hiveserver2: server	10000	支持JDBC
zookeeper	2181
kafka	9092

注：

NN UI：访问时可能会重定向到ResourceManager处于活动状态的主机，想访问要么映射活动主机的端口；要么手动杀死活动主机的RM，使RM自动切换到本例映射端口的主机上 (推荐)，查询状态命令： yarn rmadmin -getAllServiceState。也可以使用命令hdfs haadmin -failover -forcefence -forceactive nn2 nn1切换，但是必须将dfs.ha.automatic-failover.enabled的配置改为false。
端口超链接主机名为docker，请通过docker machine的ip进行访问，或者在windows hosts文件中添加docker machine IP 到 ‘docker’ 的映射。

附录

1. 常用命令集合

（1）通过进程名称找到它所占用的端口：

# 法一，立即推不好用
netstat -anp | grep hadoop	# 查hadoop相关进程的端口号
#[root@hadoop01 /] netstat -anp | grep hadoop
#[root@hadoop01 /]# 	              #毛也没有查到

# 法二，先查进程ID，再根据进程ID查端口。大智慧啊~
ps -ef | grep hadoop	# 查出进程ID 2419  
# [root@hadoop01 /]ps -ef | grep hadoop
# root  2419  2405 11 18:22 pts/1  00:02:14 /root/hadoop/bin/...
netstat -anp | grep 2419  # 端口16000，16010
# [root@hadoop01 /]# netstat -anp | grep 2419
# tcp        0      0 192.168.0.11:16000    0.0.0.0:*               LISTEN      2419/java
# tcp        0      0 0.0.0.0:16010           0.0.0.0:*               LISTEN      2419/java

（2）通过端口找到占用它的进程名称：

netstat -anp | grep 3690            ----->查到进程名为svnserver

你可能感兴趣的:(docker)

Docker 入门教程（七）：容器数据卷千233 Docker（for科研er）docker java eureka
文章目录Docker入门教程（七）：容器数据卷一、为什么需要数据卷？二、三种挂载方式示例：MySQL数据持久化三、数据卷容器模式（旧式技术）Docker入门教程（七）：容器数据卷一、为什么需要数据卷？容器默认的写层具有两个关键缺点：不持久：容器一旦被删除，数据也随之丢失不可共享：每个容器的数据互相隔离为了解决这个问题，Docker提供了数据卷（Volume）机制，将数据从容器中解耦出来，形成独立、
AingDesk开源免费的本地 AI 模型管理工具(搭建和调用MCP) 没刮胡子 Linux服务器技术软件开发技术实战专栏人工智能AI 开源人工智能 AI助手 mcp sse 知识库智能体
说明AingDesk是一款开源免费的本地AI模型管理工具，旨在简化AI模型部署流程并提升用户体验。AingDesk支持本地AI模型及API+知识库搭建。支持知识库、模型API、分享、联网搜索、智能体。✨产品亮点跨平台支持客户端支持Windows、macOS，服务端可通过Docker部署高效下载与网络优化自动选择最优下载线路，支持断点续传，提升大模型部署速度兼容OpenAIAPI格式，方便第三方模型
【Docker基础】Docker容器管理：docker stats及其参数详解 IT成长日记容器技术深度解析与实践 docker 容器运维 docker stats
目录1Docker监控概述2dockerstats基本用法2.1基本命令格式2.2常用操作示例3dockerstats参数详解3.1常用参数说明3.2输出字段解析3.3格式化输出示例4dockerstats工作原理4.1监控数据采集流程4.2数据源解析5常见问题解答5.1为什么CPU使用率会超过100%？5.2内存统计中的cache/buffer包含在哪里？5.3如何监控已停止的容器？6总结1Do
容器化与微服务何遇mirror 服务器容器微服务
目录编辑第一节：容器化与微服务第二节：Docker与Kubernetes的介绍第三节：容器与传统虚拟化的对比第四节：微服务架构与虚拟化实际案例分析第一节：容器化与微服务容器化与微服务概述容器化是一种轻量级的虚拟化技术，它允许开发者将应用程序及其依赖项打包成一个可移植的容器。微服务架构则是一种将大型应用程序分解为小的、独立的服务的方法，这些服务可以独立部署、扩展和维护。容器化的优势轻量级：容器使用共
Docker 方式安装 Zabbix 7.0 LTS 支持版本运维阿峰 Zabbix docker zabbix 容器
文章目录1.介绍（1）zabbix官网可用的docker镜像（2）zabbix镜像常用的挂载点2.安装配置zabbixserver3.配置1.介绍（1）zabbix官网可用的docker镜像在DockerHub中可用的镜像：//zabbixagentzabbix/zabbix-agent//zabbixserverzabbix/zabbix-server-mysqlzabbix/zabbix-se
sentinel 自定义 dashboard 用户名密码运维阿峰 sentinel sentinel python 开发语言
默认情况下，sentineldashboard用户名密码为sentinel/sentinel，这里我使用重写镜像的方式：//定义Dockerfile$catDockerfile#基于现有SentinelDashboard镜像FROMbladex/sentinel-dashboard:1.8.4#重新定义ENTRYPOINT，确保参数顺序正确ENTRYPOINT["java","-Djava.sec
Bitnami Postgresql镜像和Docker官方镜像的区别 MyySophia GP(GreenPlum 大规模并行数据库)docker postgresql 容器
Docker官方PostgreSQL镜像不支持复制。如果您传递任何复制环境变量，这将被忽略。Docker官方镜像支持的唯一环境变量是POSTGRES_USER、POSTGRES_DB、POSTGRES_PASSWORD、POSTGRES_INITDB_ARGS、POSTGRES_INITDB_WALDIR和PGDATA。所有剩余的环境变量都特定于BitnamiPostgreSQL映像。Bitnam
【4.23号更新，docker可用镜像源】2025最新 Docker 国内可用镜像源仓库地址尤物程序猿 docker 容器运维
好久没用docker突然镜像源不能用了，好像是国外封了好多。今天从网上找了可以用的，装载于猫头虎分享：2025最新Docker国内可用镜像源仓库地址（01月01日更新）-腾讯云开发者社区-腾讯云源地址适用于linux系统对于Linux用户，需要手动修改Docker的配置文件来添加镜像源：使用编辑器打开配置文件/etc/docker/daemon.json（如果没有该文件，可以新建一个）。将以下内容
SmartSoftHelp NetCoreApi+MySQL/Oracle/SqlServer 部署Windows/Linux--深度优化版：SmartSoftHelp DeepCore XSuite SmartSoftHelp魔法精灵工作室优化安全科技 mysql oracle sqlserver
NetCoreAPI优势明显：SmartSofHelp菜单之Net9API智能微代码(SmartNetCoreAIDeep)NetCoreAPI与数据库组合在Linux/Windows部署的深度分析一、跨平台部署基础架构对比组合类型Linux部署方案Windows部署方案NetCoreAPI+MySQLDocker+MySQLDockerImageIIS+MySQLInstaller(MSI)Ne
Docker安装Mysql、配置文件挂载、修改Mysql编码武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
1.下载mysql镜像dockerpullmysql:5.72.查看镜像dockerimages3.启动mysql镜像#1.设置端口映射3306:3306、#2.设置文件挂载#3.设置mysql密码为“root”sudodockerrun-p3306:3306--namemysql\-v/mydata/mysql/mysql-files:/var/lib/mysql-files\-v/mydata
Docker-compose部署nacos集群及nginx实现负载均衡超级无敌约翰大王 nacos docker-compose docker 容器运维
目录一、环境二、部署过程1.docker和docker-compose部署2.拉取镜像3.创建网络4.创建目录5.启动数据库并导入sql6.启动7.配置nginx代理总结一、环境主机：centos7.9docker版本：24.0.6docker-compose版本：2.23.1nacos镜像版本：2.1.1数据库镜像版本：Mariadb10.5.16nginx镜像版本：1.24.0二、部署过程1.
ZooKeeper的使用和基于Curator的JavaAPI操作 Ruined_ofJoker java-zookeeper zookeeper 数据库
Docker下使用ZooKeeper在/usr/local/zookeeper目录下保存ZooKeeper数据与数据卷卷cd/usr/local&&mkdirzookeeper&&cdzookeepermkdirdata开始部署部署命令dockerrun-d-eTZ="Asia/Shanghai"-p2181:2181-v$PWD/data:/data--namezookeeper--restar
docker-compose部署nacos 青春不流名 docker 容器运维
1、docker-compose内容高版本的nacos使用docker启动，需要将所有的端口放开，仅仅开放8848端口，spring-boot客户端获取nacos配置的时候，可能取到的内容为空。version:'3'#定义自定义网络，确保服务间通信和外部访问networks:seata-network:driver:bridgeservices:mysql:image:mysql:8.0.33co
Docker 从入门到精通：运维工程师的容器化生存指南大模型大数据攻城狮运维 docker 容器 k8s 运维面试 dockerfile 虚拟化
目录第1章：Docker是什么？为什么它能改变运维的游戏规则？第2章：Docker安装与环境准备第3章：Docker常用命令入门第4章：Dockerfile的初探第5章：Docker网络的那些事儿第6章：数据持久化：让容器数据不“失忆”第7章：DockerCompose：多容器的“交响乐指挥家”第8章：进阶命令与运维技巧第9章：Docker与CI/CD：让部署快如闪电第10章：容器监控：让你的Do
【容器化技术 Docker 与微服务部署】详解架构学院 Java成神之路-架构师进阶 Java成神之路-JAVA入门 docker 微服务容器分布式中间件架构
容器化技术Docker与微服务部署无套路、关注即可领。持续更新中关注公众号：搜【架构研究站】回复：资料领取，即可获取全部面试题以及1000+份学习资料一、容器化技术概述（一）概念容器化技术是一种操作系统级别的虚拟化方法，它允许将应用程序及其依赖项（如运行时环境、系统工具、库等）打包成一个独立的、可移植的单元，这个单元就是容器。容器在运行时与宿主机共享操作系统内核，但又能在用户空间实现进程、网络、文
互联网大厂Java面试实战：严肃面试官与搞笑谢飞机的三轮提问 Fu Dun Yao Java场景面试宝典 Java 面试 JUC JVM 多线程线程池 HashMap
互联网大厂Java面试实战：严肃面试官与搞笑谢飞机的三轮提问本文通过一个面试故事，展示了互联网大厂Java求职者与严肃面试官的对话。面试官就Java核心技术、JUC、JVM、多线程、线程池、HashMap、ArrayList、Spring及相关框架、分布式技术、消息队列、中间件、数据库、Linux、Docker、设计模式及DDD等多个技术点，分三轮提问。求职者谢飞机偶尔能准确回答简单问题获得认可，
一招搞定自动化！手把手教你用Docker部署n8n工作流神器
摘要本文详解如何通过两条Docker命令快速搭建n8n自动化工作流平台，揭秘数据持久化的关键配置，助你轻松实现跨平台自动化操作，文末附赠实践小贴士。命令全解析1.数据存储奠基者dockervolumecreaten8n_data创建名为n8n_data的持久化存储卷用于保存工作流配置、密钥等关键数据️避免容器销毁时数据丢失（重要安全措施）2.容器启动魔法师dockerrun-it--rm--nam
关于docker的一些实践
{"registry-mirrors":["https://docker.registry.cyou","https://docker-cf.registry.cyou","https://dockercf.jsdelivr.fyi","https://docker.jsdelivr.fyi","https://dockertest.jsdelivr.fyi","https://mirror.al
【通过pip安装 Open-WebUI 快速使用入门】慕慕涵雪月光白 llama 代理模式
OpenWebUI是一个可扩展、功能丰富且用户友好的自托管AI平台，旨在完全离线操作。它支持各种LLM运行器，如Ollama和OpenAI兼容的API，内置RAG推理引擎，使其成为强大的AI部署解决方案。使用Docker快速入门如果Ollama在您的计算机上，请使用以下命令：dockerrun-d-p3000:8080--add-host=host.docker.internal:host-gat
【docker】离线部署docker-compose
简介记录一下安装docker-compose的步骤，首先表示安装的系统是centos，docker已经安装好了，本文采用的是离线安装的方式。网上使用的在线安装由于github网络时好时坏，所以只能采用离线安装的方式。参考文档。步骤1.进入到官网官网的链接是https://github.com/docker/compose/releases/tag/v2.18.1。注意这里的是2.18.1版本，可以
docker 命令 X1A0RAN docker 容器
镜像#1.查看镜像#列出所有本地镜像：dockerimages#列出详细信息：dockerimages--digests#查看特定镜像的详细信息：dockerinspect#2.拉取镜像#从DockerHub或其他注册中心拉取镜像：#dockerpull:#3.构建镜像#从Dockerfile构建镜像：dockerbuild-t:.#4.删除镜像#删除特定镜像：dockerrmi#强制删除镜像（如
nvidia-container-runtime离线包安装说明：快速部署NVIDIA容器环境盛罡城Rachel
nvidia-container-runtime离线包安装说明：快速部署NVIDIA容器环境【下载地址】nvidia-container-runtime离线包安装说明此项目为无网络环境下的用户提供了nvidia-container-runtime的离线安装包，极大简化了安装流程。通过简单的解压缩和rpm包安装，用户可以快速完成环境配置。安装完成后，仅需重启Docker容器即可生效。项目特别适合网络
docker网络_docker之间的网络协议 2401_89224733 网络 docker 网络协议
一、docker网络模式docker0网络docker容器的虚拟网关loopback:回环网卡、TCP/IP网卡virtualbridge:linux自身继承了一个虚拟化功能(kvm架构)，是原生架构的一个虚拟化平台，安装了一个虚拟化平台之后就会系统就会自动安装虚拟网卡。安装workstation(虚拟化平台)之后，会在网络适配器中会多出VMnet1VMnet8VMnet0)docker0:容器的
如何在 Manjaro Linux 上安装 Docker 容器
在ManjaroLinux上通过DockerHub安装、创建和运行Docker容器的简单步骤，以便在虚拟环境中使用各种应用程序。使用虚拟机有其自身的优势，它能够更好地利用硬件资源，节省成本和空间。然而，在传统虚拟机上运行每一个应用程序不仅耗时，还需要更多的资源。为了解决这一问题，Docker应运而生。它使我们能够在名为容器的虚拟化环境中即时运行应用程序。这些容器可以相互构建并相互通信……例如，这些
docker-compose配置文件解析疯狂吧小飞牛 docker 容器运维
原文地址：docker-compose配置文件解析–无敌牛欢迎参观我的个人博客：无敌牛–技术/著作/典籍/分享等我们在把服务docker化的时候，不仅需要把各个服务做成docker镜像，还需要编辑各个服务之间的启动方式。对于不需要暴露的端口，还需要通过虚拟网桥的方式，保证各个服务之间的正常通讯。这就需要用到docker-compose工具，并且需要编辑对应的DockerCompose配置文件来控制
Windows Server 2019 安装 Docker 完整指南 z日火 docker windows docker 容器
博主本人使用的是离线安装1.安装前准备系统要求操作系统：WindowsServer2019（或2016/2022）权限：管理员权限的PowerShell网络：可访问互联网（或离线安装包）启用容器功能Install-WindowsFeature-NameContainers如果提示需要重启，但Restart-Computer-Force失败，请手动重启服务器。2.安装Docker方法1：在线安装（推
【攻防篇】解决：阿里云docker 容器中自动启动xmrig挖矿-- 实战 ladymorgana 日常工作总结 docker 挖矿实战
文章目录场景一、问题二、原因三、解决方案1、控制台处理2、[清除与防护](https://blog.csdn.net/ladymorgana/article/details/148921668?spm=1001.2014.3001.5501)1.紧急处理：停止挖矿进程2.清理被感染的容器3.防护措施：防止再次被入侵4.排查入侵来源四、实战Step1：检查服务器是否被植入挖矿程序Step2：删除被感
使用 Docker 部署 MySQL 8
使用Docker部署MySQL8详细指南MySQL是一个广泛使用的开源关系型数据库管理系统。通过Docker部署MySQL8可以快速搭建一个可移植、可扩展的数据库环境。本文将详细介绍如何使用Docker部署MySQL8，并讲解如何根据需求配置MySQL。从拉取镜像开始的详细步骤1.拉取MySQL8镜像首先，从DockerHub拉取MySQL8的官方镜像。dockerpullmysql:8.0mys
Docker+Portainer 离线安装 qq_30024063 docker 容器运维
1.Docker安装步骤一：官网下载docker安装包步骤二：解压安装包;tar-zxvfdocker-24.0.6.tgz步骤三：将解压之后的docker文件移到/usr/bin目录下;cpdocker/*/usr/bin/步骤四：将docker注册成系统服务;vim/etc/systemd/system/docker.service然后在文件中添加以下内容，退出并保存（:wq!）[Unit]D
如何用Docker部署Mysql 小楠小楠小楠 docker mysql 容器
1.安装Docker确保已安装Docker，并启动Docker服务。Linux：bash复制sudoaptupdatesudoaptinstalldocker.iosudosystemctlstartdockersudosystemctlenabledocker2.拉取MySQL镜像从DockerHub拉取官方MySQL镜像。bash复制dockerpullmysql:latest3.启动MySQ
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =