白猫与下午茶

1.Hadoop3.x 环境搭建

文章目录

Hadoop3.x 环境搭建
- 流程一 : 虚拟机软件安装
- 流程二 : 模板虚拟机系统硬件配置
- 流程三 : 模板虚拟机系统软件配置
- 流程四 : 模板虚拟机系统网络配置
- 流程五 : 模板虚拟机与主机互传配置
- 流程六 : 模板虚拟机所需环境配置
- 流程七 : 模板虚拟机克隆集群配置
- 流程八 : 集群虚拟机安装软件配置
- 流程九 : 集群虚拟机安装软件分发
- 流程十 : 集群虚拟机分发脚本配置
- 流程十一 : 集群虚拟机ssh免密登录配置
- 流程十二 : 三台主机的集群配置
- 流程十三 : 群起集群
- 流程十四 : 集群程序历史服务器配置
- 流程十五 : 集群日志聚集功能配置
- 流程十六 : 集群常用脚本编写
- 流程十七 : 集群时间同步配置
- 流程十八 : HDFS API 环境配置
- 流程十九 : MapReduce WordCount 环境配置

Hadoop3.x 环境搭建

流程一 : 虚拟机软件安装

1.模板虚拟机软件及版本:
- VMware Workstation15.5
2.模板虚拟机获取地址:
- 官网下载地址：https://customerconnect.vmware.com/cn/downloads/info/slug/desktop_end_user_computing/vmware_workstation_pro/15_0
3.模板虚拟机安装步骤:

流程二 : 模板虚拟机系统硬件配置

1.模板虚拟机系统及版本
- CentOS7.5
2.模板虚拟机系统获取地址
- 网盘链接：https://pan.baidu.com/s/1XbUuY7L2krWFpM9sCzj31A?pwd=voj8
- 提取码：voj8
3.模板虚拟机系统硬件配置步骤
- 拍摄快照的目的是为了防止我们在操作时出现失误而能够让系统返回到之前的状态而让我们有机会进行重新操作

流程三 : 模板虚拟机系统软件配置

1.模板虚拟机系统及版本
- CentOS7.5
2.模板虚拟机系统软件配置步骤

流程四 : 模板虚拟机系统网络配置

1.模板虚拟机系统及版本
- CentOS7.5

2.模板虚拟机系统网络配置步骤

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

流程五 : 模板虚拟机与主机互传配置

1.互传所需软件及版本
- Xshell 7 一一主要负责连接主机和虚拟机
- Xftp 7 一一主要负责主机和虚拟机的文件互传
2.模板虚拟机与主机互传思路
- 安装 Xshell7 连接虚拟机,通过 Xftp7 将本地文件发送到虚拟机上 (先连上 Xshell7, 然后才能用Xftp7 发文件)
3.互传所需软件下载地址
- 官网免费申请: https://www.xshell.com/zh/free-for-home-school/
  
  注意 : 可能需要挂VPN,不然的话可能会提示响应时间过长，用是绝对能用的。
4.互传所需软件安装步骤
- 3.1 安装 Xshell 7
图片/Hadoop3.x 环境搭建45.png
- 3.2 安装 Xftp7
4.xshell连接到模板虚拟机步骤

注意: 当我们需要用Xshell7从主机连接到虚拟机时, 虚拟机必须是启动的, 不然任凭怎么连接都不会连通.
5.xftp7连接到模板虚拟机步骤

流程六 : 模板虚拟机所需环境配置

1.模板虚拟机系统及版本
- CentOS7.5

2.模板虚拟机所需环境配置步骤

① 使用ping命令测试下虚拟机联网情况,如下图所示为网络连接正常

[atguigu@hadoop100 ~]$ su
密码：
[root@hadoop100 atguigu]# cd
[root@hadoop100 ~]# ping www.baidu.com

② 安装epel-release(相当于是安装了一个软件仓库，因为大多数rpm包都不在官方repository中)
```
[root@hadoop100 ~]# yum install -y epel-release
```

③ 关闭防火墙，并设置关闭防火墙选项开机自启

[root@hadoop100 ~]# systemctl stop firewalld
[root@hadoop100 ~]# systemctl disable firewalld.service

④ 给 atguigu 用户赋予 root 权限 (方便后期加 sudo 执行 root 权限的命令)

[root@hadoop100 ~]# vim /etc/sudoers
------------------------------------------

atguigu ALL=(ALL)       NOPASSWD:ALL

------------------------------------------
:wq!

⑤ 在 /opt 目录下创建文件夹，并修改所属主和所属组

[root@hadoop100 ~]# mkdir /opt/module
[root@hadoop100 ~]# mkdir /opt/software
[root@hadoop100 ~]# chown atguigu:atguigu /opt/module
[root@hadoop100 ~]# chown atguigu:atguigu /opt/software

⑥ 卸载虚拟机自带的 JDK

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

⑦ 重启虚拟机
```
[root@hadoop100 ~]# reboot
```

流程七 : 模板虚拟机克隆集群配置

1.模板虚拟机系统及版本
- CentOS7.5
2.模板虚拟机克隆集群配置步骤

重复上述 1~11 步从模板机hadoop100中克隆出集群组机hadoop103、hadoop104

重复上述 15~18 步完成集群hadoop103、hadoop104组机的配置

流程八 : 集群虚拟机安装软件配置

1.集群虚拟机安装的软件
- JDK1.8
- Hadoop3.1.3
2.软件安装包获取地址
- 链接：https://pan.baidu.com/s/1-0gMqKEOibTqILCizHDt0w?pwd=zt5m
- 提取码：zt5m
3.软件安装的集群虚拟机
- hadoop102

4.集群虚拟机安装软件配置步骤

① 使用Xshell将hadoop安装包,jdk安装包传入到/opt/software路径下

② 安装jdk及其配置

[atguigu@hadoop102 ~]$ cd /opt/software/
[atguigu@hadoop102 software]$ll
[atguigu@hadoop102 software]$ tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/         --解压 JDK 到/opt/module 目录下
[atguigu@hadoop102 ~]$ sudo vim /etc/profile.d/my_env.sh            --配置 JDK 环境变量     
添加如下内容:
------------------------------------------
#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin
------------------------------------------
[atguigu@hadoop102 ~]$ source /etc/profile              --让新的环境变量 PATH 生效
[atguigu@hadoop102 ~]$ java -version                    --测试 JDK 是否安装成功

③ 安装hadoop及其配置

[atguigu@hadoop102 ~]$ cd /opt/software/
[atguigu@hadoop102 software]$ll
[atguigu@hadoop102 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/
[atguigu@hadoop102 software]$ ls /opt/module/hadoop-3.1.3     --查看解压是否成功
[atguigu@hadoop102 hadoop-3.1.3]$ sudo vim /etc/profile.d/my_env.sh
添加追加如下内容:
------------------------------------------
#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
------------------------------------------
[atguigu@hadoop102 hadoop-3.1.3]$ source /etc/profile
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop version

流程九 : 集群虚拟机安装软件分发

1.集群虚拟机需要分发的软件
- JDK1.8
- Hadoop3.1.3
2.集群虚拟机分发软件的思路
- 使用命令将配置好的软件JDK和Hadoop从hadoop102主机通过拷贝命令分发到hadoop103主机和hadoop104主机
  
  注意 : scp 命令可以实现服务器与服务器之间的数据拷贝.
3.集群虚拟机分发软件的步骤
- ① 在102主机上通过scp命令将102主机上的JDK拷贝到103主机指定位置.
```
[atguigu@hadoop102 ~]$ scp -r /opt/module/jdk1.8.0_212 atguigu@hadoop103:/opt/module
[atguigu@hadoop102 ~]$
```
  传输时有两个操作需要进行(第②③步操作时同理):
  - 1.“Are you sure you want to continue connecting (yes/no)?” 输入yes即可
  - 2."atguigu@hadoop103’s password: " 输入103主机的登录密码即可
- ② 在103主机上通过scp命令将102主机上的hadoop拷贝到103主机指定位置.
```
[atguigu@hadoop103 ~]$ scp -r atguigu@hadoop102:/opt/module/hadoop-3.1.3 /opt/module/
[atguigu@hadoop103 ~]$
```

③ 在103主机上通过scp命令将102主机上的JDK和hadoop拷贝到104主机指定位置.

  [atguigu@hadoop103 ~]$ cd /opt/
  [atguigu@hadoop103 opt]$ scp -r atguigu@hadoop102:/opt/module/* atguigu@hadoop104:/opt/module
  [atguigu@hadoop103 opt]$

流程十 : 集群虚拟机分发脚本配置

1.集群虚拟机分发脚本的作用
- 比如在hadoop102主机配置完的文件就不用再重复的在hadoop103和hadoop104主机上再去配一次, 而是通过脚本分发到hadoop103和hadoop104主机即可.

2.配置虚拟机分发脚本的步骤

① 在/home/atguigu/bin 目录下创建 xsync 文件

[atguigu@hadoop102 opt]$ cd /home/atguigu
[atguigu@hadoop102 ~]$ mkdir bin
[atguigu@hadoop102 ~]$ cd bin
[atguigu@hadoop102 bin]$ vim xsync

② 在xsync文件中插入如下内容

#!/bin/bash


#1. 判断参数个数
if [ $# -lt 1 ]
then
	echo Not Enough Arguement!
	exit;
fi


#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
do
	echo ==================== $host ====================
	#3. 遍历所有目录，挨个发送
	
	for file in $@
	do
		#4. 判断文件是否存在
		if [ -e $file ]
			then
				#5. 获取父目录
				pdir=$(cd -P $(dirname $file); pwd)


				#6. 获取当前文件的名称
				fname=$(basename $file)
				ssh $host "mkdir -p $pdir"
				rsync -av $pdir/$fname $host:$pdir
			else
				echo $file does not exists!
		fi
	done
done

③ 修改脚本 xsync 具有完全权限

[atguigu@hadoop102 bin]$ chmod 777 xsync

④ 测试脚本

[atguigu@hadoop102 ~]$ xsync /home/atguigu/bin

⑤ 将脚本复制到/bin中，以便全局调用
```
[atguigu@hadoop102 bin]$ sudo cp xsync /bin/
```

⑥ 同步环境变量配置（root 所有者）并检查是否生效

[atguigu@hadoop102 ~]$ sudo ./bin/xsync /etc/profile.d/my_env.sh
[atguigu@hadoop103 bin]$ sudo vim /etc/profile.d/my_env.sh
[atguigu@hadoop104 bin]$ sudo vim /etc/profile.d/my_env.sh

⑦ 环境变量生效
```
[atguigu@hadoop103 bin]$ source /etc/profile
[atguigu@hadoop103 bin]$ java
[atguigu@hadoop104 bin]$ source /etc/profile
[atguigu@hadoop104 bin]$ java
```
注意1 : xsync 集群分发脚本用来实现循环复制文件到所有节点的相同目录下.

注意2 : 改文件名称命令 mv+旧名+新名

注意3 : 如果用了 sudo，那么 xsync 一定要给它的路径补全.

流程十一 : 集群虚拟机ssh免密登录配置

1.集群虚拟机ssh免密登录的作用
- 因为集群分发文件或是互传数据的频率比较高, 而每次都要输入密码进行验证就较为繁琐, 所以干脆直接设置一个集群中的虚拟机互相之间都免密登录, 免去繁琐验证的步骤.

2.配置集群虚拟机ssh免密登录的步骤

(这里只以102主机普通用户免密登录到103、104主机为例.如果想在103,104主机上实现对其他两个主机的免密登录,重复下述操作即可)

(atguigu用户配置了ssh免密登录,但是当我们切换到root用户想要用ssh登录其他两台主机时则还是需要输入密码,因为root用户没有
配置ssh免密登录,登录到root用户按上述步骤配置一遍即可(root用户输入的密码应为root).)

配置:
[atguigu@hadoop102 ~]$ ls -la
[atguigu@hadoop102 ~]$ cd ./.ssh/
[atguigu@hadoop102 .ssh]$ cat known_hosts
[atguigu@hadoop102 .ssh]$ ssh-keygen -t rsa(三次enter回车即可)
[atguigu@hadoop102 .ssh]$ ll
[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop102
[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop103
[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop104
验证:
[atguigu@hadoop102 .ssh]$ ssh hadoop102
[atguigu@hadoop102 .ssh]$ ssh hadoop103
[atguigu@hadoop102 .ssh]$ ssh hadoop104

注意1 : 密钥对(ssh-key-gen)即公钥和私钥,私钥保存,发送公钥,其他服务器得到公钥授权后不用密码验证登录则可以访问我们的服务器数据.

注意2 : id_rsa（私钥）、id_rsa.pub（公钥）

流程十二 : 三台主机的集群配置

1.三台主机的集群配置的作用
- 因为现在三台主机还没有配置集群相关的文件, 而只是三台独立的虚拟机, 我们接下来把相关的配置文件配了就将三台主机联系成了一个真正的集群.

2.三台主机的集群配置的步骤

① 在102主机上配置核心配置文件 core-site.xml

[atguigu@hadoop102 ~]$ cd $HADOOP_HOME/etc/hadoop
[atguigu@hadoop102 hadoop]$ vim core-site.xml
插入内容如下：
------------------------------------------
<configuration>
    
    <property>
        <name>fs.defaultFSname>
        <value>hdfs://hadoop102:8020value>
    property>


    
    <property>
        <name>hadoop.tmp.dirname>
        <value>/opt/module/hadoop-3.1.3/datavalue>
    property>


    
    <property>
        <name>hadoop.http.staticuser.username>
        <value>atguiguvalue>
    property>
configuration>
------------------------------------------
:wq

注意 : 是插入到中.

② 在102主机上配置HDFS配置文件 hdfs-site.xml

[atguigu@hadoop102 ~]$ cd $HADOOP_HOME/etc/hadoop
[atguigu@hadoop102 hadoop]$ vim hdfs-site.xml
插入内容如下：
------------------------------------------
<configuration>
	
	<property>
        <name>dfs.namenode.http-addressname>
        <value>hadoop102:9870value>
    property>
	
    <property>
        <name>dfs.namenode.secondary.http-addressname>
        <value>hadoop104:9868value>
    property>
configuration>
------------------------------------------
:wq

③ 在102主机上配置YARN配置文件 yarn-site.xml

[atguigu@hadoop102 ~]$ cd $HADOOP_HOME/etc/hadoop
[atguigu@hadoop102 hadoop]$ vim yarn-site.xml
插入内容如下：
------------------------------------------
<configuration>
    
    <property>
        <name>yarn.nodemanager.aux-servicesname>
        <value>mapreduce_shufflevalue>
    property>


    
    <property>
        <name>yarn.resourcemanager.hostnamename>
        <value>hadoop103value>
    property>


    
    <property>
        <name>yarn.nodemanager.env-whitelistname>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOMEvalue>
    property>
configuration>
------------------------------------------
:wq

④ 在102主机上配置MapReduce配置文件 mapred-site.xml

[atguigu@hadoop102 ~]$ cd $HADOOP_HOME/etc/hadoop
[atguigu@hadoop102 hadoop]$ vim mapred-site.xml
插入内容如下：
------------------------------------------
<configuration>
	
    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>
configuration>
------------------------------------------
:wq

⑤ 在102主机上分发配置好的Hadoop配置文件给103,104主机并查看情况

[atguigu@hadoop102 hadoop]$ xsync /opt/module/hadoop-3.1.3/etc/hadoop/
[atguigu@hadoop103 ~]$ cat /opt/module/hadoop-3.1.3/etc/hadoop/core-site.xml
[atguigu@hadoop104 ~]$ cat /opt/module/hadoop-3.1.3/etc/hadoop/core-site.xml

流程十三 : 群起集群

1.群起集群需要启动的组件
- NameNode
- HDFS
- YARN

2.群起集群的步骤

① 在102主机上配置 workers文件

[atguigu@hadoop102 hadoop]$ vim /opt/module/hadoop-3.1.3/etc/hadoop/workers
删除localhost后插入如下内容:
------------------------------------------
hadoop102
hadoop103
hadoop104
------------------------------------------
:wq
[atguigu@hadoop102 hadoop]$ xsync /opt/module/hadoop-3.1.3/etc

② 在102主机上格式化NameNode(第一次启动时用)

[atguigu@hadoop102 hadoop]$ cd /opt/module/hadoop-3.1.3/
[atguigu@hadoop102 hadoop-3.1.3]$ hdfs namenode -format
[atguigu@hadoop102 current]$ pwd
/opt/module/hadoop-3.1.3/data/dfs/name/current


[atguigu@hadoop102 current]$ ll
总用量 16
-rw-rw-r--. 1 atguigu atguigu 394 5月  13 21:55 fsimage_0000000000000000000
-rw-rw-r--. 1 atguigu atguigu  62 5月  13 21:55 fsimage_0000000000000000000.md5
-rw-rw-r--. 1 atguigu atguigu   2 5月  13 21:55 seen_txid
-rw-rw-r--. 1 atguigu atguigu 219 5月  13 21:55 VERSION


[atguigu@hadoop102 current]$ cat VERSION 
#Fri May 13 21:55:43 CST 2022
namespaceID=2071359521
clusterID=CID-8808cb0b-a47c-405b-95f9-d26408372a72
cTime=1652450143404
storageType=NAME_NODE
blockpoolID=BP-1330503042-192.168.10.102-1652450143404
layoutVersion=-64

注意1 : 格式化NameNode，会产生新的集群id，导致NameNode和DataNode的集群id不一致，集群找不到已往数据。如果集群在运行过程中报错，需要重新格式化NameNode的话，一定要先停止namenode和datanode进程，并且要删除所有机器的data和logs目录，然后再进行格式化.

③ 在102主机上启动HDFS

[atguigu@hadoop102 sbin]$ pwd
/opt/module/hadoop-3.1.3/sbin


[atguigu@hadoop102 hadoop-3.1.3]$ sbin/start-dfs.sh
Starting namenodes on [hadoop102]
Starting datanodes
hadoop104: WARNING: /opt/module/hadoop-3.1.3/logs does not exist. Creating.
hadoop103: WARNING: /opt/module/hadoop-3.1.3/logs does not exist. Creating.
Starting secondary namenodes [hadoop104]


[atguigu@hadoop102 hadoop-3.1.3]$ jps
8709 Jps
8281 NameNode
8412 DataNode


[atguigu@hadoop103 ~]$ jps
8064 DataNode
8171 Jps


[atguigu@hadoop104 ~]$ jps
8150 SecondaryNameNode
8279 Jps
8078 DataNode

注意 : 登录Web端查看HDFS的NameNode: http://hadoop102:9870/explorer.html#/

④ 在103主机上启动YARN

[atguigu@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh
Starting resourcemanager
Starting nodemanagers


[atguigu@hadoop103 hadoop-3.1.3]$ jps
8064 DataNode
8321 ResourceManager
8801 Jps
8442 NodeManager


[atguigu@hadoop102 hadoop-3.1.3]$ jps
8930 Jps
8281 NameNode
8412 DataNode
8813 NodeManager


[atguigu@hadoop104 ~]$ jps
8501 Jps
8150 SecondaryNameNode
8377 NodeManager
8078 DataNode

注意 : 登录Web端查看YARN的ResourceManager: http://hadoop103:8088/cluster

流程十四 : 集群程序历史服务器配置

1.配置历史服务器的作用
- 为了查看程序的历史运行情况，需要在102主机上配置一下历史服务器。

2.配置历史服务器的步骤

[atguigu@hadoop102 hadoop]$ pwd       查看当前命令执行路径
/opt/module/hadoop-3.1.3/etc/hadoop


[atguigu@hadoop102 hadoop]$ vim mapred-site.xml  配置mapred-site.xml
插入内容如下：
------------------------------------------
    
    <property>
        <name>mapreduce.jobhistory.addressname>
        <value>hadoop102:10020value>
    property>
    
    
    <property>
        <name>mapreduce.jobhistory.webapp.addressname>
        <value>hadoop102:19888value>
    property>
------------------------------------------
:wq


[atguigu@hadoop102 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml    分发配置
...
[atguigu@hadoop102 hadoop]$ mapred --daemon start historyserver   在hadoop102启动历史服务器
[atguigu@hadoop102 hadoop]$ jps  查看历史服务器是否启动
3332 Jps
2534 NodeManager
3270 JobHistoryServer
2059 NameNode
2188 DataNode

注意1 : 登录Web端查看JobHistory http://hadoop102:19888/jobhistory

流程十五 : 集群日志聚集功能配置

1.日志聚集概念的解释
- 日志聚集 : 应用运行完成以后，将程序运行日志信息上传到HDFS系统上
2.配置日志聚集功能的作用
- 可以方便的查看到程序运行详情，方便开发调试,需要我们在hadoop102主机上进行配置.

3.配置日志聚集功能的步骤

[atguigu@hadoop102 hadoop]$ pwd      查看当前命令执行路径
/opt/module/hadoop-3.1.3/etc/hadoop


[atguigu@hadoop102 hadoop]$ vim yarn-site.xml   配置yarn-site.xml
插入内容如下：
------------------------------------------
    
    <property>
        <name>yarn.log-aggregation-enablename>
        <value>truevalue>
    property>
    
    <property>  
        <name>yarn.log.server.urlname>  
        <value>http://hadoop102:19888/jobhistory/logsvalue>
    property>
    
    <property>
        <name>yarn.log-aggregation.retain-secondsname>
        <value>604800value>
    property>
------------------------------------------
:wq
[atguigu@hadoop102 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/yarn-site.xml    分发配置
...
[atguigu@hadoop104 hadoop]$ cd /opt/module/hadoop-3.1.3/
[atguigu@hadoop102 hadoop-3.1.3]$ mapred --daemon stop historyserver    单节点停止一个进程
[atguigu@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
[atguigu@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh
[atguigu@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver 单节点开启一个进程
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /output2

注意 : 登录Web端查看日志: http://hadoop102:19888/jobhistory

流程十六 : 集群常用脚本编写

① 编写Hadoop集群启停脚本

[atguigu@hadoop102 ~]$ cd /home/atguigu/bin
[atguigu@hadoop102 bin]$ vim myhadoop.sh
插入内容如下：
------------------------------------------
#!/bin/bash


if [ $# -lt 1 ]
then
    echo "No Args Input..."
    exit ;
fi


case $1 in
"start")
        echo " =================== 启动 hadoop集群 ==================="


        echo " --------------- 启动 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/sbin/start-dfs.sh"
        echo " --------------- 启动 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop-3.1.3/sbin/start-yarn.sh"
        echo " --------------- 启动 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/bin/mapred --daemon start historyserver"
;;
"stop")
        echo " =================== 关闭 hadoop集群 ==================="


        echo " --------------- 关闭 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/bin/mapred --daemon stop historyserver"
        echo " --------------- 关闭 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop-3.1.3/sbin/stop-yarn.sh"
        echo " --------------- 关闭 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/sbin/stop-dfs.sh"
;;
*)
    echo "Input Args Error..."
;;
esac
------------------------------------------
:wq


[atguigu@hadoop102 bin]$ chmod 777 myhadoop.sh      赋予脚本执行权限

[atguigu@hadoop102 bin]$ myhadoop.sh stop
[atguigu@hadoop102 bin]$ jps
[atguigu@hadoop103 hadoop-3.1.3]$ jps
[atguigu@hadoop104 hadoop-3.1.3]$ jps

[atguigu@hadoop102 bin]$ myhadoop.sh start
[atguigu@hadoop102 bin]$ jps
[atguigu@hadoop103 hadoop-3.1.3]$ jps
[atguigu@hadoop104 hadoop-3.1.3]$ jps

② 查看所有主机的jps运行情况脚本

[atguigu@hadoop102 ~]$ cd /home/atguigu/bin
[atguigu@hadoop102 bin]$ vim jpsall
插入内容如下：
------------------------------------------
#!/bin/bash


for host in hadoop102 hadoop103 hadoop104
do
        echo =============== $host ===============
        ssh $host jps 
done
------------------------------------------
:wq
[atguigu@hadoop102 bin]$ chmod 777 jpsall     赋予脚本执行权限
[atguigu@hadoop102 bin]$ jpsall
[atguigu@hadoop102 ~]$ xsync /home/atguigu/bin/      分发/home/atguigu/bin目录，保证自定义脚本在三台机器上都可以使用

流程十七 : 集群时间同步配置

1.集群时间同步作用图解

2.集群时间同步配置的步骤

[atguigu@hadoop102 ~]$ su                            时间服务器配必须用root用户
[root@hadoop102 atguigu]# systemctl status ntpd      查看所有节点ntpd服务状态
[root@hadoop102 atguigu]# systemctl start ntpd       开启ntpd服务
[root@hadoop102 atguigu]# systemctl is-enabled ntpd  设置ntpd服务开机自启动
disabled


[root@hadoop102 atguigu]# vim /etc/ntp.conf          修改102主机的ntp.conf配置文件
修改内容如下:
------------------------------------------
 17 restrict 192.168.10.0 mask 255.255.255.0 nomodify notrap


 21 # server 0.centos.pool.ntp.org iburst
 22 # server 1.centos.pool.ntp.org iburst
 23 # server 2.centos.pool.ntp.org iburst
 24 # server 3.centos.pool.ntp.org iburst


 60 server 127.127.1.0
 61 fudge 127.127.1.0 stratum 10
------------------------------------------
:set number
:wq


[root@hadoop102 atguigu]# vim /etc/sysconfig/ntpd
插入内容如下:
------------------------------------------
SYNC_HWCLOCK=yes         让硬件时间与系统时间一起同步
------------------------------------------
:wq
[root@hadoop102 atguigu]# systemctl start ntpd           重新启动ntpd服务
[root@hadoop102 atguigu]# systemctl enable ntpd          设置ntpd服务开机启动
Created symlink from /etc/systemd/system/multi-user.target.wants/ntpd.service to /usr/lib/systemd/system/ntpd.service.


[atguigu@hadoop103 ~]$ sudo systemctl stop ntpd
[atguigu@hadoop103 ~]$ sudo systemctl disable ntpd
[atguigu@hadoop104 ~]$ sudo systemctl stop ntpd
[atguigu@hadoop104 ~]$ sudo systemctl disable ntpd        关闭所有节点上ntp服务和自启动


[atguigu@hadoop103 ~]$ sudo crontab -e                    配置1分钟与时间服务器(102主机)同步一次
编写定时任务如下：如下:
------------------------------------------
*/1 * * * * /usr/sbin/ntpdate hadoop102
------------------------------------------
:wq


[atguigu@hadoop103 ~]$ sudo date -s "2021-9-11 11:11:11"   修改103主机时间
[atguigu@hadoop103 ~]$ date
2021年 09月 11日 星期六 11:11:25 CST


[atguigu@hadoop103 ~]$ sudo date 		1分钟后查看机器是否与时间服务器同步

流程十八 : HDFS API 环境配置

1.拷贝hadoop-3.1.0到非中文路径（比如E:\hadoops\software\hadoop-3.1.0）
- 链接：https://pan.baidu.com/s/1wjvVQpMdlcSDkB-Wr-zCXQ?pwd=s9q2
- 提取码：s9q2
2.配置HADOOP_HOME环境变量
3.将HADOOP_HOME添加到Path变量中

注意 : 如果环境变量不起作用，可以重启电脑尝试。
4.验证Hadoop环境变量是否正常

注意 : 双击后有一个窗口一闪而过即表示Hadoop环境变量配置正常, 但是如果报如下错误则说明缺少微软运行库（正版系统往往有这个问题）下载对应的微软运行库安装包双击安装即可。

微软运行库安装包:

链接：https://pan.baidu.com/s/173mAjgX8NkbB5vMVgR_VWg?pwd=sx4k
提取码：sx4k
5.在 IDEA 中新建一个 Maven 项目 HDFSClient
6.配置 HDFSClient 项目的 maven 路径

注意 : 没有搭建过Maven环境的请参考我写的这一篇文章 Maven环境搭建。

7.配置 Maven 项目 pom.xml 文件

    <dependencies>
        <dependency>
            
            <groupId>org.apache.hadoopgroupId>
            <artifactId>hadoop-clientartifactId>
            <version>3.1.3version>
        dependency>
        <dependency>
            <groupId>junitgroupId>
            <artifactId>junitartifactId>
            <version>4.12version>
        dependency>
        <dependency>
            <groupId>org.slf4jgroupId>
            <artifactId>slf4j-log4j12artifactId>
            <version>1.7.30version>
        dependency>
    dependencies>

8.在项目的src/main/resources目录下新建一个 “log4j.properties” 文件并写入内容

log4j.rootLogger=INFO, stdout  
log4j.appender.stdout=org.apache.log4j.ConsoleAppender  
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout  
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n  
log4j.appender.logfile=org.apache.log4j.FileAppender  
log4j.appender.logfile.File=target/spring.log  
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout  
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

9.在src/main/java目录下新建一个包名 com.atguigu.hdfs,并创建一个HdfsClient类
10.在src/main/resources目录下新建一个hdfs-site.xml文件并写入内容

流程十九 : MapReduce WordCount 环境配置
1.在 IDEA 中新建一个 Maven 项目MapReduceDemo
2.配置 MapReduceDemo 项目的 maven 路径

3.配置 Maven 项目 pom.xml 文件

<dependencies>
    <dependency>
        <groupId>org.apache.hadoopgroupId>
        <artifactId>hadoop-clientartifactId>
        <version>3.1.3version>
    dependency>
    <dependency>
        <groupId>junitgroupId>
        <artifactId>junitartifactId>
        <version>4.12version>
    dependency>
    <dependency>
        <groupId>org.slf4jgroupId>
        <artifactId>slf4j-log4j12artifactId>
        <version>1.7.30version>
    dependency>
dependencies>

<build>
    <plugins>
        <plugin>
            <artifactId>maven-compiler-pluginartifactId>
            <version>3.6.1version>
            <configuration>
                <source>1.8source>
                <target>1.8target>
            configuration>
        plugin>
        <plugin>
            <artifactId>maven-assembly-pluginartifactId>
            <configuration>
                <descriptorRefs>
                    <descriptorRef>jar-with-dependenciesdescriptorRef>
                descriptorRefs>
            configuration>
            <executions>
                <execution>
                    <id>make-assemblyid>
                    <phase>packagephase>
                    <goals>
                        <goal>singlegoal>
                    goals>
                execution>
            executions>
        plugin>
    plugins>
build>

4.在项目的src/main/resources目录下新建一个 “log4j.properties” 文件并写入内容

log4j.rootLogger=INFO, stdout  
log4j.appender.stdout=org.apache.log4j.ConsoleAppender  
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout  
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n  
log4j.appender.logfile=org.apache.log4j.FileAppender  
log4j.appender.logfile.File=target/spring.log  
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout  
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

5.在src/main/java目录下新建一个包名 com.atguigu.mapreduce.wordcount,并分别创建WordCountMapper.java、WordCountReducer.java 和 WordCountDriver.java 三个类

你可能感兴趣的:(#,大数据路线,运维,网络,大数据)

计算机网络进化论：从比特流到量子通信的深层解构 ox0080 #北漂+滴滴出行 VIP 激励网络计算机网络
第一章物理媒介与链路层（1960-1970）1.1比特流物理编码//曼彻斯特编码实现vectormanchester_encode(uint8_tbyte){vectorbits;for(inti=7;i>=0;--i){boolbit=(byte>>i)&1;bits.push_back(bit);//前半周期bits.push_back(!bit);//后半周期}returnbits;}物理层
大数据和人工智能概念全面解析就犯得上方法
一、大数据和人工智能大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义，大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求，使数据能够从量变到质变，真正产生价值
DeepSeek的实际应用场景：AI技术如何赋能多领域创新 2501_91189350 人工智能
DeepSeek作为新一代智能技术平台，凭借其强大的算法能力和灵活的部署方式，正在多个行业掀起效率革命。本文将从真实案例出发，解析DeepSeek在不同场景中的落地应用。‌场景一：金融风控建模‌在信贷风险评估领域，传统模型存在数据维度单一、更新滞后等问题。某银行引入DeepSeek的‌动态特征工程模块‌，通过实时整合用户行为数据、社交网络信息等100+维度特征，成功将坏账识别准确率提升至98.5%
pip download 是一个很有用的命令 weixin_46375180 pip
确实，pipdownload是一个很有用的命令，通常用于下载包到本地以供离线安装或在网络不稳定时使用。以下是关于pipdownload的详细介绍：pipdownload命令下载指定的包：使用pipdownload可以下载指定的包，而不安装它。例如，下载numpy包：pipdownloadnumpy下载指定版本的包：你可以指定要下载的包的版本：pipdownloadnumpy==1.21.0下载并指
【mysql】mysql之主从部署以及介绍向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
一文搞懂大数据神器Spark，真的太牛了！ qq_23519469 大数据 spark 分布式
Spark是什么在如今这个大数据时代，数据量呈爆炸式增长，传统的数据处理方式已经难以满足需求。就拿电商平台来说，每天产生的交易数据、用户浏览数据、评论数据等，数量巨大且种类繁多。假如要对这些数据进行分析，比如分析用户的购买行为，找出最受欢迎的商品，预测未来的销售趋势等，用普通的单机处理方式，可能需要花费很长时间，甚至根本无法完成。这时，Spark就应运而生了。Spark是一个开源的、基于内存计算的
大模型应用编排工具Dify二开之登录Token改造 Daphnis_z Python开发 LLM chatgpt python docker web
1.前言dify工作室支持在画布上直接编辑业务流程，通过调用开源大模型可以实现特定场景的业务，而且可以迅速更新发布。因此，某些项目要求在产品里面能够直接编辑dify业务流程，使得现场开发人员能够迅速响应客户需求。另外，方便对dify进行运维，比如更新开源大模型认证信息。环境信息：dify-0.8.3,docker-212.实现思路分析常规的思路有两种：把dify源码迁移到产品中代码改造量大、难度高
Docker DRUN_K docker 容器
DockerDocker架构的工作流程构建镜像：通过编写dockerfile来进行构建推送镜像到仓库：将镜像上传到DockerHub或私有注册表中拉取镜像：通过dockerpull从从仓库中拉取镜像运行容器：使用镜像创建并启动容器管理容器：使用Docker客户端命令管理正在运行的容器，如查看日志、停止容器、查看资源使用情况等网络与存储：容器之间通过Docker网络连接，数据通过Docker卷或绑定
《Linux运维总结：基于银河麒麟V10+ARM64架构部署多机elasticsearch7.17.21分布式集群+单机kibana7.17.21二进制版ssl集群》东城绝神《Linux运维实战总结》运维 linux elasticsearch ssl
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：Linux运维实战总结一、背景elasticsearch是一个分布式、实时、高性能的搜索和分析引擎，它广泛应用于企业级搜索、日志分析、实时数据处理等领域。随着elasticsearch的广泛应用，安全性变得越来越重要。这里将从安全策略和访问控制两方面来部署elasticsearch集群安全策略涉及到数据安全、访问安全和操作安全等
linux网络编程(二) Zhuai-行淮 linux网络编程 linux 网络服务器
day14多路IO转接：select：poll：相比select相差不多intpoll(structpollfd*fds,nfds_tnfds,inttimeout);-----fds：监听的文件描述符【数组】------structpollfd{intfd：待监听的文件描述符shortevents：待监听的文件描述符对应的监听事件取值：POLLIN、POLLOUT、POLLERR可读事件：POL
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
ESP8266 与 ARM7 接口-LPC2148 创建 Web 服务器以控制 LED David WangYang ESP8266项目服务器运维
ESP8266与ARM7接口-LPC2148创建Web服务器以控制LEDESP8266Wi-Fi收发器提供了一种将微控制器连接到网络的方法。它被广泛用于物联网项目，因为它便宜、体积小且易于使用。在本教程中，我们将ESP8266Wi-Fi模块与ARM7-LPC2148微控制器连接，并创建一个Web服务器来控制连接到LPC2148的LED。工作流程将如下所示：从LPC2148向ESP8266发送AT命
信息系统运行管理员教程4--信息系统软件运维 LRX_198927 信息系统运行管理运维数据库
第四章信息系统软件运维信息系统软件是信息系统运行的核心，其运维的目的是保证信息系统软件能正常而可靠地运行，并能使系统不断得到改善和提高，以充分发挥作用。第1节信息系统软件运维概述1.信息系统软件运维的概念信息系统软件运维是指信息系统软件在开发完后投入使用后，对信息系统软件进行的改正性维护、适应性维护、完善性维护、预防性维护等软件工程活动。2.信息系统软件的可维护性及维护类型软件可维护性的度量可以从
热点研究 | OpenAI 重磅发布 Agents SDK，人人都能手搓 Manus? Ai野生菌技术面 php 开发语言 manus openai agent
3月12日，OpenAI正式发布了OpenAIAgentsSDK，这一重要发布不仅为开发者提供了强大的工具，更预示着AIAgent技术即将进入快速发展期。这些工具为开发者提供更强大功能，使代理能够独立执行复杂任务，如搜索网络、处理文件和自动化计算机操作。ResponsesAPI同步发布，为开发者提供了构建自定义AIAgent的能力，能够执行网络搜索、文件检索等任务。这套新工具和API旨在赋能开发者
本周安全速报（2025.3.11~3.17）联蔚盘云安全
合规速递01瑞士出台新规：关基设施遭遇网络攻击需在24小时内上报原文:https://www.bleepingcomputer.com/news/security/swiss-critical-sector-faces-new-24-hour-cyberattack-reporting-rule/新规要求，关键基础设施组织发现网络攻击后，首次报告需在24小时内完成，详细报告需在后续14天内完成，未
httpcanary动态注入_HttpCanary weixin_39760721 httpcanary动态注入
HttpCanary是一款功能十分强大网络抓包工具，它可以分析多个协议HTTP、https、http2等，这是一款最新的专为移动端设计的抓包工具，用户可以根据这个工具来应用，使用非常的简单，一学就会。对这款HttpCanary感兴趣的用户点击下载就可以使用啦!软件介绍HttpCanary是一款功能齐全的互联网包抓取和分析工具，相当于是移动端的Fiddler或是Charles，可是HttpCanar
httpcanary小米闪退_Android HttpCanary最强抓包工具！ ssslience httpcanary小米闪退
迎使用HttpCanary——最强Android抓包工具！HttpCanary是一款功能强大的HTTP/HTTPS/HTTP2网络包抓取和分析工具，你可以把他看成是移动端的Fiddler或者Charles，但是HttpCanary使用起来更加地简单容易，因为它是专门为移动端设计的！最重要的是：无需root权限！无需root权限！无需root权限！HttpCanary支持对HTTP协议包的抓取和注入
httpcanary动态注入_HttpCanary使用指南——正则匹配注入火锅大魔王 httpcanary动态注入
HttpCanary于v2.11.0版本上线了正则匹配注入功能。顾名思义，就是使用正则表达式或者匹配字符串，动态修改网络请求数据中的部分数据。举个例子：{"date":"30日星期天","high":"高温30℃","fengli":"","low":"低温23℃","fengxiang":"西南风","type":"多云"}复制代码我们希望将网络请求体中这段数据中的符号℃修改为中文摄氏度，即：{
数据湖：Apache Iceberg在腾讯的探索和实践学而知之@ 数据库腾讯大数据 java 编程语言
摘要：今天分享的是ApacheIceberg在腾讯内部的探索和实践。本文结合腾讯大数据技术分享内容和2020全球软件开发大会分享内容进行整理，主要内容包括：1、数据湖技术概述2、ApacheIceberg的简介3、腾讯为什么选择ApacheIceberg4、腾讯看点万亿数据下的业务痛点5、ApacheIceberg在看点实践6、ApacheIceberg读写和删除ApacheIceberg新一代数
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
AI 时代，学习 Java 应如何入手？琢磨先生David 人工智能 java
一、Java的现状：生态繁荣与AI融合的双重机遇在2025年的技术版图中，Java依然稳坐企业级开发的“头把交椅”。根据行业统计，Java在全球企业级应用中的市场份额仍超过65%，尤其在微服务架构、大数据平台和物联网（IoT）领域占据核心地位。随着云原生技术的普及，Java生态正经历新一轮进化：轻量化框架通过无服务器架构优化，启动速度提升300%，内存占用降低50%，使得Java在容器化部署中更具
Hyperlane：Rust 生态中的轻量级高性能 HTTP 服务器库，助力现代 Web 开发 LTPP rust http 服务器开发语言后端前端面试
Hyperlane：Rust生态中的轻量级高性能HTTP服务器库，助力现代Web开发在Rust生态系统中，Hyperlane是一个备受关注的HTTP服务器库，以其轻量级、高性能和易用性脱颖而出。无论你是想快速构建一个高效的Web服务，还是需要支持实时通信的现代应用，Hyperlane都能成为你的理想选择。它不仅简化了网络服务的开发，还提供了强大的功能支持，如HTTP请求解析、响应构建、TCP通信，
Apache Doris整合Iceberg + Flink CDC构建实时湖仓体的联邦查询分析架构 MfvShell apache flink 架构 Flink
随着大数据技术的迅猛发展，构建实时湖仓体并进行联邦查询分析成为了许多企业的迫切需求。在这篇文章中，我们将探讨如何利用ApacheDoris整合Iceberg和FlinkCDC来构建这样一个架构，并提供相应的源代码示例。简介实时湖仓体是一种灵活、可扩展的数据架构，结合了数据湖和数据仓库的优势。ApacheDoris是一款开源的分布式SQL引擎，专注于实时分析和查询。Iceberg是一种开放式表格格式
基于 KubeSphere v4 的 Kubernetes 生产环境部署架构设计及成本分析 KubeSphere 云原生 kubernetes 容器云原生
本文作者：运维有术。今天分享的主题是：如何规划设计一个高可用、可扩展的中小规模生产级K8s集群？通过本文的指导，您将掌握以下设计生产级K8s集群的必备技能：集群规划能力合理规划节点规模和资源配置设计高可用的控制平面、计算平面、存储平面架构规划网络拓扑和安全策略制定存储解决方案组件选型能力选择适合的容器运行时(ContainerRuntime)评估和选择网络插件(CNIPlugin)规划监控、日志等
【前端】面试八股文——输入URL到页面展示的过程帅比九日面试八股文前端面试 javascript
【前端】面试八股文——输入URL到页面展示的过程1.DNS解析当用户在浏览器中输入URL并按下回车时，首先需要将域名转换为IP地址，这个过程称为DNS（域名系统）解析。具体步骤如下：浏览器缓存：浏览器首先检查自身缓存中是否有该域名的IP地址。操作系统缓存：如果浏览器缓存中没有找到，浏览器会向操作系统请求DNS信息。路由器缓存：如果操作系统缓存也没有找到，操作系统会向本地网络中的路由器请求DNS信息
NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题 Chaos_Wang_ NLP常见面试题自然语言处理 rnn 人工智能
普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小，最终趋于接近0，导致模型前层的参数难以更新。原因：在反向传播时，每一层的梯度是通过链式法则计算得到的。因为链式求导中不断乘以一个较小的数值（小于1），随着层数或时间步的增加，梯度将指数级
信息收集综合只不过是胆小鬼罢了信息收集 php web安全安全
1《应用服务器资产分析与角色定性详解》在网络安全领域，对应用服务器的资产分析与角色定性是至关重要的工作。通过对服务器的操作系统、IP资产、端口资产等方面进行详细分析，可以更好地了解服务器的特性与用途，从而为网络安全防护提供有力支持。本文将从多个维度深入探讨应用服务器的资产分析与角色定性方法。一、操作系统分析1.Web大小写敏感性在分析应用服务器的操作系统时，Web大小写敏感性是一个重要的参考因素。
2025年计算机毕业设计springboot 智慧社区管理系统 zhihao503 课程设计 spring boot 后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于智慧社区管理系统的研究，现有成果多聚焦于单一功能模块的数字化（如物业缴费或门禁系统），缺乏对多场景服务整合与用户体验优化的系统性研究。国外研究侧重物联网技术应用（如新加坡“智慧国”计划中的社区传感器网络），而国内研究更多关注管理平台的基础框架设计，但针对业主、物业、设备多方
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
从零实现B站视频下载器：Python自动化实战教程木觞清 #编程语言自动化运维
一、项目背景与实现原理1.1B站视频分发机制Bilibili的视频采用音视频分离技术，通过以下方式提升用户体验：动态码率适配（1080P/4K/HDR）分段加载技术（基于M4S格式）内容保护机制（防盗链/签名验证）1.2技术实现路线graphTDA[模拟浏览器请求]-->B[获取加密播放信息]B-->C[解析音视频地址]C-->D[多线程下载]D-->E[FFmpeg合并]二、代码逐层解析2.1请
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比