指剑

Hadoop3.0基础平台搭建(三节点),以及案例运行并使用python生成词云

一、设备配置列表，软件包

二、主机名映射

三、生成密钥

四、将密钥发送到各个节点

五、注意事项及验证

六、关闭防火墙和SeLinux安全模块(所有主机均需操作

七、解压JDK、hadoop包，设置Java和hadoop环境

八、配置Hadoop相关配置文件

九、将已经修改好的文件使用scp命令复制到各个节点

十、node1 、 node2使环境生效，并验证

十一、启动hadoop系统并验证

十二、在本地编写并测试mapreduce程序，运行WordCount案例

十三、在hadoop中运行运行WordCount案例

十四、利用生成文件结合python生成词云

一、假设有如下设备

设备编号	主机名	系统	IP地址	准备文件
1	master	centos7.2	10.0.0.10	----------------hadoop3.0.0.tar.gz -------------------------jdk-8u161-linux-x64.tar.gz
2	node1	centos7.2	10.0.0.11
3	node2	centos7.2	10.0.0.12

软件包下载地址：
链接: https://pan.baidu.com/s/1dvf4o8i9J02fmUu3SMRyDw 提取码: 3dk3

二、首先，需要在各个节点上设置主机名映射(千万不要忘了改主机名)，以master为例

[root@master ~]# vi /etc/hosts
添加如下内容
10.0.0.10 master
10.0.0.11 node1
10.0.0.12 node2

三、使用命令生成密钥(以master节点为例)

ssh-keygen

[root@master ~]# ssh-keygen

四、然后使用命令复制SSH密钥到目标主机，开启无密码SSH登录(以master节点为例)，这里对另外两台都需要将密钥复制过去

[root@master ~]# ssh-copy-id master
[root@master ~]# ssh-copy-id node1
[root@master ~]# ssh-copy-id node2

五、第一次会让你输入yes 这样master节点就可以免密登陆其他节点，同样其他节点也需要进行以上操作，就可以免密登陆其他节点

验证

[root@master ~]# ssh master
[root@master ~]# ssh node1
[root@master ~]# ssh node2

六、关闭防火墙和SeLinux安全模块(所有主机均需操作

#systemctl stop firewalld;systemctl disable firewalld;setenforce 0

这里是关闭防火墙并关闭其开机自启，并将selinux设置为允许模式，个人认为这里较为重要，若不设置，可能防火墙会拦截主机间的通信流量

七、解压JDK、hadoop包，设置Java和hadoop环境

将tar.gz文件传输到master节点，进行如下操作

这里暂时只做master节点，到第九步才是将配置好的所有东西复制到其他节点，可以点击传送门查看

第九节传送门

1、每个节点创建文件夹

mkdir /opt/bigdata

2、将文件传输到bigdata目录中

[root@master ~]# mkdir /opt/bigdata
[root@master ~]# mv hadoop-3.0.0.tar.gz jdk-8u161-linux-x64.tar.gz /opt/bigdata/
[root@master ~]#

3、解压压缩包文件

[root@master bigdata]# tar -zxf hadoop-3.0.0.tar.gz -C /opt/bigdata/
[root@master bigdata]# tar -zxf jdk-8u161-linux-x64.tar.gz -C /opt/bigdata/
[root@master bigdata]# ll
total 484528
drwxr-xr-x 9 centos centos       139 Dec  8  2017 hadoop-3.0.0
-rw-r--r-- 1 root   root   306392917 Mar 11 08:50 hadoop-3.0.0.tar.gz
drwxr-xr-x 8     10    143      4096 Dec 20  2017 jdk1.8.0_161
-rw-r--r-- 1 root   root   189756259 Mar 11 08:50 jdk-8u161-linux-x64.tar.gz

4、添加环境变量

#vi /etc/profile添加如下内容

export JAVA_HOME=/opt/bigdata/jdk1.8.0_161
export PATH=$JAVA_HOME/bin:$PATH
export HADOOP_HOME=/opt/bigdata/hadoop-3.0.0
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

5、使环境变量生效

source /etc/profile

6、验证

# hadoop version
# java -version

八、配置Hadoop相关配置文件

hadoop目录是hadoop平台的配置目录，我们需要对hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml进行配置

1、首先进入hadoop系统目录/opt/bigdata/hadoop-3.0.0/etc/hadoop

[root@master ~]# cd /opt/bigdata/hadoop-3.0.0/etc/hadoop
[root@master hadoop]# pwd
/opt/bigdata/hadoop-3.0.0/etc/hadoop
[root@master hadoop]# ls

2、编辑hadoop-env.sh,添加java环境

[root@master hadoop]# vi hadoop-env.sh


移动到第54行，删除前面的 '#' 和空格，并修改成如下内容
export JAVA_HOME=/opt/bigdata/jdk1.8.0_161

3、编辑core-site.xml文件

[root@master hadoop]# vi core-site.xml

  
    fs.default.name</name>
    hdfs://master:9000</value>
  </property>
  
    hadoop.temp.dir</name>
    /opt/bigdata/hadoop-3.0.0/tmp</value>
  </property>

4、编辑hdfs-site.xml文件

[root@master hadoop]# vi hdfs-site.xml

  
    dfs.replication</name>
    2</value>
  </property>
  
    dfs.namenode.name.dir</name>
    /opt/bigdata/hadoop-3.0.0/hdfs/name</value>
  </property>
  
    dfs.datanode.data.dir</name>
    /opt/bigdata/hadoop-3.0.0/hdfs/data</value>
  </property>
  
    dfs.namenode.secondary.http-address</name>
    node1:9001</value>
  </property>
  
    dfs.http.address</name>
    0.0.0.0:50070</value>
  </property>

5、编辑mapred-site.xml文件

[root@master hadoop]# vi mapred-site.xml

  
    mapreduce.framework.name</name>
    yarn</value>
  </property>
  
    mapred.job.tracker.http.address</name>
    0.0.0.0:50030</value>
  </property>
  
    mapred.task.tracker.http.address</name>
    0.0.0.0:50060</value>
  </property>
  
    mapreduce.applicaton.classpath</name>
    
      /opt/bigdata/hadoop-3.0.0/etc/hadoop,
      /opt/bigdata/hadoop-3.0.0/share/hadoop/common/*,
      /opt/bigdata/hadoop-3.0.0/share/hadoop/common/lib/*,
      /opt/bigdata/hadoop-3.0.0/share/hadoop/hdfs/*,
      /opt/bigdata/hadoop-3.0.0/share/hadoop/hdfs/lib/*
      /opt/bigdata/hadoop-3.0.0/share/hadoop/mapreduce/*,
      /opt/bigdata/hadoop-3.0.0/share/hadoop/yarn/*,
      /opt/bigdata/hadoop-3.0.0/share/hadoop/yarn/lib/*
    </value>
  </property>

6、编辑yarn-site.xml文件

[root@master hadoop]# vi yarn-site.xml

  
    yarn.resourcemanager.hostname</name>
    master</value>
  </property>
  
    yarn.resourcemanager.webapp.address</name>
    master:8099</value>
  </property>
  
    yarn.application.classpath</name>
    /opt/bigdata/hadoop-3.0.0/etc/hadoop:/opt/bigdata/hadoop-3.0.0/share/hadoop/common/lib/*:/opt/bigdata/hadoop-3.0.0/share/hadoop/common/*:/opt/bigdata/hadoop-3.0.0/share/hadoop/hdfs:/opt/bigdata/hadoop-3.0.0/share/hadoop/hdfs/lib/*:/opt/bigdata/hadoop-3.0.0/share/hadoop/hdfs/*:/opt/bigdata/hadoop-3.0.0/share/hadoop/mapreduce/*:/opt/bigdata/hadoop-3.0.0/share/hadoop/yarn:/opt/bigdata/hadoop-3.0.0/share/hadoop/yarn/lib/*:/opt/bigdata/hadoop-3.0.0/share/hadoop/yarn/*
 </value>
  </property>

     yarn.nodemanager.vmem-check-enabled</name>
     false</value>
</property>

    yarn.nodemanager.aux-services</name>
    mapreduce_shuffle</value>
</property>

    yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
    org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

7、编辑workers文件，指定节点

[root@master hadoop]# vi workers
添加node1 node2

如果不想master中也有datanode，就把localhost删掉，只保留node1 node2

8、编辑启动配置文件，都添加如下内容

[root@master ~]# vi /opt/bigdata/hadoop-3.0.0/sbin/start-dfs.sh
[root@master ~]# vi /opt/bigdata/hadoop-3.0.0/sbin/stop-dfs.sh

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

编辑配置文件，都添加如下内容
[root@master ~]# vi /opt/bigdata/hadoop-3.0.0/sbin/start-yarn.sh
[root@master ~]# vi /opt/bigdata/hadoop-3.0.0/sbin/stop-yarn.sh

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

九、将已经修改好的文件使用scp命令复制到各个节点

1、首先要在各个节点创建/opt/bigdata目录

[root@node1 ~]# mkdir /opt/bigdata
[root@node2 ~]# mkdir /opt/bigdata

2、master节点复制hadoop文件夹和jdk文件夹，以及环境配置文件

[root@master ~]# scp -r /opt/bigdata/hadoop-3.0.0 node1:/opt/bigdata
[root@master ~]# scp -r /opt/bigdata/hadoop-3.0.0 node2:/opt/bigdata
[root@master ~]# scp -r /opt/bigdata/jdk1.8.0_161/ node1:/opt/bigdata/
[root@master ~]# scp -r /opt/bigdata/jdk1.8.0_161/ node2:/opt/bigdata/
[root@master ~]# scp /etc/profile node1:/etc/
[root@master ~]# scp /etc/profile node2:/etc/

十、node1 、 node2使环境生效，并验证

##### 1、node1验证 ```powershell [root@node1 ~]# source /etc/profile [root@node1 ~]# java -version [root@node1 ~]# hadoop version ```

2、node2验证

[root@node2 ~]# source /etc/profile
[root@node2 ~]# java -version
[root@node2 ~]# hadoop version

十一、启动hadoop系统并验证

1、第一次启动，格式化namenode

[root@master ~]# hadoop namenode -format

2、启动hadoop系统，并验证

[root@master ~]# start-all.sh
[root@master ~]# jps
[root@node1 ~]# jps
[root@node2 ~]# jps

网页端访问master节点ip地址
http://Master_IP:50072
例:
http://10.0.0.10:50070

网页端查看HDFS文件系统

十二、在本地编写并测试mapreduce程序，运行WordCount案例

编写MapReduce程序,请注意，此处使用python2代码。因为CentOS7.2已经安装了python2

1、首先编写mapper.py程序

[root@master ~]# vi mapper.py

#!/usr/bin/env python
# -*- coding:UTF-8 -*-

import sys
for line in sys.stdin:
    line = line.strip()
    words = line.split()
    for word in words:
        print '%s\t%s' % (word, 1)

2、编写Reducer程序

[root@master ~]# vi reducer.py

#!/usr/bin/env python
# -*- coding:UTF-8 -*-

#from operator import itemgetter
import sys

current_word = None
current_count = 0
word = None

for line in sys.stdin:
    line = line.strip()

    word, count = line.split('\t', 1)
    
    try:
        count = int(count)
    except ValueError:
        continue

    if current_word  == word:
        current_count += count
    else:
        if current_word:
            print '%s\t%s' % (current_word, current_count)
        current_count = count
        current_word = word
        
if current_word == word:
    print '%s\t%s' % (current_word, current_count)

3、给刚刚编写的程序添加执行权限

[root@master ~]# chmod a+x mapper.py  
[root@master ~]# chmod a+x reducer.py

4、使用echo加sort对程序进行测试

[root@master ~]# echo “hello world hell hi word” | python mapper.py |sort|python reducer.py

十三、在hadoop中运行WordCount案例

一定要检查一下yarn-site.xml，之前的配置文件我已经重新修改了，请回到第八步第六小点再看看，yarn-site.xml有没有添加上


    yarn.nodemanager.aux-services</name>
    mapreduce_shuffle</value>
</property>

    yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
    org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

1、首先编写MapReduce脚本mapreduce.sh

[root@master ~]# vi mapreduce.sh

hadoop jar /opt/bigdata/hadoop-3.0.0/share/hadoop/tools/lib/hadoop-*streaming*.jar -mapper "python mapper.py" -reducer "python reducer.py" -input /user_test/
data.txt -output /output_dir -file /opt/bigdata/mapreduce/mapper.py -file /opt/bigdata/mapreduce/reducer.py

#streaming可以执行任意语言写的mapper，reducer程序
-mapper "python mapper.py"  #执行mapper程序
-reducer "python reducer.py"   #执行reducer程序
-input /user_test/data.txt -output /output_dir  #导入文件及导出文件地址
-file /opt/bigdata/mapreduce/mapper.py  #mapper程序路径
-file /opt/bigdata/mapreduce/reducer.py  #reducer程序路径

2、在本地，首先创建文件夹，将mapper.py和reducer.py移动到相应位置，也可在相应位置创建好

[root@master ~]# mkdir /opt/bigdata/mapreduce
[root@master ~]# mv mapper.py reducer.py /opt/bigdata/mapreduce/
[root@master ~]# ls /opt/bigdata/mapreduce/

3、在本地创建data.txt文件，并输入相应数据

[root@master ~]# vi data.txt

java
java
python
ruby
ruby
mongo
ruby
java
python
java
python
python
java
python
python
java
python
python
java
java

4、在 HDFS 文件系统中创建相应目录以及将data.txt文件上传

[root@master ~]# hdfs dfs -mkdir /user_test
[root@master ~]# hdfs dfs -chmod -R 777 /user_test ##给目录添加权限
[root@master ~]# hdfs dfs -put /root/data.txt /user_test
[root@master ~]# hdfs dfs -ls /user_test

5、查看是否存在输出目录 (一定不能存在，如果存在就需要删除)

[root@master ~]# hdfs dfs -ls /

6、运行mapreduce.sh脚本，测试运行

[root@master ~]# source mapreduce.sh

7、查看结果

[root@master ~]# hdfs dfs -ls /output_dir
[root@master ~]# hdfs dfs -cat /output_dir/part-00000

也可以在Web端查看
http://Master_I:50070

点击下载会提示网页无法访问，请将node1或者node2替换成相应的IP地址即可

十四、利用生成文件结合python生成词云

这里我使用python3进行实验

1、将上述的文件下载到Windows

2、在windows下，下载/安装pip

pip install wordcloud（执行下载woedcloud）
pip install matplotlib（执行下载matplotlib）

3、此时我将part-00000文件存放于E盘下

4、编写输出词云的python程序

# -*-coding:UTF-8 -*-
# 导入相关的库
import matplotlib #导入matplotlib
matplotlib.use('Agg')
from os import path
import matplotlib.pyplot as plt
from wordcloud import WordCloud #从wordcloud导入WordCloud

# 获取当前文件路径
# __file__ 为当前文件, 在ide中运行此行会报错,可改为
# d = path.dirname('.')
d = path.dirname('.') ##选择文件路径

# 读取整个文件
text = open(path.join(d, 'E:\part-00000')).read() #打开文件并赋值给变量text
#wordcloud = WordCloud().generate(text)
wc = WordCloud().generate(text)
wc.to_file('Word Cloud.png') #命名生成的图片
# 绘图
plt.imshow(wc)
plt.axis("off")

6、运行程序得到词云图片

本次教程到此结束，如果您觉得不错，可以打赏，请您到B站观看更多技术视频，欢迎点赞投币打赏！

B站传送门

Java-校验值区间值的连续性江节胜-胜行全栈AI java 状态模式开发语言
最新版本更新https://code.jiangjiesheng.cn/article/363?from=csdnc＜30，30≤c＜60，60≤c＜100，100≤c有值时，必须收尾相等。BigDecimalendCheckValue=null;for(BssCompareMethodParameterConfigAddVOconfigRow:actualSampleCompareList){e
JAVA集合arraylist存取数据_ArrayList集合月小烟
集合出现的原因数组存储数据是固定存储,当遇到要存储数据的个数不确定的时候数组就不满足了,集合就出现了集合存储数据的个数,可以随着数据量的变化而变化,不会造成越界或者大量的空间浪费存储数据的个数是可变的ArrayList:java.util包下底层维护了一个数组线程不同步(处理速度快)创建ArrayList对象的格式:ArrayList集合名字=newArrayList();:泛型,代表了集合中要存
Android 和 Linux 之间关联和区别测试也是会开发的 android linux 运维
1.核心：基于Linux内核底层依赖：Android的核心系统服务（如进程管理、内存管理、硬件驱动等）依赖于Linux内核。Android使用Linux内核的修改版本（如AndroidCommonKernel），并针对移动设备的特性（电源管理、低内存优化等）进行了定制。开源协议：Linux内核采用GPL协议，因此Android对内核的修改必须开源（厂商发布的Android设备内核代码需公开）。2.
《Java线程池深度解析：从核心参数到饱和策略实战》云之兕 java基础入门到精通 java 开发语言
"线程池核心数设置多少合适？为什么任务队列满了会导致OOM？如何设计可降级的异步任务系统？"本文通过电商秒杀场景贯穿线程池参数调优全过程，结合ThreadPoolExecutor源码解析核心机制，并给出动态线程池与监控报警的最佳实践。一、线程池核心参数关系图解graphLRA[提交任务]-->B{核心线程是否已满?}B-->|否|C[创建核心线程执行]B-->|是|D{队列是否已满?}D-->|否
Microsoft Visual C++ Redistributable 各版本安装包合集 Eric Woo X C++Windows microsoft c++开发语言
MicrosoftVisualC++Redistributable2019x86:https://aka.ms/vs/16/release/VC_redist.x86.exex64:https://aka.ms/vs/16/release/VC_redist.x64.exeMicrosoftVisualC++Redistributable2017x86:https://go.microsoft.c
【JavaScript】11-JS高阶技巧 beibeibeiooo JavaScript【已完结】javascript 前端 ecmascript es6
本文介绍JS中的一些高阶技巧。目录1.深浅拷贝1.1浅拷贝1.2深拷贝1.2.1通过递归实现1.2.2lodash/cloneDeep1.2.3JSON.stringify()2.异常处理2.1throw抛异常2.2try/catch捕获异常2.3debugger3.处理this3.1this指向3.1.1普通函数this3.1.2箭头函数的this3.2改变this3.2.1call方法改变3.
QT-LINUX-Bluetooth蓝牙开发大象荒野嵌入式QT开发笔记 qt
BlueToothAPIQT-BlueToothApiQtBluetooth6.8.2官方提供的蓝牙API不支持linux。D-Bus的API实现蓝牙确保系统中安装了BlueZ（版本需≥5.56），并且Qt已正确安装并配置了D-Bus支持。默默看了下自己的版本.....D-BUS的API也不支持。在D-Bus中，org目录是D-Bus对象路径（ObjectPath）的一部分，用于唯一标识系统中的对
java面向对象基础 miehamiha java 开发语言
引入三大特征封装核心思想就是“隐藏细节”、“数据安全”，将对象不需要让外界访问的成员变量和方法私有化，只提供符合开发者意愿的公有方法来访问这些数据和逻辑，保证了数据的安全和程序的稳定。所有的内容对外部不可见。继承子类可以继承父类的属性和方法，并对其进行拓展。将其他的功能继承下来继续发展。多态同一种类型的对象执行同一个方法时可以表现出不同的行为特征。通过继承的上下转型、接口的回调以及方法的重写和重载
如何用PHP开发一个api数据接口幽蓝计划 php
对于一个iOS开发者来说，我一直觉得会写接口是一件很酷的事情，因为它可以实时修改前台数据，而不像App一样需要更新版本和接受审核。更重要的是，它意味着你的技术完成了一个闭环，可以独自完成一整个项目的开发。PHP是我接触的第一个脚本语言，使用之后更是感觉PHP功能强大，开发过程非常友好方便，虽然之后也学习过Python、JavaScript等语言，但现在还是习惯使用PHP，下面就来介绍一下如何用PH
hdc工具安装、常用命令及使用技巧 MardaWang HarmonyOS NEXT harmonyos 华为
介绍：hdc（OpenHarmonyDeviceConnector）是为开发人员提供的用于设备连接调试的命令行工具，该工具需支持部署在Windows/Linux/Mac等系统上与OpenHarmony设备（或模拟器）进行连接调试通信。简单来讲，hdc是OpenHarmony提供的用于开发人员调试硬件、应用的命令行工具，用在电脑与开发板之间的交互。hdc适用于OpenHarmony应用、硬件开发及测
Java 环境配置与 JAR 文件问题解决全攻略不羁。。杂记丨每天亿点小知识 java jar 开发语言
目录一、Java环境配置指南1.Windows系统配置步骤1.1下载安装JDK1.2配置环境变量2.Linux/macOS系统配置2.1终端命令配置二、JAR文件问题诊断与修复1.检查JAR文件完整性1.1命令行验证1.2哈希值校验2.依赖库管理方案2.1Maven依赖配置示例2.2命令行指定依赖三、常见问题解决方案1.环境变量不生效处理1.1清除系统缓存1.2路径优先级调整2.旧版本残留处理2.
COMP 315: Cloud Computing for E-Commerce 后端
Assignment1:JavascriptCOMP315:CloudComputingforE-CommerceFebruary20251IntroductionAcommontaskwhenbackendprogrammingisdatacleaning,whichistheprocessoftakinganinitialdatasetthatmaycontainerroneousorinco
Linux常见的敏感目录 306Safe linux php apache
渗透过程中，我们可能会碰到一些任意文件读取，以下是Linux下的常见的敏感目录，可以使用burp进行爆破。/apache/apache/conf/httpd.conf/apache/apache2/conf/httpd.conf/apache/php/php.ini/bin/php.ini/etc/anacrontab/etc/apache/apache.conf/etc/apache/httpd
MDC-Mapped Diagnostic Context（映射诊断上下文） NEUMaple 微服务 spring boot java MDC
MDC，全称为MappedDiagnosticContext（映射诊断上下文），是SLF4J（SimpleLoggingFacadeforJava）提供的一种机制，用于在多线程应用中存储和管理与特定线程相关的上下文信息。这种机制特别适用于需要跨多个方法调用或服务边界传递诊断信息的场景，例如跟踪分布式系统中的请求流。MDC的主要用途日志关联：在分布式系统或多线程应用中，MDC可以用来携带一些上下文信
硅谷企业的大数据平台架构什么样？看看Twitter、Airbnb、Uber的实践大数据v 分布式数据库大数据编程语言 hadoop
导读：本文分析一下典型硅谷互联网企业的大数据平台架构。作者：彭锋宋文欣孙浩峰来源：大数据DT（ID：hzdashuju）01Twitter的大数据平台架构Twitter是最早一批推进数字化运营的硅谷企业之一，其公司运营和产品迭代的很多功能是由其底层的大数据平台提供的。图7-2所示为Twitter大数据平台的基本示意图。▲图7-2Twitter大数据平台架构Twitter的大数据平台开发比较早，很多
Java：Apache HttpClient中HttpRoute用法的介绍 netyeaxi Java java apache 开发语言
当使用ApacheHttpClient组件时，经常会用到它的连接池组件。典型的代码如下：PoolingHttpClientConnectionManagerconnectionManager=newPoolingHttpClientConnectionManager();connectionManager.setMaxTotal(httpConfig.getMaxPoolTotal());conn
挑战20天学完JavaSE第四天——方法的定义、调用和方法重载呆呆why care 挑战20天学完javaSE java 笔记改行学it 程序人生
Java方法是语句的集合，它们在一起执行一个功能。方法是解决一类问题的步骤的有序组合。方法包含于类或对象中。方法在程序中被创建，在其他地方被引用。设计方法的原则:方法的本意是功能块，就是实现某个功能的语句块的集合。我们设计方法的时候，最好保持方法的原子性，就是一个方法只完成1个功能，这样利于我们后期的扩展。方法的命名规则：首字母小写驼峰命名方法的定义Java的方法类似于其它语言的函数，是一段用来完
linux 编译QT atom,QT5 编译使用TagLib weixin_39551611 linux 编译QT atom
需要使用TagLib读取媒体信息,记录下编译过程使用的文件,使用Taglib库版本1.6.3QT版本5.12.3x32MinGWCMAKE版本3.9.0使用CMAKE配置TagLIbtagLib解压后如下:image配置环境变量选择mingw的bin路径,如下图image.png打开Cmake,在Cmake中选择对应目录如下图是我的选择,基于taglib的解压目录image.png之后点击Conf
java struts jxl 导入导出Excel（无模板） weixin_30437847 java 数据库 javascript ViewUI
jar包：importjavax.servlet.http.HttpServletResponse;importjava.io.OutputStream;importjava.io.File;importjxl.DateCell;importjxl.Sheet;importjxl.Workbook;importjxl.format.Alignment;importjxl.format.Border
ZooKeeper集群高可用性测试与实践：从规划到故障模拟磐基Stack专业服务团队 Zookeeper zookeeper 可用性测试
#作者：任少近文章目录ZooKeeper集群环境规划1.集群数据一致性测试2.集群节点故障测试ZooKeeper集群高可用性测试的主要目的是确保在分布式环境中，ZooKeeper服务能够持续提供一致性和高可用性的协调服务。ZooKeeper集群环境规划节点ipZooKeeper版本java版本对外端口集群通信端口集群选举端口192.168.x.xZooKeeper-3.6.11.8.0_33221
VS Code 在Linux下IDE开发C++的HelloWorld leon_zeng0 c++VScode linux ide c/c++helloworld
用VisualStudioCode在Linux(Ubuntu)下构造c++的集成开发环境，编辑，编译和调试运行一个简单程序HelloWorld。想达到上面目标，搜索到以下文章，学习验证而成本文日记。链接是：https://code.visualstudio.com/docs/cpp/config-linux前期准备运行环境是ubuntu16.0，先安装好VisualStudioCode(VSCod
Java File 类与文件操作代码先锋者 java开发 java 开发语言
一、引言在Java编程中，文件操作是一项非常常见且重要的任务。无论是读取配置文件、保存用户数据，还是进行日志记录，都离不开对文件的操作。Java提供了File类来表示文件和目录的抽象路径名，通过该类可以对文件和目录进行创建、删除、重命名等操作。同时，Java还提供了一系列的输入输出流类，用于对文件内容进行读写操作。本文将详细介绍Java中File类的使用以及相关的文件操作案例。二、File类概述2
Java 基础数据类型代码先锋者 java开发 java 开发语言
一、引言在Java中每个变量都必须先声明其数据类型，才能使用（即Java是强类型语言）。Java的数据类型分为两大类：基本数据类型（PrimitiveDataTypes）和引用数据类型（ReferenceDataTypes）。二、基本数据类型分类Java有8种基本数据类型（如下图所示），可分为四大类（整数型，浮点型，字符型和布尔型）：8大基本数据类型具体位数、取值范围和默认值等如下表所示：数据类型
Linux内核srio驱动,Zynq—Linux移植学习笔记（十四）：RapidIO驱动开发 weixin_39942572 Linux内核srio驱动
#defineDRIVER_NAME"xiic-rio"#defineSRIO_ZYNQ_BASEADDR0x40000000#defineSRIO_ZYNQ_NODE_BASEADDR0x10100#defineSRIO_ZYNQ_MAX_HOPCOUNT13structxiic_rio{structmutexlock;u8*data;};/*Weneedglobalvarriableforma
【大模型系列】SFT（Supervised Fine-Tuning，监督微调） Kwan的解忧杂货铺@新空间代码工作室 s2 AIGC 大模型
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
《Linux设备驱动开发详解（第3版）》第12章 Linux块设备驱动请向我看齐嵌入式 linux 驱动开发运维
12.1块设备驱动概述块设备以块为单位进行数据传输，通常支持随机访问，如硬盘、U盘等。块设备驱动负责管理这些设备的I/O操作，为内核和用户空间提供统一的接口。这部分通常以理论讲解为主，代码示例较少。12.2块设备的I/O栈块设备的I/O栈涉及多个层次，从用户空间的系统调用开始，经过VFS（虚拟文件系统）、通用块层，最终到达块设备驱动层。这部分也是理论性较强，直接的代码示例较少。12.3通用块层通用
Linux驱动开发实战之SRIO驱动（二）基于Tsi721驱动 niuTaylor SRIO驱动实战 linux 驱动开发运维 SRIO
常用驱动介绍在RapidIO系统中，TSI721是一款常用的RapidIO交换芯片，其驱动程序和相关模块负责管理和优化数据传输，包括DMA（直接内存访问）操作。以下是您提到的各个模块的作用概述：rapidio.ko:这是RapidIO核心模块，为RapidIO子系统提供基础支持。它负责管理RapidIO设备、维护RapidIO网络拓扑结构，以及处理RapidIO协议的底层细节。rio_cm.ko:
编程自学指南：java程序设计开发，Java 对象创建的6种方式，从new到反射：Java 对象创建全解析，new关键字，反射机制，克隆（Clone），反序列化，工厂模式，建造者模式 zl515035644 java自学指南 java 开发语言
编程自学指南：java程序设计开发，Java对象创建的几种方式一、课程信息学习目标掌握6种主流对象创建方式的实现方法理解每种方式的适用场景与优缺点能根据需求选择最合适的创建方式避免对象创建中的常见错误（如构造器权限问题）二、课程导入：生活中的"创建"场景类比买现成的→new关键字（最常用）复制已有物品→克隆（Clone）按图纸定制→工厂模式（复杂对象）反序列化→从文件/网络恢复对象三、主流创建方式
Java 泛型代码先锋者 java开发 java 开发语言
一、引言在Java编程中，泛型是一项强大的特性，它允许在类、接口和方法的定义中使用类型参数。泛型提供了类型安全的集合，避免了在运行时进行类型转换的风险，提高了代码的可读性和可维护性。二、泛型的基本概念2.1泛型的定义泛型，即“参数化类型”，就是将类型由原来的具体的类型参数化，类似于方法中的变量参数，此时类型也定义成参数形式（可以称之为类型形参），然后在使用/调用时传入具体的类型（类型实参）。2.2
Linux驱动开发实战之SRIO驱动（一） niuTaylor linux 驱动开发 c语言开发语言
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！提醒：在发布作品前，请将不需要的内容删除。LinuxSRIO驱动开发终极指南：从基础到实战一、SRIO协议基础SRI
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

Hadoop3.0基础平台搭建(三节点),以及案例运行并使用python生成词云

一、设备配置列表，软件包

二、主机名映射

三、生成密钥

四、将密钥发送到各个节点

五、注意事项及验证

六、关闭防火墙和SeLinux安全模块(所有主机均需操作

七、解压JDK、hadoop包，设置Java和hadoop环境

八、配置Hadoop相关配置文件

九、将已经修改好的文件使用scp命令复制到各个节点

十、node1 、 node2使环境生效，并验证

十一、启动hadoop系统并验证

十二、在本地编写并测试mapreduce程序，运行WordCount案例

十三、在hadoop中运行运行WordCount案例

十四、利用生成文件结合python生成词云

一、假设有如下设备

二、首先，需要在各个节点上设置主机名映射(千万不要忘了改主机名)，以master为例

三、使用命令生成密钥(以master节点为例)

四、然后使用命令复制SSH密钥到目标主机，开启无密码SSH登录(以master节点为例)，这里对另外两台都需要将密钥复制过去

五、第一次会让你输入yes 这样master节点就可以免密登陆其他节点，同样其他节点也需要进行以上操作，就可以免密登陆其他节点

六、关闭防火墙和SeLinux安全模块(所有主机均需操作

这里是关闭防火墙并关闭其开机自启，并将selinux设置为允许模式，个人认为这里较为重要，若不设置，可能防火墙会拦截主机间的通信流量

七、解压JDK、hadoop包，设置Java和hadoop环境

将tar.gz文件传输到master节点，进行如下操作

这里暂时只做master节点，到第九步才是将配置好的所有东西复制到其他节点，可以点击传送门查看

第九节传送门

1、每个节点创建文件夹

2、将文件传输到bigdata目录中

3、解压压缩包文件

4、添加环境变量

5、使环境变量生效

6、验证

八、配置Hadoop相关配置文件

1、首先进入hadoop系统目录/opt/bigdata/hadoop-3.0.0/etc/hadoop

2、编辑hadoop-env.sh,添加java环境

3、编辑core-site.xml文件

4、编辑hdfs-site.xml文件

5、编辑mapred-site.xml文件

6、编辑yarn-site.xml文件

7、编辑workers文件，指定节点

如果不想master中也有datanode，就把localhost删掉，只保留node1 node2

8、编辑启动配置文件，都添加如下内容

九、将已经修改好的文件使用scp命令复制到各个节点

1、首先要在各个节点创建/opt/bigdata目录

2、master节点复制hadoop文件夹 和jdk文件夹，以及环境配置文件

十、node1 、 node2使环境生效，并验证

2、node2验证

十一、启动hadoop系统并验证

1、第一次启动，格式化namenode

2、启动hadoop系统，并验证

十二、在本地编写并测试mapreduce程序，运行WordCount案例

编写MapReduce程序,请注意，此处使用python2代码。因为CentOS7.2已经安装了python2

1、首先编写mapper.py程序

2、编写Reducer程序

3、给刚刚编写的程序添加执行权限

4、使用echo加sort对程序进行测试

十三、在hadoop中运行WordCount案例

一定要检查一下yarn-site.xml，之前的配置文件我已经重新修改了，请回到第八步第六小点再看看，yarn-site.xml有没有添加上

1、首先编写MapReduce脚本mapreduce.sh

2、在本地，首先创建文件夹，将mapper.py和reducer.py移动到相应位置，也可在相应位置创建好

3、在本地创建data.txt文件，并输入相应数据

4、在 HDFS 文件系统中创建相应目录以及将data.txt文件上传

5、查看是否存在 输出目录 (一定不能存在，如果存在就需要删除)

6、运行mapreduce.sh脚本，测试运行

7、查看结果

十四、利用生成文件结合python生成词云

这里我使用python3进行实验

1、将上述的文件下载到Windows

2、在windows下，下载/安装pip

3、此时我将part-00000文件存放于E盘下

4、编写输出词云的python程序

6、运行程序得到词云图片

本次教程到此结束，如果您觉得不错，可以打赏，请您到B站观看更多技术视频，欢迎点赞投币打赏！

B站传送门

你可能感兴趣的:(BigData,Hadoop,Linux操作合集,hadoop,大数据,linux,java,centos)

2、master节点复制hadoop文件夹和jdk文件夹，以及环境配置文件

5、查看是否存在输出目录 (一定不能存在，如果存在就需要删除)