老象学院

Hadoop实战之路——第二章 Hadoop集群实验环境安装

所谓“万事开头难”，Hadoop集群实验环境的安装放倒了不少新手，没有安装好实验环境导致后面的内容没法学习，于是乎只有放弃了。Hadoop的运行模式主要有三种：

      • 单机模式。默认情况下，Hadoop被配置成以非分布式模式运行的一个独立Java进程。这对调试非常有帮助。
      • 伪分布式模式。Hadoop可以在单节点上以所谓的伪分布式模式运行，此时每一个Hadoop守护进程都作为一个独立的Java进程运行。
      • 完全分布式模式。具有实际意义的Hadoop集群，其规模可从几个节点的小集群到几千个节点的超大集群。

2.1 Hadoop1.x的完全分布式实验环境安装

首先说明一下，下面的安装过程仅供参考学习，不考虑优化。

2.1.1 硬件环境

处理器：二核1.7G+ 硬盘：40G+ 内存：768M+ 网络：局域网

2.1.2 软件环境

(1) JDK：Java 6+，可以从Oracle官网下载Linux版本。

(2) Hadoop1.x：可以从Hadoop官网http://hadoop.apache.org/core/releases.html

(3) 操作系统：CentOS，下载地址：http://isoredirect.centos.org/centos/6.5/isos/

2.1.3 安装过程

(1) 安装3台搭载CentOS的主机，也可以用虚拟主机，并保证每台主机上有统一的登录名，如hadoop，相同的目录结构。

1)更改hostname，将每台主机名改成便于管理的名字：vi /etc/sysconfig/network 修改hostname

2)更改hosts，在作为namenode节点的主机上配置IP与主机名的对应关系：vi /etc/hosts，如：

172.16.51.204 master204

172.16.51.214 slaver214

172.16.51.217 slaver217

3)关闭防火墙

service iptables stop

chkconfig iptables off

(2) 安装JDK

在每台主机上安装JDK，使用PieTTY 0.3.26登录CentOS，可直接使用root用户登录（仅为了学习的方便，不产生更多障碍，生产环境中不建议）。要安装JDK需把准备好的jdk-7u55-linux-x64.tar.gz放到Linux系统中，当然可以采用wget方法直接下载，也可采用WinSCP上传。说下WinSCP的文件上传吧。

step1：下载安装WinSCP，如果不会下载安装，先百度啦。

step2：打开WinSCP，如图2-1：

图2-1 WinSCP界面

step3：在主机名处输入主机的IP地址，也可输入名（但需要设置hosts），输入root及登录密码，单击“登录”按钮，出现如图2-2：

图2-2 WinSCP操作界面

note：左侧圆角框所示为本地Windows系统目录结构，右侧直角框所示为Linux目录结构。

step4：在左侧找到等上传的jdk-7u55-linux-x64.tar.gz，在右侧找到目标位置，这里选择的是/usr/local目录，将左侧的jdk-7u55-linux-x64.tar.gz拖至右侧即可。

接下来的工作就是到Linux系统上安装JDK啦，找到/usr/local目录，命令：

cd /usr/local

1) 用ls查看一下目录下的文件，确认jdk-7u55-linux-x64.tar.gz已经存在后，使用命令：

tar -zxvf jdk-7u55-linux-x64.tar.gz

2) 配置JAVA环境变量

step1：vi /etc/profile

step2：按下i键进入编辑模式，加入以下内容：

export JAVA_HOME=/usr/local/jdk1.1.0_55

export PATH=.:$JAVA_HOME/bin:$PATH

step3：按ESC键后再输入:wq保存退出。

step4：使用source命令在当前bash环境下读取并执行profile中的命令，如下：

source /etc/profile

step5：确认，使用java -version出现面2-3的界面说明JDK安装成功。

图2-3 java -version效果

(3) 配置hosts

vi /etc/hosts

说明：slaver217,slaver214作为datanode节点，master204作为namenode节点。另外，各datanode节点主机上只需配置如：172.16.51.214 slaver214。

(4) 安装Hadoop1.x

1) 使用WinSCP将hadoop-1.1.2.tar.gz上传至Linux服务器/usr/local目录下。

2) 登录Linux系统后，进入/usr/local目录下，命令：

cd /usr/local

3) 解压hadoop-1.1.2.tar.gz，命令：

tar -zxvf hadoop-1.1.2.tar.gz

解压后可将文件夹名称hadoop-1.1.2改为hadoop1，命令：mv hadoop-1.1.2 hadoop1

4) 配置环境变量

vi /etc/profile

加入：

export HADOOP_HOME=/usr/local/hadoop1

export PATH=.:$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

验证：命令hadoop

5) 配置Hadoop的hadoop-env.sh

进入到目录/usr/local/hadoop/conf，命令：cd /usr/local/hadoop/conf

ls后如图2-4所示。

图2-4 conf目录结构

vi hadoop-env.sh

找到行export JAVA_HOME所在行，去掉注释#，将其改为：export JAVA_HOME=/usr/local/jdk1.7.0_55，保存退出。

6) 配置core-site.xml

vi core-site.xml

配置如下：

说明：hadoop.tmp.dir hadoop文件系统依赖的基础配置,很多路径都依赖它，如果指定的目录不存在，要及时建立（mkdir命令）

fs.default.name NameNode的名称（IP地址）和端口号

7) 配置hdfs-site.xml

vi hdfs-site.xml

配置如下：

说明：dfs.repliction 文件备份系数，就不大于datanode数。

8) 配置mapred-site.xml

vi mapred-site.xml

配置如下：

说明：mapred.job.tracker 连接jobtrack服务器的配置项，默认不写是local，map数1，reduce数1。

9) 配置masters文件

vi master

将localhost改为namenode结点的主机名或IP，这里我使用的是master204。

10) 配置slaves文件

vi slaves

将localhost去掉，加入作为datanode节点的主机名或IP，一个主机名占（IP）占一行。

10) 复制配置好的hadoop/到各datanode主机的同名文件夹下，确保目录结构与namenode机一致。命令：

scp -r /usr/local/hadoop1 root@slaver214:/usr/local/local/hadoop1

scp -r /usr/local/hadoop1 root@slaver217:/usr/local/local/hadoop1

(5) 设置ssh登录（很关键）

在namenode主机上，我这里用的是master204，进入目录root下，命令：

cd /root

ssh-keygen -t rsa

一路回车，生成id_rsa.pub等文件。

chmod 0700 .ssh

用命令ls -a查看，存在.ssh文件夹，如下：

cd .ssh

在各datanode节点主机下也作相同的工作。

将id_rsa.pub拷贝到各datanode节点的相同目录下，执行touch /root/.ssh/authorized_keys (如果已经存在这个文件, 跳过这条)，chmod 600 ~/.ssh/authorized_keys (# 注意：必须将~/.ssh/authorized_keys的权限改为600, 该文件用于保存ssh客户端生成的公钥，可以修改服务器的ssh服务端配置文件/etc/ssh/sshd_config来指定其他文件名），cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys (将id_rsa.pub的内容追加到 authorized_keys 中, 注意不要用 > ，否则会清空原有的内容，使其他人无法使用原有的密钥登录)

　　　验证： ssh slaver214

成功情况如下所示：

(6) 格式化namenode

hadoop namenode -format

观察各datanode节点是否正常。

(7) 启动HDFS，命令：start-all.sh，验证进程，用命令jps，成功启动时应该有5个进程。

namenode节点上的进程如下：

datanode节点上的进程如下：

还可以在浏览器中输入：http://172.16.51.204:50070，出现如下的界面说明安装成功。

在浏览器中输入：http://172.16.51.204:50030，出现如下界面。

2.2 Hadoop2.x的完全分布式实验环境安装

在安装Hadoop2.x时，安装JDK(32-bit)、配置hosts、配置hostname、关闭防火墙与安装hadoop1.x相同的。不过要强调一下，下面的安装是基于32-bit的centOS(在64-bit下安装Hadoop2.x需要重新编译Hadoop)，这里就从Hadoop2.x安装开始。

因为namenode与各datanode的配置相同，故在namenode节点主机上安装好后，再复制到各datanode节点主机。

2.2.1 Hadoop2.x的获取

下载地址：http://apache.claz.org/hadoop/common/hadoop-2.2.0/

将下载的hadoop-2.2.0.tar.gz上传至namenode节点主机的/usr/local目录下，也可直接用wget命令下载到此目录下。wget http://apache.claz.org/hadoop/common/hadoop-2.2.0/

2.2.2 解压hadoop-2.2.0.tar.gz

(1) 解压

tar -zxvf hadoop-2.2.0.tar.gz

(2) 重命名文件夹hadoop-2.2.0为hadoop2

mv hadoop-2.2.0 hadoop2

(3) 进入hadoop2文件夹，建data、name、tmp文件夹

cd hadoop2

mkdir data

mkdir name

mkdir tmp

[root@master101 hadoop2]# ls
bin data etc include lib libexec LICENSE.txt name NOTICE.txt README.txt sbin share tmp

2.2.3 修改Hadoop配置文件

配置HADOOP_HOME，命令：

[root@master101 hadoop]# vi /etc/profile

加入：export HADOOP_HOME=/usr/local/hadoop2

export PATH=.:$JAVA_HOME/bin:$HADOOP_HOME/bin:PATH

Hadoop2.x需要修改的配置文件有7个，都存放于hadoop2/etc/hadoop目录下，下面一一介绍各配置文件的配置。

(1) hadoop-env.sh

[root@master101 hadoop]# vi hadoop-env.sh

找到JAVA_HOME所在行，配置JAVA_HOME。如下：

export JAVA_HOME=/usr/local/jdk1.7.0_55

(2) yarn-env.sh

[root@master101 hadoop]# vi yarn-env.sh

找到JAVA_HOME所在行，配置JAVA_HOME。如下：

export JAVA_HOME=/usr/local/jdk1.7.0_55

(3) slaves

[root@master101 hadoop]# vi slaves

加入datanode节点主机的IP或hostname

slaver102
slaver103
slaver104

(4) core-site.xml

[root@master101 hadoop]# vi core-site.xml

fs.defaultFS
hdfs://master101:9000

io.file.buffer.size
131072

hadoop.tmp.dir
file:/usr/local/hadoop2/tmp

hadoop.proxyuser.hduser.hosts
*

hadoop.proxyuser.hduser.groups
*

  (5) hdfs-site.xml
[root@master101 hadoop]# vi hdfs-site.xml


dfs.namenode.secondary.http-address
master101:9001

dfs.namenode.name.dir
file:/usr/local/hadoop2/name

dfs.datanode.data.dir
file:/usr/local/hadoop2/data

dfs.replication
2

dfs.webhdfs.enabled
true

(6) mapred-site.xml

这个文件不存在时，可以通过[root@master101 hadoop]# cp mapred-site.xml.template mapred-site.xml复制

          mapreduce.framework.name
            yarn


            mapreduce.jobhistory.address
            master101:10020


            mapreduce.jobhistory.webapp.address
            master101:19888

(7) yarn-site.xml
[root@master101 hadoop]# vi yarn-site.xml

yarn.nodemanager.aux-services
mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler

yarn.resourcemanager.address
master101:8032

yarn.resourcemanager.scheduler.address
master101:8030

yarn.resourcemanager.resource-tracker.address
master101:8031

yarn.resourcemanager.admin.address
master101:8033

yarn.resourcemanager.webapp.address
master101:8088

2.2.4 分发Hadoop至各datanode节点主机

[root@master101 local]# scp -r ./hadoop2 root@slaver102:/usr/local/hadoop2

[root@master101 local]# scp -r ./hadoop2 root@slaver103:/usr/local/hadoop2

[root@master101 local]# scp -r ./hadoop2 root@slaver104:/usr/local/hadoop2

2.2.5 启动Hadoop集群

(1) 格式化namenode节点

在namenode节点进入hadoop2.x安装目录hadoop2，命令：

[root@master101 hadoop2]# ./bin/hdfs namenode -format

(2) 启动hfds

在namenode节点进入hadoop2.x安装目录hadoop2，命令：

[root@master101 hadoop2]# ./sbin/start-dfs.sh

Starting namenodes on [master101]
master101: starting namenode, logging to /usr/local/hadoop2/logs/hadoop-root-namenode-master101.out
slaver104: starting datanode, logging to /usr/local/hadoop2/logs/hadoop-root-datanode-slaver104.out
slaver103: starting datanode, logging to /usr/local/hadoop2/logs/hadoop-root-datanode-slaver103.out
slaver102: starting datanode, logging to /usr/local/hadoop2/logs/hadoop-root-datanode-slaver102.out
Starting secondary namenodes [master101]
master101: starting secondarynamenode, logging to /usr/local/hadoop2/logs/hadoop-root-secondarynamenode-master101.out

(3) 启动yarn

在namenode节点进入hadoop2.x安装目录hadoop2，命令：

[root@master101 hadoop2]# ./sbin/start-yarn.sh

starting yarn daemons
starting resourcemanager, logging to /usr/local/hadoop2/logs/yarn-root-resourcemanager-master101.out
slaver103: starting nodemanager, logging to /usr/local/hadoop2/logs/yarn-root-nodemanager-slaver103.out
slaver102: starting nodemanager, logging to /usr/local/hadoop2/logs/yarn-root-nodemanager-slaver102.out
slaver104: starting nodemanager, logging to /usr/local/hadoop2/logs/yarn-root-nodemanager-slaver104.out

2.2.6 验证

在namenode节点主机master101上执行命令： [root@master101 hadoop2]# jps，存在以下进程：

ResourceManager
NameNode
SecondaryNameNode

在datanode节点主机slaver102、slaver103、slaver104上执行命令： [root@master101 hadoop2]# jps，存在以下进程：

DataNode
NodeManager

【Linux】Hadoop-3.4.1的伪分布式集群的初步配置孤独打铁匠Julian Linux linux hadoop ubuntu
配置步骤一、检查环境JDK#目前还是JDK8最适合Hadoopjava-versionecho$JAVA_HOMEHadoophadoopversionecho$HADOOP_HOME二、配置SSH免密登录Hadoop需要通过SSH管理节点（即使在伪分布式模式下）sudoaptinstallopenssh-server#安装SSH服务（如未安装）cd~/.ssh/ssh-keygen-trsa#生
【测试工程师必备！】VS Code好用插件FastPytestRunner 花小田 pytest vscode
你是否还在为PythonTestExplorerforVisualStudioCode以下痛点焦头烂额？•测试扫描慢到怀疑人生，每次启动都要等待5分钟•调试时总是找不到断点入口，配置项复杂到崩溃•传统测试工具无法满足大规模测试需求•每次切换项目都要重新配置测试环境FastPytestRunner——专为测试工程师量身打造的极速测试利器来了！️实战进阶技巧：✅配置黄金法则：{"pytestRunne
MyBatis——基于MyBatis注解的学生管理程序基础较差的cs菜鸟 JavaEE实验 mybatis java mysql
MyBatis——基于MyBatis注解的学生管理程序Resourcedao层pojo层utils层测试层实验要求本实验要求根据学生表在数据库中创建一个s_student表，根据班级表在数据库中创建一个c_class表，班级表c_class和学生表s_student是一对多的关系。实验内容表1学生表（s_student）学生编号（id）学生名称（name）学生年龄（age）所属班级（cid）1
Hive 分区实战指南：动态分区 vs 静态分区的深度解析自然术算 Hive面试100篇 hive hadoop 数据仓库
一、为什么需要分区？在Hive数据仓库中，表数据通常以**分区（Partition）**形式组织。想象一个存储了10年电商订单的表，如果没有分区，所有数据会集中在一个目录下：/user/hive/warehouse/orders/├──part-00000├──part-00001└──...（百万个文件）这种情况下，即使执行WHEREdt='2023-12-31'的查询，Hive也需要扫描全表数
【MySQL】实战篇—数据库设计与实现：根据需求设计数据库架构 AI人H哥会Java MySQL sql mysql 数据库
在设计数据库架构时，开发者需要遵循一系列步骤，以确保数据库能够高效、可靠地满足系统需求。以下是设计数据库架构的理论知识和步骤说明。1.需求分析需求分析是数据库设计的第一步，旨在理解系统的功能需求和数据需求。通过与利益相关者（如用户、开发人员和业务分析师）进行沟通，明确系统需要存储和管理的数据类型。步骤说明识别业务需求：确定系统的主要功能，例如用户管理、订单处理、库存管理等。收集数据需求：明确每个功
数据库原理实验报告：Powerdesigner建模E-R模型并转换表不吃~香菜各类实验报告汇总需要私数据库实验报告 Powerdesigner E-R模型建模
注：此实验并不完整，仅供参考，如需完整版请私我留言一、实验目的：二、实验工具：三、实验要求：四、实验过程：图文并茂，每一步都包含详细图片，总共11页word！往期回顾：计算机接口实验报告：8254定时/计数器应用实验-CSDN博客计算机接口实验报告：D/A转换实验-CSDN博客计算机接口实验报告：LED显示实验-CSDN博客数据库原理实验报告：Powerdesigner建模E-R模型并转换表一、实
计算机接口实验报告：D/A转换实验不吃~香菜各类实验报告汇总需要私计算机接口实验报告 D/A转换实验
注：此实验并不完整，仅供参考，如需完整版请私我留言完整版包含：1、实验原理2、实验内容3、实验代码4、实验截图5、实验心得图文并茂，包含内部引脚图、线路图等，非常详细！总共10+页word！往期回顾：计算机接口实验报告：8255并行接口实验-CSDN博客计算机接口实验报告：8254定时/计数器应用实验-CSDN博客计算机接口实验报告：D/A转换实验一、实验内容编写D/A转换程序，要求产生锯齿波、脉
【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
读书笔记五 ---大数据之路--数仓分层 qq_38215991 big data 大数据
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据（进行了数据清洗）,包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。（原始数据
从零开始学习 Go 语言九班长 Golang 学习 golang 后端开发语言 gin
Go语言（又称Golang）是由Google开发的一种静态强类型、编译型、并发型编程语言。它以其简洁的语法、高效的并发支持和强大的标准库而闻名，非常适合开发高性能的服务器端应用、分布式系统和云计算工具。本文将从零开始，详细介绍如何学习Go语言，涵盖基础语法、核心概念、并发编程、工具链和实战项目等内容。1.Go语言简介1.1Go语言的特点简洁易学：语法简洁，学习曲线平缓。高效编译：编译速度快，生成的
侯捷 C++ 课程学习笔记：深入掌握 C++ 高阶特性 —— 实践与心得分享清水白石008 C++学习笔记课程教程 c++学习笔记
侯捷C++课程学习笔记：深入掌握C++高阶特性——实践与心得分享自从开始接触侯捷C++系列精品课程以来，我对C++语言有了全新的认识与深入理解。这套课程不仅系统地梳理了C++的基础知识，更从实际案例中展示了许多高阶特性和工程实战技巧。作为一名长期从事C++开发的专业人士，我深深感受到侯捷老师讲解中那种由浅入深、逻辑严密的魅力，也正是这种教学风格让我在短时间内掌握了不少难以琢磨的知识点。今天，我将结
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
FreeRTOS从入门到实战精通指南（一） niuTaylor RTOS学习与实战单片机嵌入式硬件 RTOS FREERTOS
FreeRTOS从入门到实战精通指南一、核心知识体系搭建1.FreeRTOS架构全景图硬件层FreeRTOS内核核心模块任务管理内存管理通信机制队列信号量事件组中断管理调度器二、关键概念深度解析1.抢占式调度vs中断特性抢占式调度中断触发机制软件触发（调度器决策）硬件触发（外设请求）响应速度微秒级（依赖任务切换时间）纳秒级（硬件直接响应）执行上下文任务上下文中断上下文典型应用场景任务优先级管理硬件
基础实验3-2.4 出栈序列的合法性(栈和队列的运用c语言) Feliz.. 数据结构数据结构
题目:给定一个最大容量为m的堆栈，将n个数字按1,2,3,...,n的顺序入栈，允许按任何顺序出栈，则哪些数字序列是不可能得到的？例如给定m=5、n=7，则我们有可能得到{1,2,3,4,5,6,7}，但不可能得到{3,2,1,7,5,6,4}。输入格式：输入第一行给出3个不超过1000的正整数：m（堆栈最大容量）、n（入栈元素个数）、k（待检查的出栈序列个数）。最后k行，每行给出n个数字的出栈序
Linux进程间通信：消息队列与msgget函数使用详解无形小手
本文还有配套的精品资源，点击获取简介：本文深入介绍了Linux消息队列的创建和操作方法，包括msgget()、msgsnd()和msgrcv()三个核心函数。介绍了通过消息队列实现进程间通信的基础实验步骤和关键要点，如键值计算、消息发送和接收，以及进程间通信时常见的权限控制、消息顺序、类型匹配和同步问题。通过学习这些内容，开发者能够更好地理解和掌握如何在项目中实现高效的进程间通信。1.Linux消
Python 数据分析实战：跨境电商行业发展解析萧十一郎@ python python 数据分析开发语言
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1跨境电商消费者地域分布分析2.4.2跨境电商商品销售与价格关系分析2.4.3跨境电商行业未来发展预测三、主要的代码难点解析3.1数据收集3.2数据清洗-销售数据处理3.3数据分析-跨境电商消费者地域分布分析3.4数据分析-跨境电商商品销售与价格关系分析3.5数据可视化四、可能改进的代码4.1数据收集
用Python爬虫获取AliExpress商品信息：item_search API接口实战指南 JelenaAPI小小爬虫 Python API python 爬虫开发语言
引言在全球化电商的浪潮中，数据的力量不容小觑。对于电商分析师、市场研究者以及在线商家而言，能够快速获取商品信息是至关重要的。AliExpress作为全球知名的跨境电商平台，提供了丰富的商品数据。本文将介绍如何使用Python爬虫结合item_searchAPI接口，按关键字搜索并获取AliExpress上的商品信息。一、为什么选择Python爬虫Python因其简洁的语法和强大的库支持，成为编写爬
通过Bokeh实现大规模数据可视化的最佳实践【从静态图表到实时更新】步入烟尘算法指南信息可视化 Bokeh python
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
抖音视频数据获取实战：从API调用到热门内容挖掘爱搞技术的猫猫 API 音视频
在短视频流量为王的时代，掌握抖音热门视频数据已成为内容运营、竞品分析及营销决策的关键。本文将手把手教你通过抖音开放平台API获取视频详情数据，并提供完整的代码实现及商业化应用思路。一、抖音API权限申请与核心接口抖音API需企业资质认证，个人开发者权限受限。以下是接入流程：企业开发者认证•登录开放平台，选择注册，提交信息等材料。•完成认证后，创建应用（如“视频数据分析工具”），获取ClientKe
Python 爬虫实战：社交媒体品牌反馈数据抓取与舆情分析西攻城狮北 python 爬虫媒体
一、引言在当今数字化时代，社交媒体已成为公众表达意见、分享信息的重要渠道。品牌的声誉和市场表现往往受到消费者在社交平台上的反馈和评价的影响，因此品牌舆情分析变得至关重要。本文将介绍如何使用爬虫技术爬取社交媒体上的品牌反馈数据，并通过数据分析技术，分析品牌的舆情动态。二、环境准备在开始之前，确保你的开发环境已经安装了以下必要的Python库：requests:用于发送HTTP请求。beautiful
[AI速读]用持续集成（CI）优化芯片验证环境：Jenkins与EDA工具的实战指南 iccnewer ci/cd jenkins 运维
在芯片验证中，回归测试（RegressionTest）是确保设计稳定性的关键步骤。但随着设计复杂度增加，手动管理海量测试用例、分析日志和覆盖率数据变得异常耗时。本文将介绍如何利用持续集成（CI）工具Jenkins，结合EDA验证环境（如CadencevManager），实现自动化测试与结果分析，大幅提升验证效率。传统验证的痛点在传统流程中，验证工程师通常面临以下挑战：手动操作多：每次代码提交后，需
pfsense部署四（静态路由的配置） SecPulse pfsense使用 pfsense 开源防火墙人工智能服务器组网网络安全 tcp/ip
目录一.介绍二.配置过程一.介绍pfsense开源防火墙经常在进行组网时，通常会用于连接不同的网络，在这个时候进需要给pfsense配置路由，而这篇文章介绍的是静态路由的配置二.配置过程拓扑图：本次实验使用ensp模拟器进行模拟，使用一个cloud连接pfsense，有两个网段，分别是192.168.184.0/24和192.168.111.0/24首先给cloud进行配置给AR1配置ip地址sy
企业磁盘管理实战：常见问题与高效解决方案 Gold Steps. 技术博文分享 linux 运维服务器
案例1：开发环境内存不足，大量占用Swap场景还原测试服务器运行多个内存密集型应用时，物理内存耗尽，系统频繁触发Swap交换机制。由于Swap分区不足，测试任务卡顿甚至中断，但物理内存无法临时扩容，需快速缓解内存压力。优化方案为测试环境临时创建Swap分区，平衡内存负载。遵循“内存≤8G时Swap=1-1.5倍内存，内存>8G时Swap≤8G”原则，避免过度依赖Swap影响性能。解决措施#步骤1：
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
Hadoop 集群规划与部署最佳实践 AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2009年2月2日，ApacheHadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征，因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念，因此可以轻松应对数据量、计算能力和存储成本的增长。2013年底，
轻松入门Apache SeaTunnel：数据集成利器窝窝和牛牛 SeaTunnel ETL 数据集成
文章目录轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnel基本原理运行流程SeaTunnelvsDataX：两大数据集成工具对比实战场景：MySQL数据同步至ElasticsearchSeaTunnel实现方案DataX实现方案实现原理对比底层依赖环境方案优缺点分析快速上手环境准备简单示例总结轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnelAp
MySQL 到 Hadoop：Sqoop 数据迁移 ETL Ice星空 ETL
文章目录ETL：Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS：OperationalDataStore-可操作数据存储2.DW：DataWarehouse-数据仓库3.DM：DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
java毕业设计，网上商城系统爱编程的小哥 java毕设 java 课程设计 spring boot vue
️OnlineMall商城系统全解析|Vue3+SpringBoot全栈实战（附高并发与数据安全方案）一、系统架构全景基于七张效果图分析，该系统是企业级电商综合管理平台，采用SpringBoot3+Vue3+ElementPlus+MyBatisPlus技术栈，覆盖商品管理、订单处理、会员运营等核心场景。通过RBAC权限控制+Elasticsearch搜索+分布式事务三大技术亮点，支持10万级商品
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

Hadoop实战之路——第二章 Hadoop集群实验环境安装

你可能感兴趣的:(Hadoop实战之路——第二章 Hadoop集群实验环境安装)