_Old_Summer

从零开始安装Hadoop

一新建虚拟机

二设置固定IP

三检验

3.1 查看虚拟机能否Ping通我们设置的IP地址

3.2 查看虚拟机能否连通外网

3.3 查看主机能否Ping通我们的虚拟机

四 SSH无密登陆、远程连接、关闭防火墙

五安装JDK

六本地模式

6.1 参数配置

6.2 验证

七伪分布式模式

八完全分布式模式

8.1 /etc/hadoop/hadoop-env.sh

8.2 /etc/hadoop/yarn-env.sh

8.3 /etc/hadoop/slaves

8.4 /etc/hadoop/core-site.xml

8.5 /etc/hadoop/hdfs-site.xml

8.6 /etc/hadoop/mapred-site.xml

8.7 /etc/hadoop/yarn-site.xml

8.8 克隆虚拟机

8.9 配置SSH免密登录

8.10 配置时间同步

所需工具：

VMware 15 pro
Linux操作系统 CentOS 7
Hadoop 2.10.1
JDK-18

一新建虚拟机

Hadoop是基于分布式集群进行数据存储（HDFS）和运算（MapReduce）的，也就是我们需要多台机器，可以选择真正用多台电脑构建一个集群，如果手中没有多台电脑，则可以利用虚拟机构建出多台电脑，虚拟机就是可以利用一台真实机器假装出多台机器的一个工具。打开VMware，创建新的虚拟机

选择典型安装就可以

到http://mirrors.bupt.edu.cn/centos/7.9.2009/isos/x86_64/CentOS-7-x86_64-DVD-2009.iso上下载Linux操作系统，然后映像文件选择你刚才下载到的文件路径

点击自定义硬件，重新配置我们新建虚拟机的硬件属性(尽量分配较大的内存)

网络这里选择NAT模式或者自定义下面下拉框中的VMnet8都可以，就是一种网络连接方式，不用细究，后面会讲。然后点击完成，等待安装就可以了。

二设置固定IP

参考了centOS7虚拟机设置固定IP - 正怒月神 - 博客园这步操作是什么意思呢，我们建立完了一个虚拟机，多个虚拟机之间是通过IP地址互相通信的，我们希望自己设置我们虚拟机的IP地址，而不是由系统自动分配。（这步很关键一定不要弄错）假设我们现在想将我们新建立的这台虚拟机的IP地址设置为192.168.2.2 安装完系统点击重启之后，应该是来到这个界面

这是Linux的命令行界面，咱们平时用的Windows那个界面叫图形化界面，如果只是在Linux中进行一些工作，不上网娱乐什么的，这个命令行界面足够了。 localhost login那里输入你想登录的用户名，这里用root账号登录，然后系统会让你输入对应的密码，注意这里用主键盘上的数字输入密码，不要用小键盘上的数字输入（注意，输入的密码是不会在屏幕上显示的）正确输入后，我们就进入系统了

“root@localhost ~”的意思是当前用户是root，主机名是localhost，~是当前工作目录，也就是根目录输入指令

cd /etc/sysconfig/network-scripts/

这里cd表示目录跳转，/etc这个目录是关于系统配置的目录，因为我们要改IP地址，那就是修改网络配置，所以跳到/etc/sysconfig/network-scripts/这个目录下输入指令

ls

列出这个目录下都有哪些文件

用vim编辑ifcfg-ens33这个文件，这个文件是关于网卡的配置文件，输入指令

vi ifcfg-ens33

这样我们就打开这个文件了，因为我们是用root账号登录的，所以我们可以对其进行更改

按下'i’进入文本编辑模式，改成下面这样

重点更改几个属性的值 BOOTPROTO这个属性改成static，取消原先的dhcp设置 onboot这个属性改成yes，设置为开机读取我们这个配置添加IPADDR属性，这里写想要改成的固定IP地址添加NETMASK属性，这里是子网掩码，照着填就行添加GATEWAY（注意拼写）,这里是网关的地址，前3个字段应该与你要设置的IP地址的前三个字段一致，最后一个建议设为1，省的忘记，然后你的IP地址从2开始添加DNS1属性，这里是DNS的地址更改完之后按ESC，然后输入

::wq!

这样就把我们的配置信息写入进去了输入

service network restart

重启网络。点击虚拟机上方菜单中的'编辑->虚拟网络编辑器'选项

选择VMnet8那个选项，这是虚拟机虚拟出来的网卡，点击'更改设置'

取消'使用本地DHCP...'那个勾选，然后子网IP设置为与你自己要设置的IP地址的前三个字段相同，最后一个是0，子网掩码是255.255.255.0，然后点击'NAT设置'

把刚才设置的网关地址填上，然后点击确定一路返回就可以回到Windows主机，打开设置中的WLAN->更改适配器选项

右键第二个那个VMnet8，点击属性

点击Internet 协议版本4的属性选项，填入具体地址，这里的IP地址不要跟你设置的虚拟机IP地址相同

然后一路确定返回就可以

三检验

到这里需要检验一下IP设置是否成功

3.1 查看虚拟机能否Ping通我们设置的IP地址

如果出现下面这样的结果证明可以Ping通

按Ctrl+z停止ping

3.2 查看虚拟机能否连通外网

Ping一下百度，如果出现下面这样的结果证明能Ping通

3.3 查看主机能否Ping通我们的虚拟机

回到Windows主机，win+r然后输入cmd打开命令行窗口，ping我们设置的虚拟机IP地址，如果出现下面结果证明能够Ping通，如果不成功关闭Windows防火墙再试试

四 SSH无密登陆、远程连接、关闭防火墙

首先配置SSH无密码登录输入

ssh-keygen -t rsa

然后连着按三次Enter确认

设置IP和域名的映射，输入

vi /etc/hosts

按'i’在文件里填入我们虚拟机的IP地址和域名映射

master就是我们上面新建的那个虚拟机，后面的slave.x是后面要通过克隆机制新建的其它虚拟机，先不用管复制公钥到master认证文件,输入

ssh-copy-id -i /root/.ssh/id_rsa.pub master

按照提示输入'yes’和密码就可以其它虚拟机（可以先跳过）同样进行复制

ssh-copy-ip -i /root/.ssh/id_rsa.pub slave1 
ssh-copy-ip -i /root/.ssh/id_rsa.pub slave2 
ssh-copy-ip -i /root/.ssh/id_rsa.pub slave3

然后输入

ssh master

查看我们是否设置成功，如果出现下面的结果证明设置成功

利用WinScp等工具远程连接到我们的虚拟机，为什么要远程连接呢，比如我们下面需要下载JDK和Hadoop，如果直接在虚拟机上下载会很慢，我们可以在Windows主机上下载，然后通过远程连接上传到虚拟机中

主机名那里写你前面设置的虚拟机IP地址就可以，然后输入用户名和密码进行远程连接，默认会来到相应用户的根目录下。接下来关闭主机的防火墙切换到root,输入

firewall-cmd --state

可以查看当前防火墙状态输入

systemctl stop firewalld.service

关闭防火墙输入

systemctl disable firewalld.service

禁止防火墙服务开机自启

五安装JDK

Hadoop依赖Java，需要安装JDK，去官网下载JDK，然后通过远程连接上传到虚拟机中

然后用你远程连接登录的号，再次登录虚拟机，输入ls，检验文件是否上传成功

然后输入

tar zxvf openjdk_18_linux-x64_bin.tar.gz

将JDK包解压到当前文件夹，然后输入

cd jdk-18/bin

进入解压之后JDK的bin文件夹然后输入

./java -version

检验JDK是否安装成功，如果是下面这样表明成功

接下来配置环境变量PATH，这样可以直接在命令行中使用Java的相关命令首先跳转到jdk的解压目录下，输入

pwd

记录一下它输出的这个变量信息

输入

su -

输入密码切换到root 输入

vi /etc/profile

进行环境变量配置，在文件末尾添加

export JAVA_HOME=刚才你记录的输出

export PATH=$PATH:$JAVA_HOME/bin

然后输入

source /etc/profile java -version

如果出现以下输出证明配置成功

Hadoop具有三种安装模式：

本地模式：无须任何守护进程，所有程序在同一个JVM上执行，如果只是想玩玩Hadoop写几个MapReduce程序，这个模式足够了。
伪分布式模式：当前机器既是主节点也是从节点，所有的守护进程运行在同一个机器上，模拟集群
完全分布式模式：当前机器是主节点，然后其它机器是从节点，节点之间通过网络进行通信，真正的集群

下面分别对这三种不同的安装模式进行说明

六本地模式

本地模式安装步骤如下：

安装虚拟机
设置固定IP
安装JDK
配置SSH无密登陆
Hadoop环境参数配置
验证

1~4前面都说了下面说参数配置

6.1 参数配置

修改hadoop-env.sh文件，设置正确的JAVA_HOME位置即可

跳转到你的hadoop解压目录下，所有的配置文件都在你的hadoop解压目录/etc/hadoop这个目录中，用cd跳转到这个目录下

cd user/hadoop-2.10.1/etc/hadoop

获取当前系统Java的配置位置

which java

记录下这个输出

输入

vi hadoop-en.sh

在其中加入

exprot 你的Java配置位置

这样就配置完毕了。

PATH中加入Hadoop root下输入

vi /etc/profile

添加Hadoop环境变量

然后输入

source /etc/profile

这样可以直接在命令行中利用Hadoop命令

6.2 验证

输入

hadoop fs -ls

这是查看HDFS系统，列出其下的文件，因为我们是本地模式，所以输出就是本机的目录，如果输出下面这样证明本地模式安装成功，可以运行MapReduce任务了

七伪分布式模式

伪分布式就是本机即当主节点（master）也当从节点(slaves) 安装步骤如下：

安装虚拟机
配置固定IP
配置无密登陆SSH，关闭防火墙
安装JDK
安装Hadoop
Hadoop参数配置
验证

1~5按照前面所说的进行即可 6和7可参考https://www.cnblogs.com/thousfeet/p/8618696.html 修改主机IP地址映射表 vi /etc/hosts 添加你虚拟机和域名的映射

master是当前主机，IP地址时192.168.128.130，后面那三个是从节点，后面完全分布式模式的时候用。然后输入 ping master 如果能ping通证明配置成功

八完全分布式模式

完全分布式模式下存在多台机器，这些机器构成一个集群，其中一台是主节点（master）其余是从节点（slaves）。主节点协调多个从节点对外提供服务，这样虽然集群是由多个节点组成，但是对于客户来说感觉上就像是一台普通的机器。安装步骤如下：

安装虚拟机
设置固定IP
安装JDK
安装Hadoop
配置Hadoop
克隆虚拟机
配置SSH免密码登录
配置时间同步服务

1~4按照前面说的就行 Hadoop的配置涉及到以下7个文件

/etc/hadoop/hadoop-env.sh:Hadoop运行基本环境配置
/etc/hadoop/yarn-env.sh：YARN框架运行环境配置
/etc/hadoop/slaves:slave节点信息配置
/etc/hadoop/core-site.xml：核心属性配置文件
/etc/hadoop/hdfs-site.xml：HDFS属性配置文件
/etc/hadoop/mapred-site.xml:MapReduce属性配置文件
/etc/hadoop/yarn-site.xml：YARN属性配置文件

下面按照顺序介绍相应文件的配置首先进入Hadoop的解压目录下的/etc/hadoop，这里根据你hadoop的解压情况自己进行跳转，比如我这里是

cd hadoop-2.10.1/etc/hadoop

8.1 /etc/hadoop/hadoop-env.sh

这里要配置我们JDK的安装位置老样子vi命令进入对应文件进行更改，将export那行改成你JDK 的安装路径

8.2 /etc/hadoop/yarn-env.sh

这里也是改JDK的安装路径，添加一行

8.3 /etc/hadoop/slaves

设置节点的信息，添加我们克隆的三个虚拟机节点

8.4 /etc/hadoop/core-site.xml

所谓的xml文件不要想的多么复杂，它就是一个键值对映射，改成下面这样

在中我们定义了两个属性,第一个属性是HDFS系统的命名，以及其位置是主机的8020端口，第二个属性配置了Hadoop临时文件的存放位置

8.5 /etc/hadoop/hdfs-site.xml

定义了四个属性，分别指定了NameNode和DataNode数据的存储位置，SecondaryNameNode的地址，文件块的副本数

8.6 /etc/hadoop/mapred-site.xml

我下的这个Hadoop中这个文件名已经改成mapred-site.xml.template了，注意一下自己的hadoop中的文件名，添加以下配置，设置mapreduce使用yarn框架

8.7 /etc/hadoop/yarn-site.xml

添加以下配置


 yarn.resourcemanager.hostname 
master 
 
 
yarn.resourcemanager.address 
master:8032 
 
 
yarn.resourcemanager.scheduler.address 
master:8030 
 
 
yarn.resourcemanager.webapp.address 
master:8088 
 

 yarn.resourcemanager.webapp.https.address
 master:8090
  
 
yarn.resourcemanager.ressource-tracker.address 
master:8031 
 
 
yarn.resourcemanager.admin.address
 master:8033
  

 yarn.nodemanager.local-dirs 
/home/oldsummer/data/hadoop/yarn/local
  
 
yarn.log-aggregation-enable 
true 

 
 yarn.nodemanager.remote-app-log-dir
 /home/oldsummer/data/tmp/logs
 
 
 yarn.log.server.url 
http://master:19888/jobhistory/logs/
 URL for job history server 

 
 yarn.nodemanager.vmem-check-enabled
 false
 
 
 yarn.nodemanager.aux-services 
mapreduce_shuffle 

  
yarn.nodemanager.aux-services.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler 
 
 
yarn.nodemanager.resource.memory-mb
 2048
  
 
yarn.scheduler.minimum-allocation-mb 
512 
 

 yarn.shceduler.maximum-allocation-mb 
4096
  
 
mapreduce.map.memory.mb
 2048
  
 
mapreduce.reduce.memory.mb 
2048 
 
 
yarn.nodemanager.resource.cpu-vcores
 1

8.8 克隆虚拟机

关闭当前虚拟机，右键克隆->创建完整克隆等待克隆，然后修改相关配置，先删除一个文件

rm -rf /etc/udev/rules.d/70-persistent-net.rules

然后输入

ifconfig -a

记录下HWADDR的值修改slaves的网卡配置，修改HWADDR、IPADDR的值，注释掉UUID

输入

vi /etc/sysconfig/network

修改机器名，然后重启，主机和克隆机之间互ping一下查看是否成功，按照同样的步骤克隆slaves2、slaves3

8.9 配置SSH免密登录

在主节点master上，输入

ssh-keygen -t rsa

然后连按三次enterssh 然后复制公钥到相应机器中

ssh-copy-id -i /root/.ssh/id_rsa.pub master

ssh-copy-id -i /root/.ssh/id_rsa.pub slave1

ssh-copy-id -i /root/.ssh/id_rsa.pub slave2

ssh-copy-id -i /root/.ssh/id_rsa.pub slave3

按照提示输入yes和密码即可，最后在master下分别输入 ssh slave1 ssh slave2 ssh slave3 如果登录上了证明配置成功

8.10 配置时间同步

在每个机器上输入

yum install -y ntp

安装时间同步工具

设置master节点为主节点，在master中

vi /etc/ntp.conf

注释掉以server开头的行，并添加

restrict 192.168.0.0 mask 255.255.255.0

nomodify notrap server 127.127.1.0

fudge 127.127.1.0 stratum 10

在slave机器中同样注释掉server开头的行，然后添加

server master

然后确定所有机器都关闭了防火墙在master节点输入

service ntpd start chkconfig ntpd on

在slave节点输入

ntpdate master service ntpd start chkconfig ntpd on

启动时间同步服务这样就安装、配置完毕了，接下来就是该初始化初始化，启动集群就启动集群，如果还是出现问题可以参考这篇文章修改一下配置hadoop分布式集群的启动和关闭的问题_ghsticker的博客-CSDN博客_hadoop集群开启后忘记关闭

你可能感兴趣的:(数据,hadoop)

为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
UNIX域套接字
1、UNIX域套接字的定义UNIX域套接字是进程间通信（IPC）的一种方式，不涉及网络协议栈，因此在同一台主机上的通信中，它比基于TCP/IP协议的网络套接字更快速、更高效。2、UNIX域套接字的分类字节流套接字（SOCK_STREAM）：提供面向连接的、可靠的数据传输服务。数据报套接字（SOCK_DGRAM）：提供无连接的数据传输服务，数据以独立的数据报形式传输。3、UNIX套接字与TCP/IP
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
“Datawhale AI夏令营”基于带货视频评论的用户洞察挑战赛 fzyz123 Datawhale AI夏令营人工智能 Datawhale 大模型技术 NLP 深度学习 AI夏令营
前言：本次是DatawhaleAI夏令营2025年第一期的内容，赛事是：基于带货视频评论的用户洞察挑战赛（科大讯飞AI大赛）一、赛事背景在直播电商爆发式增长浪潮中，短视频平台积累的海量带货视频及用户评论数据蕴含巨大商业价值。这些数据不仅是消费者体验的直接反馈，更是驱动品牌决策的关键资产。用户洞察的核心在于视频内容与评论数据的联合挖掘：通过智能识别推广商品分析评论中的情感表达与观点聚合精准捕捉消费者
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

从零开始安装Hadoop

一 新建虚拟机

二 设置固定IP

三 检验

3.1 查看虚拟机能否Ping通我们设置的IP地址

3.2 查看虚拟机能否连通外网

3.3 查看主机能否Ping通我们的虚拟机

四 SSH无密登陆、远程连接、关闭防火墙

五 安装JDK

六 本地模式

6.1 参数配置

6.2 验证

七 伪分布式模式

八 完全分布式模式

8.1 /etc/hadoop/hadoop-env.sh

8.2 /etc/hadoop/yarn-env.sh

8.3 /etc/hadoop/slaves

8.4 /etc/hadoop/core-site.xml

8.5 /etc/hadoop/hdfs-site.xml

8.6 /etc/hadoop/mapred-site.xml

8.7 /etc/hadoop/yarn-site.xml

8.8 克隆虚拟机

8.9 配置SSH免密登录

8.10 配置时间同步

你可能感兴趣的:(数据,hadoop)

一新建虚拟机

二设置固定IP

三检验

五安装JDK

六本地模式

七伪分布式模式

八完全分布式模式