syp_net

Hadoop-2.6.5完整安装配置过程

记录Hadoop-2.6.5完整安装配置过程

一、Hadoop是什么？
二、Hadoop-2.6.5安装配置
- 1. 修改主机名
- 2. 下载并解压JDK
- 3. 配置环境变量
- 4. 修改Hadoop中5个主要配置文件
- 5. 启动Hadoop
- 6. Hadoop Web端口测试
三、总结

一、Hadoop是什么？

Hadoop系统最初的源头来自于Apache Lucene项目下的搜索引擎子项目Nutch，该项目的负责人是Doug Cutting。
2003年，Google为了解决其搜索引擎中大规模Web网页数据的处理，研究发明了一套称为MapReduce的大规模数据并行处理技术。
2004年，在OSDI会议上发表了题为：“MapReduce: Simplified Data Processing on Large Clusters”的论文，简要介绍了MapReduce的基本设计思想。
Doug Cutting发现Google MapReduce所解决的大规模搜索引擎数据处理问题，正是他同样面临并急需解决的问题。因此，他尝试模仿Google MapReduce的设计思路，用Java设计实现了一套新的MapReduce并行处理系统，并将其与Nutch分布式文件系统NDFS结合，用以支持Nutch搜索引擎的数据处理。
2006年，将NDFS和MapReduce从Nutch项目中分离出来，成为一套独立的软件系统，并用Doug Cutting小儿子当时牙牙学语称呼自己玩具小象的名字“Hadoop”命名了这个系统。

二、Hadoop-2.6.5安装配置

下面我们将以Hadoop-2.6.5（下载地址请见这里）为例，说明它的安装配置过程。

1. 修改主机名

我们需要在Linux CentOS的两个配置文件中修改主机名信息，具体操作主要包括两个步骤：

操作如下（示例）：

（1）修改/etc/sysconfig下的network文件，将其中HOSTNAME的值修改为用户指定的主机名。

（a）打开network文件：

vi /etc/sysconfig/network

（b）修改network文件中HOSTNAME的值：

NETWORKING=yes
HOSTNAME=shengyphadoop

其中，shengyphadoop是我们指定的主机名。

（2）修改/etc下的hosts文件，增加一条IP地址到主机名的映射信息。

192.168.238.101   localhost shengyphadoop

其中，192.168.238.101是CentOS所在主机的静态IP地址，shengyphadoop是我们指定的主机名。

待上述修改完成后，我们需要通过hostname命令使之生效：

hostname  shengyphadoop

最后，我们可以选择ping命令或hostname命令检查修改后的主机名，如下所示。

2. 下载并解压JDK

在当前配置中，我们用到的JDK是jdk1.8.0_191版本（下载地址请见【百度网盘】(链接：https://pan.baidu.com/s/14IpNNHfRJYQCzZ2kl11gYA ，提取码：4dhg）.

（1）下载jdk1.8.0_191后，将它上传至CentOS系统（在这里，我们上传到的CentOS目录为：/home/shengyp/tools；采用filezilla（下载地址请见【百度网盘】(链接：https://pan.baidu.com/s/1tFVcIKtbraYg7CynDXtzaA ，提取码：o6oa））作为文件传输工具（即上传工具）。

（2）使用tar -zxf命令对jdk1.8.0_191进行解压：

[root@shengyphadoop tools]#tar -zxf  ./jdk-8u191-linux-x64.tar.gz

3. 配置环境变量

根据hadoop压缩包的解压路径，在系统全局配置文件/etc/profile中增加相应的环境变量，具体操作主要包括两个步骤：

操作如下（示例）：

（1）进入hadoop-2.6.5.tar.gz包所在的目录（这里是：/home/shengyp/tools），通过tar -zxf命令对其进行解压：

[root@shengyphadoop tools]#tar -zxf  ./hadoop-2.6.5.tar.gz

（2）进入/etc/profile文件，在该文件的末尾处创建JAVA_HOME和HADOOP_HOME环境变量，并将它们进行赋值。

（a）打开/etc/profile文件：

[root@shengyphadoop tools]#vi  /etc/profile

（b）使用export命令增加JAVA_HOME和HADOOP_HOME两个环境变量，并对它们进行赋值。最后，在PATH变量中通过$符号引用以上两个变量，指定到它们各自的/bin和/sbin目录，并通过分号；依次进行黏贴。

export JAVA_HOME=/home/shengyp/tools/jdk1.8.0_191
export HADOOP_HOME=/home/shengyp/tools/hadoop-2.6.5
export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$PATH

其中，JAVA_HOME的值为jdk-8u191-linux-x64.tar.gz的解压目录，HADOOP_HOME的值为hadoop-2.6.5.tar.gz的解压目录。

4. 修改Hadoop中5个主要配置文件

在hadoop-2.6.5.tar.gz的解压文件中，我们主要关注hadoop-2.6.5/etc/hadoop下的hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml这5个主要配置文件。接下来，我们将给出它们的主要配置：

（1）在hadoop-env.sh文件中，修改JAVA_HOME变量，将它的值设置为jdk-8u191-linux-x64.tar.gz的解压目录，于是有：

值得进一步说明的是，如果在这里不进行设置，在格式化namenode节点时，将会报JAVA_HOME is not set and could not be found.的错误，

以下帖子中同样提到了上述错误的解决办法：
hadoop启动过程中出现Error: JAVA_HOME is not set and could not be found.解决办法

【前奏开始】
在介绍以下4个配置文件中的核心配置前，我们可以看看官方模板中的相关配置说明（请见【百度网盘】(链接：https://pan.baidu.com/s/1yq1uhVEAvVxHviFGixqXlg ，提取码：cjn4）。例如，在模板core-site-template.xml中，我们可以看到核心键-值（key-value）的模板配置，以及关于该配置的描述信息，如下图所示。

【前奏结束】

正曲开始…

（2）在core-site.xml文件中，增加的内容包括：

<configuration>
	<property>
		<name>fs.default.name</name>
        <value>hdfs://shengyphadoop:9000
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/home/shengyp/tools/hadoop-2.6.5/tmp</value>
	</property>
	<property>
		<name>dfs.namenode.secondary.http-address</name>
		<value>shengyphadoop:9001</value>
	</property>
</configuration>

其中，
（a）键fs.default.name的值的模板为hdfs://localhost:9000，我们将其中的localhost设置为shengyphadoop，即本机的主机名，读者同样可以换成本机的IP地址；9000为默认端口号。

（b）键hadoop.tmp.dir的值的模板为/tmp/hadoop-${user.name}，即一个存储HDFS以及namenode相关信息的临时文件目录，我们在hadoop-2.6.5.tar.gz的解压目录（/home/shengyp/tools/hadoop-2.6.5/）中通过mkdir命令新建tmp目录，并将该目录的地址赋值给上述键值。

（c）键dfs.namenode.secondary.http-address的值的模板为localhost:9001，我们将其中的localhost设置为shengyphadoop，即本机的主机名，读者同样可以换成本机的IP地址；9001为默认端口号。

（3）在hdfs-site.xml文件中，增加的内容包括：

<configuration>
	<property>
		<name>dfs.namenode.name.dir</name>
        <value>/home/shengyp/tools/hadoop-2.6.5/dfs/name</value>
	</property>
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>/home/shengyp/tools/hadoop-2.6.5/dfs/data</value>
	</property>
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
</configuration>

其中，
（a）键dfs.namenode.name.dir的值的模板为file://${hadoop.tmp.dir}/dfs/name，我们在hadoop-2.6.5.tar.gz的解压目录（/home/shengyp/tools/hadoop-2.6.5/）中通过mkdir -p命令新建dfs/name目录，并将该目录的地址赋值给上述键值。

（b）键dfs.datanode.data.dir的值的模板为file://${hadoop.tmp.dir}/dfs/data，我们在hadoop-2.6.5.tar.gz的解压目录（/home/shengyp/tools/hadoop-2.6.5/）中通过mkdir -p命令新建dfs/data目录，并将该目录的地址赋值给上述键值。

（c）键dfs.replication的值的模板为3，即副本集的个数，由于我们采用“伪分布式”部署模式，故将副本集的个数由3改为1。

（4）在mapred-site.xml文件中，增加的内容包括：

<configuration>
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
	<property>
		<name>mapreduce.cluster.local.dir</name>
		<value>/home/shengyp/tools/hadoop-2.6.5/mapred/local</value>
	</property>
	<property>
		<name>mapreduce.jobtracker.system.dir</name>
		<value>/home/shengyp/tools/hadoop-2.6.5/mapred/system</value>
	</property>
</configuration>

其中，
（a）键mapreduce.framework.name的值的模板为local，由于我们采用yarn作为资源调度框架，进而为mapreduce进程分配资源。因此，这里将local改为yarn。

（b）键mapreduce.cluster.local.dir的值的模板为${hadoop.tmp.dir}/mapred/local，我们在hadoop-2.6.5.tar.gz的解压目录（/home/shengyp/tools/hadoop-2.6.5/）中通过mkdir -p命令新建/mapred/local目录，并将该目录的地址赋值给上述键值。

（c）键mapreduce.jobtracker.system.dir的值的模板为${hadoop.tmp.dir}/mapred/system，我们在hadoop-2.6.5.tar.gz的解压目录（/home/shengyp/tools/hadoop-2.6.5/）中通过mkdir -p命令新建/mapred/system目录，并将该目录的地址赋值给上述键值。

（5）在yarn-site.xml这个文件中，增加的内容包括：

<configuration>
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>shengyphadoop</value>
	</property>
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
</configuration>

其中，
（a）键yarn.resourcemanager.hostname的值的模板为0.0.0.0，我们将其中的0.0.0.0地址修改为shengyphadoop，即本机的主机名，读者同样可以换成本机的IP地址。

（b）键yarn.nodemanager.aux-services的值的模板为，我们将该键值修改为mapreduce_shuffle。

为方便读者进一步查看相关配置，作者已将上述5个已填充的主要配置文件上传至百度网盘，请见【这里】(链接：https://pan.baidu.com/s/1l4Zzu8aQXMYju6sIwT30sw ，提取码：ks7q）

5. 启动Hadoop

完成上述主要配置后，我们可以正常启动Hadoop-2.6.5了。Hadoop的启动命令/脚本主要在/home/shengyp/tools/hadoop-2.6.5/bin目录，或者是/home/shengyp/tools/hadoop-2.6.5/sbin目录下。

（1）进入/home/shengyp/tools/hadoop-2.6.5/bin目录，通过hdfs namenode -format命令初始化namenode节点：

[root@shengyphadoop hadoop-2.6.5]#cd ./bin
[root@shengyphadoop hadoop-2.6.5]#hdfs namenode -format

注意，这时如果出现unknownhostexception错误，请见以下帖子：
hadoop分布式格式化时出现异常java.net.unknownhostexception

【小技巧开始】

当我们不记得命令参数时，可以使用-help命令来查看说明，例如：

【小技巧结束】

（2）在/home/shengyp/tools/hadoop-2.6.5/sbin目录（这里是/sbin目录，不是/bin目录）下，我们通过以下命令启动namenode、datanode、jobhistory、resourcemanager、nodemanager这5个守护进程：

（a）通过hadoop-daemon.sh start namenode命令启动namenode进程：

这里，我们可以看到：namenode进程的启动信息被写入了/home/shengyp/tools/hadoop-2.6.5/logs/hadoop-root-namenode-shengyphadoop.out这个日志文件中。换句话而言，我们可以通过查看该日志文件，追踪namenode进程的启动过程，尤其是排查相关错误。

（b）通过hadoop-daemon.sh start datanode命令启动datanode进程：

类似地，datanode进程的启动信息被写入了/home/shengyp/tools/hadoop-2.6.5/logs/hadoop-root-datanode-shengyphadoop.out这个日志文件中。

（c）通过mr-jobhistory-daemon.sh start historyserver命令启动jobhistory进程：

（d）通过yarn-daemon.sh start resourcemanager命令启动resourcemanager进程：

（e）通过yarn-daemon.sh start nodemanager命令启动nodemanager进程：

最后，我们可以通过jps命令查看目前系统中的守护进程：

此外，我们同样可以通过hadoop-daemon.sh stop namenode命令、
hadoop-daemon.sh stop datanode命令、
mr-jobhistory-daemon.sh stop historyserver命令、
yarn-daemon.sh stop resourcemanager命令和
yarn-daemon.sh stop nodemanager命令来关闭
namenode进程、datanode进程、jobhistory进程、jobhistory进程、resourcemanager进程和nodemanager进程。

这里值得进一步说明的是，

6. Hadoop Web端口测试

除使用jps命令外，我们同样可以通过hadoop Web端口查看这些守护进程背后的Web服务。关于hadoop Web端口，请见常用hadoop和yarn的端口

（1）在50070端口进行测试，如下图所示：

（2）在8088端口进行测试，如下图所示：

（3）在8042端口进行测试，如下图所示：

（4）在19888端口进行测试，如下图所示：

三、总结

提示：这里对文章进行总结：
例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

【彩蛋来了】

看完作者写的这篇博文，或许读者还想再找找描述类似内容的博文。预料之中，作者已将它们附上，请参见：

centOS 6.4主机名的修改和网络配置ip、DNS等配置
linux jdk1.7 下载
转（hadoop2.6.3环境搭建）
hadoop_2.6.5集群安装
Hadoop2.6.5安装部署及环境变量配置
hadoop2.6.5 linux安装
hadoop 2.6.5安装详细步骤
Hadoop分别启动namenode,datanode,secondarynamenode等服务
hadoop namenode启动不了_Hadoop 安装教程 - HA方式

updated in 2021.12.16

OpenHarmony解读之设备认证：Pake协议详解与实战陈乔布斯鸿蒙开发 HarmonyOS OpenHarmony harmonyos 分布式鸿蒙开发软总线 openHarmony 嵌入式硬件
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）①鸿蒙应用开发与鸿蒙系统开发哪个更有前景？②嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~③对于大前端开发来说，转鸿蒙开发究竟是福还是祸？④鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？⑤记录一场鸿蒙开发岗位面试经历~⑥持续更新中……一、概述在设备认证过程中，pake协议用于认证会话密钥协商，基于该会话密钥，双方可以安全地交换各自的
Elasticsearch：基本概念、索引结构与优缺点分析 Leaton Lee elasticsearch 大数据搜索引擎
一、Elasticsearch基本概念Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能。核心概念解析文档(Document)Elasticsearch中的基本数据单元，使用JSON格式表示每个文档有唯一ID和类型示例：一条产品信息、一篇博客文章或一个客户记录索引(Index)文档的集合，类似于关系数
MySQL分布式ID冲突详解：场景、原因与解决方案码不停蹄的玄黓 mysql 分布式数据库 ID冲突
引言在分布式系统开发中，你是否遇到过这样的崩溃时刻？——明明每个数据库实例的自增ID都从1开始，插入数据时却提示“Duplicateentry‘100’forkey‘PRIMARY’”；或者分库分表后，不同库里的订单ID竟然重复，业务合并时直接报错……这些问题的核心，都是分布式ID冲突。今天咱们就来扒一扒MySQL分布式ID冲突的常见场景、底层原因，以及对应的解决方案，帮你彻底避开这些坑！一、为什
管理大数据存储的十大技巧 weixin_34238633 大数据数据库运维
在1990年，每一台应用服务器都倾向拥有直连式系统(DAS)。SAN的构建则是为了更大的规模和更高的效率提供共享的池存储。Hadoop已经逆转了这一趋势回归DAS。每一个Hadoop集群都拥有自身的——虽然是横向扩展型——直连式存储，这有助于Hadoop管理数据本地化，但也放弃了共享存储的规模和效率。如果你拥有多个实例或Hadoop发行版，那么你就将得到多个横向扩展的存储集群。而我们所遇到的最大挑
MapReduce数据处理过程2万字保姆级教程大模型大数据攻城狮 mapreduce 大数据 yarn cdh hadoop 大数据面试 shuffle
目录1.MapReduce的核心思想：分而治之的艺术2.HadoopMapReduce的架构：从宏观到微观3.WordCount实例：从代码到执行的完整旅程4.源码剖析：Job.submit的魔法5.Map任务的执行：从分片到键值对6.Shuffle阶段：MapReduce的幕后英雄7.Reduce任务的执行：从数据聚合到最终输出8.Combiner的魔法：提前聚合的性能利器9.Partition
Linux 启动过程流程图--ARM版进击的程序汪 linux arm开发运维
以下是ARM版本Linux启动过程的超详细树状图，涵盖硬件上电到应用程序交互的全流程，并包含关键函数调用链及源码位置，适用于系统开发与调试场景：ARMLinux启动全流程（含函数调用链）ARMLinux启动流程（函数级调用链）│├───**1.硬件上电与BootROM阶段**│││├───硬件复位与初始化││├───CPU进入Reset异常向量（ARM异常向量表基址0x0或0xffff0000）│
Hadoop核心组件最全介绍 Cachel wood 大数据开发 hadoop 大数据分布式 spark 数据库计算机网络
文章目录一、Hadoop核心组件1.HDFS(HadoopDistributedFileSystem)2.YARN(YetAnotherResourceNegotiator)3.MapReduce二、数据存储与管理1.HBase2.Hive3.HCatalog4.Phoenix三、数据处理与计算1.Spark2.Flink3.Tez4.Storm5.Presto6.Impala四、资源调度与集群管
数据仓库技术及应用（Hive 产生背景与架构设计，存储模型与数据类型）娟恋无暇数据仓库笔记 hive
1.Hive产生背景传统Hadoop架构存在的一些问题：MapReduce编程必须掌握Java，门槛较高传统数据库开发、DBA、运维人员学习门槛高HDFS上没有Schema的概念，仅仅是一个纯文本文件Hive的产生：为了让用户从一个现有数据基础架构转移到Hadoop上现有数据基础架构大多基于关系型数据库和SQL查询Facebook诞生了Hive2.Hive是什么官网：https://hive.ap
爆改RAG！用强化学习让你的检索增强生成系统“开挂”——从小白到王者的实战指南许泽宇的技术分享人工智能
“RAG不准？RL来救场！”——一位被RAG气哭的AI工程师前言：RAG的烦恼与AI炼丹师的自我修养在AI圈混久了，大家都知道RAG（Retrieval-AugmentedGeneration，检索增强生成）是大模型落地的“万金油”方案。无论是企业知识库、智能问答，还是搜索引擎升级，RAG都能插上一脚。但你用过RAG就知道，理想很丰满，现实很骨感。明明知识库里啥都有，问个“量子比特的数学表达式”，
搜索领域SEO进阶：内容优化与用户体验提升搜索引擎技术 ux ai
搜索领域SEO进阶：从关键词堆砌到用户价值——内容优化与体验升级的实战指南关键词SEO进阶、内容质量、用户体验、E-E-A-T、用户行为信号、结构化数据、页面速度优化摘要当“SEO=关键词堆砌”的时代成为历史，当搜索引擎算法从“识别文字”进化到“理解意图”，SEO从业者正面临一场从“技术投机”到“用户价值”的范式转移。本文将深度拆解搜索领域的进阶策略：从内容优化的核心逻辑（E-E-A-T框架、主题
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
LRU缓存算法在搜索引擎中的应用数据结构与算法学习缓存算法搜索引擎 ai
LRU缓存算法在搜索引擎中的应用关键词：LRU算法、缓存淘汰、搜索引擎、哈希表、双向链表、性能优化、访问频率摘要：本文深入探讨了LRU(最近最少使用)缓存算法在搜索引擎中的关键应用。我们将从基本概念出发，通过生活化的比喻解释LRU的工作原理，分析其在搜索引擎架构中的具体实现方式，并通过Python代码示例展示如何构建一个高效的LRU缓存系统。文章还将讨论LRU算法的数学建模、实际应用场景以及未来发
推客系统开发：从0到1构建高效社交化推荐引擎 wx_ywyy6798 推客系统分销系统海外短剧系统推客小程序推客系统开发推客小程序开发推客分销系统
在信息爆炸的时代，如何让用户快速获取感兴趣的内容？推客系统（推荐引擎）成为解决这一问题的核心方案。无论是电商、内容平台还是社交应用，精准的推荐算法都能显著提升用户粘性和转化率。本文将带您了解推客系统的核心模块与开发要点，助您快速构建高效的推荐体系。一、推客系统的核心价值个性化体验：基于用户行为数据（浏览、点赞、收藏等）生成定制化推荐。流量高效分发：解决“信息过载”问题，提升内容/商品的曝光率。商业
《推客系统开发全景指南：从架构设计到运营落地的完整解决方案》 wx_ywyy6798 数据库大数据短剧 java 推客系统推客小程序推客分销
一、推客系统概述与市场背景1.1什么是推客系统？推客系统（ReferralSystem）是一种基于社交关系网络的数字化推荐营销平台，通过系统化的机制设计激励用户自发进行产品或服务的推广传播。这种系统将传统的口碑营销模式与现代互联网技术相结合，形成了可追踪、可量化、可优化的新型营销生态系统。1.2行业发展现状随着流量红利逐渐消退，企业获客成本不断攀升，推客系统凭借其高效低成本的特性受到广泛关注。据统
python+springboot+nodejs+uniapp基于微信小程序外卖系统 QQ_1963288475 python spring boot uni-app django flask node.js 微信小程序
文章目录具体实现截图本项目支持的技术路线源码获取详细视频演示：文章底部获取博主联系方式！！！！本系统开发思路进度安排及各阶段主要任务java类核心代码部分展示主要参考文献：源码获取/详细视频演示##项目介绍随着移动互联网的迅猛发展，微信小程序凭借其无需下载安装、即用即走的特点，成为众多应用开发的首选平台。本文设计并实现了一款基于微信小程序的外卖网站，旨在为用户提供便捷的点餐服务，同时为餐厅提供高效
鸿蒙设备开发OpenHarmony深度解读之设备认证：HiChain机制部分源码解析1（推荐模块之外）
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、概述H
FeignClient客户端调用入门超龄超能程序猿 java spring
在分布式微服务架构广泛应用的技术背景下，服务间通信机制的设计与实现已成为系统开发的核心环节。Feign作为一种基于声明式编程范式的HTTP客户端框架，通过标准化的接口定义与注解配置，显著降低了Web服务调用的开发复杂度，有效提升了微服务间的交互效率。在SpringCloud技术栈体系中，Feign客户端功能的实现主要依托于@FeignClient注解，该注解通过整合Spring框架的依赖注入与动态
缺少关键的 MapReduce 框架文件
计算圆周率时提醒Hadoop集群缺少关键的MapReduce框架文件mr-framework.tar.gz在http://master:7180/cmf/services/4/status里直接安装再次运行代码：
基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
ClickHouse【理论篇】01：什么是ClickHouse
ClickHouse是一款开源的列式数据库管理系统（Column-OrientedDBMS），专为高性能实时数据分析（OLAP,OnlineAnalyticalProcessing）场景设计。它由俄罗斯搜索引擎公司Yandex开发（2016年开源），目前由独立基金会ClickHouse,Inc.维护，广泛应用于大数据分析、日志处理、用户行为洞察等领域。一、核心定位：OLAP场景的“性能标杆”传统关
Docker三分钟部署ElasticSearch平替MeiliSearch轻量级搜索引擎
‍个人主页：阿木木AEcru(更多精彩内容可进入主页观看)系列专栏：《Docker容器化部署系列》《Java每日面筋》每一次技术突破，都是对自我能力的挑战和超越。目录一、什么是MeiliSearch？二、对比ElasticSearch有什么好处？三、使用场景有哪些？四、docker部署MeiliSearch4.1创建数据持久化文件夹4.2拉取镜像4.3运行容器五、访问测试5.1访问5.2下载测试文
大数据 ETL 工具 Sqoop 深度解析与实战指南
一、Sqoop核心理论与应用场景1.1设计思想与技术定位Sqoop是Apache旗下的开源数据传输工具，核心设计基于MapReduce分布式计算框架，通过并行化的Map任务实现高效的数据批量迁移。其特点包括：批处理特性：基于MapReduce作业实现导入/导出，适合大规模离线数据迁移，不支持实时数据同步。异构数据源连接：支持关系型数据库（如MySQL、Oracle）与Hadoop生态（HDFS、H
文档全文搜索引擎：AnyTXT Searcher xixi_666 搜索引擎
“超强桌面文档全文搜索引擎”：AnyTXTSearcherAnyTXTSearcher国内下载：Anytxt文档内容搜索官方下载链接，支持国产信创系统https://anytxt.net.cn/download.html
meilisearch-轻量级搜索引擎 Leon.ENV 大数据搜索引擎
meilisearch是一款开源的轻量级搜索引擎，相比于elasticsearch等重量级搜索引擎，meilisearch注重数据搜索，从而而省去了其它不必要的功能（如支持聚合分析、分布式搜索等特性），以便于快速上手开发和构建应用。meilisearch有以下优点1）非常轻量级，只需500MB内存就可以运行2）支持多种接入方式：http、多种语言SDK3）无其它依赖环境，下载启动即可使用4）非常适
安装Hadoop集群&入门&源码编译只年大数据 Hadoop hadoop 大数据分布式
安装Hadoop集群完全分布式先决条件准备三台机器NameStaticIPDESCbigdata102192.168.1.102DataNode、NodeManager、NameNodebigdata103192.168.1.103DataNode、NodeManager、ResourceManagerbigdata104192.168.1.104DataNode、NodeManager、Seco
Hadoop之HDFS 只年大数据 Hadoop HDFS hadoop hdfs 大数据
Hadoop之HDFSHDFS的Shell操作启动Hadoop集群（方便后续测试）[atguigu@hadoop102~]$sbin/start-dfs.sh[atguigu@hadoop102~]$sbin/start-yarn.sh-help：输出这个命令参数[atguigu@hadoop102~]$hadoopfs-helprm-ls：显示目录信息[atguigu@hadoop102~]$h
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战 lingRJ777 Java技术栈应用 java backend elasticsearch springboot microservices searchengine
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战引言每年的“双十一”大促，海量用户涌入电商平台，搜索请求量瞬时可达平时的数十甚至上百倍。同时，数百万商品的库存、价格、促销信息也在以极高的频率更新。这种“读写混合”的超高并发场景，对商品搜索引擎提出了两大核心挑战：高可用与可扩展性：如何在流量洪峰下保证搜索服务7x24小时不间断，并且能够随着业务增长而平滑扩容？极致的查询性能：
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
安装Python3.12报错：HTTP 429 TOO MANY REQUESTS for url ＜https://mirrors.ustc.edu.cn/anaconda/pkgs/free/li
安装Python3.12报错(base)[xxx@hadoop104python_shell]$condacreate--namepythonThirteenpython=3.12报错如下：Retrievingnotices:…working…ERRORconda.notices.fetch:get_channel_notice_response(63):Requesterrorforchanne
Buildroot，Ubuntu，Debian，Yocto 它们分别是什么，它们之间的具体关系是什么玄奕子嵌入式学习之Linux入门篇 ubuntu debian linux Buildroot Yocto
1.Buildroot定义：Buildroot是一个简化和加速嵌入式Linux系统开发过程的工具，提供一种容易、高效的方式来生成交叉编译工具链、根文件系统、内核映像和引导加载程序。Buildroot使用makefile和kconfig（和Linux内核使用的相同系统）来配置和构建整个嵌入式系统。适用场景：对于需要轻量级或高度定制的嵌入式系统，Buildroot非常适合，尤其是那些资源受限或对启动时
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul