蓝狐乐队

Hadoop 2.2.0 (YARN)搭建笔记

最近工作需要，摸索着搭建了Hadoop 2.2.0(YARN)集群，中间遇到了一些问题，在此记录，希望对需要的同学有所帮助。

本篇文章不涉及hadoop2.2的编译，编译相关的问题在另外一篇文章《hadoop 2.2.0 源码编译笔记》中说明，本篇文章我们假定已经获得了hadoop 2.2.0的64bit发行包。

由于spark的兼容问题，我们后面使用了Hadoop 2.0.5-alpha的版本（2.2.0是稳定版本），2.0.5的配置有一点细微的差别，文中有特别提示。

1. 简介

【本节摘自http://www.cnblogs.com/xia520pi/archive/2012/05/16/2503949.html】

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统（HDFS，Hadoop Distributed Filesystem）和MapReduce（Google MapReduce的开源实现）为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。

　　对于Hadoop的集群来讲，可以分成两大类角色：Master和Salve。一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中NameNode作为主服务器，管理文件系统的命名空间和客户端对文件系统的访问操作；集群中的DataNode管理存储的数据。MapReduce框架是由一个单独运行在主节点上的JobTracker和运行在每个集群从节点的TaskTracker共同组成的。主节点负责调度构成一个作业的所有任务，这些任务分布在不同的从节点上。主节点监控它们的执行情况，并且重新执行之前的失败任务；从节点仅负责由主节点指派的任务。当一个Job被提交时，JobTracker接收到提交作业和配置信息之后，就会将配置信息等分发给从节点，同时调度任务并监控TaskTracker的执行。

　　从上面的介绍可以看出，HDFS和MapReduce共同组成了Hadoop分布式系统体系结构的核心。HDFS在集群上实现分布式文件系统，MapReduce在集群上实现了分布式计算和任务处理。HDFS在MapReduce任务处理过程中提供了文件操作和存储等支持，MapReduce在HDFS的基础上实现了任务的分发、跟踪、执行等工作，并收集结果，二者相互作用，完成了Hadoop分布式集群的主要任务。

2. 系统环境

系统版本

CentOS 6.4 64bit
uname -a
Linux ** 2.6.32_1-7-0-0 #1 SMP *** x86_64 x86_64 x86_64 GNU/Linux

JAVA环境

安装Java 1.6
将jdk解压到local目录下
添加JAVA_HOME环境变量到.bashrc文件中

export JAVA_HOME="/home/<hostname>/local/jdk1.6.0_45/"
export JRE_HOME="/home/<hostname>/local/jdk1.6.0_45/jre/"
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

HADOOP解压hadoop-2.2.0-bin_64.tar.gz(这个包是我在CentOS6.4 64bit的环境下编译得到的) 到用户根目录

export HADOOP_HOME=/home/<hostname>/hadoop-2.2.0

[html] view plaincopyprint?

export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

测试本地模式

hadoop默认情况下配置为本地模式，所以解压后不修改任何配置，可以执行本地测试
// 创建本地目录
mkdir input
// 填充数据
cp conf/*.xml input
// 执行hadoop
bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+'
// 查看结果

[html] view plaincopyprint?

cat output/*

3. 网络环境

由于前期只是测试环境和配置，所以简单的使用两个节点：
master机器，充当namenode & datanode
slave机器，充当datanode

设置hostname
HDFS用hostname而不是IP来相互之间进行通信，hadoop会反向解析hostname，即使是用了IP，也会使用hostname 来启动TaskTracker，所以所有配置文件只能用hostname，不能用IP（满满的都是泪）。我们给两个机器分别设置如下：

机器	IP	HOSTNAME	角色
master	192.168.216.135	master	namenode, datanode
slave	192.168.216.136	slave1	datanode

临时更改hostname的命令是(root权限)
hostname <new_name>
永久更改需要修改配置文件/etc/sysconfig/network

[html] view plaincopyprint?

HOSTNAME=<new_name>

修改hosts文件

设置/etc/hosts文件(每台机器上都要设置)，添加如下内容

[html] view plaincopyprint?

192.168.216.135 master
192.168.216.136 slave1

namenode与datanode的/etc/hosts内容都必须是ip位址与host name的对应，不能使用127.0.0.1代替本机的ip地址，否则hadoop使用hostname找ip时，会以"127.0.0.1"作为ip位址。

设置ssh无密码访问

master和所有的slave之间，需要实现双向ssh无密码访问(slave和slave之间可以不用实现)。

请参见《ssh无密码访问》文章，本文不再详述

防火墙设置

严格来说，应该是打开某些对应的端口。为了简单起见，我们这里关闭selinux和iptalbes.

关闭selinux的方法

[html] view plaincopyprint?

setenforce 1 设置SELinux 成为enforcing模式
setenforce 0 设置SELinux 成为permissive模式

如果永久关闭，编辑/etc/selinux/config

[html] view plaincopyprint?

SELINUX=disabled

关闭iptables的方法

[html] view plaincopyprint?

service iptables stop
service ip6tables stop

如果需要永久关闭（各个运行级别）

[html] view plaincopyprint?

chkconfig iptables off
chkconfig ip6tables off

4. 配置

我们只需要在master机器上配置好所有的配置文件，然后全部拷贝到各个slave机器上即可。

注意配置文件中涉及到的一些访问地址，都写成master：port的形式。很多文档中写为localhost或者127.0.0.1，这个是不对的，在多机器集群中，每一个机器上的这些配置，都是指向master节点的。

配置文件位于$HADOOP_HOME/etc/hadoop/目录下

建立数据目录

我们在根目录下建立$HADOOP_DATA_HOME目录(/home/<hostname>/hadoop-data/, 其中<hostname>是你的用户名), 将dfs和mapred目录建立在这里，包括：

$HADOOP_DATA_HOME/dfs/name

$HADOOP_DATA_HOME/dfs/data

$HADOOP_DATA_HOME/mapred/local

$HADOOP_DATA_HOME/mapred/system

HDFS配置

配置hadoop-env.sh

将该脚本中的JAVA_HOME设置为JAVA安装的位置，该配置文件中，只有JAVA_HOME变量是必须配置的，其它变量都是可选配置的。

由于我们在.bashrc中添加了JAVA_HOME环境变量，这一步可以省略。

配置core-site.xml

[html] view plaincopyprint?

<configuration>
<property>
<name>io,native.lib.available</name>
<value>true</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://master:54310</value>
<final>true</final>
</property>
</configuration>

hdfs-site.xml

[html] view plaincopyprint?

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home/<hostname>/hadoop-data/dfs/name</value>
<description>Determines where on the local filesystem the DFS name node should store the name table.If this is a comma-delimited list of directories,then name table is replicated in all of the directories,for redundancy.</description>
<final>true</final>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home/<hostname>/hadoop-data/dfs/data</value>
<description>Determines where on the local filesystem an DFS data node should store its blocks.If this is a comma-delimited list of directories,then data will be stored in all named directories,typically on different devices.Directories that do not exist are ignored.
</description>
<final>true</final>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
<description>副本数目</description>
</property>
<property>
<name>dfs.permission</name>
<value>false</value>
</property>
</configuration>

dfs.datanode.name.dir是NameNode持久存储名字空间及事务日志的本地文件系统路径。当这个值是一个逗号分割的目录列表时，nametable数据将会被复制到所有目录中做冗余备份。

dfs.datanode.data.dir是DataNode存放块数据的本地文件系统路径，逗号分割的列表。当这个值是逗号分割的目录列表时，数据将被存储在所有目录下，通常分布在不同设备上。

dfs.replication是数据需要备份的数量，默认是3，如果此数大于集群的机器数会出错。

map-reduce配置

mapred-env.sh

类似hadoop-env.sh，配置JAVA_HOME即可

mapred-site.xml

[html] view plaincopyprint?

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
<description>设置MapReduce的执行框架为YARN，这样mr job会被提交到ResourceManager</description>
</property>
<property>
<name>mapreduce.job.tracker</name>
<value>hdfs://master:9001</value>
<final>true</final>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>1536</value>
</property>
<property>
<name>mapreduce.map.java.opts</name>
<value>-Xmx1024M</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>3072</value>
</property>
<property>
<name>mapreduce.reduce.java.opts</name>
<value>-Xmx2560M</value>
</property>
<property>
<name>mapreduce.task.io.sort.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.task.io.sort.factor</name>
<value>100</value>
</property>
<property>
<name>mapreduce.reduce.shuffle.parallelcopies</name>
<value>50</value>
</property>
<property>
<name>mapred.system.dir</name>
<value>file:/home/hadoop/mapred/system</value>
<final>true</final>
</property>
<property>
<name>mapred.local.dir</name>
<value>file:/home/hadoop/mapred/local</value>
<final>true</final>
</property>
</configuration>

Yarn配置

yarn-site.xml

[html] view plaincopyprint?

<configuration>
<property>
<name>yarn.resourcemanager.address</name>
<value>master:8080</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:8081</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:8082</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>

注意这里的配置文件里面，有两处mapreduce_shuffle（原本配置是mapreduce.shuffle，启动时会报错，原因是**命名不能包含.字符）。

2.0.5.alpha版本中，这里需要配置成mapreduce.shuffle，否则会报错【java.lang.IllegalStateException: Invalid shuffle port number -1 returned】

yarn中shuffle部分被独立成一个service，需要在nodemanager启动的时候作为auxiliary service一起启动，这样可以自定义第三方的shuffle provider，和ShuffleConsumer，比如可以替换现阶段的HTTP Shuffle为RDMA Shuffle，对于中间结果merge可以采用更合适的策略来得到更好的性能提升。

masters & slaves文件

masters文件，告诉系统那个节点是master，填写的是master节点的hostname(由于我们配置了其就叫master，所以内容填master，注意这里必须是hostname，如果填IP，会出错)

[html] view plaincopyprint?

master

slaves文件，告诉系统哪些节点是slave，填写的是所有slave节点的hostname，每行一个。注意事项同master。

[html] view plaincopyprint?

slave1

默认的环境里面可能没有masters和slaves文件，自己建立即可。

5. 启动集群

格式化HDFS：

$HADOOP_HOME/bin/hdfs namenode -format

注意，如果不是第一次格式化，那么需要先清理tmp目录中的数据（默认的tmp目录在/tmp/hadoop-<username>下面），以及hdfs-site.xml中配置的dfs.datanode.data.dir目录，否则可能出错。

启动集群

$HADOOP_HOME/sbin/start-all.sh

该命令会依次启动hdfs和yarn，分别调用start-hdfs.sh和start-yarn.sh;

start-hdfs.sh依次启动namenode、secondarynamenode、datanode，也可以单独启动，对应的命令为

[html] view plaincopyprint?

hdfs namenode
hdfs secondarynamenode
hdfs datanode

6. 测试

JPS测试

在master上执行jps，输出：

[html] view plaincopyprint?

3716 ResourceManager
3456 DataNode
4193 Jps
3350 NameNode
3587 SecondaryNameNode
3807 NodeManager

在slaver上执行jps，输出：

[html] view plaincopyprint?

2032 DataNode
2118 NodeManager
2274 Jps

WebUI访问

查看端口打开状态

[html] view plaincopyprint?

netstat -nap | grep 54310

访问http://<master-ip>:8088

NameNode：http://<master-ip>:50070

JobTracker：http://<master-ip>:50030

HDFS访问

在HDFS上创建新目录，可进一步测试HDFS是否工作正常：

[html] view plaincopyprint?

hdfs dfs -mkdir /xxx
hdfs dfs -ls /

简单任务执行

简单的map-reduce任务，在hadoop的根目录下执行：

[html] view plaincopyprint?

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar pi 2 2

其中最后两个参数是map数和reduce数目

或者使用如下方式调用：

[html] view plaincopyprint?

yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar pi -Dmapreduce.clientfactory.class.name=org.apache.hadoop.mapred.YarnClientFactory -libjars $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar 2 2

其它的例子：

[html] view plaincopyprint?

// 将数据上传到hdfs,如果这时出现 SafeModeException 异常，不用担心，等待几分钟即可。因为hadoop刚刚启动时，会进入安全模式进行自检。
bin/hadoop fs -put etc/hadoop/*.xml input
// 运行 Hadoop 自带的例子:
<pre name="code" class="html">hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar grep input output 'dfs[a-z.]+'</pre><pre name="code" class="html">// 查看运行结果</pre>hadoop fs -cat output/*

7. 扩展性

添加datanode节点

添加一个新的节点到现有的Hadoop集群需要做的事情包括：

1. 将这个新节点添加到网络环境中，处理好ssh免密码登录(包括从master到该机器以及从该机器到master)

2. 在该机器上部署hadoop，并设置masters文件中的master为现有集群的master（name node）

3. 在master的slaves文件中添加该新的机器

4. start-all.sh启动系统

然后可以通过http://(Masternode的主机名):50070查看新添加的DataNode

8. 问题记录

出错的时候，可以设置logger级别，看下具体原因：export HADOOP_ROOT_LOGGER=DEBUG,console

1. INFO util.NativeCodeLoader - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable -- hadoop的本地库加载失败。

Hadoop默认会从$HADOOP_HOME/lib/native/Linux-*目录中加载本地库。如果加载成功，输出为：

DEBUG util.NativeCodeLoader - Trying to load the custom-built native-hadoop library...

INFO util.NativeCodeLoader - Loaded the native-hadoop library

如果加载失败，则报错为Unable to load native-hadoop library for your platform...

相关的配置：

在Hadoop的配置文件core-site.xml中可以设置是否使用本地库：

[html] view plaincopyprint?

<property>

[html] view plaincopyprint?

<name>hadoop.native.lib</name>

[html] view plaincopyprint?

<value>true</value>

[html] view plaincopyprint?

<description>Should native hadoop libraries, if present, be used.</description>

[html] view plaincopyprint?

</property>

Hadoop默认的配置为启用本地库。另外，可以在环境变量中设置使用本地库的位置：

export JAVA_LIBRARY_PATH=/path/to/hadoop-native-libs

出错原因：

检查native库的版本信息，32bit的版本和64bit的版本在不匹配的机器上会加载失败，检查的命令是file <native-so-file>。

native库依赖的glibc的版本问题。如果在高版本gcc（glibc）的机器上编译的native库，放到低版本的机器上使用，会由于glibc版本不一致导致该错误。

2. java.io.IOException: Failed on local exception: java.io.EOFException; Host Details : local host is: "master/192.168.216.135"; destination host is: "master":54310;

重新格式化namenode

3. maps to localhost, but this does not map back

是因为DNS服务器把 192.168.x.x 的地址都反向解析成 localhost ，而DNS服务器不是自己的，不能改。解决的办法就是，编辑 ssh 客户端的 /etc/hosts 文件，把出问题的IP 地址和主机名加进去，就不会报这样的错了。

4. java.io.IOException: Incompatible clusterIDsin /home/wangming/hadoop-data/dfs/data

format 前 rm 一下

5. jps命令正常，但是8088端口的WEB页面无法访问

检查一下防火墙，selinux & iptables

6. 8088端口访问正常，但是看不到datanode节点

查看配置中，发现yarn-site.xml中，yarn.resourcemanager.address属性配置的端口号为8080，启动的时候，打开这个端口失败（可能是被其它进程占用，maybe tomcat等），改成8085，重新启动，问题解决。

7. java.io.IOException: Failed on local exception: java.io.EOFException; Host Details : local host is: "master/192.168.216.135"; destination host is: "master":54310;

不知道为什么，重新格式化namenode,再启动，没有再报错。

8. java.lang.IllegalStateException: Invalid shuffle port number -1 returned

参见yarn-site.xml的配置，2.0.5.alpha版本中，这里需要配置成mapreduce.shuffle

9. org.apache.hadoop.ipc.Client: Retrying connect to server: master/192.168.216.131:54310

一是检查slave机器到master机器的连通性；

二是检查master机器上，是否打开了192.168.216.131:54310的监听（netstat -nap | grep 54310）

注意hostname的问题，同时，namenode与data node的/etc/hosts内容都必须是ip位址与host name的对应，不能使用127.0.0.1代替本机的ip地址，否则hadoop使用hostname找ip时，会以"127.0.0.1"作为ip位址。

10. FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Exception in secureMain：

hostname不在hosts列表里面，检查hostname和/etc/hosts文件

11. INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Exiting Datanode 或者 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Removed Block pool

fs.data.dir参数设置的目录权限必需为755，要不启动datanode节点启动就会因为权限检测错误而自动关闭。

9. 参考资料

1. 在CentOS上安装Hadoop

2. Hadoop-2.0.5-alpha部署

3. Hadoop集群（第5期）Hadoop安装配置

4. Hadoop Cluster Setup

5. YARN安装配置初体验

Apache有另一个项目叫做Ambari，旨在让大家能够方便快速的配置和部署Hadoop生态圈相关的组件的环境,并提供维护和监控的功能，本文没有涉及到这个工具，有兴趣的同学可以一试。

你可能感兴趣的:(Hadoop 2.2.0 (YARN)搭建笔记)

方舟生存进化mysql_基于MySQL 的 SQL 优化总结_卡盟,辅助 weixin_36307344 方舟生存进化mysql
SonarQube搭建手记dnf辅助基于MySQL的SQL优化总结在数据库运维过程中，优化SQL是DBA团队的一样平常义务。例行SQL优化，不仅可以提高程序性能，还能减低线上故障的概率。现在常用的SQL优化方式包罗但不限于：营业层优化、SQL逻辑优化、索引优化等。其中索引优化通常通过调整索引或新增索引从而到达SQL优化的目的。索引优化往往可以在短时间内发生异常伟大的效果。---来自美团手艺团队SQ
鸿蒙系统是怎样一种系统,鸿蒙系统pc版怎么安装鸿蒙系统pc版安装教程焦虑中鸿蒙系统是怎样一种系统
鸿蒙系统pc版安装教程1.插入U盘，打开U盘制作软件rufus3.1。2.插入设备选项，选中下载的华为鸿蒙系统镜像文件，其他默认，点击开始。3.链接下载点击是，勾选以ISO镜像模式写入4.点击OK，等待U盘启动制作并写入华为鸿蒙系统完成5.把制作好的U盘插入电脑，开机启动按F12，选择U盘启动，台式机一般为：Delete键笔记本一般为：F2键惠普笔记本一般为：F10键联想笔记本一般为：F12键苹果
电磁兼容学习笔记12-电子设备中的主要骚扰源胡你一脸团团团学习笔记单片机
跟杨老师学习电磁兼容电子设备中的主要骚扰源#第16课典型的骚扰源（找du/dt、di/dt比较大的电路）：骚扰源1：二次电源（几乎所有的电路都需要DC/DC），传导骚扰骚扰源2：数字电路，传导骚扰和辐射骚扰DC/DC模块骚扰产生原理：du/dt：开关导通时，直流电压直接传送到输出端；开关断开时，电流无法传送到输出端，依靠输出端电容进行供电。开关导通时，输出电压为0；断开时电容放电，开关上电压为输入
如何学懂C++语言：C++从入门到精通的全面指南（完整C++学习笔记）猿享天开 c++学习笔记
数字人助手猿小美带你一起学编程一、引言作为一名拥有多年开发经验的技术人员，我的职业生涯涵盖了多种编程语言，包括C语言、C++、C#和JavaScript等。在我多年的编程生涯中，这些语言不仅丰富了我的知识储备，还极大地拓展了我的视野和技能。出于对编程的热爱，以及希望帮助更多编程爱好者的目的，我决定利用业余时间整理一套全面的C++语言学习指南。这套指南旨在为C++语言编程爱好者提供一个清晰的学习路线
21天学通C++——11多态（引入多态的目的）不想睡觉_ QT客户端学习路线 c++开发语言
多态：利用不同类似的方法处理不同类似的对象笔记原因：既然继承可以进行基类的方法覆盖，为什么还要引入多态呢？解释原因：继承classBase{public:voidfunc(){std::coutfunc();return0;}结果为Base：：func（）引入多态（Virtual）classBase{public:virtualvoidfunc(){std::coutfunc();return0;
蓝桥杯备赛笔记（九）动态规划（一）小魏´•ﻌ•` 蓝桥杯C++蓝桥杯笔记动态规划
1.动态规划基础(1)线性DP1）什么是DP（动态规划）DP（动态规划）全称DynamicProgramming，是运筹学的一个分支，是一种将复杂问题分解成很多重叠的子问题，并通过子问题的解得到整个问题的解的算法。在动态规划中有一些概念：状态：就是形如dp[i][j]=val的取值，其中i，j为下标，也是用于描述、确定状态所需的变量，val为状态值。状态转移：状态与状态之间的转移关系，一般可以表示
软件工程——第9章面向对象方法学引论知识点整理顾老师不懂代码软件工程导论第6版软件工程面向对象方法学引论对象模型动态模型功能模型
本专栏是博主个人笔记，主要目的是利用碎片化的时间来记忆软工知识点，特此声明！文章目录1.当前最好的软件开发技术是？2.面向对象的原则是什么？3.人们把客观世界中的实体抽象为什么？4.软件系统本质上是？5.面向对象方法学的优点？6.对象的定义是什么？7.对象的特点有哪些？8.类的定义是什么？9.实例是什么？10.属性是什么？11.封装是什么？12.继承是什么？13.重载和重写的区别有哪些？14.使用
深入理解Spring Boot：启动方式、注解、配置文件与模板引擎 Bro_cat SpringBoot spring boot java spring Freemarker properties yml
引言SpringBoot是一个用于简化Spring应用初始搭建以及开发过程的框架。它通过约定大于配置的方式，大大减少了开发者需要编写的配置代码。本文将详细介绍SpringBoot的启动方式、核心注解的用法及含义、配置文件的书写格式以及模板引擎的使用方法。SpringBoot的启动方式SpringBoot应用有多种启动方式，以下是最常见的三种方式：1.直接运行主类的main方法这是最常见的启动方式。
《CPython Internals》阅读笔记：p232-p249 python
《CPythonInternals》学习第13天，p232-p249总结，总计18页。一、技术总结无。二、英语总结(生词：1)1.overhead(1)overhead:over-("above")+head(“toppart,uppermostsection”)overhead的字面意思是：abovethehead,后来演变成"representthingssituatedaboveormeta
蓝桥杯备赛笔记（七）排序小魏´•ﻌ•` 蓝桥杯C++蓝桥杯笔记算法
1.冒泡排序(1)冒泡排序的思想冒泡排序的思想是每次将最大的一下一下运动到最右边，然后将最右边这个确定下来。再来确定第二个大的，再确定第三个大的...对于数组a[]，具体的来说，每次确定操作就是从左往右扫描，如果a[i]>a[i+1]，我们就执行swap(a[i],a[i+1])将两项交换，然后再往右检查，这样可以找出最大的并将其丢到最右边。第一次确定操作是将a[i]~a[n]中最大的放到a[n]
vue项目中使用mockjs模拟后端接口上趣工作室 vue3.x vue2.x uniapp vue.js javascript ecmascript
Vue2中使用Mock.js来模拟数据是一个非常常见的做法，尤其是在前端开发时需要与后端接口交互但后端尚未完成的情况下。下面是一个简单的案例，演示如何在Vue2项目中使用Mock.js来模拟数据。1.安装Mock.js首先，确保在你的项目中安装了Mock.js。可以使用npm或yarn来安装：npminstallmockjs--save-dev或者yarnaddmockjs--dev2.将Mock
Vue3 使用 pinia 有一个好名字 javascript 开发语言 ecmascript
什么是PiniaPinia是Vue的存储库，它允许您跨组件/页面共享状态，与vuex功能一样。准备安装npminstallpinia或者yarnaddpinia使用首先修改main.ts文件main.tsimport'./assets/main.css'import{createApp}from'vue'importAppfrom'./App.vue'import{createPinia}from
Hadoop 和 Spark 的内存管理机制分析王子良. 经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
python传参是什么意思_如何最简单、通俗地理解Python的传入参数？ weixin_39857876 python传参是什么意思
目录：一、笔记二、我的自学路线三、笔记目录一、笔记①传入参数分为形参和实参两种，形参是形式参数(变量)，实参是实际参数(值)。②传入参数，一个星号*表示传入一个元组，两个星号表示传入一个字典。③加了星号*的变量会存放所有未命名的变量参数。④加了星号**的变量会存放所有命名的变量参数。⑤*号的使用使得传入的参数不定长。⑥传入参数中，默认值参数都是放在后面。#coding=utf-8#形参是定义函数后
提升效率的印象笔记（Evernote）使用指南 vvvae1234 印象笔记
印象笔记（Evernote）是一个功能强大、跨平台的笔记管理工具，它不仅能帮助你记录日常笔记，还可以用于整理工作计划、管理项目、存储灵感和信息等。为了最大化地提高你的生产力，以下将介绍一些高效使用印象笔记的技巧，帮助你充分发挥其潜力。一、入门基础：理解印象笔记的基本概念1.1笔记本与笔记印象笔记的核心概念是笔记本和笔记。笔记是你存储信息的基本单位，它可以包含文字、图片、音频、视频、文件等内容。而笔
三星笔记备份指南【常见问题+介绍3种方法】 Coolmuster 三星手机安卓笔记 android
SamsungNotes是众多可用应用程序之一，但它对于记笔记、画草图和掌握重要信息特别有用。但如何保护这些笔记的问题经常出现。我们将在这个内容丰富的教程中回答有关SamsungNotes的一些常见问题，并提供高效备份的分步说明。阅读以了解它们！第1部分：有关SamsungNotes问题的简要解答为了提供全面知识的基础，让我们在详细了解SamsungNotes备份之前先解决这些基本问题：Q1.三星
【AI Agent系列】【MetaGPT多智能体学习】1. 再理解 AI Agent - 经典案例和热门框架综述同学小张大模型人工智能学习 gpt 笔记 MetaGPT agi 智能体
本系列文章跟随《MetaGPT多智能体课程》（https://github.com/datawhalechina/hugging-multi-agent），深入理解并实践多智能体系统的开发。本文为该课程的第二章（智能体综述及多智能体框架介绍)笔记）。文章目录0.温故而知新-再看AIAgent是什么1.一个AIAgent实例介绍-BabyAGI2.多智能体框架比较3.警告？0.温故而知新-再看AIA
MySQL学习笔记11：limit 分页查询 AsajuHuishi MySQL mysql 数据库
简介本系列（MySQL学习笔记）是我基于B站上SQL播放量第一的MySQL基础+高级篇-数据库-sql-尚硅谷视频所做的笔记，方便大家学习和掌握MySQL。说明1.这个系列基本包含了视频中老师讲课的所有内容，包括知识点、案例、部分测试题。2.所需的配套资料（来自B站评论区）@黎曼的猜想：配套资料下载–>公众号公众号DragonWell回复：mysql注意：是公众号！！是公众号！！是公众号，点那个搜
搭建一个基于Spring Boot的校园台球厅人员与设备管理系统鹿屿二向箔 spring boot 后端 java
搭建一个基于SpringBoot的校园台球厅人员与设备管理系统可以涵盖多个功能模块，例如用户管理、设备管理、预约管理、计费管理等。以下是一个简化的步骤指南，帮助你快速搭建一个基础的系统。—1.项目初始化使用SpringInitializr生成一个SpringBoot项目：访问SpringInitializr。选择以下依赖：SpringWeb（用于构建RESTfulAPI或MVC应用）SpringD
【软考速通笔记】系统架构设计师⑬——云原生架构设计理论与实践小康师兄系统架构设计师笔记系统架构云原生软考分布式容器微服务
文章目录一、前言二、云原生架构基础知识2.1定义2.2特点2.3原则三、云原生架构模式3.1服务化架构模式3.2Mesh化架构模式3.3Serverless模式3.4存储计算分离模式3.5分布式事务模式3.6可观测模式3.7事件驱动架构3.8反云原生模式四、云原生技术4.1容器技术4.2容器编排技术4.3微服务4.4无服务器技术4.5服务网格五、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统
学习笔记078——Java Properties类使用详解上下求索. Java 学习笔记 java
文章目录概述常见方法写入读取遍历概述Properties继承于Hashtable。表示一个持久的属性集，属性列表以key-value的形式存在，key和value都是字符串。Properties类被许多Java类使用。例如，在获取环境变量时它就作为System.getProperties()方法的返回值。我们在很多需要避免硬编码的应用场景下需要使用properties文件来加载程序需要的配置信息，
学习笔记040——如何定时备份服务器中的数据库？上下求索. MySQL Linux mysql 服务器
目录1、编写备份脚本：2、创建crontab定时任务需求前景：Ubuntu系统的服务器中，需要定时备份MySQL数据库中的数据。确保数据能够得到安全保障。我的方法：1、写一个备份数据库的脚本2、利用Ubuntu的crontab每日定时执行脚本。下面是我的实现方式：1、编写备份脚本：#!/bin/bash#设置数据库名，用户和密码DB_NAME="数据库名"DB_USER="账号"DB_PASSWO
mysql学习笔记(八):分页查询代码魔法师Sunny MySQL mysql 学习笔记
应用场景：当要显示的数据，一页显示不全，需要分页提交sql请求语法：select查询列表from表【jointypejoin表2on连接条件where筛选条件groupby分组字段having分组后的筛选orderby排序的字段】limit【offset,】size;offset要显示条目的起始索引（起始索引从0开始）size要显示的条目个数特点：①limit语句放在查询语句的最后②公式要显示的页
学习笔记081——如何备份服务器中MySQL数据库数据？上下求索. MySQL Linux 数据库学习笔记
方法：可以通过编写sh脚本的方式，结合Linux中的crontab定时任务来实现定时备份数据的功能。sh脚本如下：#!/bin/bash#要备份的数据库DB_NAME="wms"#数据库账号DB_USER="root"#数据库密码DB_PASSWORD="123456"#数据备份存放目录BACKUP_DIR="/home/htl/backup"mkdir-p$BACKUP_DIR#备份文件名BAC
大数据学习（五）：如何使用 Livy提交spark批量任务--转载 zuoseve01 livy
Livy是一个开源的REST接口，用于与Spark进行交互，它同时支持提交执行代码段和完整的程序。Livy封装了spark-submit并支持远端执行。启动服务器执行以下命令，启动livy服务器。./bin/livy-server这里假设spark使用yarn模式，所以所有文件路径都默认位于HDFS中。如果是本地开发模式的话，直接使用本地文件即可（注意必须配置livy.conf文件，设置livy.
隐语课程隐语架构概览学习笔记皓月雪学习笔记
隐语架构包含：产品层、算法层、计算层、资源层和硬件层隐语产品：定位：通过可视化产品，降低终端用户的体验和演示成本。通过模块化API降低技术集成商的研发成本。人群画像：作为隐语的直观入口，隐语保护计算从业者均应该关注产品：SecretPad：轻量化安装、快速验证POC、可定制集成；多部署形态：中心模式、P2P模式全栈产品：MPC、TEE、SCQLSecretNote：Notebook形式、交互式建模
Spark Livy 指南及livy部署访问实践 house.zhang 大数据-Spark 大数据
背景：ApacheSpark是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中，它提供了两种方式进行数据处理，一是交互式处理：比如用户使用spark-shell，编写交互式代码编译成spark作业提交到集群上去执行；二是批处理，通过spark-submit提交打包好的spark应用jar到集群中进行执行。这两种运行方式都需要安装spark客户端配置好yarn集群信息，并打通集群网
用TensorFlow.NET搭建一个全连接神经网络 chiyong7717 人工智能 c#python
在本文中，我们将学习如何在C＃中构建神经网络模型计算图。与线性分类器相比，神经网络的关键优势在于它可以分离不可线性分离的数据。我们将实现此模型来对MNIST数据集的手写数字图像进行分类。我们要构建的神经网络的结构如下。MNIST数据的手写数字图像有10个类（从0到9）。该网络具有2个隐藏层：第一层具有200个隐藏单元（神经元），第二层具有10个神经元（称为分类器层）。让我们一步一步地用代码来实现：
传统架构下应用部署 aherhuo 架构 linux 云原生
2.1传统架构下应用部署实验目标：目标为在传统架构下搭建LAMP（Linux+Apache+MySQL/MariaDB+PHP,流行的开源软件组合）环境并部署WordPress服务，本次模拟在安装好的openEuler22.03系统虚拟机实现。节点配置：虚拟机版本主机名Ip地址安装服务openEuler22.03web01192.168.110.200Apache、PHP、MariaDB2.1.1
AI 在播客领域的应用姚家湾播客 AI
播客以语言交谈为主，是大语言模型AI可以大展拳脚的地方，比如播客简介，播客节目笔记（shownotes）的自动化生成，播客节目单自动化推荐等等。笔者做了一些探索性实验工作，结果发现，在现有播客的文本描述（通常称为播客的元数据）基础上实现AI推荐是不理想的。这主要是现有的播客节目的文本元数据质量参差不齐，大模型难以做矢量搜索和内容生成。播客元数据存在的问题目前播客存在的问题：播客节目的名称太长，夹杂
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag