张小凡vip

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本

准备工作

前面我们已经了解了有关于hadoop的相关原理

hadoop基础----hadoop理论(一)----Hadoop简介

hadoop基础----hadoop理论(二)-----hadoop学习路线(持续更新)

hadoop基础----hadoop理论(三)-----hadoop分布式文件系统HDFS详解

hadoop基础----hadoop理论(四)-----hadoop分布式并行计算模型MapReduce详解

本章开始进入实际操作阶段

因为在学习阶段一般我们没有那么多实体机来进行操作。也就是不能实现真正的分布式。

但是我们可以通过虚拟机来模拟分布式。

所以在安装hadoop之前，我们需要先准备好3台虚拟机。

这里我们使用的VMware Workstation

新建虚拟机的步骤如下:

hadoop基础------虚拟机(二)---虚拟机安装以及安装linux系统

根据上面的文章，我们就已经有了3台CentOS 6.4系统的虚拟机。

为了方便我们操作命令，我们需要让虚拟机与本机共享剪切板也就是我在本机剪切的命令能够直接粘贴到虚拟机里使用，相关设置参考:

hadoop基础-------虚拟机(三)-----VMware虚拟机下linux系统的与windows主机实现复制粘贴

然后我们需要把它们之间的网络调试一下，目的是让3台虚拟机都能上外网而且与本机能够相互通信。

因为我们是克隆的机子所以虚拟机的mac是有冲突的详细的解决注意看 linux基础十中的可能遇到的问题。

虚拟机网络模式了解(熟悉的人可直接配置成桥接，并设置ip即可，不熟悉的需要看详细步骤):

hadoop基础-------虚拟机(五)-----虚拟机linux系统网络配置的三种模式

详细网络配置步骤在:

linux基础(十)----linux网络配置详细步骤---桥接模式和两台机子的远程通信

网络调好之后我们就可以就可以开始安装 hadoop环境了。

但是hadoop是开源的，所以发展到现在，已经有了很多分支版本。

由于Hadoop版本混乱多变，因此，Hadoop的版本选择问题一直令很多初级用户苦恼。

所以我们有必要对如果选取版本和了解版本信息的方法进行熟悉：

hadoop基础----hadoop实战(零)-----hadoop的平台版本选择

我们在生产环境中建议使用第三方发行版，但是这里为了学习hadoop的安装原理等我们这一次先手动安装hadoop1.0版，等学习到2.0版本的时候再使用第三方发行版进行安装。

根据上表我们这里就要进行 1.2.1版本的 Hadoop安装。

官网安装配置文档

http://hadoop.apache.org/docs/r1.2.1/cluster_setup.html

熟悉虚拟机环境

查看到系统版本

使用命令

cat /etc/redhat-release

查看到系统版本是CentOS release 6.4 (Final)

查看主机名

使用命令

hostname

查看主机名

一般没修改过的话都是localhost.localdomain

我们需要修改主机名方便区分和识别。

设置主机名

临时设置

使用hostname命令设置主机名。格式为：hostname 主机名，如下。
[root@joe /]# hostname hadoop1
该设置为临时生效。重新启动系统后，设置失效。

永久设置

编辑/etc/sysconfig/network文件中的HOSTNAME字段就可以修改主机名。如下所示：

vim /etc/sysconfig/network

[root@ joe /]# vim /etc/sysconfig/network
NETWORKING=yes
NETWORKING_IPV6=yes
HOSTNAME=hadoop1

HOSTNAME=hadoop1 表示主机设置为hadoop1 .
注意：修改主机名后，需要重启系统后永久生效。

查看ip

使用命令查看ip

ifconfig

架构和角色分配

我们先整理出三台虚拟机的ip和主机名

192.168.30.180 hadoop0

192.168.30.189 hadoop1

192.168.30.186 hadoop2

角色如下

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

192.168.30.189 hadoop1 作为slave担任DataNode 和 TaskTracker

192.168.30.186 hadoop2 作为slave担任DataNode 和 TaskTracker

其中NameNode/DataNode工作在HDFS层，JobTracker/TaskTracker工作在MapReduce层。

设备列表中hadoop0是master，担任NameNode 和JobTracker，hadoop1 ，hadoop2为slave，担任DataNode和TaskTracker。secondary namenode在hadoop 1.03中被废弃，用checkpoint node或backupnode来代替。这里暂没有配checkpoint node或backupnode。

用户权限配置

在各机器建立同名用户joe，可选自己喜欢的名称，用于管理hadoop。

如果当前是超级用户root

新建如下：

adduser joe

设置密码

passwd joe

关于用户设置的详情可查看

linux管理(一)---用户管理及权限

下载hadoop安装包

进入官网中找到镜像页面找到我们使用的版本，这里是1.2.1稳定版。下载步骤如下图:

任意选择一个镜像，我这里选择第一个：

选择版本:

选择需要下载的文件，因为我们是linux系统中使用所以下载hadoop-1.2.1.tar.gz

ps: 熟悉linux系统的同学也可以直接使用wget命令下载

wget http://apache.fayea.com/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz

配置hosts

在每一台机器的/etc/hosts文件中加入ip地址和主机名的映射，也就是把之前查询出来的ip和主机名信息(下面的三行)加入到hosts文件中。

192.168.30.180 hadoop0

192.168.30.189 hadoop1

192.168.30.186 hadoop2

vim  /etc/hosts

配置好的hosts内容如下所示：

ps:如果遇到'readonly' option is set (add ! to override) 需要用root权限

su -

输入root密码再编辑即可。

配置ssh无密码访问

ssh 用于登录远程主机, 并且在远程主机上执行命令. 它的目的是替换 rlogin 和 rsh, 同时在不安全的网络之上, 两个互不信任的主机之间, 提供加密的, 安全的通信连接. X11 连接和任意 TCP/IP 端口均可以通过此安全通道转发(forward).当用户通过连接并登录主机 hostname 后, 根据所用的协议版本, 用户必须通过钥匙的方法向远程主机证明他/她的身份。

执行以下命令：

生成密钥文件

ssh-keygen -t dsa -P "" -f ~/.ssh/id_dsa

ps:主要不是 shh -keygen 中间没有空格。然后当前用户也需要注意，因为我们主要是用之前的同名用户joe在操作，所以应该用joe用户生成密钥文件。这样它们生成的目录路径是不一样的。

把密钥内容写到授权文件中

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

并且把所有节点的authorized_keys的内容相互拷贝加入到每一个节点的authorized_keys中，配置完成后每一个节点的authorized_keys文件的内容应该是一样的。

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第9张图片

这是其中一台的授权文件，我们把三台的内容都取出来组合成最终的文件。最终每一台的authorized_keys内容都如下:

密钥文件授权

chmod 700 ~/.ssh
chmod 644   ~/.ssh/authorized_keys

`把密钥添加到缓存中`

ssh-add

测试ssh功能

在继续安装前，一定要保证这一步安装正确，可以使用ssh 主机名命令来测试是否成功，例如：ssh hadoop1，如果成功则会进入到hadoop1机器中。

第一次连接可能会遇到询问:

The authenticity of host 'hadoop0 (192.168.30.180)' can't be established.
RSA key fingerprint is 21:b8:6a:49:c3:41:96:aa:5a:f0:cd:76:75:6c:1f:4e.
Are you sure you want to continue connecting (yes/no)? ^
如果回答yes的话能无密码登录则没问题这样会生成一个know hosts文件下次登录后就不会询问了，这种情况是主机有变动，估计是ip变了。

如果回答yes的话会再次询问你的密码才能登录就不能达到我们无密码登录的目的，这种情况需要解决一下，解决的方法看下文的可能遇到的问题。

成功无密码连接之后 ~/.ssh/路径下会生成一个know hosts文件记录成功连接过的密钥。

我们依次检查几台机器的~/.ssh/know hosts，如果都成功互联了对方，则ssh无密码登录设置成功。

cat  ~/.ssh/know hosts

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第13张图片

PS：

可能遇到的问题ssh: connect to host hadoop1 port 22: No route to host

这种情况是虚拟机的ip与hosts中写的不对应了。

解决方法

重新检查几台机器的ip 以及相互之间分别用 ip和主机名是否能ping通。重新编辑hosts配置文件后重新生成密钥。

可能遇到的问题:The authenticity of host 'hadoop0 (192.168.30.180)' can't be established.

RSA key fingerprint is 21:b8:6a:49:c3:41:96:aa:5a:f0:cd:76:75:6c:1f:4e.
Are you sure you want to continue connecting (yes/no)? ^

如果回答yes的话能无密码登录则没问题这样会生成一个know hosts文件下次登录后就不会询问了，这种情况是主机有变动，估计是ip变了。

如果回答yes的话会再次询问你的密码才能登录。

就不能达到我们无密码登录的目的。

原因

密钥文件不起作用---权限问题或者主机的ip等信息有变动。

解决方法一

重新生成一遍密钥分发一次。

ssh-keygen -t dsa -P "" -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

授权密钥文件

chmod 700 ~/.ssh
chmod 644   ~/.ssh/authorized_keys

检查是否生成正确

ll ~/.ssh/

如果生成有known_hosts文件那应该就没问题了。

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第15张图片

解决方法二

使用命令(相对安全的内网时才建议使用)

ssh -o StrictHostKeyChecking=no hadoop1

能实现无密码登录。

SSH对主机的public_key的检查等级是根据StrictHostKeyChecking变量来配置的。默认情况下，StrictHostKeyChecking=ask。简单所下它的三种配置值：
1.StrictHostKeyChecking=no
#最不安全的级别，当然也没有那么多烦人的提示了，相对安全的内网测试时建议使用。如果连接server的key在本地不存在，那么就自动添加到文件中（默认是known_hosts），并且给出一个警告。
2.StrictHostKeyChecking=ask #默认的级别，就是出现刚才的提示了。如果连接和key不匹配，给出提示，并拒绝登录。
3.StrictHostKeyChecking=yes #最安全的级别，如果连接与key不匹配，就拒绝连接，不会提示详细信息。

解决方法三

这个也是修改StrictHostKeyChecking配置实现无密码登录。

不过是直接修改配置文件。(相对安全的内网时才建议使用)

修改/etc/ssh/ssh_config文件（或$HOME/.ssh/config）中的配置，添加如下两行配置：

StrictHostKeyChecking no
UserKnownHostsFile /dev/null

修改好配置后，重新启动sshd服务即可，命令为：/etc/init.d/sshd restart （或 service sshd restart ）
当然，这是内网中非常信任的服务器之间的ssh连接，所以不考虑安全问题，就直接去掉了主机密钥（host key）的检查。

可能遇到问题:Agent admitted failure to sign using the key

解决方法

使用命令

ssh-add

再尝试一次 ssh hadoop1

成功了。无密码登录成功。

可能遇到的情况:hadoop0能免密ssh到hadoop2,但hadoop2ssh到hadoop0需要密码

这种情况是因为 hadoop0中的密钥文件authorized_keys中hadoop2的密钥字符串有问题。这种情况需要仔细检查一下是否少了开头结尾的一些字符，或者重新把hadoop2中authorized_keys的hadoop2的密钥字符串重新粘贴过来到hadoop0中一次。应该就可以了。如果还是不行就在 hadoop2中重新执行一次生成密钥授权，把新的密钥粘贴到
hadoop0中的密钥文件authorized_keys中，并给hadoop0中的密钥文件authorized_keys授权 664即可。

安装hadoop

我们在前面已经下载了hadoop-1.2.1.tar.gz文件，现在用ssh工具把安装文件分别放到三台机子中的/home/joe目录下新建的hadoop文件夹中。

如下图:

然后在控制台进入/home/joe/hadoop路径执行下面的命令把hadoop解压出来则安装完成。

cd /home/joe/hadoop
tar -zxvf hadoop-1.2.1.tar.gz

配置hadoop

因为在配置过程中会使用jdk的路径，如果之前没安装jdk的话可以安装下面的步骤把每一台的机子都安装上jdk。

linux软件(一)---CentOS安装jdk

进入到hadoop安装目录，(我自己的是/home/joe/hadoop/)，运行ls看到conf文件夹，这里存放的是配置相关信息；bin文件夹，存放的是可执行的文件；

进入conf目录，配置hadoop文件，我们需要配置以下几个文件：

cd /home/joe/hadoop/hadoop-1.2.1/conf

配置masters文件

我们上面已经做了角色分配

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

vim masters

去掉原文件中的localhost然后把192.168.30.180添加到文件中如下图:

配置slaves文件

192.168.30.189 hadoop1 作为slave担任DataNode 和 TaskTracker
192.168.30.186 hadoop2 作为slave担任DataNode 和 TaskTracker

vim slaves

去掉localhost 写入作为slave的2台机子的ip如下：

配置hadoop-env.sh文件

这里是配置jdk的安装地址,也就是jdk安装配置时的JAVA_HOME。我这里的路径是/home/joe/java/jdk1.8.0_91

vim hadoop-env.sh

在文件中加入

export JAVA_HOME=/home/joe/java/jdk1.8.0_91

配置hdfs-site.xml文件

配置replication，即数据保存份数。一般根据集群的机器数量来调整。我们这里是3台，可以设置成3。

vim hdfs-site.xml

在之间加上:

dfs.replication
3

如图:

PS：配置中还可以指定dfs.data.dir数据存储路径等参数。我们先用默认的，如有特殊需求可参考官网的配置。

配置core-site.xml

配置namenode的地址和端口,以及临时目录

回顾一下角色:

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

端口可以自己选择这里采用9000

vim core-site.xml

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第27张图片

在之间加上:

fs.default.name
hdfs://192.168.30.180:9000

hadoop.tmp.dir
/home/joe/hadoop/hadooptmpdir
A base for other temporary directories.

如图：

配置mapred-site.xml

配置jobtracker的地址和端口

回顾一下角色:

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

所以这里的ip还是180 跟 core-site.xml中的一样。

但是端口需要另外分配一个，因为NameNode已经用了9000端口，所以这里我们用9001.

vim mapred-site.xml

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第29张图片

在之间加上:

mapred.job.tracker
hdfs://192.168.30.180:9001

如图：

同步配置

这样我们就配置好了其中一台机器，其它几台机器也需要一模一样的配置。

我们可以分别手动去设置。但最好是把配置复制过去。

我这里把整个hadoop文件夹复制过去,我首先设置了hadoop2,这里需要赋值到hadoop0和hadoop1:

scp -r /home/joe/hadoop/  hadoop0:/home/joe/
scp -r /home/joe/hadoop/  hadoop1:/home/joe/

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第31张图片

检查配置

我们已经把hadoop2的给同步复制过来了，这里的路径要尤其注意，需要确保是原安装路径的覆盖替换，并检查我们配置文件是否已经跟我们在hadoop2中的配置一样。

格式化hadoop的文件系统HDFS

配置完成之后我们已经安装完毕，现在做启动前的准备：格式化hadoop的文件系统。

三台机器任意一台进入bin目录

cd /home/joe/hadoop/hadoop-1.2.1/bin/
./hadoop namenode -format

如果出现……has been successfully formatted，说明格式化成功。

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第33张图片

关闭master防火墙

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

防火墙关闭

也可把相应的配置中的端口打开，例如我上面设置的9000和9001，需要把每台机器的这2个端口都打开，

我这里为了方便，把hadoop0 机器(也就是master)的防火墙暂时关闭。需要root权限！再关闭防火墙。否则关闭无效。

service iptables stop

可以用下面命令查询防火墙状态，如果不是root权限该命令无效。

service iptables status

切换到root后关闭防火墙

su root
service iptables stop
service iptables status

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第35张图片

启动hadoop

切换回joe用户,因为我们只配置了joe用户在三台机器之间的互通访问。在三台机子中的任意一台进入hadoop的bin目录启动

cd /home/joe/hadoop/hadoop-1.2.1/bin/
./start-all.sh

hadoop基础----hadoop实战(一)-----hadoop环境安装---手动安装官方1.0版本_第36张图片

验证是否启动成功

方法一

验证Name和JobTracker

在master节点运行jps，如果出现以下红色框里的进程，说明NameNode 和JobTracker启动成功。

我们这里master是hadoop0

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

验证DataNode 和 TaskTracker

在slave节点运行jps，如果出现以下红色框里的进程，说明DataNode 和 TaskTracker启动成功

192.168.30.189 hadoop1 作为slave担任DataNode 和 TaskTracker

192.168.30.186 hadoop2 作为slave担任DataNode 和 TaskTracker

我们分别在 hadoop1和hadoop2运行jps

可能遇到的情况

DataNode 和TaskTracker没启动起来

解决方法

需要去相关的日志中查看原因，相应解决。如果要查看hadoop1的日志则需要在hadoop1中查看

cd /home/joe/hadoop/hadoop-1.2.1/libexec/../logs
ls
tail -f -n 800  hadoop-joe-datanode-hadoop1.log

遇到的问题是java.net.NoRouteToHostException: No route to host

在配置hadoop的时候，很容易遇到以上错误，遇到以上问题的时候，一般可以通过以下几种方法解决。
1、从namenode主机ping其它主机名（如：ping slave1），如果ping不通,原因可能是namenode节点的/etc/hosts配置错误。

2、从datanode主机ping namenode主机名，如果ping不通,原因可能是datenode节点的/etc/hosts配置的配置错误。

3、查看namenode主机的9000（具体根据core-site.xml中的fs.default.name节点配置）端口，是否打开。

netstat -lnp|grep 9000

#9000请换为你的设置的端口

执行以上命令，可以查看到9000端口正在被哪个进程使用。如下图，进程号为25601。

ps 25601

执行以上命令。查看相应进程号的程序详细路径。

如果是nameNode 在使用该端口，则是对的。

4、关闭系统防火墙。这是最容易出现的问题。用此命令service iptables stop关闭后。

进入hadoop的bin目录用下面命令

./stop-all.sh

停止所有集群再启动一遍

./start-all.sh

一切正常集群正常使用。

方法二

通过浏览器查看---端口是hadoop默认的 --NameNode是50070，JobTracker是50030，TaskTracker是50060.

192.168.30.180 hadoop0 作为master担任NameNode 和 JobTracker

192.168.30.189 hadoop1 作为slave担任DataNode 和 TaskTracker
192.168.30.186 hadoop2 作为slave担任DataNode 和 TaskTracker

NameNode

http://192.168.30.180:50070/dfshealth.jsp

JobTracker

http://192.168.30.180:50030/jobtracker.jsp

TaskTracker

http://192.168.30.189:50060/tasktracker.jsp
http://192.168.30.186:50060/tasktracker.jsp

PS:这2个打不开的话需要把他们的防火墙也关闭才能用局域网内的浏览器访问。

一些启动停止的命令

正式启动Hadoop啦，bin/目录下有很多启动脚本，可以根据自己的需要来启动停止Hadoop的守护进程。

start-all.sh

启动所有的Hadoop守护进程。包括NameNode、 Secondary NameNode、DataNode、JobTracker、 TaskTrack

stop-all.sh

停止所有的Hadoop守护进程。包括NameNode、 Secondary NameNode、DataNode、JobTracker、 TaskTrack

start-dfs.sh

启动Hadoop HDFS守护进程NameNode、SecondaryNameNode和DataNode

stop-dfs.sh

停止Hadoop HDFS守护进程NameNode、SecondaryNameNode和DataNode

hadoop-daemons.sh start namenode

单独启动NameNode守护进程

hadoop-daemons.sh stop namenode

单独停止NameNode守护进程

hadoop-daemons.sh start datanode

单独启动DataNode守护进程

hadoop-daemons.sh stop datanode

单独停止DataNode守护进程

hadoop-daemons.sh start secondarynamenode

单独启动SecondaryNameNode守护进程

hadoop-daemons.sh stop secondarynamenode

单独停止SecondaryNameNode守护进程

start-mapred.sh

启动Hadoop MapReduce守护进程JobTracker和TaskTracker

stop-mapred.sh

停止Hadoop MapReduce守护进程JobTracker和TaskTracker

hadoop-daemons.sh start jobtracker

单独启动JobTracker守护进程

hadoop-daemons.sh stop jobtracker

单独停止JobTracker守护进程

hadoop-daemons.sh start tasktracker

单独启动TaskTracker守护进程

hadoop-daemons.sh stop tasktracker

单独启动TaskTracker守护进程

如果Hadoop集群是第一次启动，可以用start-all.sh。比较常用的启动方式是一个一个守护进程来启动，启动的步骤如下。

1．启动Hadoop的HDFS模块里的守护进程

HDFS里面的守护进程启动也有顺序，即：

1）启动NameNode守护进程；

2）启动DataNode守护进程；

3）启动SecondaryNameNode守护进程。

2．启动MapReduce模块里面的守护进程

MapReduce的守护进程启动也是有顺序的，即：

1）启动 JobTracker守护进程；

2）启动TaskTracker守护进程。

关闭的步骤正好相反，在这里就不描述了，可以自己试一下。

注意　正常情况下，我们是不使用start-all.sh和stop-all.sh来启动和停止Hadoop集群的。这样出错了不好找原因。建议一个一个守护进程来启动，哪个启动失败就去看相应的log日志，这样就缩小了找错的范围。

你可能感兴趣的:(hadoop,hadoop从基础到实战)

浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
Hadoop windows intelij 跑 MR WordCount piziyang12138
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
Hadoop学习第三课（HDFS架构--读、写流程）小小程序员呀~ 数据库 hadoop 架构 big data
1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
hadoop启动HDFS命令 m0_67401228 java 搜索引擎 linux 后端
启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
spark常用命令我是浣熊的微笑 spark
查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
spark启动命令学不会又听不懂 spark 大数据分布式
hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购计算机编程指导师 Java实战集 Python实战集大数据实战集课程设计 hadoop 数据分析 spring boot java 进货 python
✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
Hadoop Common 之序列化机制小解猫君之上 #Apache Hadoop
1.JavaSerializable序列化该序列化通过ObjectInputStream的readObject实现序列化，ObjectOutputStream的writeObject实现反序列化。这不过此种序列化虽然跨病态兼容性强，但是因为存储过多的信息，但是传输效率比较低，所以hadoop弃用它。（序列化信息包括这个对象的类，类签名，类的所有静态，费静态成员的值，以及他们父类都要被写入）publ
深入理解hadoop(一)----Common的实现----Configuration maoxiao_jsd 深入理解----hadoop
属本人个人原创，转载请注明,希望对大家有帮助！！一,hadoop的配置管理a,hadoop通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml");conf.addResource("core-site.xml");后者会覆盖前者中未final标记的相同配置项b
hadoop 0.22.0 部署笔记 weixin_33701564 大数据 java 运维
为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
深入解析HDFS：定义、架构、原理、应用场景及常用命令 CloudJourney hdfs 架构 hadoop
引言Hadoop分布式文件系统（HDFS，HadoopDistributedFileSystem）是Hadoop框架的核心组件之一，它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨，帮助读者全面深入地了解HDFS。1.HDFS的定义1.1什么是HDFSHDFS是Hadoop生态系统中的一个分布式文件系
Hadoop的搭建流程 lzhlizihang hadoop 大数据分布式
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步：2、第二步：3、第三步：4、第四步：5、第五步：七、安装hadoop1、上传2、解压3、重命名4、开始配置环境变量5、刷新配置文件6、验证hadoop命令是否可以识别八、全分布搭建7、修改配置文件core-site.xml8、修改配置文件hdfs-site.xml9、修改配置文件hadoop-en
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
Hadoop之mapreduce -- WrodCount案例以及各种概念 lzhlizihang hadoop mapreduce 大数据
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法（自定义分区器）4、reducer方法5、driver（main方法）6、Writable（手机流量统计案例的实体类）三、关于片和块1、什么是片，什么是块？2、mapreduce启动多少个MapTask任务？四、MapReduce的原理五、Shuffle过
IAAS: IT公司去IOE-Alibaba系统构架解读 wishchin 心理学/职业 BigDataMini Spark PaaS
从Hadoop到自主研发，技术解读阿里去IOE后的系统架构原地址：......................云计算阿里飞天摘要：从IOE时代，到Hadoop与飞天并行，再到飞天单集群5000节点的实现，阿里一直摸索在技术衍变的前沿。这里，我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及，智能终端的增加，大数据时代悄然而至。在这个数据为王的时代，数十倍、数百倍的数据给各
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s