Bentley-2012

hadoop完全分布式集群+Win Eclipse+Hbase+Hive+Zookeeper+Sqoop+SPARK试验机平台

【申明】本文的编写是参考了数个Blog，并由本人亲身试验配置完成。为的是不忘却自己的配置过程，以便于及时恢复查看之用。最终会在配置完成之后提供虚拟机节点的百度云下载链接，供大家下载使用。

注：更多资源及软件请W信关注“学娱汇聚门”

之前一直用的Hadoop伪分布式的平台进行试验。今天突发奇想，想配个更为真实的模拟环境——hadoop完全分布式集群，在VMware下用三个虚拟机实现模拟3个物理节点。

本人电脑64位，配置如下：

准备工作：

1、在本本上安装虚拟机为：VMware WorkStation8；

2、在虚拟机中安装一个Centos 6.5 X64位系统，作为master节点，并安装好Java，配置如下：

3、所以，在准备好这3个结点之后，需要分别将Centos系统的主机名重命名（因为前面是复制和粘帖操作产生另两上结点，此时这3个结点的主机名是一样的），重命名主机名的方法：

Vim /etc/hosts

以下是我对三个结点（还有两个没配呢）的centos系统主机分别命名为：master, node1, node2。

4、准备2个node节点：无须重点安装两个Centos虚拟机系统，只需将master节点(已经安装好JAVA环境,并修改了主机名了)文件Copy两份，在WorkStation中添加即可，命令为node1 与node2节点。

按照hadoop集群的基本要求，其中一个是master结点，主要是用于运行hadoop程序中的namenode、secondorynamenode和jobtracker任务。用外两个结点均为slave结点，其中一个是用于冗余目的，如果没有冗余，就不能称之为hadoop了，所以模拟hadoop集群至少要有3个结点，如果电脑配置非常高，可以考虑增加一些其它的结点。slave结点主要将运行hadoop程序中的datanode和tasktracker任务。

准备工作就绪，以下安装Hadoop完全分布式环境了：

一、配置hosts文件

二、建立hadoop运行帐号

三、配置ssh免密码连入

四、下载并解压hadoop安装包

五、配置namenode,修改site文件

六、配置hadoop-env.sh文件配置masters和slaves文件

七、格式化namenode

八、启动hadoop

九、用jps检验各后台进程是否成功启动

十、完全分布式Hbase的安装

十一、完全分布式Hive的安装

十二、 SQOOP的安装

十三、 SPARK的安装

十四、在主机Win8下用MyEclipse连接VMware虚拟机Centos的Hadoop

十五、总结及常见问题：

以下我们逐步进行吧：

一、配置hosts文件：

这一步其实我们在准备工作中已经完成了，但复制节点之后，两个datanode节点的IP地址是随机分配的，所以仍需配置好IP地址。

sudo ifconfig eth1 192.168.1.125 //在node1上节点进行修改

sudo ifconfig eth1 192.168.1.126 //在node2上节点进行修改

此名，还需修改两个文件：

a.修改/etc/sysconfig/network文件，将包含当前的hostname改为新的hostname(这里三个都要修改的，分别对应着master,node1,node2)

b.在三台机子中使用命令hosname更改一下，命令为：hostname 新的主机名，然后用hostname名称查看是否修改成功。

hostname master

hostname

二、建立Hadoop运行帐号

即为hadoop集群专门设置一个用户组及用户，这部分比较简单，参考示例如下：

sudo groupadd hadoop //设置hadoop用户组

sudo useradd –s /bin/bash –d /home/lb –m lb –g hadoop –G admin //添加一个lb用户，此用户属于hadoop用户组，且具有admin权限。

sudo passwd lb //设置用户lb登录密码

su lb //切换到lb用户中

以上三个节点均须作同样的操作

三、配置ssh免密码登录

在Hadoop启动以后，Namenode是通过SSH（Secure Shell）来启动和停止各个datanode上的各种守护进程的，这就须要在节点之间执行指令的时候是不须要输入密码的形式，故我们须要配置SSH运用无密码公钥认证的形式。以本文中的三台机器为例，现在Master是主节点，他须要连接node1、node2。须要确定每台机器上都安装了ssh，并且datanode机器上sshd服务已经启动（一般centos6.5都已经自启动了，不需操作）。
在master节点上，切换到lb用户( 保证用户lb可以无需密码登录，因为我们后面安装的hadoop属主是lb用户。)
1) 在每台主机生成密钥对

#su - hadoop

#ssh-keygen -t rsa

#cat ~/.ssh/id_rsa.pub 即/home/lb目录下，但.ssh目录是不可见的

这个命令生成一个密钥对：id_rsa（私钥文件）和id_rsa.pub（公钥文件）。默认被保存在~/.ssh/目录下。
2) 在另外两个datanode节点进行以上同操作。

3) 在master中将id_rsa.pub文件发放到node2: scp /home/lb/.ssh/id_rsa.pub lb@node2:~/.ssh/master.pub

在node1中将id_rsa.pub文件发放到node2: scp /home/lb/.ssh/id_rsa.pub lb@node2:~/.ssh/node1.pub

在node2中将id_rsa.pub文件复制一份： cp id_rsa.pub node2.pub

再复制master.pub，node1.pub，node2.pub三个文件的内容到一个文件，命名为authorized_keys，并将生成的文件Copy到另两个节点的.ssh目录下。

权限设置为600.(这点很重要，网没有设置600权限会导致登陆失败)

再 vim /etc/ssh/sshd_config 进行以下配置。

测试登陆： ssh node1，第一次会提示输入密码，exit之后，再退出的时候就不用再输入密码，此时ssh配置才算成功。

如果未成功，先重启一下ssh服务： /etc/init.d/sshd restart 尝试一下。

提示：本人在此步骤足足嗑磕碰碰了两个多小时就是第二次登录时还会提示输入密码，有以下几个原因：

a.authorized_keys文件并没有包括三个文件内容的合体；

b.目录或文件的权限没有设置好： chomn

首先 .ssh目录权限是700(chmod 700 .ssh )，两个dsa 和 rsa的私钥权限是600，其余文件权限是644.

其次，.ssh目录的父目录文件权限应该是755，即所属用户的用户文件目录，本虚拟机中应为/home/lb目录

c. 关闭防火墙（选择永久性关闭）：

永久性生效，重启后不会复原

开启： chkconfig iptables on

关闭： chkconfig iptables off

即时生效，重启后复原

开启： service iptables start

关闭： service iptables stop

四、下载并解压Hadoop安装包

在master节点中先下载hadoop1.2.1安装包到目录，并解压之：

tar -zxvf hadoop-1.2.1.tar.gz

五、配置master(namenode)的文件

如上图所示修改master中的6个文件:

a.core-site.xml

b.hadoop-env.sh

c.hdfs-site.xml

d.mapred-site.xml

e.masters

f.slaves

六、配置slave(datanode)的文件

在master下将hadoop文件包分发下去(这三个节点一定要保持一致哦！)：

scp -r /home/lb/hadoop-1.2.1 lb@node1:~/

scp -r /home/lb/hadoop-1.2.1 lb@node2:~/

七、格式化namenode

在master下运行 hadoop namenode -format

八、启动hadoop

在masters下运行：start-all.sh

九、检验各后台进程是否成功启动

1) 用jps检验各后台进程是否成功启动

--在master节点查看后台进程

$ jps

3180 Jps

2419 SecondaryNameNode

2236 NameNode

2499 JobTracker

--在slave节点查看后台进程

$ jps

2631 Jps

2277 DataNode

2365 TaskTracker

1) 通过网站查看各后台进程是否成功启动

在浏览器中输入：http://192.168.1.117:50030，网址为master结点所对应的IP：

还有在浏览器中输入：http://192.168.1.100:50070，网址为master结点所对应的IP：

十、安装hbase.

在安装hbase之前要先安装好zookeeper.

1、zookeeper安装：可以参考http://chwshuang.iteye.com/blog/2037530 步骤是完全一样的。

但需注意的是：zookeeper 的启动需分别在node2、node1，master的zookeeper目录下的bin子目录下，依次执行zkServer.sh start （也可以使用./zkServer start指令）来启动 zookeeper，所有服务器启动完成后，就可以通过zkServer.sh status来查看服务器状态。没有报错说明都正常了。输入jps可以看到服务器中多了一个QuorumPeerMain服务。

2、hbase的安装：

Step1:先配置/home/lb/hbase-0.94.17/conf/hbase-site.xml

Xml代码

[myhadoop@myhadoop1 ~]$ vim hbase-0.94.17/conf/hbase-site.xml
xml version="1.0"?>

xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

  <property>

    <name>hbase.rootdirname>

    <value>hdfs://master:9000/hbasevalue>

    <description>区域服务器使用存储HBase数据库数据的目录,服务器名称不能填IP，不然会报错description>

  property>

  <property>

     <name>hbase.cluster.distributedname>

     <value>truevalue>

     <description>指定HBase运行的模式： false: 单机模式或者为分布式模式   true: 全分布模式 description>

  property>

  <property>

    <name>hbase.zookeeper.quorumname>

    <value>master,node1,node2value>

    <description>ZooKeeper集群服务器的位置description>

  property>

configuration>

step2:配置数据服务器地址
                hbase-0.94.17/conf/regionservers

Java代码

[myhadoop@myhadoop1 ~]$ vim hbase-0.94.17/conf/regionservers



master

node1

node2

step3: 配置HBase中Zeekeeper使用方式
             在hbase-0.94.17/conf/hbase-env.sh文件最尾部，打开注释 export HBASE_MANAGES_ZK=false，修改true为false。意思是使用外部的Zeekeeper。此外，还需要打开注释 export JAVA_HOME=/usr/local/jdk1.8.0_65

Java代码

[myhadoop@myhadoop1 ~]$ vim hbase-0.94.17/conf/hbase-env.sh

export JAVA_HOME= /usr/local/jdk1.8.0_65

export HBASE_MANAGES_ZK=false

              （3）复制HBase目录到其他服务器

           在myhadoop1上以myhadoop用户，使用以下命令进行复制：

                 scp -r hbase-0.94.17 lb@node1:~

                 scp -r hbase-0.94.17 lb@node2:~

              （4）启动，验证

                   拷贝完成后在master的hbase目录的bin子目录下就可以输入：./start-hbase.sh启动HBase集群了；启动完成后，node1上使用jps命令可以看到多了一个HMaster服务，在子节点输入jps可以看到多了一个HRegionServer服务；登录HBase可以使用hbase shell命令登录HBase，输入status查看当前状态。输入exit退出HBase服务。

Java代码

[myhadoop@myhadoop1 ~]$ start-hbase.sh

starting master, logging to /home/myhadoop/hbase-0.94.17/logs/hbase-myhadoop-master-myhadoop1.out

node1: starting regionserver, logging to /home/myhadoop/hbase-0.94.17/bin/../logs/hbase-myhadoop-regionserver-myhadoop2.out

node2: starting regionserver, logging to /home/myhadoop/hbase-0.94.17/bin/../logs/hbase-myhadoop-regionserver-myhadoop3.out

master: starting regionserver, logging to /home/myhadoop/hbase-0.94.17/bin/../logs/hbase-myhadoop-regionserver-myhadoop1.out

[myhadoop@myhadoop1 ~]$ jps

4870 SecondaryNameNode

4625 NameNode

6013 HMaster

4746 DataNode

5102 TaskTracker

6377 Jps

5744 QuorumPeerMain

4971 JobTracker

6171 HRegionServer

       通过浏览器查看：在Win8主机的浏览器中输入： http://master:60010/ 见下图所示

十一、Hive的安装

1、在master节点上安装MySQL（可以参考文档http://blog.sina.com.cn/s/blog_6c288ff50102v5rt.html）后，创建用户hive，密码为libing，并创建新的Database名hive后，再从网上下载hive-0.10.0,下载地址：http://archive.apache.org/dist/

2、vim ~/.bashrc,修改如下：

3、将下载的zip文件解压。

在hive主目录下找到conf文件夹下的hive_env.sh，将其中得HADOOP_HOME和HIVE_CONF_DIR并配置：

  4、配置文件hive-site.xml

javax.jdo.option.ConnectionURL jdbc:mysql://192.168.1.117:3306/hive javax.jdo.option.ConnectionDriverName com.mysql.jdbc.Driver 驱动名 javax.jdo.option.ConnectionUserName hive 用户名 javax.jdo.option.ConnectionPassword libing 密码 hive.metastore.warehouse.dir /home/hadoop/hive/warehouse 数据路径（相对hdfs） hive.metastore.uris thrift://192.168.1.117:9083 运行hive得主机地址及端口 javax.jdo.option.ConnectionURL jdbc:mysql://192.168.1.117:3306/hive javax.jdo.option.ConnectionDriverName com.mysql.jdbc.Driver 驱动名 javax.jdo.option.ConnectionUserName hive 用户名 javax.jdo.option.ConnectionPassword libing 密码 hive.metastore.warehouse.dir /home/hadoop/hive/warehouse 数据路径（相对hdfs） hive.metastore.uris thrift://192.168.1.117:9083 运行hive得主机地址及端口
在本机中的配置如下：





为了使MySQL与Hive能连接起来，还需要在MySQL下做如下操作：

mysql -u root -p libing;

create user 'hive'@'master' identified by 'libing';

grant all privileges on *.* to 'hive'@'master' with grant option;

为了使node1与node2（即集群中所有节点都有权限操作mySQL数据库，为以后安装Sqoop工具做基础）必须做如下操作：



至此，hive完成安装！在MySQL下查看元数据：

最后建议将/home/lb/hive-0.10.0 scp 到其它的两个节点，这样可以从node1或node2节点上使用hive..

十二、安装SQOOP

1.下载安装包及解压

sqoop-1.4.6.bin_hadoop-1.0.0.tar.gz

2.配置环境变量和配置文件

解压 sqoop-1.4.6.bin_hadoop-1.0.0.tar.gz 到/home/hadoop/下: tar -zxvf sqoop-1.4.6.bin_hadoop-1.0.0.tar.gz sqoop

进入/home/hadoop/sqoop/conf

cp sqoop-env-template.sh   sqoop-env.sh

在sqoop-env.sh中添加如下代码：

(如果数据读取不设计hbase和hive，那么相关hbase和hive的配置可以不加，如果集群有独立的zookeeper集群，那么配置zookeeper，反之，不用配置)。

修改$SQOOP_HOME/bin/configure-sqoop

注释掉HCatalog，Accumulo检查(除非你准备使用HCatalog，Accumulo等HADOOP上的组件)

##Moved to be a runtime check in sqoop.

#if[ ! -d "${HCAT_HOME}" ]; then

#  echo "Warning: $HCAT_HOME does notexist! HCatalog jobs will fail."

#  echo 'Please set $HCAT_HOME to the root ofyour HCatalog installation.'

#fi

#if[ ! -d "${ACCUMULO_HOME}" ]; then

#  echo "Warning: $ACCUMULO_HOME does notexist! Accumulo imports will fail."

#  echo 'Please set $ACCUMULO_HOME to the rootof your Accumulo installation.'

#fi

#Add HCatalog to dependency list

#if[ -e "${HCAT_HOME}/bin/hcat" ]; then

# TMP_SQOOP_CLASSPATH=${SQOOP_CLASSPATH}:`${HCAT_HOME}/bin/hcat-classpath`

#  if [ -z "${HIVE_CONF_DIR}" ]; then

# TMP_SQOOP_CLASSPATH=${TMP_SQOOP_CLASSPATH}:${HIVE_CONF_DIR}

#  fi

#  SQOOP_CLASSPATH=${TMP_SQOOP_CLASSPATH}

#fi

#Add Accumulo to dependency list

#if[ -e "$ACCUMULO_HOME/bin/accumulo" ]; then

#  for jn in `$ACCUMULO_HOME/bin/accumuloclasspath | grep file:.*accumulo.*jar |cut -d':' -f2`; do

# SQOOP_CLASSPATH=$SQOOP_CLASSPATH:$jn

#  done

#  for jn in `$ACCUMULO_HOME/bin/accumuloclasspath | grep file:.*zookeeper.*jar |cut -d':' -f2`; do

# SQOOP_CLASSPATH=$SQOOP_CLASSPATH:$jn

#  done

#fi

接下来修改环境参数文件 /etc/profile：

3.copy需要的lib包到Sqoop/lib

所需的包：mysql的jdbc包,这个包我们在前面已经拷过了（或Oracle的jdbc包等）

4.添加环境变量

vim ~/.bashrc

5.测试验证

--列出mysql数据库中的所有数据库

sqoop list-databases --connect jdbc:mysql://master:3306 --username hive --password libing

---导入数据：将MySQL下的某张表导入到HDFS中去

sqoop import --connect jdbc:mysql://master:3306/hive -table DBS --username hive --passoword libing -m1

其中，hive为MySQL中的数据库名，DBS为表名，第二个hive为Mysql的hive帐号及其密码, -m 1表示只有一个Map过程。（注意：在使用过程中，必须保证集群的所有节点都能访问MySQL的权限，本内容见hive的安装过程设置。）

从HDFS中可以看出，我们导出的文件为.CSV类型（字段以逗号分隔）的。

注：为了使数据能从HDFS中顺利到HIVE数据库中，Sqoop也提供了以下操作顺序：

a.将数据从MySQL中导入到HDFS；

b.使用Sqoop创建表

例如上例中数据：

sqoop create-hive-table --connect jdbc:mysql://master:3306/hive --tableDBS --fields-terminated-by ',' --usernamehive --passoword libing --hive-table testTable

创建一个testTable的HIVE表，跟MySQL中的DBS是一样的格式。

c.将数据从HDFS加载到HIVE表中

当然以上三个步骤可以凑成一个：

（导出MySQL的表结构到HIVE） sqoop create-hive-table --connect jdbc:mysql://master:3306/hive --table DBS --username hive --password libing --hive-table test2

（导出MySQL表数据到HIVE）sqoop import --connect jdbc:mysql://master:3306/hive --table DBS --username hive --password libing --hive-table test2 --hive-import

  如此生成了test2表，与MySQL中的DBS表是一样的结构：

---导出数据：将HDFS中的某张表导出到MySQL中

1、要先在MySQL中建立一张表 test_received；

2、sqoop export  --connect jdbc:mysql://master:3306/hive --table test_received --export-dir /user/hive/warehouse/test2 --username hive --password libing -m 1 --fields-terminated-by '\t' (将test2表从hive中导出到Mysql的test_received表)

十三、在主机Win8下用MyEclipse连接VMware虚拟机Centos的Hadoop

1、主机Win8系统安装MyEclipse8

2、从网上下载hadoop-eclipse-plugin-1.2.1.jar插件（当然，也可以自己编译了，本文不再附述）

3、将插件放到MyEclipse安装目录的dropins下

4、重启MyEclipse，并且打开 windows->open perspective->other->map/reduce 可以看到map/reduce开发视图。点击。
在Window-->Show View中打开Map/Reduce Locations。
在Map/Reduce Locations中新建一个Hadoop Location。在这个View中，右键-->New Hadoop Location。在弹出的对话框中填写配置Location name可以随意填写，Map/Reduce Master和DFS Master里面的Host、Port分别为你在mapred-site.xml、core-site.xml中配置的地址及端口。username填写主节点的名称。

然后是打开“Advanced parameters”设置面板，修改相应参数。

dfs.datanode.data.dir dfs.namenode.name.dir等

点击Finish后可以看到HDFS结构。

设置成功。即可用之！

十三、 SPARK的安装：

参考http://blog.csdn.net/yeruby/article/details/49805121

但完成Scala与SPARK的配置之后，不急着启动，scp scala与spark到两个slave节点。也要配置两个节点的配置文件~/.bashrc.之后再启动。

十二、总结及常见问题：

常见问题：

现象：当停止Hadoop的时候发现no datanode to stop的信息

原因1：每次namenode format会重新创建一个namenodeId，而tmp/dfs/data下包含了上次format下的id，namenode format清空了namenode下的数据，但是没有清空datanode下的数据，导致启动时失败，所要做的就是每次fotmat前，清空tmp一下的所有目录。

这里有两种解决方案：

1）删除“/usr/hadoop/tmp”里面的内容

       rm -rf /usr/hadoop/tmp/*

2）删除“/tmp”下以“hadoop”开头的文件

       rm -rf /tmp/hadoop*

3）重新格式化hadoop

       hadoop namenode -format

4）启动hadoop

       start-all.sh

这种方案的缺点是原来集群上的重要数据全没有了。因此推荐第二种方案：

1）修改每个Slave的namespaceID，使其与Master的namespaceID一致。

或者

2）修改Master的namespaceID使其与Slave的namespaceID一致。

Master的“namespaceID”位于“/usr/hadoop/tmp/dfs/name/current/VERSION”文件里面，Slave的“namespaceID”位于“/usr/hadoop/tmp/dfs/data/current/VERSION”文件里面。

原因2：问题的原因是hadoop在stop的时候依据的是datanode上的mapred和dfs进程号。而默认的进程号保存在/tmp下，linux 默认会每隔一段时间（一般是一个月或者7天左右）去删除这个目录下的文件。因此删掉hadoop-hadoop-jobtracker.pid和hadoop-hadoop-namenode.pid两个文件后，namenode自然就找不到datanode上的这两个进程了。

在配置文件hadoop_env.sh中配置export HADOOP_PID_DIR可以解决这个问题。

在配置文件中，HADOOP_PID_DIR的默认路径是“/var/hadoop/pids”，我们手动在“/var”目录下创建一个“hadoop”文件夹，若已存在就不用创建，记得用chown将权限分配给hadoop用户。然后在出错的Slave上杀死Datanode和Tasktracker的进程(kill -9 进程号)，再重新start-all.sh，stop-all.sh时发现没有“no datanode to stop”出现，说明问题已经解决。

现象二：number of under-replicated blocks:1
hadoop集群Number of Under-Replicated Blocks问题

　　跑了一个mapreduce发现集群上出现了7个Under-Replicated Blocks，在web页面上能看到，在主节点上执行：

　　$ bin/hadoop fsck -blocks 重启完了即好啦。

现象三：在使用MyEclipse时，上传文件，会出现以下情况：

这是因为没有文件写权限所致，解决方法为：

修改HDFS中相应文件夹的权限，后面的/user/hadoop这个路径为HDFS中的文件路径，这样修改之后就让我们的administrator有在HDFS的相应目录下有写文件的权限（所有的用户都是写权限）。之后问题解决了！！

在运行Eclipse时还会发现，如果想要输出文件放在/user/lb/output/output.dat

可能会出现无法操作，不能写入的情况，那么要hadoop dfs -chmod 777 /user/lb/output才行。

现象四：hadoop1.2.1在windows远程调试linux的程序时，报错:

12/04/24 15:32:44 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

12/04/24 15:32:44 ERROR security.UserGroupInformation: PriviledgedActionException as:Administrator cause:java.io.IOException: Failed to set permissions of path: \tmp\hadoop-Administrator\mapred\staging\Administrator-519341271\.staging to 0700
Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-Administrator\mapred\staging\Administrator-519341271\.staging to 0700

...

...

解：这个是Windows下文件权限问题，在Linux下可以正常运行，不存在这样的问题。
解决方法是，修改/hadoop-1.0.2/src/core/org/apache/hadoop/fs/FileUtil.java里面的checkReturnValue，注释掉即可（有些粗暴，在Window下，可以不用检查）

......

  private static void checkReturnValue(boolean rv, File p,

                                       FsPermission permission

                                       ) throws IOException {

    /**

if (!rv) {

throw new IOException("Failed to set permissions of path: " + p +

" to " +

String.format("%04o", permission.toShort()));

}

**/

  }

......

最后重新编译打包hadoop-core-1.2.1.jar，替换掉hadoop-1.2.1根目录下的hadoop-core-1.2.1.jar即可。

当然也可以直接从网上找一些，即可：下载地址为http://download.csdn.net/detail/echoqun/6198467

最后可以运行成功。

补记：
2016年7月参加广东省高职院校Hadoop大数据应用师资培训班。使用CentOS6.5（三个节点）布署Hadoop2.7.0的记录：
1、一到四的步骤与上相同。第五步配置namenode文件时，做以下修改：
一、            配置hosts文件

二、            建立hadoop运行帐号

三、            配置ssh免密码连入

四、            下载并解压hadoop安装包

五、            配置namenode,修改site文件

hadoop-env.sh:

hdfs-site.xml:

mapred-site.xml:

yarn-site.xml:

另外masters与slaves的配置如前部分所示。。

在启动的过程中，出现了datanode无法启动的情况，或namenode无法启动的情况。解决之道：先stop-all.sh,再需要将mapred-site.xml，中的tmp与dfs文件夹删除（3个节点都要删除。），再hadoop namenode -format，格式化后重启,看是否可以，如果还是不行。需要将~/hadoop-2.7.0/lib下的native文件另存为native-old以备份后，将native目录下的所有文件删除，再从网上下载hadoop-native-64-2.6.1.tar文件在native下tar -xf hadoop-native-64-2.6.1.tar 解压。

解压之后，将native文件目录scp -r native hadoop@node1:~/hadoop-2.7.0/lib，scp 到两个datanode节点。并且 vim /etc/profile,加入新的语句：export LD_LIBRARY_PATH=......如下图所示。

再重新先stop-all.sh,再需要将mapred-site.xml，中的tmp与dfs文件夹删除（3个节点都要删除。），再hadoop namenode -format，格式化后重启之后则可以通过。并且无以下的警告了：

util.NativeCodeLoader: Unable to load native-hadoop library for your platform

git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
CentOS的根目录下，/bin 和 /sbin 用途和权限 Energet!c Linux日常 centos linux 运维
CentOS的根目录下，/bin和/sbin用途和权限一、/bin(Binary)二、/sbin(SystemBinary)三、总结在CentOS的根目录下，/bin和/sbin目录有不同的用途和权限一、/bin(Binary)用途:存放系统的基本命令，这些命令对所有用户都是可用的。例如：ls、cp、mv、rm等。权限:普通用户和系统管理员都可以使用这些命令。二、/sbin(SystemBinar
CentOS 7官方源停服，配置本机光盘yum源码哝小鱼 linux运维 centos linux 运维
1、挂载系统光盘mkdir/mnt/isomount-oloop/tools/CentOS-7-x86_64-DVD-1810.iso/mnt/isocd/mnt/iso/Packages/rpm-ivh/mnt/iso/Packages/yum-utils-1.1.31-50.el7.noarch.rpm(图形界面安装，默契已安装）如安装yum-utils依赖错误，按提示安装依赖包rpm-ivh
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
【2023年】云计算金砖牛刀小试6 geekgold 云计算服务器网络 kubernetes 容器
第一套【任务1】私有云服务搭建[10分]【题目1】基础环境配置[0.5分]使用提供的用户名密码，登录提供的OpenStack私有云平台，在当前租户下，使用CentOS7.9镜像，创建两台云主机，云主机类型使用4vCPU/12G/100G_50G类型。当前租户下默认存在一张网卡，自行创建第二张网卡并连接至controller和compute节点（第二张网卡的网段为10.10.X.0/24，X为工位号
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
LeetCode 53. Maximum Subarray 枯萎的海风算法与OJ C/C++leetcode
1.题目描述Findthecontiguoussubarraywithinanarray(containingatleastonenumber)whichhasthelargestsum.Forexample,giventhearray[−2,1,−3,4,−1,2,1,−5,4],thecontiguoussubarray[4,−1,2,1]hasthelargestsum=6.clicktos
【LeetCode】53. Maximum Subarray 墨染百城 LeetCode leetcode
问题描述问题链接：https://leetcode.com/problems/maximum-subarray/#/descriptionFindthecontiguoussubarraywithinanarray(containingatleastonenumber)whichhasthelargestsum.Forexample,giventhearray[-2,1,-3,4,-1,2,1,-
LeetCode 673. Number of Longest Increasing Subsequence (Java版; Meidum) littlehaes 字符串动态规划算法 leetcode 数据结构
welcometomyblogLeetCode673.NumberofLongestIncreasingSubsequence(Java版;Meidum)题目描述Givenanunsortedarrayofintegers,findthenumberoflongestincreasingsubsequence.Example1:Input:[1,3,5,4,7]Output:2Explanatio
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
CentOS7 安装MySQL5.7.44 不要Null了 java centos mysql
1.下载mysql安装包，我放在百度网盘里(下方链接)链接：https://pan.baidu.com/s/1_Mn1XW_1mWdTV4mhnLG66A提取码：s31n2.首先看看以前是否安装过mysqlrpm-qa|grep-imysql如果已经安装过mysql会提示卸载mysqlrpm-emysql-…3.使用FinallShell或者Xftp进行上传放到/usr/local/mysql，没
Kubernetes 自定义控制器开发 IT回忆录 Kubenetes kubernetes
目录前言一、CRD二、创建数据库表（Mysql）二、控制器开发1.使用kubernetes的examplecontroller模板2.在controller.go中新增数据表监听方法3.修改tools工具生成资源对象结构体定义这里记录开发k8s控制器的一般方式，controller开发主要使用k8s提供的client-go库进行。前言Controller监听集群内部资源对象的变化，编辑资源对象(增
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
PAT Advanced 1015. Reversible Primes (C语言实现) OliverLew
我的PAT系列文章更新重心已移至Github，欢迎来看PAT题解的小伙伴请到GithubPages浏览最新内容。此处文章目前已更新至与GithubPages同步。欢迎star我的repo。题目Areversibleprimeinanynumbersystemisaprimewhose"reverse"inthatnumbersystemisalsoaprime.Forexampleinthedec
tf.get_collection() yalesaleng
此函数有两个参数，key和scope。Args:1.key:Thekeyforthecollection.Forexample,theGraphKeysclasscontainsmanystandardnamesforcollections.2.scope:(Optional.)Ifsupplied,theresultinglistisfilteredtoincludeonlyitemswhose
SQLite的入门级项目学习记录（二）深蓝海拓 SQLite学习笔记 sqlite 学习数据库
再补充一些基础知识：并行操作的问题1、可以多游标同时运行SQLite，对于同一个连接sqlite3.connect(db_file)，可以同时创建多个游标，每个游标都是独立的，可以执行各自的SQL命令序列。importsqlite3#创建数据库连接conn=sqlite3.connect('example.db')#创建第一个游标cursor1=conn.cursor()cursor1.execu
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

hadoop完全分布式集群+Win Eclipse+Hbase+Hive+Zookeeper+Sqoop+SPARK试验机平台

util.NativeCodeLoader: Unable to load native-hadoop library for your platform

你可能感兴趣的:(数据建模&数据挖掘,Hadoop,centos,hadoop1.2.1,完全分布式,hbase,eclipse)