Nazarite_wen

Hadoop集群节点的动态增加与删除

http://heylinux.com/archives/2047.html

Hadoop集群节点的动态增加与删除

Hadoop集群节点的动态增加
1. 安装配置节点
具体过程参考《Hadoop集群实践之 (1) Hadoop(HDFS)搭建》

2. 在配置过程中需要在所有的Hadoop服务器上更新以下三项配置
$ sudo vim /etc/hadoop/conf/slaves

 
          1 
          hadoop-node-1 
        
          2 
          hadoop-node-2 
        
          3 
          hadoop-node-3

$ sudo vim /etc/hosts

 
          1 
          10.6.1.150 hadoop-master 
        
          2 
          10.6.1.151 hadoop-node-1 
        
          3 
          10.6.1.152 hadoop-node-2 
        
          4 
          10.6.1.153 hadoop-node-3

$ sudo vim /etc/hadoop/conf/hdfs-site.xml

 
          01 
          <?xml version="1.0"?> 
        
          02 
          <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 
        
          03 
            
          04 
          <configuration> 
        
          05 
          <property> 
        
          06 
            <name>dfs.data.dir</name> 
        
          07 
            <value>/data/hdfs</value> 
        
          08 
          </property> 
        
          09 
          <property> 
        
          10 
            <name>dfs.replication</name> 
        
          11 
            <value>3</value> 
        
          12 
          </property> 
        
          13 
          <property> 
        
          14 
            <name>dfs.datanode.max.xcievers</name> 
        
          15 
            <value>4096</value> 
        
          16 
          </property> 
        
          17 
          </configuration>

3. 启动datanode与tasktracker
dongguo@hadoop-node-3:~$ sudo /etc/init.d/hadoop-0.20-datanode start
dongguo@hadoop-node-3:~$ sudo /etc/init.d/hadoop-0.20-tasktracker start

4. 检查新增节点是否已经Live
通过WEB管理界面查看

http://10.6.1.150:50070/dfsnodelist.jsp?whatNodes=LIVE

可以看到hadoop-node-3已经被动态添加到了Hadoop集群中

5.应用新的备份系数dfs.replication

5.1 检查目前的备份系数
dongguo@hadoop-master:~$ sudo -u hdfs hadoop fs -lsr /dongguo
-rw-r--r-- 2 hdfs supergroup 33 2012-10-07 22:02 /dongguo/hello.txt

结果行中的第2列是备份系数（注：文件夹信息存储在namenode节点上，没有备份，故文件夹的备份系数是横杠-）
目前文件的备份系数仍是之前设置的参数2，Hadoop不会自动的按照新的备份系数进行调整。

dongguo@hadoop-master:~$ sudo -u hdfs hadoop fsck /

 
          01 
          12/10/10 21:18:32 INFO security.UserGroupInformation: JAAS Configuration already setup for Hadoop, not re-installing. 
        
          02 
          FSCK started by hdfs (auth:SIMPLE) from /10.6.1.150 for path / at Wed Oct 10 21:18:33 CST 2012 
        
          03 
          .................Status: HEALTHY 
        
          04 
           Total size:    7786 B 
        
          05 
           Total dirs:    46 
        
          06 
           Total files:   17 
        
          07 
           Total blocks (validated):  17 (avg. block size 458 B) 
        
          08 
           Minimally replicated blocks:   17 (100.0 %) 
        
          09 
           Over-replicated blocks:    0 (0.0 %) 
        
          10 
           Under-replicated blocks:   0 (0.0 %) 
        
          11 
           Mis-replicated blocks:     0 (0.0 %) 
        
          12 
           Default replication factor:    2 
        
          13 
           Average block replication: 2.0 
        
          14 
           Corrupt blocks:        0 
        
          15 
           Missing replicas:      0 (0.0 %) 
        
          16 
           Number of data-nodes:      4 
        
          17 
           Number of racks:       1 
        
          18 
          FSCK ended at Wed Oct 10 21:18:33 CST 2012 in 48 milliseconds 
        
          19 
          The filesystem under path '/' is HEALTHY

通过 hadoop fsck / 也可以方便的看到Average block replication的值仍然为旧值2，该值我们可以手动的进行动态修改。
而Default replication factor则需要重启整个Hadoop集群才能修改，但实际影响系统的还是Average block replication的值，因此并非一定要修改默认值。

5.2 修改hdfs文件备份系数，把/ 目录下所有文件备份系数设置为3
dongguo@hadoop-master:~$ sudo -u hdfs hadoop dfs -setrep -w 3 -R /

 
          01 
          12/10/10 21:22:35 INFO security.UserGroupInformation: JAAS Configuration already setup for Hadoop, not re-installing. 
        
          02 
          Replication 3 set: hdfs://hadoop-master/dongguo/hello.txt 
        
          03 
          Replication 3 set: hdfs://hadoop-master/hbase/-ROOT-/70236052/.oldlogs/hlog.1349695889266 
        
          04 
          Replication 3 set: hdfs://hadoop-master/hbase/-ROOT-/70236052/.regioninfo 
        
          05 
          Replication 3 set: hdfs://hadoop-master/hbase/-ROOT-/70236052/info/7670471048629837399 
        
          06 
          Replication 3 set: hdfs://hadoop-master/hbase/.META./1028785192/.oldlogs/hlog.1349695889753 
        
          07 
          Replication 3 set: hdfs://hadoop-master/hbase/.META./1028785192/.regioninfo 
        
          08 
          Replication 3 set: hdfs://hadoop-master/hbase/.META./1028785192/info/7438047560768966146 
        
          09 
          Waiting for hdfs://hadoop-master/dongguo/hello.txt .... done 
        
          10 
          Waiting for hdfs://hadoop-master/hbase/-ROOT-/70236052/.oldlogs/hlog.1349695889266... done 
        
          11 
          Waiting for hdfs://hadoop-master/hbase/-ROOT-/70236052/.regioninfo ... done 
        
          12 
          Waiting for hdfs://hadoop-master/hbase/-ROOT-/70236052/info/7670471048629837399 ...done 
        
          13 
          Waiting for hdfs://hadoop-master/hbase/.META./1028785192/.oldlogs/hlog.1349695889753... done 
        
          14 
          Waiting for hdfs://hadoop-master/hbase/.META./1028785192/.regioninfo ... done 
        
          15 
          Waiting for hdfs://hadoop-master/hbase/.META./1028785192/info/7438047560768966146 ...done 
        
          16 
          ...

可以看到Hadoop对所有文件的备份系数进行了刷新

5.3 再次检查备份系数的情况
dongguo@hadoop-master:~$ sudo -u hdfs hadoop fsck /

 
          01 
          12/10/10 21:23:26 INFO security.UserGroupInformation: JAAS Configuration already setup for Hadoop, not re-installing. 
        
          02 
          FSCK started by hdfs (auth:SIMPLE) from /10.6.1.150 for path / at Wed Oct 10 21:23:27 CST 2012 
        
          03 
          .................Status: HEALTHY 
        
          04 
           Total size:    7786 B 
        
          05 
           Total dirs:    46 
        
          06 
           Total files:   17 
        
          07 
           Total blocks (validated):  17 (avg. block size 458 B) 
        
          08 
           Minimally replicated blocks:   17 (100.0 %) 
        
          09 
           Over-replicated blocks:    0 (0.0 %) 
        
          10 
           Under-replicated blocks:   0 (0.0 %) 
        
          11 
           Mis-replicated blocks:     0 (0.0 %) 
        
          12 
           Default replication factor:    2 
        
          13 
           Average block replication: 3.0 
        
          14 
           Corrupt blocks:        0 
        
          15 
           Missing replicas:      0 (0.0 %) 
        
          16 
           Number of data-nodes:      4 
        
          17 
           Number of racks:       1 
        
          18 
          FSCK ended at Wed Oct 10 21:23:27 CST 2012 in 11 milliseconds 
        
          19 
          The filesystem under path '/' is HEALTHY

可以看到已经变成了新的备份系数"3"

5.4 测试一下创建新的文件时是否能集成新的备份系数
dongguo@hadoop-master:~$ sudo -u hdfs hadoop fs -copyFromLocal mysql-connector-java-5.1.22.tar.gz /dongguo
dongguo@hadoop-master:~$ sudo -u hdfs hadoop fs -lsr /dongguo

 
          1 
          -rw-r--r--   3 hdfs supergroup         33 2012-10-07 22:02 /dongguo/hello.txt 
        
          2 
          -rw-r--r--   3 hdfs supergroup    4028047 2012-10-10 21:28 /dongguo/mysql-connector-java-5.1.22.tar.gz

可以看到新上传的文件的备份系数是"3"

6 对HDFS中的文件进行负载均衡
dongguo@hadoop-master:~$ sudo -u hdfs hadoop balancer

 
          1 
          Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved 
        
          2 
          12/10/10 21:30:25 INFO net.NetworkTopology: Adding a new node: /default-rack/10.6.1.153:50010 
        
          3 
          12/10/10 21:30:25 INFO net.NetworkTopology: Adding a new node: /default-rack/10.6.1.150:50010 
        
          4 
          12/10/10 21:30:25 INFO net.NetworkTopology: Adding a new node: /default-rack/10.6.1.152:50010 
        
          5 
          12/10/10 21:30:25 INFO net.NetworkTopology: Adding a new node: /default-rack/10.6.1.151:50010 
        
          6 
          12/10/10 21:30:25 INFO balancer.Balancer: 0 over utilized nodes: 
        
          7 
          12/10/10 21:30:25 INFO balancer.Balancer: 0 under utilized nodes: 
        
          8 
          The cluster is balanced. Exiting... 
        
          9 
          Balancing took 1.006 seconds

至此，Hadoop集群的动态增加就已经完成了。
下面，我开始对Hadoop集群的节点进行动态的删除。

Hadoop集群节点的动态删除
1. 使用新增的节点
尽可能的在HDFS中产生一些测试数据，并通过Hive执行一些Job以便使新的节点也执行MapReduce并行计算。
这样做的原因是尽可能的模拟线上的环境，因为线上环境在进行删除节点之前肯定是有很多数据和Job执行过的。

2. 修改core-site.xml
dongguo@hadoop-master:~$ sudo vim /etc/hadoop/conf/core-site.xml

 
          1 
          <property> 
        
          2 
            <name>dfs.hosts.exclude</name> 
        
          3 
            <value>/etc/hadoop/conf/exclude</value> 
        
          4 
            <description>Names a file that contains a list of hosts that are 
        
          5 
            not permitted to connect to the namenode.  The full pathname of the 
        
          6 
            file must be specified.  If the value is empty, no hosts are 
        
          7 
            excluded.</description> 
        
          8 
          </property>

3. 修改hdfs-site.xml
dongguo@hadoop-master:~$ sudo vim /etc/hadoop/conf/hdfs-site.xml

 
          1 
          <property> 
        
          2 
            <name>dfs.hosts.exclude</name> 
        
          3 
            <value>/etc/hadoop/conf/exclude</value> 
        
          4 
            <description>Names a file that contains a list of hosts that are 
        
          5 
            not permitted to connect to the namenode.  The full pathname of the 
        
          6 
            file must be specified.  If the value is empty, no hosts are 
        
          7 
            excluded.</description> 
        
          8 
          </property>

4. 创建/etc/hadoop/conf/exclude
dongguo@hadoop-master:~$ sudo vim /etc/hadoop/conf/exclude

 
          1 
          hadoop-node-3

在文件中增加需要删除的节点，一行一个，我这里仅需要写入新增的hadoop-node-3做测试。

5. 降低备份系数
在我的测试环境中，目前节点为4台，备份系数为3，如果去掉一台的话备份系数就与节点数相同了，而Hadoop是不允许的。
通常备份系数不需要太高，可以是服务器总量的1/3左右即可，Hadoop默认的数值是3。

下面，我们将备份系数从3降低到2

5.1 在所有的Hadoop服务器上更新以下配置
$ sudo vim /etc/hadoop/conf/hdfs-site.xml

 
          01 
          <?xml version="1.0"?> 
        
          02 
          <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 
        
          03 
            
          04 
          <configuration> 
        
          05 
          <property> 
        
          06 
            <name>dfs.data.dir</name> 
        
          07 
            <value>/data/hdfs</value> 
        
          08 
          </property> 
        
          09 
          <property> 
        
          10 
            <name>dfs.replication</name> 
        
          11 
            <value>2</value> 
        
          12 
          </property> 
        
          13 
          <property> 
        
          14 
            <name>dfs.datanode.max.xcievers</name> 
        
          15 
            <value>4096</value> 
        
          16 
          </property> 
        
          17 
          </configuration>

5.2 修改hdfs文件备份系数，把/ 目录下所有文件备份系数设置为2
dongguo@hadoop-master:~$ sudo -u hdfs hadoop dfs -setrep -w 2 -R /

遇到的疑问：
在进行文件备份系数的降低时，能够很快的进行Replication set，但是在Waiting for的过程中却很长时间没有完成。
最终只能手动Ctrl+C中断，个人猜测在这个过程中HDFS正视图对数据文件进行操作，在删除一个副本容量的数据。
因此，我们应该对dfs.replication的数值做出很好的规划，尽量避免需要降低该数值的情况出现。

6. 动态刷新配置
dongguo@hadoop-master:~$ sudo -u hdfs hadoop dfsadmin -refreshNodes

7. 检查节点的处理状态
通过WEB管理界面查看
Decommissioning(退役中)

http://10.6.1.150:50070/dfsnodelist.jsp?whatNodes=DECOMMISSIONING

Dead(已经下线)

http://10.6.1.150:50070/dfsnodelist.jsp?whatNodes=DEAD

可以看到，节点已经经历了退役的过程并成功的下线了。

需要注意的是：
在删除节点时一定要停止所有Hadoop的Job，否则程序还会向要删除的节点同步数据，这样也会导致Decommission的过程一直无法完成。

8. 检查进程状态
这时我们查看进程状态，可以发现datanode进程已经被自动中止了
dongguo@hadoop-node-3:~$ sudo /etc/init.d/hadoop-0.20-datanode status
hadoop-0.20-datanode is not running.

而Tasktracker进程还在，需要我们手动中止
dongguo@hadoop-node-3:~$ sudo /etc/init.d/hadoop-0.20-tasktracker status
hadoop-0.20-tasktracker is running
dongguo@hadoop-node-3:~$ sudo /etc/init.d/hadoop-0.20-tasktracker stop
Stopping Hadoop tasktracker daemon: stopping tasktracker
hadoop-0.20-tasktracker.

此时，即使我们手动启动datanode，也是不能成功的，日志中会显示UnregisteredDatanodeException的错误。
dongguo@hadoop-node-3:~$ sudo /etc/init.d/hadoop-0.20-datanode start

 
          1 
          Starting Hadoop datanode daemon: starting datanode, logging to /usr/lib/hadoop-0.20/logs/hadoop-hadoop-datanode-hadoop-node-3.out 
        
          2 
          ERROR. Could not start Hadoop datanode daemon

dongguo@hadoop-node-3:~$ tailf /var/log/hadoop/hadoop-hadoop-datanode-hadoop-node-3.log

 
          01 
          2012-10-11 19:33:22,084 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.protocol.UnregisteredDatanodeException: Data node hadoop-node-3:50010 is attempting to report storage ID DS-500645823-10.6.1.153-50010-1349941031723. Node 10.6.1.153:50010 is expected to serve this storage. 
        
          02 
              at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getDatanode(FSNamesystem.java:4547) 
        
          03 
              at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.verifyNodeRegistration(FSNamesystem.java:4512) 
        
          04 
              at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.registerDatanode(FSNamesystem.java:2355) 
        
          05 
              at org.apache.hadoop.hdfs.server.namenode.NameNode.register(NameNode.java:932) 
        
          06 
              at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
        
          07 
              at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) 
        
          08 
              at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25) 
        
          09 
              at java.lang.reflect.Method.invoke(Method.java:597) 
        
          10 
              at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:557) 
        
          11 
              at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1434) 
        
          12 
              at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1430) 
        
          13 
              at java.security.AccessController.doPrivileged(Native Method) 
        
          14 
              at javax.security.auth.Subject.doAs(Subject.java:396) 
        
          15 
              at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1157) 
        
          16 
              at org.apache.hadoop.ipc.Server$Handler.run(Server.java:1428) 
        
          17 
                  at org.apache.hadoop.ipc.Client.call(Client.java:1107) 
        
          18 
              at org.apache.hadoop.ipc.RPC$Invoker.invoke(RPC.java:226) 
        
          19 
              at $Proxy4.register(Unknown Source) 
        
          20 
              at org.apache.hadoop.hdfs.server.datanode.DataNode.register(DataNode.java:717) 
        
          21 
              at org.apache.hadoop.hdfs.server.datanode.DataNode.runDatanodeDaemon(DataNode.java:1519) 
        
          22 
              at org.apache.hadoop.hdfs.server.datanode.DataNode.createDataNode(DataNode.java:1586) 
        
          23 
              at org.apache.hadoop.hdfs.server.datanode.DataNode.secureMain(DataNode.java:1711) 
        
          24 
              at org.apache.hadoop.hdfs.server.datanode.DataNode.main(DataNode.java:1728) 
        
          25 
          2012-10-11 19:33:22,097 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: SHUTDOWN_MSG: 
        
          26 
          /************************************************************ 
        
          27 
          SHUTDOWN_MSG: Shutting down DataNode at hadoop-node-3/10.6.1.153 
        
          28 
          ************************************************************/

至此，对Hadoop集群节点的动态删除也已经成功完成了。

你可能感兴趣的:(hadoop,节点动态添加删除)

C++STL容器：链表介绍与使用背影疾风 C++学习数据结构 c++链表
目录一、链表概念介绍C++中链表的实现与使用1.手写链表的定义（无方法）2.STL库容器：list(双向链表)与forward_list（单向链表）listlist构造方法list增、删、查list的正向与逆向迭代器list的特殊方法一、链表概念介绍链表是一种通过指针串连起来的数据结构，一个链表节点分为数据域（用来存储数据），和指针域（存储指向下一个（或上一个）结点的地址指针）。根据结构特点可以
MySQL视图 shilinnull MySQL mysql 数据库
文章目录基本使用创建视图删除视图视图规则和限制视图是一个虚拟表，其内容由查询定义。同真实的表一样，视图包含一系列带有名称的列和行数据。视图的数据变化会影响到基表，基表的数据变化也会影响到视图。基本使用创建视图createview视图名asselect语句；案例：mysql>createviewmyviewasselectename,dnamefromemp,deptwhereemp.deptno=
C++ | 什么是哈希? | 闭散列结构的模拟实现与讲解宇宙第一乌龟骑士数据结构与算法哈希算法 c++算法
文章目录什么是哈希？什么是unordered_map？闭散列的线性探测闭散列的模拟实现整体结构的交代查找接口的实现插入接口的实现删除接口的实现什么是哈希？哈希是一种将任意长度的数据映射到固定长度的数据的方法。哈希的目的是为了快速的比较，查找或者验证数据的完整性，其通常用于数据结构，加密，签名等领域中。哈希有多种算法，如MD5，SHA等什么是unordered_map？在C++11之前，STL标准库
Java IO流知识点总结 Zonda要好好学习 javaSE java 开发语言
文章目录IO流的定义作用主要应用场景IO流的分类按照流的方向分类按照读取数据方式不同分类重要IO流讲解IO包重点掌握的16中IO包FileInputStream文件拷贝FileReader的使用FileWriter的使用带有缓冲区的字符流BufferedReader节点流和包装流带有缓冲区的字符输出流数据流DataOutputStream和DataInputStream标准输出流日志工具类的封装F
Python实例题：基于 Python 的简单文件管理器狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于Python的简单文件管理器要求：使用Python构建一个简单的文件管理器，支持以下功能：浏览文件和文件夹创建、删除和重命名文件/文件夹复制、移动和压缩文件/文件夹搜索文件和文件夹查看文件属性和预览文本文件使用tkinter构建图形用户界面。支持多平台（Windows、Linux、macOS）。解题思路：使用tkinte
199.二叉树的右视图(C++逐句解析） lcy_robotics c++算法 leetcode
classSolution{public:vectorrightSideView(TreeNode*root){//方法的类型是vector，需要的参数是节点类型queueque;//创建队列，队列里存的是节点类型if(root!=NULL)que.push(root);//如果根节点不是空的，把根节点放入队列vectorresult;//创建int类型容器，存放输出结果while(!=que.e
二叉树展开为链表C++
给你二叉树的根结点root，请你将它展开为一个单链表：展开后的单链表应该同样使用TreeNode，其中right子指针指向链表中下一个结点，而左子指针始终为null。展开后的单链表应该与二叉树先序遍历顺序相同。迭代法，创建了一个哨兵节点（先序遍历），用了栈，空间复杂度为O(n)classSolution{public:voidflatten(TreeNode*root){if(root==null
199. 二叉树的右视图 C++实现
给定一棵二叉树，想象自己站在它的右侧，按照从顶部到底部的顺序，返回从右侧所能看到的节点值。示例:输入: [1,2,3,null,5,null,4]输出: [1,3,4]解释:1rightSideView(TreeNode*root){//使用队列vectordata;queueque;if(root==NULL)returndata;que.push(root);intcurrent=1;//用于
力扣199-二叉树的右视图-C++ TLJava^v^ 数据结构 #力扣-C++c++力扣二叉树右视图层次遍历
一、运行结果二、题目给定一个二叉树的根节点root，想象自己站在它的右侧，按照从顶部到底部的顺序，返回从右侧所能看到的节点值。示例1:输入:[1,2,3,null,5,null,4]输出:[1,3,4]示例2:输入:[1,null,3]输出:[1,3]示例3:输入:[]输出:[]来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/binary-tr
Python 的内置函数 property
Python内建函数列表>Python的内置函数propertyPython的内置函数property()是一个非常重要的工具，用于管理类属性的访问。它提供了一种优雅的方式来定义属性访问器（getter）、设置器（setter）和删除器（deleter）方法，同时保持简洁的接口。基本用法classPerson:def__init__(self,name):self._name=name@prope
MinerU API 服务Docker一键部署（附源码）码农垦荒笔记 docker 容器运维
一、关于MinerU一站式、开源、高质量的数据提取工具，支持多种功能，如提取PDF、word、markdown等格式的内容。1.主要功能删除页眉、页脚、脚注、页码等元素，保持语义连贯对多栏输出符合人类阅读顺序的文本保留原文档的结构，包括标题、段落、列表等提取图像、图片标题、表格、表格标题自动识别文档中的公式并将公式转换成latex自动识别文档中的表格并将表格转换成latex乱码PDF自动检测并启用
Redis哨兵模式 SkyWide 无限领航 Linux redis linux
Redis哨兵模式文章原始同步：微信搜索公众号：SkyWide无限领航QQ技术群：308191819欢迎各位加入Redis哨兵模式（1）一主二从Redis集群部署使用SSH工具连接三个虚拟机节点修改主机名。命令如下所示：redis1主节点：[root@localhost~]#hostnamectlset-hostnameredis1redis2从节点：[root@localhost~]#hostn
如何学习才能更好地理解人工智能工程技术专业和其他信息技术专业的关联性？人工智能教学实践 python编程实践人工智能学习人工智能
要深入理解人工智能工程技术专业与其他信息技术专业的关联性，需要跳出单一专业的学习框架，通过“理论筑基-实践串联-跨学科整合”的路径构建系统性认知。以下是分阶段、可落地的学习方法：一、建立“专业关联”的理论认知框架绘制知识关联图谱操作方法：用XMind或Notion绘制思维导图，以AI为中心，辐射关联专业的核心技术节点。例如：AI（机器学习）├─数据支撑：大数据技术（Hadoop/Spark）+数据
哈希表经典题目深度解析 - 从理论到实践
哈希表经典题目深度解析-从理论到实践哈希表理论基础回顾哈希表的本质哈希表是一种在时间和空间上做权衡的数据结构，通过哈希函数将键映射到数组索引，实现O(1)平均时间复杂度的查找、插入、删除操作。哈希表的三种经典结构数组-简单直接的哈希表set-集合型哈希表map-键值对哈希表选择指南数组：数据范围有限且连续（如小写字母、固定范围整数）set：需要去重，不需要记录额外信息map：需要记录键值对关系（如
研究方法 | 社会网络分析大锤资源学习经验分享
社会网络分析（SocialNetworkAnalysis，SNA）是一种研究社会结构的方法，它通过分析社会主体（如个人、组织、国家等）之间的关系网络，探讨这些关系对群体行为、互动和结构的影响。这种方法强调网络中节点（社会主体）和边（社会联系）之间的相互作用，揭示了人类社会交往中的复杂性和内在模式。01分析内容社会网络分析的核心内容包括：•节点与边：节点代表社会网络中的个体或实体，边则是连接这些节点
java arthas redefine实现热替换某个类 master-dragon #java类加载和gc java arthas
简单的看下arthasredefine类的效果,需要注意redefine的class不能修改、添加、删除类的field和method，包括方法参数、方法名称及返回值。redefine后的原来的类不能恢复，redefine有可能失败（比如增加了新的field），参考jdk本身的文档。redefine命令和jad/watch/trace/monitor/tt等命令会冲突。执行完redefine之后，如
顺序表、链表、栈和队列总结 Ljw... 数据结构数据结构顺序表链表栈和队列总结
目录顺序表链表栈队列总结补充顺序表实现链表实现栈实现队列实现顺序表、链表、栈和队列都是线性数据结构，但它们在管理和访问数据方面有不同的特点和用途。以下是它们之间的主要区别：顺序表存储方式：在连续的内存空间中存储元素。访问方式：通过索引直接访问，时间复杂度为O(1)。插入/删除：在表尾插入或删除元素，时间复杂度为O(n)，因为可能需要移动元素。动态性：通常需要预先分配固定大小的存储空间，但如果需要，
【EXCEL_VBA_基础知识】02 使用IF进行逻辑判断南工说焊接软件应用 excel
课程来源：王佩丰老师的《王佩丰学VBA视频教程》，如有侵权，请联系删除！相信大家在平时使用EXCEL时，经常会使用到IF函数进行判断。那么，IF函数在VBA是怎么写呢？让我们跟随王佩丰老师课程，一起一探究竟！另外，从王佩丰老师的课程中，还掌握了一个小技巧：当我们不知道一段代码如何编写时，可以通过录制宏的方式来查看功能实现的代码！目录1.0小知识点1.0.1Range("单元格或区域位置")：代表取
Python 中如何使用 Conda 管理版本和创建 Django 项目懂搬砖 Python小白成长记原力计划 python conda django
文章目录引言一、思维导图二、Conda基础操作1.安装Conda2.创建和管理环境创建新环境激活环境查看所有环境删除环境3.安装和管理包安装包查看已安装的包更新包删除包三、使用Conda环境创建Django项目1.激活Conda环境2.创建Django项目3.启动开发服务器4.创建Django应用5.配置项目和应用配置**settings.py**定义模型迁移数据库四、总结引言在Python开发中
浏览器原生控件上传PDF导致hash值不同 wsxqaz pdf 哈希算法算法
用户要求对上传的pdf计算hash排重，上线后发现排重失败1、postman直接调用接口没有发现问题，每次获取的hash值是一样的2、apifox网页版，调用接口发现问题，清除缓存后（将选择的文件删除重新选择），就会出现相同文件hash值不同3、apifox本地安装版本和postman一样没有发现问题问题：1、尝试修改Content-Type，各种类型试了一下，包括流方式无效每次hash还是不同2
Word控件Spire.Doc 【段落处理】教程(十二)：如何在 C# 中管理 word 文档的分页
当我们要管理段落的分页时，我们可以直接插入分页符。但是后来我们可能会发现很难在分页符上方添加或删除文本，然后我们必须删除整个分页符。使用Microsoftword，我们还可以使用段落对话框来管理word段落的灵活分页，如下所示：Spire.Docfor.NET最新下载https://www.evget.com/product/3368/download我们已经向您展示了如何在word文档中插入分页
GNN多任务预测模型实现（二）：将EXCEL数据转换为图数据走的远一些神经网络知识分享知识备份人工智能深度学习
目录一.引言二.加载和检查数据三.提取特征和标签四.标准化特征五.构建节点索引六.构建边及其特征七.总结八.结语一.引言在图神经网络（GraphNeuralNetworks,GNNs）的多任务学习场景中，数据预处理是至关重要的一步。尤其是当我们的数据存储在表格格式（如Excel文件）中时，如何有效地将其转换为图数据格式，是搭建GNN模型的基础。二.加载和检查数据第一步是加载数据并检查其格式。我们通
linux常用基础命令_新脚大江山稳 linux 运维服务器
本文介绍了Linux系统中常用的命令和操作，涵盖了文件管理、系统监控、服务管理、软件安装等多个方面。主要内容包括：查看文件和目录大小（du、df）、路径操作（pwd）、文件删除（rm）、服务管理（systemctl）、端口查询（netstat）、软件版本管理（yum）、文件查找（find）、文件内容查看（cat、more）、管道符和过滤（grep）、重定向符（>、>>）、文件跟踪（tail）、以及
JS 使用节点实现简单购物车数量和金额凌冰_ JS
一、购物车中商品数量二、计算金额HTML页面:购物车序号商品名称数量单价小计1羊肉串5.005.002草莓奶茶9.009.003饼干20.1020.104葡萄8.058.05共计消费:￥42.15元JS脚本//add+varadds=document.getElementsByClassName("add");//循环for(vari=0;itoFixed(2)this.parentNode.ne
HDFS与HBase有什么关系？ lucky_syq hdfs hbase hadoop
1、HDFS文件存储系统和HBase分布式数据库HDFS是Hadoop分布式文件系统。HBase的数据通常存储在HDFS上。HDFS为HBase提供了高可靠性的底层存储支持。Hbase是Hadoopdatabase，即Hadoop数据库。它是一个适合于非结构化数据存储的数据库，HBase基于列的而不是基于行的模式。
大数据基础知识-Hadoop、HBase、Hive一篇搞定原来是猪猪呀 hadoop 大数据分布式
HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构，其核心设计包括分布式文件系统（HDFS）和MapReduce编程模型；Hadoop是一个开源的分布式计算框架，旨在帮助用户在不了解分布式底层细节的情况下，开发分布式程序。它通过利用集群的力量，提供高速运算和存储能力，特别适合处理超大数据集的应用程序。Hadoop生态圈Hadoop生态圈是一个由多个基于Hadoop开发的相
PHP基本语法（基础篇）
PHP脚本可以放在服务器上执行，然后将纯HTML结果发送回浏览器PHP是一门弱类型语句1、php标记PHP脚本可以放在文档的任何位置，以结束：php文件默认文件扩展名“.php”PHP文件通常包含HTML标签和一些PHP脚本代码,例如：myfirstphppage如果文件是纯PHP代码，最好在文件末尾删除PHP结束标记有两种在浏览器输出文本的指令：echo和print2、指令分隔符每个语句后用分号
Hadoop、HDFS、Hive、Hbase区别及联系静心观复大数据 hadoop hdfs hive
Hadoop、HDFS、Hive和HBase是大数据生态系统中的关键组件，它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。HadoopHadoop是一个开源的分布式计算框架，它允许用户在普通硬件上构建可靠、可伸缩的分布式系统。Hadoop通常指的是整个生态系统，包括HadoopCommon（共享库和工具）、HadoopDistributedFileSystem(
Redis 的常见问题及解决方案云起川南 Redis redis 数据库缓存
1、性能问题：当Redis负载过高时，可能会出现性能下降的情况。这可能是由于大量的并发访问、数据量过大或复杂的操作导致的。解决方案：优化数据结构的使用，避免使用过于复杂的操作。考虑使用分布式Redis架构行水平扩展，分担负载。还可以对Redis进行性能监控和调优，如调整内存参数、优化key的设计等。2、数据一致性问题：在分布式系统中，Redis可能面临数据一致性的挑战，例如在多个Redis节点之间
大数据(1)-hdfs&hbase viperrrrrrr 大数据 hdfs hbase
hbase&hdfs一、体系结构HDFS是一个标准的主从(Master/Slave)体系结构的分布式系统；HDFS集群包含一个或多个NameNode(NameNodeHA会有多个NameNode)和多个DataNode(根据节点情况规划),用户可以通过HDFS客户端同NameNode和DataNode进行交互以访问文件系统。HDFS公开文件系统名称空间，并允许将用户数据存储在文件中。在内部，一个文
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他