数据的小伙伴

Hadoop学习-HDFS

Hdoop之HDFS

什么是HDFS

背景及意义

背景

随着数据量的增加，一个操作系统存不下所有数据，就需要分配到更多的操作系统磁盘中，为了方便管理和维护，需要一种系统来管理多台机器上的文件，这就是分布式文件系统，HDFS只是分布式文件系统中的一种，其他的如：fastdfs 等
定义

HDFS 分布式文件系统，用来管理和存储文件的，由于是分布式的，是由多台服务器组成
特性

HDFS适合一次写入，多次读出的场景，不支持对文件的修改

优点

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bA1e7nz6-1656919344364)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/ce7812e8fb7b45c28b8664c00b49422e~tplv-k3u1fbpfcp-zoom-1.image)]

缺点

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kk6gyKIs-1656919344366)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/b0cfb1fc08214f35ab0c3b482867a83f~tplv-k3u1fbpfcp-zoom-1.image)]

组成架构

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3QAGmg50-1656919344368)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5303aa23722746c6bc10df54ad7ffa7c~tplv-k3u1fbpfcp-zoom-1.image)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jIDAQlO8-1656919344369)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/b8d66e9a691040e28515bb7dcd59f6b1~tplv-k3u1fbpfcp-zoom-1.image)]

HDFS文件块大小

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VqwNjwaA-1656919344371)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/96549458f5064ebebea65b7531308bb0~tplv-k3u1fbpfcp-zoom-1.image)]

块大小影响因素

块设置太小会增加寻址时间，导致程序一直在寻找块的位置
块设置太大，数据传输时间会明显大于定位块位置时间，导致处理这个块数据的程序非常慢

总结： HDFS块大小设置取决于磁盘传输速率

HDFS命令操作

基本语法

hadoop fs 具体命令   OR  /hdfs dfs 具体命令

命令大全

下面的命令和linux下命令基本一致，基本一看就能明白怎么使用，不过多解释

[tian@hadoop201 ~]$ hdfs dfs   个人习惯试用hdfs dfs   也可以试用 hadoop fs
Usage: hadoop fs [generic options]
        [-appendToFile  ... ]    #加一个文件到已经存在的文件末尾
        [-cat [-ignoreCrc]  ...]    	    #显示文件内容
        [-checksum  ...]                    # 
        [-chgrp [-R] GROUP PATH...]
        [-chmod [-R]  PATH...] # 设置权限
        [-chown [-R] [OWNER][:[GROUP]] PATH...] 			# 设置所有者权限
        [-copyFromLocal [-f] [-p] [-l]  ... ]  # 从本地复制到hdfs 
        [-copyToLocal [-p] [-ignoreCrc] [-crc]  ... ] # 从hdfs复制到本地
        [-count [-q] [-h]  ...]						# 
        [-cp [-f] [-p | -p[topax]]  ... ] 	#从HDFS的一个路径拷贝到HDFS的另一个路径
        [-createSnapshot  []] # 创建快照
        [-deleteSnapshot  ]	# 删除快照
        [-df [-h] [ ...]]			# 查看hdfs存储
        [-du [-s] [-h]  ...]		# 查看文件假大小
        [-expunge]
        [-find  ...  ...]		
        [-get [-p] [-ignoreCrc] [-crc]  ... ]  #等同于copyToLocal，就是从HDFS下载文件到本地
        [-getfacl [-R] ]
        [-getfattr [-R] {-n name | -d} [-e en] ]
        [-getmerge [-nl]  ]		#合并下载多个文件，比如HDFS的目录 /user/test下有多个文件:log.1, log.2,log.3,...
        [-help [cmd ...]]				# 帮助命令
        [-ls [-d] [-h] [-R] [ ...]] 	#查看文件夹下文件
        [-mkdir [-p]  ...]			# 创建文件夹
        [-moveFromLocal  ... ] 	# 从本地移动到hdfs
        [-moveToLocal  ]       	# 从hdfs移动到本地
        [-mv  ... ]					# 移动文件
        [-put [-f] [-p] [-l]  ... ] #等同于copyFromLocal
        [-renameSnapshot   ]  #重命名快照
        [-rm [-f] [-r|-R] [-skipTrash]  ...]		# 删除文件
        [-rmdir [--ignore-fail-on-non-empty]  ...]		#删除文件夹
        [-setfacl [-R] [{-b|-k} {-m|-x } ]|[--set  ]]
        [-setfattr {-n name [-v value] | -x name} ]
        [-setrep [-R] [-w]   ...]		#设置HDFS中文件的副本数量
        [-stat [format]  ...]
        [-tail [-f] ]		#显示一个文件的末尾
        [-test -[defsz] ]
        [-text [-ignoreCrc]  ...]
        [-touchz  ...]
        [-truncate [-w]   ...]		# 清空路径
        [-usage [cmd ...]]

Generic options supported are
-conf      specify an application configuration file
-D             use value for given property
-fs       specify a namenode
-jt     specify a ResourceManager
-files     specify comma separated files to be copied to the map reduce cluster
-libjars     specify comma separated jar files to include in the classpath.
-archives     specify comma separated archives to be unarchived on the compute machines.

The general command line syntax is
bin/hadoop command [genericOptions] [commandOptions]

HDFS API操作

上面介绍了如何使用命令操作hdfs，这部分是如何使用代码操作hdfs

环境搭建

解压hadoop-2.7.2 到一个非中文无空格的目录下（所有开发涉及到的软件或配置尽量使用非中文无空格）

我解压到D:\softWare\devSoft\hadoop-2.7.2

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D5WQsd67-1656919344374)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d4d59d3a79d04bf4babaf540646603c9~tplv-k3u1fbpfcp-zoom-1.image)]

配置Hadoop环境变量

2.1新建HADOOP_HOME，路径为安装的文件夹 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gJXJjiez-1656919344376)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/88e2b4820f4d4a268c0c5ae80889d556~tplv-k3u1fbpfcp-zoom-1.image)]

2.2 配置Path环境变量

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GVxGMF4Z-1656919344378)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/e7ab8046e8374784b7ebea474d94bd6f~tplv-k3u1fbpfcp-zoom-1.image)]
验证是否安装成功

打开CMD 执行hadoop version 能显示当前Hadoop版本即可

C:\Users\Tian>hadoop version
Hadoop 2.7.2
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r b165c4fe8a74265c792ce23f546c64604acf0e41
Compiled by jenkins on 2016-01-26T00:08Z
Compiled with protoc 2.5.0
From source with checksum d0fda26633fa762bff87ec759ebe689c
This command was run using /D:/softWare/devSoft/hadoop-2.7.2/share/hadoop/common/hadoop-common-2.7.2.jar

打开IDEA 使用maven创建hdfsClientDemo工程，并在MAVEN中导入相关依赖

<dependencies>
		<dependency>
			<groupId>junitgroupId>
			<artifactId>junitartifactId>
			<version>RELEASEversion>
		dependency>
		<dependency>
			<groupId>org.apache.logging.log4jgroupId>
			<artifactId>log4j-coreartifactId>
			<version>2.8.2version>
		dependency>
		<dependency>
			<groupId>org.apache.hadoopgroupId>
			<artifactId>hadoop-commonartifactId>
			<version>2.7.2version>
		dependency>
		<dependency>
			<groupId>org.apache.hadoopgroupId>
			<artifactId>hadoop-clientartifactId>
			<version>2.7.2version>
		dependency>
		<dependency>
			<groupId>org.apache.hadoopgroupId>
			<artifactId>hadoop-hdfsartifactId>
			<version>2.7.2version>
		dependency>
		<dependency>
			<groupId>jdk.toolsgroupId>
			<artifactId>jdk.toolsartifactId>
			<version>1.8version>
			<scope>systemscope>
			<systemPath>${JAVA_HOME}/lib/tools.jarsystemPath>
		dependency>
dependencies>

添加日志配置文件

在项目的src/main/resources目录下，新建一个文件，命名为“log4j.properties”，在文件中填入如下内容

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

创建包名和HdfsClient类

结构如下

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T7MjlbfO-1656919344380)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/62189a1af5f141cd8e7b2d27028e4b6f~tplv-k3u1fbpfcp-zoom-1.image)]

案例

HDFS文件上传

    @Test
    public void testMkdirs() throws IOException, InterruptedException, URISyntaxException {

        // 1 获取文件系统
        Configuration configuration = new Configuration();
        // 配置在集群上运行
        // configuration.set("fs.defaultFS", "hdfs://hadoop201:9000");
        // FileSystem fs = FileSystem.get(configuration);

        FileSystem fs = FileSystem.get(new URI("hdfs://hadoop201:9000"), configuration, "tian");

        // 2 创建目录
        fs.mkdirs(new Path("/test/tian/hdfsDemo"));

        // 3 关闭资源
        fs.close();
    }

可以通过HDFS命令行查看结果，也可以通过WEB端查看结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BOiLFFuB-1656919344381)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/80e9ac5fe7f4406bbc920389b3023d8c~tplv-k3u1fbpfcp-zoom-1.image)]

HDFS文件下载

/**
     * HDFS文件下载
     */
    @Test
    public void testCopyToLocalFile() throws IOException, InterruptedException, URISyntaxException{

        // 1 获取文件系统
        Configuration configuration = new Configuration();
        FileSystem fs = FileSystem.get(new URI("hdfs://hadoop201:9000"), configuration, "tian");

        // 2 执行下载操作
        // boolean delSrc 指是否将原文件删除
        // Path src 指要下载的文件路径
        // Path dst 指将文件下载到的路径
        // boolean useRawLocalFileSystem 是否开启文件校验
        fs.copyToLocalFile(false, new Path("/word.txt"), new Path("d:/word.txt"), true);

        // 3 关闭资源
        fs.close();
    }

HDFS文件夹删除

@Test
public void testDelete() throws IOException, InterruptedException, URISyntaxException{

	// 1 获取文件系统
	Configuration configuration = new Configuration();
	FileSystem fs = FileSystem.get(new URI("hdfs://hadoop201:9000"), configuration, "tian");
		
	// 2 执行删除
	fs.delete(new Path("/test/tian/hdfsDemo"), true);
		
	// 3 关闭资源
	fs.close();
}

HDFS文件名修改

@Test
public void testRename() throws IOException, InterruptedException, URISyntaxException{

	// 1 获取文件系统
	Configuration configuration = new Configuration();
	FileSystem fs = FileSystem.get(new URI("hdfs://hadoop201:9000"), configuration, "tian"); 
		
	// 2 修改文件名称
	fs.rename(new Path("/word.txt"), new Path("/word1.txt"));
		
	// 3 关闭资源
	fs.close();
}

HSFS文件详情查看

查看文件名称、权限、长度、块信息

@Test
public void testListFiles() throws IOException, InterruptedException, URISyntaxException{

	// 1获取文件系统
	Configuration configuration = new Configuration();
	FileSystem fs = FileSystem.get(new URI("hdfs://hadoop201:9000"), configuration, "tian"); 
		
	// 2 获取文件详情
	RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);
		
	while(listFiles.hasNext()){
		LocatedFileStatus status = listFiles.next();
			
		// 输出详情
		// 文件名称
		System.out.println(status.getPath().getName());
		// 长度
		System.out.println(status.getLen());
		// 权限
		System.out.println(status.getPermission());
		// 分组
		System.out.println(status.getGroup());
			
		// 获取存储的块信息
		BlockLocation[] blockLocations = status.getBlockLocations();
			
		for (BlockLocation blockLocation : blockLocations) {
				
			// 获取块存储的主机节点
			String[] hosts = blockLocation.getHosts();
				
			for (String host : hosts) {
				System.out.println(host);
			}
		}
			
		System.out.println("-----------分割线----------");
	}

// 3 关闭资源
fs.close();
}

HDFS文件和文件夹判断

@Test
public void testListStatus() throws IOException, InterruptedException, URISyntaxException{
		
	// 1 获取文件配置信息
	Configuration configuration = new Configuration();
	FileSystem fs = FileSystem.get(new URI("hdfs://hadoop201:9000"), configuration, "tian");
		
	// 2 判断是文件还是文件夹
	FileStatus[] listStatus = fs.listStatus(new Path("/"));
		
	for (FileStatus fileStatus : listStatus) {
		
		// 如果是文件
		if (fileStatus.isFile()) {
				System.out.println("f:"+fileStatus.getPath().getName());
			}else {
				System.out.println("d:"+fileStatus.getPath().getName());
			}
		}
		
	// 3 关闭资源
	fs.close();
}

HDFS流程

HDFS写数据流程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7gVCuGhJ-1656919344383)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/bf23587a573f48978e6541731fb77171~tplv-k3u1fbpfcp-zoom-1.image)]

1）客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。

2）NameNode返回是否可以上传。

3）客户端请求第一个 Block上传到哪几个DataNode服务器上。

4）NameNode返回3个DataNode节点，分别为dn1、dn2、dn3。

5）客户端通过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，然后dn2调用dn3，将这个通信管道建立完成。

6）dn1、dn2、dn3逐级应答客户端。

7）客户端开始往dn1上传第一个Block（先从磁盘读取数据放到一个本地内存缓存），以Packet为单位，dn1收到一个Packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个应答队列等待应答。

8）当一个Block传输完成之后，客户端再次请求NameNode上传第二个Block的服务器。（重复执行3-7步）。

HDFS读数据流程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kfpJdJZO-1656919344385)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/0a215d8cd73940b8a3f1e90ee9c74659~tplv-k3u1fbpfcp-zoom-1.image)]

1）客户端通过Distributed FileSystem向NameNode请求下载文件，NameNode通过查询元数据，找到文件块所在的DataNode地址。

2）挑选一台DataNode（就近原则，然后随机）服务器，请求读取数据。

3）DataNode开始传输数据给客户端（从磁盘里面读取数据输入流，以Packet为单位来做校验）。

4）客户端以Packet为单位接收，先在本地缓存，然后写入目标文件。

机架感知

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mWDZt4wp-1656919344386)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2d66466cdb0449dcb696b143fb65ae2b~tplv-k3u1fbpfcp-zoom-1.image)]

NN和2NN

NameNode中的元数据是存储在哪里的？

新的框架或组件的诞生必然是解决某些问题的

如果存储在磁盘中，因为经常需要随机访问，因此效率很低，如果放在内存中，效率高了，一旦断电，元数据丢失，集群就无法工作了，因此产生在磁盘中备份元数据的FsImage。

新的问题来了，当在内存中更新元数据时，如果同步更新FSImage，那么效率也是很低的，如果不更新，会造成数据不一致，一旦断电，也会丢失数据，==因此，引入Edits文件(只进行追加操作，效率很高)。每当元数据有更新或者添加元数据时，修改内存中的元数据并追加到Edits中。==这样，一旦NameNode节点断电，可以通过FsImage和Edits的合并，合成元数据。

但是，如果长时间添加数据到Edits中，会导致该文件数据过大，效率降低，而且一旦断电，恢复元数据需要的时间过长。因此，需要定期进行FsImage和Edits的合并，如果这个操作由NameNode节点完成，又会效率过低。因此，引入一个新的节点SecondaryNamenode，专门用于FsImage和Edits的合并。

NN和2NN工作机制

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5f6sPWkT-1656919344387)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/322f6943e9604dc6a84fd23a6dd7df24~tplv-k3u1fbpfcp-zoom-1.image)]

第一阶段：NameNode启动

（1）第一次启动NameNode格式化后，创建Fsimage和Edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。

（2）客户端对元数据进行增删改的请求。

（3）NameNode记录操作日志，更新滚动日志。

（4）NameNode在内存中对数据进行增删改。
第二阶段：Secondary NameNode工作

（1）Secondary NameNode询问NameNode是否需要CheckPoint。直接带回NameNode是否检查结果。

（2）Secondary NameNode请求执行CheckPoint。

（3）NameNode滚动正在写的Edits日志。

（4）将滚动前的编辑日志和镜像文件拷贝到Secondary NameNode。

（5）Secondary NameNode加载编辑日志和镜像文件到内存，并合并。

（6）生成新的镜像文件fsimage.chkpoint。

（7）拷贝fsimage.chkpoint到NameNode。

（8）NameNode将fsimage.chkpoint重新命名成fsimage。

NN和2NN工作机制详解：

Fsimage：NameNode内存中元数据序列化后形成的文件。

Edits：记录客户端更新元数据信息的每一步操作（可通过Edits运算出元数据）。

NameNode启动时，先滚动Edits并生成一个空的edits.inprogress，然后加载Edits和Fsimage到内存中，此时NameNode内存就持有最新的元数据信息。Client开始对NameNode发送元数据的增删改的请求，这些请求的操作首先会被记录到edits.inprogress中（查询元数据的操作不会被记录在Edits中，因为查询操作不会更改元数据信息），如果此时NameNode挂掉，重启后会从Edits中读取元数据的信息。然后，NameNode会在内存中执行元数据的增删改的操作。

由于Edits中记录的操作会越来越多，Edits文件会越来越大，导致NameNode在启动加载Edits时会很慢，所以需要对Edits和Fsimage进行合并（所谓合并，就是将Edits和Fsimage加载到内存中，照着Edits中的操作一步步执行，最终形成新的Fsimage）。SecondaryNameNode的作用就是帮助NameNode进行Edits和Fsimage的合并工作。

SecondaryNameNode首先会询问NameNode是否需要CheckPoint（触发CheckPoint需要满足两个条件中的任意一个，定时时间到和Edits中数据写满了）。直接带回NameNode是否检查结果。SecondaryNameNode执行CheckPoint操作，首先会让NameNode滚动Edits并生成一个空的edits.inprogress，滚动Edits的目的是给Edits打个标记，以后所有新的操作都写入edits.inprogress，其他未合并的Edits和Fsimage会拷贝到SecondaryNameNode的本地，然后将拷贝的Edits和Fsimage加载到内存中进行合并，生成fsimage.chkpoint，然后将fsimage.chkpoint拷贝给NameNode，重命名为Fsimage后替换掉原来的Fsimage。NameNode在启动时就只需要加载之前未合并的Edits和Fsimage即可，因为合并过的Edits中的元数据信息已经被记录在Fsimage中。

Fsimage和Edits解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ibwNxhnP-1656919344389)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5e49a8998a18489f8fec17a09e3195a4~tplv-k3u1fbpfcp-zoom-1.image)]

可以看出，Fsimage中没有记录块所对应DataNode，为什么？

在集群启动后，要求DataNode上报数据块信息，并间隔一段时间后再次上报。

CheckPoint时间设置

SecondaryNameNode 默认每一个小时执行一次

[hdfs-default.xml]

<property>
  <name>dfs.namenode.checkpoint.periodname>
  <value>3600value>
property>

设置为一分钟检查一次操作次数，当操作次数达到一百万时，执行一次

<property>
  <name>dfs.namenode.checkpoint.txnsname>
  <value>1000000value>
<description>操作动作次数description>
property>

<property>
  <name>dfs.namenode.checkpoint.check.periodname>
  <value>60value>
<description> 1分钟检查一次操作次数description>
property >

NameNode故障处理

NameNode故障后，可以采用如下两种方法恢复数据。

方法一：将SecondaryNameNode中数据拷贝到NameNode存储数据的目录；

kill -9 NameNode进程
删除NameNode存储的数据（/opt/module/hadoop-2.7.2/data/tmp/dfs/name）

rm -rf /opt/module/hadoop-2.7.2/data/tmp/dfs/name/*

拷贝SecondaryNameNode中数据到原NameNode存储数据目录

scp -r tian@hadoop203:/opt/module/hadoop-2.7.2/data/tmp/dfs/namesecondary/* ./name/

重新启动NameNode

sbin/hadoop-daemon.sh start namenode

方法二：使用-importCheckpoint选项启动NameNode守护进程，从而将SecondaryNameNode中数据拷贝到NameNode目录中。

修改hdfs-site.xml中的

<property>
  <name>dfs.namenode.checkpoint.periodname>
  <value>120value>
property>

<property>
  <name>dfs.namenode.name.dirname>
  <value>/opt/module/hadoop-2.7.2/data/tmp/dfs/namevalue>
property>

kill -9 NameNode进程
删除NameNode存储的数据（/opt/module/hadoop-2.7.2/data/tmp/dfs/name）

rm -rf /opt/module/hadoop-2.7.2/data/tmp/dfs/name/*

如果SecondaryNameNode不和NameNode在一个主机节点上，需要将SecondaryNameNode存储数据的目录拷贝到NameNode存储数据的平级目录，并删除in_use.lock文件

[tian@hadoop201 dfs]$ scp -r tian@hadoop201:/opt/module/hadoop-2.7.2/data/tmp/dfs/namesecondary ./

[tian@hadoop201 namesecondary]$ rm -rf in_use.lock

[tian@hadoop201 dfs]$ pwd
/opt/module/hadoop-2.7.2/data/tmp/dfs

[tian@hadoop201 dfs]$ ls
data  name  namesecondary

导入检查点数据（等待一会ctrl+c结束掉）

bin/hdfs namenode -importCheckpoint

启动NameNode

sbin/hadoop-daemon.sh start namenode

集群安全模式

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JHqvD9ng-1656919344390)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/06c60817967c4f29aed534fee53d7e78~tplv-k3u1fbpfcp-zoom-1.image)]

基本语法

集群处于安全模式，不能执行重要操作（写操作）。集群启动完成后，自动退出安全模式。

（1）bin/hdfs dfsadmin -safemode get （功能描述：查看安全模式状态）

（2）bin/hdfs dfsadmin -safemode enter （功能描述：进入安全模式状态）

（3）bin/hdfs dfsadmin -safemode leave （功能描述：离开安全模式状态）

（4）bin/hdfs dfsadmin -safemode wait （功能描述：等待安全模式状态）

NameNode多目录设置

NameNode的本地目录可以配置成多个，且每个目录存放内容相同，增加了可靠性

在hdfs-site.xml文件中增加如下内容

<property>
    <name>dfs.namenode.name.dirname>
<value>file:///${hadoop.tmp.dir}/dfs/name1,file:///${hadoop.tmp.dir}/dfs/name2value>
property>

停止集群，删除data和logs中所有数据。

[tian@hadoop201 hadoop-2.7.2]$ rm -rf data/ logs/
[tian@hadoop202 hadoop-2.7.2]$ rm -rf data/ logs/
[tian@hadoop203 hadoop-2.7.2]$ rm -rf data/ logs/

格式化集群并启动。

[tian@hadoop201 hadoop-2.7.2]$ bin/hdfs namenode –format
[tian@hadoop201 hadoop-2.7.2]$ sbin/start-dfs.sh

查看结果

[tian@hadoop201 dfs]$ ll
总用量 12
drwx------. 3 tian tian 4096 12月 11 08:03 data
drwxrwxr-x. 3 tian tian 4096 12月 11 08:03 name1
drwxrwxr-x. 3 tian tian 4096 12月 11 08:03 name2

DataNode

工作机制

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RkOTexkv-1656919344392)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/bf0143502aa64c1894ed8ee3d9669db6~tplv-k3u1fbpfcp-zoom-1.image)]

1）一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。

2）DataNode启动后向NameNode注册，通过后，周期性（1小时）的向NameNode上报所有的块信息。

3）心跳是每3秒一次，心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机器，或删除某个数据块。如果超过10分钟没有收到某个DataNode的心跳，则认为该节点不可用。

4）集群运行中可以安全加入和退出一些机器。

数据完整性

思考：如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号（1）和绿灯信号（0），但是存储该数据的磁盘坏了，一直显示是绿灯，是否很危险？同理DataNode节点上的数据损坏了，却没有发现，是否也很危险，那么如何解决呢？

如下是DataNode节点保证数据完整性的方法。

1）当DataNode读取Block的时候，它会计算CheckSum。

2）如果计算后的CheckSum，与Block创建时值不一样，说明Block已经损坏。

3）Client读取其他DataNode上的Block。

4）DataNode在其文件创建后周期验证CheckSum

掉线时限参数设置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EBRKpTUw-1656919344393)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2168e12700bd4107916362bca115c7e0~tplv-k3u1fbpfcp-zoom-1.image)]

需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒，dfs.heartbeat.interval的单位为秒。

<property>
    <name>dfs.namenode.heartbeat.recheck-intervalname>
    <value>300000value>
property>

<property>
    <name>dfs.heartbeat.intervalname>
    <value>3value>
property>

服役新节点

背景是公司业务增长，数据量越来越大，原来的节点容量不够了，需要在原有集群基础上动态增加新的数据节点

准备新服务器，取名为Hadoop204
配置Hadoop204和其他DataNode节点一致

注意要无密登录,hosts文件和hostname，关闭防火墙
如果要被群起命令管理需要配置slave，增加新的节点hostname
删除原来HDFS文件系统留存的文件（/opt/module/hadoop-2.7.2/data和log）
source一下配置文件
```
source /etc/profile
```
直接在新机器上单机启动DataNode

hadoop-daemon.sh start datanode
yarn-daemon.sh start nodemanager

如果数据不均衡，可以用命令实现集群的再平衡

./start-balancer.sh

退役旧节点

黑名单退役

在黑名单上面的主机都会被强制退出。

在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件
```
hadoop204 # 添加要退役的节点名称
```

在NameNode的hdfs-site.xml配置文件中增加dfs.hosts.exclude属性

<property>
<name>dfs.hosts.excludename>
      <value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.excludevalue>
property>

刷新NameNode、刷新ResourceManager

hdfs dfsadmin -refreshNodes # 刷新namenode节点
yarn rmadmin -refreshNodes	# 刷新ResourceManager

检查Web浏览器，退役节点的状态为decommission in progress（退役中），说明数据节点正在复制块到其他节点
等待退役节点状态为decommissioned（所有块已经复制完成），停止该节点及节点资源管理器。注意：如果副本数是3，服役的节点小于等于3，是不能退役成功的，需要修改副本数后才能退役

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TDYz7Fqx-1656919344395)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/29bdcc60e8da414ea6beb5cfa173e37c~tplv-k3u1fbpfcp-zoom-1.image)]
如果数据不均衡，可以用命令实现集群的再平衡
```
start-balancer.sh 
```

注意：不允许白名单和黑名单中同时出现同一个主机名称。

白名单退役

退役如下节点

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KYXbaeu6-1656919344396)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/45443185f3b74cb69c9168ef26a739d7~tplv-k3u1fbpfcp-zoom-1.image)]

在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件
添加如下主机名称（不添加hadoop204）
```
hadoop201
hadoop202
hadoop203
```

在NameNode的hdfs-site.xml配置文件中增加dfs.hosts属性

<property>
<name>dfs.hostsname>
<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hostsvalue>
property>

配置文件分发
```
xsync hdfs-site.xml
```

刷新NameNode 更新ResourceManager节点

hdfs dfsadmin -refreshNodes # 刷新namenode节点
yarn rmadmin -refreshNodes	# 刷新ResourceManager

在web浏览器上查看,直接退役掉

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TAF835jG-1656919344397)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/df3038df9b254cb4953182d0aa6f349e~tplv-k3u1fbpfcp-zoom-1.image)]

Datanode多目录配置

DataNode也可以配置成多个目录，每个目录存储的数据不一样。即：数据不是副本

修改hdfs-site.xml

<property>
        <name>dfs.datanode.data.dirname>
<value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2value>
property>

分发配置文件
```
xsync hdfs-site.xml
```

刷新

hdfs dfsadmin -refreshNodes # 刷新namenode节点
yarn rmadmin -refreshNodes	# 刷新ResourceManager

查看目录

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NZ6kEO7V-1656919344398)(//p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/24da4d21b93b4763917254e652b8fe7e~tplv-k3u1fbpfcp-zoom-1.image)]

你可能感兴趣的:(Hadoop,hadoop,hdfs,学习)

Linux下SPI驱动：SPI设备驱动简介
一.简介Linux下的SPI驱动框架和I2C很类似，都分为主机控制器驱动和设备驱动，主机控制器也就是SOC的SPI控制器接口，SPI设备驱动也就是所操作的SPI设备的驱动。本文来学习一下Linux下SPI设备驱动。二.Linux下SPI驱动：SPI设备驱动简介1.spi_driver结构体spi设备驱动也和i2c设备驱动也很类似，Linux内核使用spi_driver结构体来表示spi设备驱动，我
“养娃如种树•家长成长营”～能量分享卡片26#0617～坚持Day26 馨元_亲子教育_生活本真
父母好好学习孩子天天向上父母要学会懂孩子俗话说，知己知彼，百战不殆！要想给孩子最好的教育，首先就要了解孩子；然后，才能对症下药，药到而病除。孩子的内心是脆弱的，所以他们渴望被爱，渴望来自家庭的温暖，一旦实现不了就会叛逆，甚至在犯错的道路上越走越远，越陷越深。因此，明智的父母通常都能让孩子感受到自己的爱。父母的信任是对孩子的最好鼓励，孩子很希望得到父母的信任，像朋友一样平等交流。如果父母不能理解这一
彻底解决＂‘vue-cli-service‘ 不是内部或外部命令＂的问题！晷龙烬龙鳞拆解（前端深渊）vue.js 前端 npm
以龙息淬炼代码，在时光灰烬中重铸技术星河欢迎来到晷龙烬的博客✨！这里记录技术学习点滴，分享实用技巧，偶尔聊聊奇思妙想～原创内容✍️，转载请注明出处～感谢支持❤️！请尊重原创！欢迎在评论区交流！引言我最近拉取了一个Vue2的老项目，各种尝试，最终卡在了“vue-cli-service不是内部或外部命令”的这个错误提示上，令人倍感挫败。本文聚焦这一常见难题，提供我解决的思路，以供参考。一、问题分析该错
日常修炼夏摩山谷深处
修炼一：【工作篇】1.关于和领导交流在分配任务时，要马上搞明白你的任务是啥，不要因不好意思假装听懂了，再去猜领导的意思，万一猜错了，时间浪费了，工作也白做了，还会留下不好的印象。向领导征求意见时，提前准备好你的备选方案，多让领导去做选择题而不是问答题。2.关于工作学习建议主动学习，主动去接受任务，能学多少学多少。把握两个原则“令行禁止”和“法无禁止即可为“。前者的意思是当你被安排了多个任务时，直系
情感主播培训有哪些项目，说说我的经历糖葫芦不甜
作为一名从情感主播培训中走出来的“新人”，我想分享一些我所经历的培训项目以及这段经历如何塑造了我。5星公会，免费加入，一对一指导扶持↓微信在文章底部。培训的第一步，是从理论根基开始。我们系统地学习了情感解析的技巧，包括如何识别不同情绪背后的深层需求、理解人际关系的动态变化等。作为主播，声音是我们最直接的“武器”。培训中，我们接受了专业的声音训练，包括发音技巧、语调控制、情感融入等，旨在通过声音传递
《朗读手册》|持续默读：朗读的最佳拍档吉林付巍巍
暑假阅读计划教育有一条通则是：“人在暑假会变笨”。研究发现，所有人——不论是优等生还是学习差的学生——在暑假的学习速度都较慢。有些人甚至更早居然发生退步。许多原因导致了暑假退步现象。要避免这种事情的发生，就给孩子们朗读并让他们自己阅读。SSR在家中进行也有效在家里家长的角色非常重要。你可以拟定一个适合你们全家的BBS计划。对于不习惯长时间阅读的孩子，一开始可以把时间规定在10分钟或者是15分钟，等
投射与感赏 0324_cb8d
投射儿子今天上课专心，能跟上老师的节奏。投射儿子这次期中考试能达到他的目标。投射儿子对老师和家人有感恩的心，开启学习动力，向目标努力。投射老师看见孩子的进步，给他鼓励，让孩子找到信心找到正能量。投射女儿今天阳光自信，今天测验全对。投射女儿的字写得越来越好。投射今天我有稳稳的情绪，爱自己多一点，让孩子感受到妈妈的爱。感赏儿子周六去跟同学看电影后安时回家，后面的补课很专心，得到老师的表扬。感赏儿子周天
莹莹的感恩日记第211天季如言
❤2022年9月7日星期三❤莹莹感恩日记第211天1.感恩宇宙万物恩赐予我的一切，让我非常幸福的迎接崭新的一天，让我身心健康，精力充沛，思维敏捷，可高效的进行工作，学习和生活，谢谢，谢谢，谢谢。2.感恩我的国家繁荣富强，和平昌盛，让我所在的国家社会稳定，蓬勃发展，欣欣向荣，让我能生活在和平时代，谢谢，谢谢，谢谢。3.感恩今天的我能量满满，我又非常哇塞的输出第211天感恩日记，我太棒了，感恩坚持的自
python 抓取小红书小五咔咔咔 python 开发语言
python相关学习资料：https://edu.51cto.com/video/3832.htmlhttps://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlPython抓取小红书数据的科普文章小红书是一个流行的社交电商平台，用户可以分享购物心得、生活点滴等。本文将介绍如何使用Python语言抓取小红书的数据
7月18日本周复盘总结风雨过后见彩虹llc
一、本周完成的打卡任务1.早起打卡7天2.阅读打卡6天3.日更写作打卡7篇4.跑步打卡4次5.朗诵课1次二、本周总结跑步，坚持打卡4次，共跑25公里，本周有很大的进步，成功挑战10公里，用时1小时4分，平均配速6’27”，并且正常工作学习，为自己点赞；早起，坚持得还不错，几乎每天都是5点45起床，继继保持；阅读，本周阅读《掌控习惯》，每天阅读1小时，按计划完成任务，还写了读后感，非常开心；日更写作
2023-04-27 花开生两面
投射我儿读书明理，修身做人，每天阳光快乐，情绪平和稳定，越来越会调节自己的情绪和压力。投射我儿对家人、他人、社会都常怀一颗感恩之心，是一个暖心的男子汉。投射我儿对自己未来人生规划清晰，建立学习中短期目标，并为此不断努力。投射我儿生活、学习自律，扎实打好各学科基础，高质量完成各科作业，门门成绩F，大二期末成绩能进入本专业年级前15名，拿到保研资格。投射我儿愿意住在学校和同学们一起学习、生活，并交到一
二下最后一月如何进行复习啸夜雨
现在是六月初，距离咱们期末考试已经不到一个月的时间了。此次微信家长周会，是为了帮助各位家长督促各位学生的学习状况。语文复习方面：语文方面，已经全部学习完毕并且进行了第一轮的复习。这里需要强调的是，三个背诵项目本来就是家庭作业，但是很多我班三十多位学生的家长没有第一时间跟上背诵的进度导致我班只好利用上课的时间来进行检查背诵，严重拖延了我班上课的进度！我班第一批《千字文》《朱子治家格言》背诵只有十一名
Spring Cloud Gateway过滤器精确控制异常返回(实战，控制http返回码和message字段) 程序员欣宸
欢迎访问我的GitHub这里分类和汇总了欣宸的全部原创(含配套源码)：https://github.com/zq2599/blog_demos本篇概览前文《SpringCloudGateway过滤器精确控制异常返回(分析篇)》咱们阅读源码，了解到SpringCloudGateway是如何处理全局异常信息的，学了那么多理论，不免手痒想实战验证学习效果，今天咱们就来写代码，最终目标是改写下图两个红框中
高标准开展干部教育培训为建设高素质干部队伍铸魂赋能 3f8a10c62f8c
近日，全国组织部长会议以电视电话会议形式在京召开，中共中央政治局委员、中组部部长陈希强调，着眼建设堪当民族复兴重任的高素质干部队伍，不断优化干部选育管用工作，坚持德配其位、才配其位选准用好干部。大力发现培养干部，是新时代赋予组织部门的职责和使命，组织部门应紧紧围绕新时代干部管理要求，对干部要“学习与实践”结合，助力干部快速成长，进一步激发干部担当作为，干事创业、创先争优。多举措并举，抓好新时代干部
2023-03-20 王歌
上周在103班上了一节家长开放课《做个百数表》。课堂上，我设置了三个教学环节：1.让学生自主完成百数表里面空缺的数字宝宝。2.小组合作寻找百数表中发现的规律。3.通过习题练习巩固百数表中发现的规律。本节课，我始终只作为课堂的引导者，真正的主体是学生。这种自主创作的模式，学生真正得到了学习机会，同时也培养了学生的小组合作精神。
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
S早起晨读练习day11 贺笙
#day11#/ʌ/、/æ/第十一天的学习内容关于study的发音今天有学到，昨天确实是习惯造成的错误，有/r/音的是另一个单词sturdy：a、形容词，坚定地；强壮的，健全的；坚固的，耐用的；精力充沛的；b、名词，（羊的）晕倒病；第二个是关于published的尾音是/t/而不是/d/；第三是magazine的重音，以前没有读重音的意识，以后要多加注意；第四，S今天早上关于昨天大家联系问题的纠正
孩子学习写作的好方法-写日记憧憬着的人儿
这是我之前在亲子群中的一次学姐分享，分享孩子写日记的经历以及如何引导的经历。从一开始，我对写日记有自己的定义，简单来说，就是每日天气每日发生每日感受。它可以平淡如水一字带过，可波澜壮阔长篇大论。他是输出，我们的大脑天生懒惰，不喜欢这活。所以开始，我们得让他足够简单可行。大脑先接受再强化再内化成生活的一部分！它的长期效果我就不讲了，大家都特别清晰。打磨一个人的思维，文字的力量是巨大的。最后我再讲讲它
交错并联Buck+LLC变换器的建模与控制优化研究
交错并联Buck+LLC变换器的建模与控制优化研究前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。摘要本文针对宽输入电压范围(200-450V)、多电压输出(12-48V)的高效DC-DC变换系统，提出了一种基于交错并联Buck预调节器和LLC谐振变换器的两级式拓扑结构。中间母线电压设定为200V，系统输出功率为1500W，要求电压和
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
焦点团队网络初级第30期张瑞宾持续分享第139天2022.1.06（周四）张瑞宾
约练挑战（总第6次）次约练，咨询师第3次，来访者1次，观察员2次学习焦点以来，感觉自己越来越稳，和患者沟通方式上已经有了很大的区别，现在很多的是在关注正向和解决，而没有把自己一生的角度放得很高，让他自己当自己的主人，双专家模式。虽说现在自己还不是一个合格的咨询师，但是感觉已经有了很多成长，也有了一些变化。今天做了一次来访者给自己的感觉是现在比以前能打开很多了，放松，安全的氛围，关注人是第1位，即便
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
2023-4-12晨间日记胡诌文学
今天是什么日子起床：就寝：天气：心情：纪念日：任务清单昨日完成的任务，最重要的三件事：改进：习惯养成：周目标·完成进度学习·信息·阅读健康·饮食·锻炼人际·家人·朋友工作·思考最美好的三件事1.2.3.思考·创意·未来
早起禹宇
早起第一天，六点闹钟响了，拿起手机进行学习强国学习，50分到手，第二项日更，第三项日精进，第四项复习《弟子规》，第五项《道德经》30～37章诵读，第六项回忆昨晚学的法律，第七项，今天讲法律听到20个视频，第八项和儿子玩，第九项去朋友家做客帮忙，第十项能练琴练琴不能练记谱，第十一项晚课。
Android架构模式推荐及分析和MVC架构模式制作一个简单的底部tab切换
目录主流架构模式对比适用场景MVP‌：团队协作开发,需要高可测试性的项目MVC架构模式制作一个简单的底部tab切换（Model-View-Controller）结构代码效果主流架构模式对比‌对比维度‌‌MVC‌‌MVP‌‌MVVM‌‌MVI‌‌学习曲线‌最低（基础分层清晰）中等（需接口抽象）较高（依赖数据绑定框架）最高（状态流管理复杂）‌代码复杂度‌低（但易导致Controller臃肿）中等（分层
每日复盘Day53 米果果教育张滢
10月7号复盘图片发自App米果果教育张滢【每日目标】每天三目标1.早起、早餐✅2.英语学习作业打卡✅3.赢效率手册和总结笔记✅【每日早起】6:30(今天6点醒来，起床后晨跑，好久没晨跑感觉好棒)【每日学习】萌姐英语课《第40课》；樊登读书会《运动改造大脑》【每日关爱】晨跑、一组减脂训练、胶原肽果饮、水光疗套装图片发自App图片发自App【每日成就】早上比计划早起，老妈在也不担心早饭，花30分钟晨
跃迁日精进210 知足常乐孙
敬爱的李老师，智慧的教授，亲爱的跃友们：大家好！我是来自广饶人民商场的孙建红，今天是我的日精进行动第210天，给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1、比学习：你无权决定自己出生的高度，但有权决定身边站的人和自己所处的环境，余生不长，和不一样的人在一起就会有不一样的人生和优秀的人同行，能帮助你遇见更好的自己，爱情婚姻也是如此，家庭事业如此，人生道路也是如此
格莱诺日记|2021-05-17 格莱在创作
微信图片_20210517233343.png清晨树下by格莱诺颜色对于照片来说就像是人靠衣装马靠鞍，影响实在太大。所以专心致志学习色彩的运用，当务之急。上午去打新冠疫苗，许多人按集团一起排队注射，很长的队伍，想起国外的现状，这个时候我们朴素的爱国主义就会由内而外散发出来了呢。持续跟进罗翔说刑法，嗯，其实他的视频岂止是说刑法啊，上千万人的粉丝可不是因为大家爱上刑法课，而多数人被他的个人魅力所吸引，
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分