象在舞

五、Hadoop核心组件之HDFS

上篇博客介绍了Hadoop的本地模式和伪分布式，本篇主要介绍Hadoop的核心组件HDFS，关注专栏《from zero to hero（Hadoop篇）》查看相关系列的文章~

一、HDFS的产生背景

二、HDFS的定义

三、HDFS的优缺点

3.1 HDFS的优点

3.2 HDFS的缺点

四、HDFS的架构

4.1 HDFS架构图

4.2 数据默认存储方式

4.3 NameNode的启动流程

4.4 元数据的合并流程

4.5 HDFS的读写流程

4.5.1 写流程

4.5.2 读流程

五、HDFS的Shell命令

5.1 简述

5.2 示例

六、HDFS的API操作

一、HDFS的产生背景

随着数据量越来越大，一个操作系统存不下所有的数据，那么就需要分配到更多的操作系统中，但是这样不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统，而HDFS正式分布式文件管理系统中的一种。

二、HDFS的定义

HDFS（Hadoop Distributed File System）是运行在普通硬件之上具备高吞吐量支持大数据集的分布式文件系统。它适合一次写入多次读出的场景且不支持文件的修改。

三、HDFS的优缺点

3.1 HDFS的优点

（1）处理超大文件，通常是指数百MB、数百TB大小的文件。

（2）流式的访问数据，一次写入，多次读取，一个数据集一旦由数据源生成就会被复制分发到不同的存储节点中，然后响应各种各样的数据分析任务的请求。在多数情况下，分析任务都会涉及数据集中的大部分数据，所以对于HDFS来说请求读取整个数据集要比读取某条记录更高效。

（3）运行于廉价的商用机器集群，对硬件要求低，这也就要求设计HDFS时要充分考虑数据的可靠性、安全性以及高可用性。

3.2 HDFS的缺点

（1）不适合低延迟数据访问，HDFS是为高数据吞吐量而设计的，这就要求以高延迟为代价。

（2）无法高效存储大量小文件，因为NameNode把文件系统的原数据放在内存中，所以文件系统所能容纳的文件数目是由NameNode的内存大小来决定的。

（3）不支持多用户写入及任意修改文件，HDFS中的一个文件只有一个写入者，而且写操作只能在文件末尾完成，也就是追加写入。

四、HDFS的架构

4.1 HDFS架构图

（1）NameNode：接收用户操作请求，维护文件系统的目录结构，管理文件与block之间的关系，block与DataNode之间的关系。一个集群只有一个处于active，用来存储文件和元数据信息，它将元数据信息保存在内存中，同时会在硬盘上保留一份。如：文件名、文件目录结构、文件属性（生成时间、副本数、文件权限等），以及每个文件的块列表和块所在的DataNode等。

（2）DataNode：在本地文件系统存储文件块数据，以及块数据的校验和。在HDFS上保存的数据副本数默认是3个，副本数可以设置。

（3）Secondary NameNode：用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS的元数据的快照。

4.2 数据默认存储方式

数据在第一个DataNode节点写成功后，会自己保留一个副本，然后向同一机架的不同节点拷贝一份，最后向另外机架的不同节点再拷贝一份，保证副本数。保存在同一机架不同节点，是为了保证传输速度，同一机架的不同节点之间网络链路相对最短。保存在不同机架的不同节点的原因在于考虑到不同机架出现故障的几率比较小，可以保证数据安全。

4.3 NameNode的启动流程

（1）NameNode启动时首先将fsimage载入内存并执行编辑日志editlog的各项操作。

（2）一旦在内存中建立文件系统元数据映射，则创建一个新的fsimage文件和一个空的editlog。

（3）在安全模式下，DataNode会向NameNode发送块列表的最新情况。

（4）此刻NameNode运行在安全模式，即NameNode的文件系统对于客户端来说是只读的。

（5）NameNode开始监听RPC和HTTP的请求。

（6）系统中数据块的位置并不是由NameNode维护的，而是以块列表的形式存储在DataNode中。

（7）在系统的正确操作期间，NameNode会在内存中保留所有块信息的映射信息。

4.4 元数据的合并流程

NameNode的元数据会先往edits文件中写，当edits文件达到一定的阈值的时候，开启合并流程：

（1）当开始合并的时候，SecondaryNameNode会把edits和fsimage拷贝到自己的内存中，开始合并，合并生成一个名为fsimage.ckpt的文件。

（2）将fsimage.ckpt拷贝到NameNode上以后，删除原有的fsimage并将fsimage.ckpt改为fsimage。

（3）当SecondaryNameNode把edits和fsimage拷贝走之后，NameNode会立即生成一个edits.new文件，用于记录新来的原数据，当合并完成之后，原有的edits才会被删除，并将edits.new改名为edits，开启新一轮的流程。

4.5 HDFS的读写流程

4.5.1 写流程

将数据存入HDFS中的时候会把数据分成一个个的block，默认大小是128M，将block1分成一个个的package，将package1发送给DN1，DN1接收完package1，自己存一份，再将package1发送给同一机架不同节点的DN2，DN2接收完之后，自己存一份，再将package1发送给不同机架不同节点的DN4……以此类推，当block1接收完成后，DN1，DN2，DN4向NN汇报消息，然后再通知客户端block1接收完毕，于是客户端开始发送block2……

4.5.2 读流程

（1）client会向NameNode发送读取数据请求，NameNode会将元数据查询出来，把每一个数据存在的位置发送给client。

（2）client会优先从本地读取数据，如果本地不存在数据，会从元数据记录的第一个存储位置DN开始读取，读取完毕开始按照block的顺序读取最近的DN上的数据。

（3）将各个block按顺序读取完毕，形成整个文件。

（4）关闭输入输出流。

五、HDFS的Shell命令

5.1 简述

这里需要注意的是在Linux上执行hdfs dfs 与hadoop fs是同等效果，dfs是fs的实现类。

[root@node2 ~]# hdfs dfs
Usage: hadoop fs [generic options]
	[-appendToFile  ... ]
	[-cat [-ignoreCrc]  ...]
	[-checksum  ...]
	[-chgrp [-R] GROUP PATH...]
	[-chmod [-R]  PATH...]
	[-chown [-R] [OWNER][:[GROUP]] PATH...]
	[-copyFromLocal [-f] [-p] [-l]  ... ]
	[-copyToLocal [-p] [-ignoreCrc] [-crc]  ... ]
	[-count [-q] [-h]  ...]
	[-cp [-f] [-p | -p[topax]]  ... ]
	[-createSnapshot  []]
	[-deleteSnapshot  ]
	[-df [-h] [ ...]]
	[-du [-s] [-h]  ...]
	[-expunge]
	[-find  ...  ...]
	[-get [-p] [-ignoreCrc] [-crc]  ... ]
	[-getfacl [-R] ]
	[-getfattr [-R] {-n name | -d} [-e en] ]
	[-getmerge [-nl]  ]
	[-help [cmd ...]]
	[-ls [-d] [-h] [-R] [ ...]]
	[-mkdir [-p]  ...]
	[-moveFromLocal  ... ]
	[-moveToLocal  ]
	[-mv  ... ]
	[-put [-f] [-p] [-l]  ... ]
	[-renameSnapshot   ]
	[-rm [-f] [-r|-R] [-skipTrash]  ...]
	[-rmdir [--ignore-fail-on-non-empty]  ...]
	[-setfacl [-R] [{-b|-k} {-m|-x } ]|[--set  ]]
	[-setfattr {-n name [-v value] | -x name} ]
	[-setrep [-R] [-w]   ...]
	[-stat [format]  ...]
	[-tail [-f] ]
	[-test -[defsz] ]
	[-text [-ignoreCrc]  ...]
	[-touchz  ...]
	[-truncate [-w]   ...]
	[-usage [cmd ...]]

Generic options supported are
-conf      specify an application configuration file
-D             use value for given property
-fs       specify a namenode
-jt     specify a ResourceManager
-files     specify comma separated files to be copied to the map reduce cluster
-libjars     specify comma separated jar files to include in the classpath.
-archives     specify comma separated archives to be unarchived on the compute machines.

The general command line syntax is
bin/hadoop command [genericOptions] [commandOptions]

5.2 示例

（1）-help：输出这个命令参数

[root@node2 ~]# hadoop fs -help rm
-rm [-f] [-r|-R] [-skipTrash]  ... :
  Delete all files that match the specified file pattern. Equivalent to the Unix
  command "rm "
                                                                                 
  -skipTrash  option bypasses trash, if enabled, and immediately deletes    
  -f          If the file does not exist, do not display a diagnostic message or 
              modify the exit status to reflect an error.                        
  -[rR]       Recursively deletes directories

（2）-ls: 显示目录信息

[root@node2 ~]# hadoop fs -ls /
Found 3 items
drwxr-xr-x   - root supergroup          0 2020-05-20 03:08 /files
drwxr-xr-x   - root supergroup          0 2020-05-20 05:12 /output
drwx------   - root supergroup          0 2020-05-20 05:11 /tmp

（3）-mkdir：在HDFS上创建目录

[root@node2 ~]# hadoop fs -mkdir -p /xzw/files
[root@node2 ~]# hdfs dfs -ls /xzw
Found 1 items
drwxr-xr-x   - root supergroup          0 2020-05-27 14:43 /xzw/files

（4）-moveFromLocal：从本地剪切粘贴到HDFS

[root@node2 files]# ll
total 4
-rw-r--r-- 1 root root 32 May 20 03:07 text
[root@node2 files]# hdfs dfs -moveFromLocal ./text /xzw/files/
[root@node2 files]# hdfs dfs -ls /xzw/files
Found 1 items
-rw-r--r--   3 root supergroup         32 2020-05-27 14:45 /xzw/files/text

（5）-appendToFile：追加一个文件到已经存在的文件末尾

[root@node2 files]# ll
total 4
-rw-r--r-- 1 root root 16 May 27 14:47 cs
[root@node2 files]# hdfs dfs -appendToFile ./cs /xzw/files/test
[root@node2 files]# hdfs dfs -cat /xzw/files/test
aaa bbb
ccc ddd

（6）-cat：显示文件内容

[root@node2 files]# hdfs dfs -cat /xzw/files/test
aaa bbb
ccc ddd
aaa bbb
ccc ddd

（7）-chgrp 、-chmod、-chown：修改文件所属权限

[root@node2 files]# hdfs dfs -chmod -R 777 /xzw
[root@node2 files]# hdfs dfs -ls /
Found 4 items
drwxr-xr-x   - root supergroup          0 2020-05-20 03:08 /files
drwxr-xr-x   - root supergroup          0 2020-05-20 05:12 /output
drwx------   - root supergroup          0 2020-05-20 05:11 /tmp
drwxrwxrwx   - root supergroup          0 2020-05-27 14:43 /xzw

（8）-copyFromLocal：从本地文件系统中拷贝文件到HDFS路径去

[root@node2 files]# ll
total 4
-rw-r--r-- 1 root root 16 May 27 14:47 cs
[root@node2 files]# hdfs dfs -copyFromLocal ./cs /xzw/files
[root@node2 files]# hdfs dfs -ls /xzw/files/
Found 3 items
-rw-r--r--   3 root supergroup         16 2020-05-28 09:03 /xzw/files/cs
-rwxrwxrwx   3 root supergroup         32 2020-05-27 14:51 /xzw/files/test
-rwxrwxrwx   3 root supergroup         32 2020-05-27 14:45 /xzw/files/text

（9）-copyToLocal：从HDFS拷贝到本地

[root@node2 files]# ll
total 4
-rw-r--r-- 1 root root 16 May 27 14:47 cs
[root@node2 files]# hdfs dfs -copyToLocal /xzw/files/text ./
[root@node2 files]# ll
total 8
-rw-r--r-- 1 root root 16 May 27 14:47 cs
-rw-r--r-- 1 root root 32 May 28 09:06 text

（10）-cp ：从HDFS的一个路径拷贝到HDFS的另一个路径

[root@node2 files]# hdfs dfs -cp /xzw/files/cs /files
[root@node2 files]# hdfs dfs -ls /files
Found 2 items
-rw-r--r--   3 root supergroup         16 2020-05-28 09:08 /files/cs
-rw-r--r--   3 root supergroup         32 2020-05-20 03:08 /files/text

（11）-mv：在HDFS目录中移动文件

[root@node2 files]# hdfs dfs -mv /xzw/files/test /files/

（12）-get：等同于copyToLocal，就是从HDFS下载文件到本地

[root@node2 files]# ls
cs  text
[root@node2 files]# hdfs dfs -get /files/test ./
[root@node2 files]# ls
cs  test  text

（13）-getmerge：合并下载多个文件

[root@node2 files]# hdfs dfs -getmerge /files/* ./aaa
[root@node2 files]# cat aaa 
aaa bbb
ccc ddd
aaa bbb
ccc ddd
aaa bbb
ccc ddd
xzw lzq lyq
lzq lyq yxy
yxy xzw

（14）-put：等同于copyFromLocal

[root@node2 files]# hdfs dfs -put ./aaa /files/

（15）-tail：显示一个文件的末尾

[root@node2 files]# hdfs dfs -tail /files/test
aaa bbb
ccc ddd
aaa bbb
ccc ddd

（16）-rm：删除文件或文件夹

[root@node2 ~]# hdfs dfs -ls /xzw/files/
Found 2 items
-rw-r--r--   3 root supergroup         16 2020-05-28 09:03 /xzw/files/cs
-rwxrwxrwx   3 root supergroup         32 2020-05-27 14:45 /xzw/files/text
[root@node2 ~]# hdfs dfs -rm -r /xzw/files/text
20/05/28 14:15:58 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 0 minutes, Emptier interval = 0 minutes.
Deleted /xzw/files/text
[root@node2 ~]# hdfs dfs -ls /xzw/files/
Found 1 items
-rw-r--r--   3 root supergroup         16 2020-05-28 09:03 /xzw/files/cs

（17）-rmdir：删除空目录

[root@node2 ~]# hdfs dfs -mkdir /aaa
[root@node2 ~]# hdfs dfs -rmdir /aaa

（18）-du统计文件夹的大小信息

[root@node2 ~]# hdfs dfs -rmdir /aaa
[root@node2 ~]# hdfs dfs -du -s -h /xzw/files
16  /xzw/files
[root@node2 ~]# hdfs dfs -du -h /xzw/files
16  /xzw/files/cs
[root@node2 ~]# hdfs dfs -du -h /files
80  /files/aaa
16  /files/cs
32  /files/test
32  /files/text

（19）-setrep：设置HDFS中文件的副本数量

[root@node2 ~]# hdfs dfs -setrep 5 /xzw/files/cs
Replication 5 set: /xzw/files/cs

这里设置的副本数只是记录在NameNode的元数据中，是否真的会有这么多副本，还得看DataNode的数量。因为目前只有3台设备，最多也就3个副本，只有节点数的增加到5台时，副本数才能达到5。

六、HDFS的API操作

1、新建Maven项目，添加如下依赖。


    
        junit
        junit
        RELEASE
    
    
        org.apache.logging.log4j
        log4j-core
        2.8.2
    
    
        org.apache.hadoop
        hadoop-common
        2.7.2
    
    
        org.apache.hadoop
        hadoop-client
        2.7.2
    
    
        org.apache.hadoop
        hadoop-hdfs
        2.7.2

2、在resources目录下添加log4j.properties。

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

3、新建Client类。

package com.xzw.hadoop.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.io.IOUtils;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.FileInputStream;
import java.io.IOException;
import java.net.URI;

/**
 * @author: xzw
 * @create_date: 2020/5/13 22:35
 * @desc: HDFS客户端
 * @modifier:
 * @modified_date:
 * @desc:
 */
public class HDFSClient {

    //定义文件系统
    private FileSystem fs;

    /**
     * 运行程序之前，先运行before方法
     *
     * @throws IOException
     * @throws InterruptedException
     */
    @Before
    public void before() throws IOException, InterruptedException {
        //获取一个hdfs的抽象封装对象
        fs = FileSystem.get(URI.create("hdfs://master:9000"), new Configuration(), "root");
    }

    /**
     * 从本地上传文件到hdfs
     *
     * @throws IOException
     * @throws InterruptedException
     */
    @Test
    public void put() throws IOException, InterruptedException {
        //设置副本数（优先级：程序设置>配置文件>默认）
        //configuration.setInt("dfs.replication", 1);

        fs.copyFromLocalFile(new Path("C:\\Users\\Machenike\\Desktop\\file\\xzw.txt"),
                new Path("/xzw"));
    }

    /**
     * 从hdfs上下载文件
     *
     * @throws IOException
     * @throws InterruptedException
     */
    @Test
    public void get() throws IOException, InterruptedException {
        fs.copyToLocalFile(new Path("/files/file.txt"),
                new Path("C:\\Users\\Machenike\\Desktop\\file\\"));
    }

    /**
     * 重命名hdfs上的文件
     *
     * @throws IOException
     * @throws InterruptedException
     */
    @Test
    public void rename() throws IOException, InterruptedException {
        fs.rename(new Path("/files/file.txt"), new Path("/files/file"));
    }

    /**
     * 删除目录
     *
     * @throws IOException
     */
    @Test
    public void delete() throws IOException {
        boolean delete = fs.delete(new Path("/files"), true);
        if (delete) {
            System.out.println("删除成功！");
        } else {
            System.out.println("删除失败！");
        }
    }

    /**
     * 追加内容到hdfs
     *
     * @throws IOException
     */
    @Test
    public void appendToHDFS() throws IOException {
        FSDataOutputStream append = fs.append(new Path("/xzw/xzw.txt"), 1024);
        FileInputStream open = new FileInputStream("C:\\Users\\Machenike\\Desktop\\file\\xzw.txt");
        IOUtils.copyBytes(open, append, 1024, true);
    }

    /**
     * 列出目录相关信息
     *
     * @throws IOException
     */
    @Test
    public void listInfo() throws IOException {
        FileStatus[] fileStatuses = fs.listStatus(new Path("/xzw"));

        for (FileStatus fileStatus : fileStatuses) {
            if (fileStatus.isFile()) {
                System.out.println("以下是这个文件的相关信息：");
                System.out.println(fileStatus.getPath());
                System.out.println(fileStatus.getLen());
            } else {
                System.out.println("这是一个文件夹");
                System.out.println(fileStatus.getPath());
            }
        }
    }

    /**
     * 获取文件的信息
     *
     * @throws IOException
     */
    @Test
    public void listFiles() throws IOException {
        RemoteIterator files = fs.listFiles(new Path("/xzw"), true);

        while (files.hasNext()) {
            LocatedFileStatus file = files.next();

            System.out.println(file.getPath());
            System.out.println("块信息：");
            BlockLocation[] blockLocations = file.getBlockLocations();
            for (BlockLocation blockLocation : blockLocations) {
                String[] hosts = blockLocation.getHosts();
                System.out.println("块在");
                for (String host : hosts) {
                    System.out.println(host + " ");
                }
            }
        }
    }

    /**
     * 程序运行结束后执行的方法
     *
     * @throws IOException
     */
    @After
    public void after() throws IOException {
        //关闭文件系统
        fs.close();
    }
}

4、HDFS的I/O流操作。

通过输入输出流实现上述HDFS的API操作。

package com.xzw.hadoop.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

/**
 * @author: xzw
 * @create_date: 2020/5/30 10:27
 * @desc: 输入输出流实现HDFS API
 * @modifier:
 * @modified_date:
 * @desc:
 */
public class HDFSAPi {

    /**
     * 本地资源上传到HDFS
     *
     * @param localPath 本地资源路径
     * @param hdfsPath  hdfs上传路径
     * @throws URISyntaxException
     * @throws IOException
     * @throws InterruptedException
     */
    public void localToHDFS(String localPath, String hdfsPath) throws URISyntaxException, IOException,
            InterruptedException {
        //1、获取文件系统
        Configuration configuration = new Configuration();
        FileSystem fs = FileSystem.get(new URI("hdfs://master:9000"), configuration, "root");

        //2、创建输入流
        FileInputStream fileInputStream = new FileInputStream(new File(localPath));

        //3、获取输出流
        FSDataOutputStream fsDataOutputStream = fs.create(new Path(hdfsPath));

        //4、流对拷
        IOUtils.copyBytes(fileInputStream, fsDataOutputStream, configuration);

        //5、关闭资源
        IOUtils.closeStream(fsDataOutputStream);
        IOUtils.closeStream(fileInputStream);
        fs.close();
    }

    /**
     * hdfs下载文件到本地
     *
     * @param hdfsPath  hdfs路径
     * @param localPath 本地路径
     * @throws URISyntaxException
     * @throws IOException
     * @throws InterruptedException
     */
    public void hdfsToLocal(String hdfsPath, String localPath) throws URISyntaxException, IOException,
            InterruptedException {
        //1、获取文件系统
        Configuration configuration = new Configuration();
        FileSystem fs = FileSystem.get(new URI("hdfs://master:9000"), configuration, "root");

        //2、获取输入流
        FSDataInputStream fsDataInputStream = fs.open(new Path(hdfsPath));

        //3、获取输出流
        FileOutputStream fileOutputStream = new FileOutputStream(new File(localPath));

        //4、流对拷
        IOUtils.copyBytes(fsDataInputStream, fileOutputStream, configuration);

        //5、关闭资源
        IOUtils.closeStream(fileOutputStream);
        IOUtils.closeStream(fsDataInputStream);
        fs.close();
    }

    public static void main(String[] args) throws InterruptedException, IOException, URISyntaxException {
        //本地上传文件到hdfs
        new HDFSAPi().localToHDFS("C:\\Users\\Machenike\\Desktop\\file\\file.txt", "/xzw/file");

        //hdfs下载文件到本地
        new HDFSAPi().hdfsToLocal("/xzw/file", "C:\\Users\\Machenike\\Desktop\\file\\file");
    }

}

本文到此也就结束了，在次过程中你们遇到什么问题，欢迎留言，让我看看你们都遇到了哪些问题~

你可能感兴趣的:(from,zero,to,hero（Hadoop篇）,hadoop,hdfs)

回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
Python3.7出现“ModuleNotFoundError: No module named ‘Tkinter‘”错误的解决方法可爱的小红猪 python
Python3.7出现“ModuleNotFoundError:Nomodulenamed‘Tkinter’”错误的解决方法在网上看到很多针对这个问题的解决方法都是重新安装或配置Tkinter库，但Tkinter是python内置的标准GUI库，安装Python时就已经内置在了库中，不需要另外下载。针对于Tkinter，你的代码很可能是这样的：importTkinter或者是这样fromTkint
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
leetcode中等.数组(21-40)python 九日火 python leetcode
80.RemoveDuplicatesfromSortedArrayII(m-21)Givenasortedarraynums,removetheduplicatesin-placesuchthatduplicatesappearedatmosttwiceandreturnthenewlength.Donotallocateextraspaceforanotherarray,youmustdoth
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Dockerfile FROM 两个 redDelta
Docker相关视频讲解：什么是容器Docker介绍实现"DockerfileFROM两个"的步骤步骤表格步骤操作1创建一个Dockerfile文件2写入FROM指令3构建第一个镜像4创建第二个Dockerfile文件5写入FROM指令6构建第二个镜像7合并两个镜像操作步骤说明步骤1：创建一个Dockerfile文件使用任意文本编辑器创建一个名为Dockerfile的文件。登录后复制#Docker
前端代码上传文件余生逆风飞翔前端 javascript 开发语言
点击上传文件import{ElNotification}from'element-plus'import{API_CONFIG}from'../config/index.js'import{UploadFilled}from'@element-plus/icons-vue'import{reactive}from'vue'import{BASE_URL}from'../config/index'i
Dockerfile命令详解之 FROM 清风怎不知意容器化 java 前端 javascript
许多同学不知道Dockerfile应该如何写，不清楚Dockerfile中的指令分别有什么意义，能达到什么样的目的，接下来我将在容器化专栏中详细的为大家解释每一个指令的含义以及用法。专栏订阅传送门https://blog.csdn.net/qq_38220908/category_11989778.html指令不区分大小写。但是，按照惯例，它们应该是大写的，以便更容易地将它们与参数区分开来。(引用
leetcode-124 Binary Tree Maximum Path Sum 乐观的大鹏 LeetCode
Givenanon-emptybinarytree,findthemaximumpathsum.Forthisproblem,apathisdefinedasanysequenceofnodesfromsomestartingnodetoanynodeinthetreealongtheparent-childconnections.Thepathmustcontainatleastonenodea
Dockerfile（1） - FROM 指令详解小菠萝测试笔记 docker python java cmd 大数据
FROM指明当前的镜像基于哪个镜像构建dockerfile必须以FROM开头，除了ARG命令可以在FROM前面FROM[--platform=][AS]FROM[--platform=][:][AS]FROM[--platform=][@][AS]小栗子FROMalpine:latest一个dockerfile可以有多个FROM可以有多个FROM来创建多个镜像，或区分构建阶段，将一个构建阶段作为另
HarmonyOS Next鸿蒙扫一扫功能实现 JohnLiu_ HarmonyOS Next harmonyos 华为扫一扫鸿蒙
直接使用的是华为官方提供的api，封装成一个工具类方便调用。import{common}from'@kit.AbilityKit';import{scanBarcode,scanCore}from'@kit.ScanKit';exportnamespaceScanUtil{exportasyncfunctionstartScan(context:common.Context):Promise{if
Vicky的ScalersTalk第六轮新概念朗读持续力训练Day73 20210411 Vicky_b9de
练习材料：ModerncavemenPart-3ˈmɒdənˈkeɪvmənpɑːt-3Theyplungedintothelake,andafterloadingtheirgearonaninflatablerubberdinghy,letthecurrentcarrythemtotheotherside.Toprotectthemselvesfromtheicywater,theyhadtow
处理标签包裹的字符串，并取出前250字符周bro 前端 javascript 开发语言
//假设这是你的HTML字符串varhtmlString=`这是一个段落。这是一个标题这是另一个段落，包含一些链接。`;//解析HTML字符串并提取文本functionextractTextFromHTML(html){varparser=newDOMParser();vardoc=parser.parseFromString(html,"text/html");vartextContent=do
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
单线程执行器（`SingleThreadedExecutor`）来处理节点的任务课堂随想 moveit2 机器人
intmain(intargc,char**argv){rclcpp::init(argc,argv);rclcpp::NodeOptionsnode_options;node_options.automatically_declare_parameters_from_overrides(true);automove_group_node=rclcpp::Node::make_shared("mo
python画出分子化学空间分布（UMAP） Sakaiay python
利用umap画出分子化学空间分布图安装pipinstallumap-learn下面是用一个数据集举的例子importtorchimportumapimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsfromsklearn.manifoldimportTSNEfromrdkit.Chemimport
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n