Eva.努力学习

第七天 - HDFS概述、命令操作 - JAVA操作HDFS - 集群间时间同步、手动修复

第七天 - HDFS概述、命令操作 - JAVA操作HDFS - 集群间时间同步、手动修复
- - 一、HDFS概述
    - - HDFS概述
      - HDFS优缺点
      - HDFS核心思想及作用
      - 重要特性
  - 二、HDFS工作原理
    - - 概述
      - 数据读取过程
      - 数据写入过程
      - Hadoop增删节点
      - NameNode详解
  - 三、HDFS命令操作
    - - Web监控
      - 使用命令操作HDFS
  - 四、JAVA操作HDFS
    - - JUnit单元测试工具
      - 准备
      - eclipse编写代码
        
        解决环境问题
        
        编写代码前的准备
        
        编写第一个测试代码，测试连接是否成功
        
        创建多级目录
        
        上传本地文件至hdfs
        
        从hdfs下载文件至本地
        
        HDFSUtil工具类的封装
  - 五、还原快照后的处理

一、HDFS概述

HDFS概述

hdfs源于Google的GFS论文，是GFS的克隆版译为易于扩展的分布式文件系统，可以运行在大量的普通廉价机器上。hadoop，离线计算框架，数据很少会发生变化。当数据发生变化时，通过操作hdfs的方式进行数据同步，在hadoop中提供数据存储服务，具备数据管理功能/数据不丢失(冗余存储)。

hadoop进行数据运算时是以分布式的方式进行：任务分发 -> 资源调配 -> 结果同步，所以在对小数据量的处理时，从主观来看会感觉使用分布式计算反而比单机计算更慢，这是因为时间花费在了任务分发、结果同步上，；然而，当数据量足够大时，就能体现出分布式计算的优势了。

hdfs可以使得在数据计算时，数据的读取变得高效，提高计算的效率，同时可以作为多个数据计算框架数据存储支持，例如hive、hbase等。

HDFS优缺点

优点
- 高可靠性:存储和处理数据的能力
- 高扩展性:可以在可用的计算机集群间分配数据来完成计算任务，并可以扩展到数以千计的节点中
- 高效性:能够在各个节点之间动态移动数据，保证各个节点的动态平衡以提升速度
- 高容错性:能够自动保存数据的多个副本，并能够将失败的任务重新分配
缺点
- 不适合低延迟的数据访问
- 无法高效存储大量的小文件
- 不支持多用户写入及修改文件

HDFS核心思想及作用

分而治之:将大文件、大批量文件，分布式存放在大量服务器上，可以快速高效的对海量数据进行运算分析
可以为各类的分布式运算框架(MapReduce，Spark等)提供数据存储服务
本质上是一个分布式文件系统，用于存储和管理文件，由多台服务器联合起来实现分布式的功能，在每个服务器上可以负责不同的工作内容

如果一个集群中有100台节点：40台做数据存储，60台做数据运算

40台用于数据存储提升数据稳定性，例如使用商用固态硬盘/弹性块存储等高性能存储设备

60台应用于数据运算，需要提升提升CPU、内存性能

这100台节点都需要保证足够的带宽，否则带宽将会是这个集群分布式计算的瓶颈

重要特性

HDFS在物理上是分块存储，块的大小可以通过配置文件来指定，在2.x版本中是128M
HDFS文件系统会给客户端提供一个统一的抽象目录树，通过hdfs协议的路径来访问文件或文件夹
由namenode节点来管理目录结构及文件分块信息(元数据)，也是集群的主节点，负责维护整个文件系统的目录树以及每一个路径所对应的block信息
由datanode节点来管理文件的block存储，也是集群的从(子)节点，每一个block都可以在多个datanode上存储多个副本

二、HDFS工作原理

概述

NameNode负责管理整个文件系统的元数据
DataNode负责管理用户存储文件的数据块
文件会按照预先指定的块大小被切成若干块后分布式存储在若干台DataNode上
每一个文件快可以有多个副本，并存放在不同的DataNode上
DataNode会定期向NameNode汇报自身保存的文件block信息，NameNode负责保持文件的副本数量
在用户使用时不需要关心HDFS的内部工作步骤，直接通过一个地址进行操作

使用流修改文件内容时，首先打开一个流，不断的读取文件信息，定位修改，通常不会直接修改

通常是以文件导入的方式将数据导入HDFS，将计算得到的数据(小数据量)进行读取，结果的展示

数据读取过程

客户端通过命令或调用FileSystem对象的open方法打开需要读取的文件
NameNode接收指令后，确定文件的block的基本信息
DataNode进行排序，如果客户端就是在一台DataNode上执行则直接从本地读取数据。
确定数据节点后会返回一个FSDataInputStream对象，从中读取数据
使用read方法以流的方式从文件中读取数据
当达到block文件末尾时，FSDataInputStream会关闭当前连接，继续读取下一个block文件
循环读取过程，直至读取整个文件，关闭FSDataInputStream

数据写入过程

客户端通过调用create()方法来请求创建文件
NameNode会对该操作进行校验，包括文件系统中是否已经存在该文件，以及是否有相应的权限进行创建
如果校验通过，NameNode会记录该文件信息，返回一个FSDataOutputStream对象，用于数据写入
FSDataOutputStream会把要写入的数据分成包的形式，写入到中间队列
DataStreamer用于将数据包中的数据分别写入到各个DataNode中
在FSDataOutputStream中维护了一个packets队列，其中存放了等待被每个DataNode确认的packets信息
一个packets信息被移出本队列当且仅当所有的DataNode都确认无误
当数据完成后会调用close方法，会flush残留的packets，通知NameNode等待确认信息

Hadoop增删节点

静态添加

停止集群，修改节点配置文件(slaves)，启动集群
- 优点：操作简单，改动较少
- 缺点：去要重启集群
- 应用场景：每天有固定的重启时间
动态添加

在集群运行过程中进行变更，在新机器上配置好环境，同步各集群的hosts文件和slaves文件

在新节点中使用如下命令进行启动

sbin/hadoop-daemon.sh start datanode

sbin/yarn-daemon.sh start nodemanager
- 优点：不需要重启集群
- 缺点：改动量较大时比较繁琐
- 应用场景：需要持续不断的提供服务

NameNode详解

负责处理客户端的请求，元数据的查询和修改

启动过程
- 首先将fsimage(镜像载入内存)，并执行和editlog相关的各项操作
- 在内存中建立元数据映射，则创建一个新的fsimage文件和一个空的editlog
- 在安全模式下，DataNode会向NameNode发送块列表的最新情况
- 在安全模式中，文件系统对于客户端是只读的
- 完成以上操作后开启监听RPC和HTTP请求，并退出安全模式
元数据管理
- NameNode的两个重要文件:fsimage-元数据镜像文件，edits-元数据操作日志
- 元数据镜像:内存中为最新的=fsimage+edits
- 定期合并fsimage和edits:由SecondaryNameNode，保证稳定运行以及NameNode重启速度
安全模式

一个新创建的集群不会进入安全模式，重新启动一个已有的集群，通常会有短暂的安全模式时间，用于完成合并和初始化的操作
- 查询当前是否处于安全模式
hadoop dfsadmin -safemode get
- 等待安全模式关闭
hadoop dfsadmin -safemode wait
- 退出安全模式
hadoop dfsadmin -safemode leave
- 启用安全模式
hadoop dfsadmin -safemode enter

三、HDFS命令操作

Web监控

浏览器中输入地址SZ01:50070

可以在这个网页中查看集群信息等，也可以在上图的位置找到查看hdfs文件系统的页面，可以将hdfs中的文件下载至Windows本地；

在浏览器中直接下载文件时，传输数据的datanode是随机的，通常需要对每一台每一台机器配置hosts映射(Windows下)，当机器数量较多时，可以手动修改主机名为IP，再重新发送请求。

使用命令操作HDFS

两种命令格式：

hadoop fs -command path

hdfs dfs -command path

command为操作命令，上传、下载、删除、查看、移动、复制文件等，命令与Linux下的命令几乎相同

path为操作路径，hdfs根路径为hdfs://host:8020/，使用时可直接简写为/

hdfs也有绝对路径和相对路径，但一般使用时使用绝对路径，即从/开始

查看hdfs系统中存在的文件的命令：ls

hdfs dfs -ls path：查看path路径下的文件

hdfs dfs -lsr path = hdfs dfs -ls -R path：递归查看path路径下的文件
上传文件至hdfs命令：put(copyFromLocal)

hdfs dfs -put src(Linux文件系统) dest(HDFS文件系统)

hdfs dfs -put .bash_profile /
查看hdfs中文件内容：cat

hdfs dfs -cat file

hdfs dfs -cat /.bash_profile
从hdfs下载文件命令：get(copyToLocal)

hdfs dfs -get src(HDFS文件系统) dest(Linux文件系统)

hdfs dfs -get /.bash_profile /tmp
删除hdfs中文件、文件夹命令：rm rmdir

hdfs dfs -rm file：删除文件

hdfs dfs -rmdir emptyDir：删除空文件夹

hdfs dfs -rm -r notEmptyDir：删除非空文件夹

在hdfs-site.xml中配置了删除文件时并不是立即删除，而是现将文件移至某一文件夹，60分钟后彻底删除

hdfs dfs -rm /.bash_profile
创建文件夹：mkdir

hdfs dfs -mkdir dirPathName：指定路径和名字创建文件夹

hdfs dfs -mkdir /input

hdfs dfs -mkdir /output

hdfs dfs -mkdir test
移动文件(夹)：mv

hdfs dfs -mv src(源) dest(目标)

hdfs dfs -mv /test.txt /s1/
复制文件(夹)：cp

hdfs dfs -cp src(源) dest(目标)

hdfs dfs -cp /s1/test.txt /s1/s2/
更改文件(夹)权限：chmod

hdfs dfs -chmod [-R] xxx file(dir)

hdfs dfs -chmod 777 /s1/test.txt

四、JAVA操作HDFS

在Windows下通过java操作服务器中的hdfs时，需要进行安装hadoop，配置环境变量，在项目中引入所需jar包，解决环境问题等操作

JUnit单元测试工具

此工具可以直接执行某一个方法：不能有参数，不能有返回值

原理：调用无参的构造方法，再去调用声明测试的方法

使用方法：添加库，在要测试的方法前引入@Test注释，右键运行时选择JUnit Test

通常测试时只会指定一个方法进行测试

使用步骤：右键项目，build Path，configure Build Path，切换至Library，add Library，Junit

检验JUnit原理测试代码：

@Test
    public void getHomeDir() {
    //输出当前家目录
        System.out.println(fs.getHomeDirectory());
    }

准备

Windows下配置hadoop
1. 将hadoop-2.7.2.tar.gz通过解压缩软件解压至目录(一般解压至软件安装目录)
2. 右键此电脑 -> 高级系统设置 -> 环境变量，在系统变量一栏选择新建
3. 变量名为HADOOP_HOME，变量值为第1步中解压的路径
解决运行MapReduce时因环境而报错(为之后编写MapReduce代码做准备)
1. 新建包org.apache.hadoop.io.nativeio
2. 将修改后的NativeIO.java粘贴到包内
3. 此时import有报错，原因是eclipse默认设置将禁止的引用进行报错，需要进行处理
4. 将禁止的引用改成警告，如下图进行设置：

eclipse编写代码

解决环境问题

编写代码前，先将winutil.exe和hadoop.dll等文件拷贝至$HADOOP_HOME/bin目录下，并且将hadoop.dll拷贝至System32及SysWOW64目录下。双击运行winutil.exe，如果没报错即成功，如果报错，则需使用类库修复工具修复(具体可百度方法)，完成后重启电脑

压缩包可从点击此处下载

编写代码前的准备

新建java项目，在项目下新建文件夹lib
在hadoop解压目录下拷贝以下jar包粘贴至项目的lib文件夹中

$HADOOP_HOME/share/hadoop/common/hadoop-common-2.7.2.jar和hadoop-nfs-2.7.2.jar

$HADOOP_HOME/share/hadoop/common/lib中全部jar包$HADOOP_HOME/share/hadoop/hdfs/hadoop-hdfs-2.7.2.jar和hadoop-hdfs-nfs-2.7.2.jar$HADOOP_HOME/share/hadoop/hdfs/lib中全部jar包
在eclipse中全选lib目录下的jar包，右键选择Build Path -> Add to Build Path(添加至构建路径)
将$HADOOP_HOME/etc/hadoop/log4j.properties拷贝至src根目录下

将第18行中hadoop.root.logger=INFO改成DEBUG，这样在运行项目后输出的信息会以debug信息输出，否则有些报错信息未能输出，不利于调试

编写第一个测试代码，测试连接是否成功

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;

public class Test01 {
    // 初始化配置对象
    private static Configuration conf = new Configuration();
    // 声明需要访问的集群地址
    private final static String URI = "hdfs://SZ01:8020/";
    // 声明操作文件系统的类
    private static FileSystem fs;

    static {
        try {
            // 从制定集群中读取配置
            FileSystem.setDefaultUri(conf, URI);
            // 使用读取到的配置实例化fs
            fs = FileSystem.get(conf);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    public static void main(String[] args) {
        // TODO 使用Java操作HDFS
        // 输出默认的block块大小
        System.out.println(fs.getDefaultBlockSize());
    }
}

运行成功后输出结果为：

下图中的设置为查看源码时使用反编译工具

创建多级目录

    // 同时创建多级目录
    public void mkdirs() {
        try {
            fs.mkdirs(new Path("t1/t2"));
            fs.mkdirs(new Path("/s1/s2"));
        } catch (IllegalArgumentException e) {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        } catch (IOException e) {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
    }

上传本地文件至hdfs

上传文件通常是客户端通过web应用进行上传操作，将文件上传到linux本地磁盘，再上传至hdfs(指定删除源文件，指定不覆盖目标文件)

// 上传本地文件至hdfs
    public void upLoad() {
        try {
            // 两个参数：本地文件路径和hdfs目录
            fs.copyFromLocalFile(new Path("G://test/test.txt"), new Path("/"));
        } catch (IllegalArgumentException e) {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        } catch (IOException e) {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
    }

从hdfs下载文件至本地

// 从hdfs下载文件至本地
    public void downLoad() {
        try {

            fs.copyToLocalFile(false, new Path("/text.txt"), new Path("E://"), true);
        } catch (IllegalArgumentException e) {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        } catch (IOException e) {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
    }

HDFSUtil工具类的封装

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

public class HDFSUtil {

    /**
     * 初始化工具类，指定需要操作的集群
     * @param hostName
     */
    public HDFSUtil(String hostName) {
        URI = "hdfs://" + hostName + ":8020";
        try {
            // 将URI信息记录到配置项中
            FileSystem.setDefaultUri(conf, URI);
            // 使用读取到的配置实例化fs
            fs = FileSystem.get(conf);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 初始化配置对象
    private static Configuration conf = new Configuration();
    // 声明需要访问的集群地址
    private static String URI = "";
    // 声明操作文件系统的类
    private static FileSystem fs;

    /**
     * 返回当前用户的家目录
     * @return
     */
    public String getHomeDir() {
        // 当前用户的家目录
        return fs.getHomeDirectory().toString();
    }

    /**
     * 创建文件夹
     * @param path 完整路径，不需要添加斜杠
     * @param useHomeDir 是否在用户家目录中创建
     */
    public void mkdirs(String path, boolean useHomeDir) {
        // 同时创建多级目录
        try {
            if (useHomeDir) {
                fs.mkdirs(new Path(path));
            } else {
                fs.mkdirs(new Path("/" + path));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    /**
     * 文件上传
     * @param delSrc 是否删除源文件
     * @param overwrite 是否覆盖目标文件
     * @param srcs 源文件路径，可以指定多个路径
     * @param dest 目标路径
     */
    public void upLoad(boolean delSrc, boolean overwrite, String[] srcs, String dest) {
        try {
            // fs.copyFromLocalFile(false, src, dst);
            // 四个参数，是否删除源文件，是否覆盖目标文件，源路径，目标路径，声明不覆盖时抛出异常(不会发生覆盖)
            // fs.copyFromLocalFile(false, false, new Path("E://test.txt"), new Path("/"));
            // 上传单个文件时，直接上传
            if (srcs.length == 1) {
                fs.copyFromLocalFile(delSrc, overwrite, new Path(srcs[0]), new Path("/"));
            } else {
                // 上传多个文件时，生成所需的Path数组
                Path[] paths = new Path[srcs.length];
                for (int i = 0; i < srcs.length; i++) {
                    paths[i] = new Path(srcs[i]);
                }
                fs.copyFromLocalFile(delSrc, overwrite, paths, new Path("/"));
            }

        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    /**
     * 文件下载
     * @param delSrc 是否删除源文件
     * @param src 源文件路径
     * @param dest 目标路径
     */
    public void downLoad(boolean delSrc,String src,String dest) {
        try {
            // 四个参数，是否删除源文件，源路径，目标路径，是否使用原生的系统文件系统
            fs.copyToLocalFile(delSrc, new Path(src), new Path(dest), true);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

五、还原快照后的处理

在集群中单台机器出现了误操作后导致系统不能正常运行，此时需要还原快照，如果没有快照则需重装系统。

还原快照后需要对三台机器的时间进行同步，否则hadoop集群无法进行正常工作。

同步时间的步骤：

所有机器切换至root用户

su - root
打开Xshell的发送键输入到所有会话的功能，输入以下命令

date -s ‘201x-xx-xx xx:xx:xx’

时间同步完成后，重启hadoop进程，即执行以下两步命令

stop-all.sh

start-all.sh

重启hadoop进程成功后，hadoop会对恢复快照的机器尝试自动检测和修复。

如果hadoop自动修复失败，即恢复快照的机器访问hdfs文件系统时跟其他机器访问hdfs所得到的结果不同，则需进行手动修复。

手动修复步骤：

损坏机器与正常机器都进入配置的datanode文件夹

cd hadoop/data/dfs/dn/current/BP-1387956734-192.168.128.121-1535966538843/current/finalized/subdir0/subdir0/
对比损坏机器与正常机器该目录下的文件情况，将正常机器多出来的文件复制到损坏的机器上，复制方式可以通过scp发送，或者Xftp先下载至本地再上传

手动修复后需要重启hadoop进程，此时修复完成。

7、开启C与Unity 3D的编程之旅珊珊333333 Unity C#Unity 3D 编程基础
开启C#与Unity3D的编程之旅1.前期准备在进行每一个教程之前，都有一个名为Scene的场景文件。在整个学习过程中，教程通常从下载项目中的Scene文件开始。打开场景的方法有两种：-直接在项目面板的Assets目录下双击场景图标。-选择File→OpenScene来打开项目中的任何场景。2.学习回顾与要点创建并将新的C#文件分配给对象并不复杂，在Unity3D编辑器中有多种方法可以实现。添加代
成功日记（Day1115）狮子座的兔子姑娘
1、学习中药一课程。~1.5h。2、跟g夙微信闲唠嗑。~0.5h。3、给自己剪头发。~0.5h。4、和包、李微信闲唠嗑。~0.5h。5、和z鹤微信闲聊几句。~0.25h。6、在赫男那做了个生命密码的测试，说我今年会有工作上的大转折，然后又聊了会天。~1h。心情：尚可。还算开心。
Day1学习心得||Leetcode704,27,977
Part1数组的一些注意点第一天学习的内容是数组，基础的内容就按下不表，浅记一下补上的漏洞1.数组的元素不能删除，只能覆盖乍一看可能比较奇怪，但是仔细思考一下很简单。关注一下数组的本质其实是内存上开辟的一串连续的内存空间。在程序中，只能将内存空间中存储的内容改写，而不能完全去除（即使动态数组也只是释放）。2.二维数组的空间地址依然是连续的（顺序比较像阅读的顺序）tip:虽然还没学过Java，但是先
【Python】Gym 库：于开发和比较强化学习（Reinforcement Learning, RL）算法彬彬侠 Python基础 python Gym 强化学习 RL Gymnasium
Gym是Python中一个广泛使用的开源库，用于开发和比较强化学习（ReinforcementLearning,RL）算法。它最初由OpenAI开发，提供标准化的环境接口，允许开发者在各种任务（如游戏、机器人控制、模拟物理系统）中测试RL算法。Gym的设计简单且灵活，适合学术研究和工业应用。2022年，Gym被整合到Gymnasium（由FaramaFoundation维护）中，成为主流的强化学习
今晚线上会议与美好同行
今晚是我们阳明心学诚意班第二次线上会议，说是7:00——7:45，却开到了八点半多。不喜欢开会的我没有一点厌烦，主持人吴老师也是这样说，估计参加会议的我们都一样的感受。这样的会议，不是谁在讲话，而是大家分享学习感受。或者有所得，或者仍迷惑，大家有什么说什么，无拘无束。主持人吴老师是一个曾学过阳明心学两年，然后离开又回到这上面来的人。她说了她的学习感受。她的离开又回来，是给我们的最好的现身说法。她学
Sissi书单｜《每天刷本书》365天不间断阅读第24天每天刷的sissi
很喜欢这本书，看起来一点不费劲儿，像聊天一样。而且会有很多温馨又感动的瞬间。好像那个正在回答问题的人就是你自己一样。推荐阅读啊～喜欢～虽然每个人被分配到的考验是不一样的，但是方法是可以借鉴和学习的，掌握的方法越多，解题思路就越多～
10月份秦汉史学习小结乔木晨曦
匆匆忙忙中，今年已踏过10个月，只剩下更匆匆的2个月。这个10月份，仍然充满了不确定性。孩子们去学校的日子，只有5天！第一次，一个人带两个孩子这么久，有一地鸡毛，有兵荒马乱，也有阳光明媚，也有欢声笑语。10月份的月夜，很有点凉飕飕，钻在被窝里，守在熟睡的儿子身边，完成了这个月秦汉史的学习和作业。（因为白天的时间基本上是属于家务和孩子们的。）一、10月份完成的读书10月份完成的读书只有3本：（1）《
mysql+explain怎么看_MySQL学习----explain查看一条sql 的性能安123
在开发的过程中,对于我们写的sql语句，我们有时候会考虑sql语句的性能，那么explain就是首选。Explain命令在解决数据库性能上是第一推荐使用命令，大部分的性能问题可以通过此命令来简单的解决，Explain可以用来查看SQL语句的执行效果，可以帮助选择更好的索引和优化查询语句，写出更好的优化语句。Explain语法：explainselect…from…[where...]例如：expl
杜老师物语（一）旋木杏
作者：旋木杏俞子烨知道高二一班新来了一个班主任，原来的班主任和他是多年搭档，前段时间请了产假，领导有意让他一个人带两个班，然后找一个语文老师来教一二班。但是俞子烨拒绝了，因为高二所有老师都知道，高二一班很麻烦，因为高二一班的学生，不是问题学生，就是一些高中毕业就出国的富二代，根本就不在乎学习，也不听老师的话。俞子烨对此再清楚不过了，因为他经常听到别的科任老师和搭档投诉，今天某某学生又如何如何了。这
第二批主题教育要“照镜子、脱靴子、钉钉子、出点子” wyzzb123
学习贯彻习近平新时代中国特色社会主义思想主题教育开展以来，全党各级党组织积极贯彻落实党中央部署，坚持理论联系实际，大兴调研之风，取得了很多成效。但各党组织不能就此满足，广大党员干部要牢记学习没有“休止符”、只有“进行时”，要全面贯彻落实党的二十大精神，在第二批主题教育中“照镜子、脱靴子、揪辫子、想法子”，实现更多新成效。“照照镜子”，关注“找差纠错”，“回头看去”促前进。习近平总书记曾指出：“让正
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
AI Agent开发学习系列 - langchain之示例选择器2：相关性与多样性兼得-MaxMarginalRelevanceExampleSelector在LangChain中的用法 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
MaxMarginalRelevanceExampleSelectorMaxMarginalRelevanceExampleSelector是LangChain中用于Few-ShotPrompt的一种智能示例选择器。它的作用是：在众多示例中，自动选择与当前输入最相关、同时彼此多样性最大的示例，插入到prompt里。主要特点相关性优先：优先选择与用户输入最相似的示例。多样性保证：避免选到内容高度重复
AI Agent开发学习系列 - langchain之memory(1)：内存中的短时记忆 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
内存中的短时记忆，在LangChain中通常指ConversationBufferMemory这类“对话缓冲记忆”工具。它的作用是：在内存中保存最近的对话历史，让大模型能理解上下文，实现连续对话。对话缓冲记忆”工具主要特点只保留最近的对话内容（如最近N轮），不会无限增长，节省内存和token。适合短对话、上下文关联不深的场景。支持多种变体，如窗口记忆（ConversationBufferWindo
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
c++day05(ASCII）有点。 #C++少儿 c++
学习目标字符型常量和变量字符的输入、输出ASCII码和字符运算键盘为什么不按照字母顺序排序历史原因:早期的机械打字机上,字母键是按照字母顺序排列的。当打字员打字速度很快时,打字机上的金属臂会相互碰撞,导致键盘卡顿,影响打字速度和精度。为了解决这个问题,打字机制造商重新设计了键盘,将经常使用的字母键分散在键盘上,以减少键盘卡顿。除了历史原因,分散的设计也是为了优化打字速度。键盘上的字母键被分成两个主
MySQL学习----Explain 典孝赢麻崩乐急 mysql 学习数据库
使用Explain可以查看sql的性能瓶颈信息，并根据结果进行sql的相关优化。当使用Explain分析SQL查询时，MySQL会返回一个包含多个字段的结果集，每个字段都提供了查询执行计划的重要信息。主要输出字段详解（1）id含义：SELECT标识符作用：表示查询中SELECT子句的执行顺序值说明：id相同：执行顺序从上到下id不同：从大到小执行id为NULL：表示结果集，如UNION结果（2）s
Python 进阶学习之全栈开发学习路线 Microi风闲【胶水语言】Python python 学习开发语言
文章目录前言一、Python全栈开发技术栈1.前端技术选型2.后端框架选择3.数据库访问二、开发环境配置1.工具链推荐2.VSCode终极配置3.项目依赖管理三、现代Python工程实践1.项目结构规范2.自动化测试策略3.CI/CD流水线四、部署策略大全1.传统服务器部署2.容器化部署3.无服务器部署五、性能优化技巧1.数据库优化2.异步处理3.静态资源优化结语前言Python作为当今最流行的编
MySQL入门学习-查询优化.EXPLAIN
在MySQL中，'EXPLAIN'命令用于获取查询执行计划的信息。一、关于'EXPLAIN'的一些常见查询优化方面的特点、使用方法、与其他比较及高级应用：1.特点：-提供查询执行计划的详细信息，帮助了解查询的执行方式。-可以用于优化查询性能，找出潜在的性能问题。-适用于各种类型的查询，包括简单查询和复杂查询。2.使用方法：-在查询语句前添加'EXPLAIN'关键字，例如：'EXPLAINSELEC
计算机网络学习----Https协议典孝赢麻崩乐急计算机网络学习 https
在互联网通信中，数据安全始终是核心需求。当用户在浏览器中输入https://访问网站时，背后隐藏着一套复杂的安全机制——HTTPS（HypertextTransferProtocolSecure）。它通过TLS/SSL协议对HTTP通信加密，而支撑这一加密体系的核心正是证书体系。本文将详细解析HTTPS的证书体系、加密通信流程、核心作用、优缺点，并结合代码示例说明其实现逻辑。HTTPS是什么？HT
Java学习----Redis集群典孝赢麻崩乐急 java 学习 redis
在分布式系统开发中，Redis作为高性能的键值存储数据库，被广泛用于缓存、会话存储、消息队列等场景。当单节点Redis无法满足高并发、大容量的需求时，Redis集群成为解决性能瓶颈和数据可靠性问题的关键方案。Redis集群是Redis提供的分布式解决方案，通过将数据分片存储在多个节点上，实现数据的分布式存储和负载均衡。它由多个Redis节点组成，节点之间通过gossip协议进行通信，共同承担数据存
《IP思维》48 农牧学堂一付海涛
《IP思维》（第48节）＃学习《IP思维》助你躺赢未来＃用户对于某些品类的认知天生就很低、决策链路长且复杂，这时，就需要专家IP，向用户传递品类相关的专业知识。对于专业人士，用户天然容易产生信任感。在决策购买前，让用户觉得专家是可靠的，是专业的，是值得信赖的，进而将这份信任关系转移到品牌上，从而购买产品；在决策购买后，通过专业知识，增进私域价值感，延长用户留存率，拉长生命周期价值。农牧行业很多产品
生命是一条艰险的峡谷，只有勇敢的人才能通过。——米歇（三重门）颖嘉_TYJ
【日精进打卡第1513天】姓名：陈颖嘉公司：马来西亚盛和塾【知～学习】✨努力、谦虚、反省、感谢、利他、乐观✨用六项精进来表达我们的生活方式。经典诵读：✨《六项精进》2遍，共2990遍✨《六项精进—通篇》0遍，共15遍✨《大学》2遍，共2990遍✨《六项精进》书籍3遍，共447页✨《经营十二条》书籍2遍，共268页✨《活法》书籍1遍，共224页✨《经营为什么需要哲学》书籍1遍，共192页✨《六项精进
swift5分钟语法速记开发之家 iOS iOS
如果你依然在编程的世界里迷茫，不知道自己的未来规划，小编给大家推荐一个IOS高级交流群：458839238里面可以与大神一起交流并走出迷茫。小白可进群免费领取学习资料，看看前辈们是如何在编程的世界里傲然前行！群内提供数据结构与算法、底层进阶、swift、逆向、整合面试题等免费资料附上一份收集的各大厂面试题（附答案）!群文件直接获取各大厂面试题又把swift相关语法部分看了一遍，并整理了swift语
⚡C++ 有必要学吗？⚡我的家长有话说司空妲命 c++开发语言
在编程教育愈发普及的当下，除了备受关注的Python，C++也进入了许多家长和孩子的视野。作为一门经典且强大的编程语言，C++在系统开发、游戏制作、嵌入式领域等有着广泛应用。然而，对于是否让孩子学习C++，家长们看法不一。有人认为它是通往高端技术领域的钥匙，也有人担忧其较高的学习难度会让孩子望而却步。今天，就让我们深入探讨C++学习的必要性。一、家长眼中的C++：潜力与顾虑交织有人疑惑：“C++现
现状小蓝的练习本
现状是不可能在短时间之内改变的，每个学习者都应该认清这个事实。在成长的过程中，就不会过分追求速度而陷入焦虑。同样，只要你不间断学习，现状也是一定会改变的，这是缓慢的、自然而然的过程。所以也不要失去信心。我们每个人都不应该放弃学习，因为时间不会亏待任何一个努力的人，没有任何知识是无用的，你所学习的，必定会在未来的某个时间回馈于你。
没有天赋，也要相信自己一定能成为黑马！林和森
大家好，我是坚持行动家林和森。这几天，章子怡对一个演员的评论上了热搜，她在《我就是演员3》中表示，她曾尝试各种各样的努力练习舞蹈，感觉都抵不过有天赋的同学，所以她认为表演是需要天赋的，没有天赋的努力毫无意义。你认同吗？有人说：以大多数人的努力程度之低，根本轮不到拼天赋。其实，就算没有天赋，我们也可以在努力的过程中找到自己的特长，我们也可以在学习的过程中变得越来越睿智，我们也可以在不断的刻意练习中越
qsort函数以及模拟不见腊月雪. c语言算法
文章目录概要qsort介绍qsort函数模拟实现小结概要本次我们将要学习一个库函数，该函数可以将你需要排序的数据进行排序，任何类型的数据都可以，比如整形数组，字符数组，或者结构体。并且本章我也会自己写一个函数模拟qsort的实现。qsort函数介绍qsort是一个C语言里面的库函数，它用于将用户指定给它的数据进行排序，它的底层逻辑是使用快速排序算法。函数引用的头文件函数需要包含头文件stdio.h
C语言自定义类型——结构体不见腊月雪. C语言 c语言
目录前言一、结构体类型的声明1.1结构体介绍1.2结构的声明1.3结构的特殊声明二、结构体变量的创建和初始化2.1结构体变量的创建2.2结构体变量的初始化2.3结果的自引用三、结构体成员访问操作符四、结构体内存对齐4.1偏移量4.2对齐规则编辑编辑4.3为什么存在内存对齐4.4修改默认对齐数五、结构体传参总结前言本次学习一种C语言自定义的数据类型——结构体一、结构体类型的声明1.1结构体介绍在C语
人生的下半场从减法开始。辣嘴热评
人到中年更多的时候是学会放下。前半生我们学的是加法。后半生我们学的是减法。这也符合我们现在学习的规律，但这恰恰是我们人生的规律少年时期，我们疯狂的去看这个世界，学各种知识，使我们想学到学，我们不想学到学我们迎接不暇的知识。于是我们在人生的圆满分享中学到了知识，学到了经验，学到了人生的阅历，积攒了人脉，积攒了智慧。人生的下半场要学会适当的放下。断舍离。断了曾经少年的那些想法。舍弃困扰身心的思想重担。
Crash Course：10分钟心理学速成-【第13集】击倒波波 ado_l
链接：https://open.163.com/newview/movie/courseintro?newurl=%2Fspecial%2Fopencourse%2Fcrashcoursepsychology.html重点1、心理学家阿尔伯特·班杜拉实验：观看了女人殴打小丑“波波”的孩子更容易模仿对方的攻击性行为。挑战了那个年代一度处于统治地位的行为主义的观点，即学习仅仅是条件作用和联结建立，奖励
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

第七天 - HDFS概述、命令操作 - JAVA操作HDFS - 集群间时间同步、手动修复

第七天 - HDFS概述、命令操作 - JAVA操作HDFS - 集群间时间同步、手动修复

一、HDFS概述

HDFS概述

HDFS优缺点

HDFS核心思想及作用

重要特性

二、HDFS工作原理

概述

数据读取过程

数据写入过程

Hadoop增删节点

NameNode详解

三、HDFS命令操作

Web监控

使用命令操作HDFS

四、JAVA操作HDFS

JUnit单元测试工具

准备

eclipse编写代码

解决环境问题

编写代码前的准备

编写第一个测试代码，测试连接是否成功

创建多级目录

上传本地文件至hdfs

从hdfs下载文件至本地

HDFSUtil工具类的封装

五、还原快照后的处理

你可能感兴趣的:(学习)