橙以

Hadoop基础知识点汇总简易版

学好hadoop不是一朝一夕的事情此文档简略仅适用于初入门做了解使用，若想深入学习请使用《hadoop权威指南》

hadoop模块：

Hadoop Common：支持其他Hadoop模块的常用实用程序。

Hadoop分布式文件系统（HDFS™）：一种分布式文件系统，可提供对应用程序数据的高吞吐量访问。

Hadoop YARN：作业调度和集群资源管理的框架。

Hadoop MapReduce：基于YARN的系统，用于并行处理大型数据集。（一种计算框架）

Hadoop Ozone： Hadoop的对象存储。（后来新增）

三种运行模式：

本地（独立）模式：

Hadoop配置为以非分布式模式运行，作为单个Java进程。这对调试很有用

伪分布式模式：

Hadoop还可以在伪分布式模式下在单节点上运行，其中每个Hadoop守护程序在单独的Java进程中运行

在一台机器上运行hdfs文件系统，运行mr程序，从hdfs上获取数据，结果存放到hdfs上

完全分布式模式：

运行在多台机器上，同时只有一个hdfs系统

10.12

hdfs体系结构（主、/从结构）

图参照官方文档

namenode：维护命名空间、保存元数据和用户对hdfs的操作、副本数等

管理文件系统命名空间的主服务器,和管理客户端对文件的访问组成,块到DataNode的映射

datanode: 存放实际数据（块）

连接到它们运行的节点的存储

提供来自文件系统客户端的读写请求

执行块的创建，删除

secondarynamenode：辅助namenode进行工作（检查点保存）

hdfs的设计理念

硬件故障是常态而非例外。HDFS实例可能包含数百或数千台服务器计算机，每台计算机都存储文件系统数据的一部分。事实上，存在大量组件并且每个组件具有非平凡的故障概率意味着HDFS的某些组件始终不起作用。

因此，检测故障并从中快速自动恢复是HDFS的核心架构目标。

在HDFS上运行的应用程序需要对其数据集进行流式访问。

它们不是通常在通用文件系统上运行的通用应用程序。HDFS设计用于批处理而不是用户的交互式使用。

重点是数据访问的高吞吐量而不是数据访问的低延迟。

POSIX强加了许多针对HDFS的应用程序不需要的硬性要求。

交易几个关键领域的POSIX语义以提高数据吞吐率。

在HDFS上运行的应用程序具有大型数据集。HDFS中的典型文件大小为千兆字节到太字节。

因此，HDFS被调整为支持大文件。它应该提供高聚合数据带宽并扩展到单个集群中的数百个节点。

它应该在单个实例中支持数千万个文件。

HDFS应用程序需要一个一次写入多次读取的文件访问模型。

除了追加和截断之外，无需更改创建，写入和关闭的文件。支持将内容附加到文件末尾，但无法在任意点更新。该假设简化了数据一致性问题并实现了高吞吐量数据访问。

MapReduce应用程序或Web爬虫应用程序完全适合此模型。

应用程序请求的计算如果在其操作的数据附近执行则更有效。

当数据集的大小很大时尤其如此。这可以最大限度地减少网络拥塞并提高系统的整体吞吐量。

假设通常更好的是将计算迁移到更靠近数据所在的位置，而不是将数据移动到运行应用程序的位置。

HDFS为应用程序提供了接口，使其自身更靠近数据所在的位置。

数据块

存储在hdfs中的最小单位

默认大小128M

这么大的原因：

为了最小化寻址开销，一般寻址时间为10ms，传输速率为100MB/s

为了寻址时间占传输时间的1%，所以。。。。

10.13

元数据：

查看fsimage

整个文件系统命名空间（包括块到文件和文件系统属性的映射）

hdfs oiv -i 要查看的文件名 -o输出的文件名 -p XML

查看edites

文件系统元数据发生的每个更改

hdfs oev -i 要查看的文件名 -o输出的文件名

namenode启动过程

加载fsimage

加载edites

进行检查点保存

等待datanode汇报块信息

datanode启动后

扫描本地块的信息

汇报给namenode

心跳机制

datanode每隔三秒汇报给namenode

检查点（运行时主要由secondarynamenode完成）

它从磁盘读取FsImage和EditLog，将EditLog中的所有事务应用到FsImage的内存中表示，并将此新版本刷新为磁盘上的新FsImage。然后它可以截断旧的EditLog，因为它的事务已应用于持久性FsImage

10.15

机架感知：

检查两台机器是否在同一机架上

NameNode通过Hadoop Rack Awareness中概述的过程确定每个DataNode所属的机架ID 。

一个简单但非最优的策略是将复制品放在独特的机架上。这可以防止在整个机架发生故障时丢失数据，并允许在读取数据时使用来自多个机架的带宽。此策略在群集中均匀分布副本，这样可以轻松平衡组件故障的负载。但是，此策略会增加写入成本，因为写入需要将块传输到多个机架。

副本存放策略：

基于机架感知

当复制因子为3时，HDFS的放置策略是在编写器位于datanode上时将一个副本放在本地计算机上，否则放在随机datanode上，另一个副本放在另一个（远程）机架上的节点上，

最后一个在同一个远程机架的不同节点上。此策略可以减少机架间写入流量，从而提高写入性能。

机架故障的可能性远小于节点故障的可能性; 此策略不会影响数据可靠性和可用性保证。

但是，它确实减少了读取数据时使用的聚合网络带宽，因为块只放在两个唯一的机架而不是三个。

使用此策略时，文件的副本不会均匀分布在机架上。三分之一的副本位于一个节点上，

三分之一的副本位于一个机架上的其他节点，另外三分之一均匀分布在剩余的机架上。此策略可提高写入性能，而不会影响数据可靠性或读取性能。

网络带宽 22

大型HDFS实例在通常分布在许多机架上的计算机群集上运行。不同机架中两个节点之间的通信必须通过交换机。

在大多数情况下，同一机架中的计算机之间的网络带宽大于不同机架中的计算机之间的网络带宽。

数据磁盘故障：

心跳和重新复制

每个DataNode定期向NameNode发送Heartbeat消息。网络分区可能导致DataNode的子集失去与NameNode的连接。

NameNode通过缺少Heartbeat消息来检测此情况。NameNode将DataNodes标记为没有最近的Heartbeats，并且不会将任何新的IO请求转发给它们。注册到死DataNode的任何数据都不再可用于HDFS。

DataNode死亡可能导致某些块的复制因子低于其指定值。NameNode不断跟踪需要复制的块，并在必要时启动复制。由于许多原因可能会出现重新复制的必要性：DataNode可能变得不可用，副本可能会损坏，DataNode上的硬盘可能会失败，标记DataNodes死机的超时是保守的长（默认情况下超过10分钟），以避免由DataNode状态抖动引起的复制风暴。

均衡器

使忙碌的datanode上的块复制到相对空闲的datanode上，确保每个datanode使用率接近集群的使用率

start-balancer.sh

数据的完整性

从DataNode获取的数据块可能已损坏。由于存储设备中的故障，网络故障或有缺陷的软件，可能会发生此损坏。HDFS客户端软件对HDFS文件的内容进行校验和检查。当客户端创建HDFS文件时，它会计算文件每个块的校验和，并将这些校验和存储在同一HDFS命名空间中的单独隐藏文件中。

当客户端检索文件内容时，它会验证从每个DataNode接收的数据是否与存储在关联校验和文件中的校验和相匹配。

如果不是，则客户端可以选择从具有该块的副本的另一个DataNode中检索该块。

文件删除和取消删除:

如果启用了垃圾箱配置，则FS Shell删除的文件不会立即从HDFS中删除。

相反，HDFS将其移动到垃圾目录（每个用户在/user//.Trash下都有自己的垃圾目录）。

只要文件保留在垃圾箱中，文件就可以快速恢复。

最近删除的文件被移动到当前的垃圾箱目录（/user//.Trash/Current），并且在可配置的时间间隔内，HDFS创建了检查点（在/ user / / .Trash / 下）

对于当前垃圾目录中的文件，并在过期时删除旧检查点。有关垃圾箱的检查点，

请参阅FS shell的expunge命令。

它的生命周期在垃圾箱中到期后，NameNode将从HDFS命名空间中删除该文件。

删除文件会导致释放与文件关联的块。

请注意，在用户删除文件的时间与HDFS中相应增加的可用空间之间可能存在明显的时间延迟。

减少复制因子

在副本数大于设定的副本数时进行

当文件的复制因子减少时，NameNode选择可以删除的多余副本。下一个Heartbeat将此信息传输到DataNode。

然后，DataNode删除相应的块，并在群集中显示相应的可用空间。

再一次，setReplication API调用完成与集群中可用空间的出现之间可能存在时间延迟。

块缓存：

预先读取文件的块到内存，用来提升常用文件的读取效率

10.22

写流程：

1.加载配置文件（参照上节课）

2.获取文件系统（参照上节课）

3.创建写入路径（Path）

4.创建输出流

10.23

mapreduce:填空式编程

MapReduce是一个分布式计算框架

分而治之-数据在哪计算在哪

两个阶段

map（映射）阶段

reduce（规约或合并）阶段

MapReduce作业的输入和输出类型：

（输入） - > map - > - > combine - > - > reduce - > （输出）

输入和输出的KV对必须由框架序列化

将结构化对象转换为字节流-----方便在网络传输和写入磁盘

10.25

Mapper

将输入键/值对映射到一组中间键/值对。

将 K1和V1 映射到 K2和V2

映射是将输入记录转换为中间记录的单个任务。

转换后的中间记录不需要与输入记录具有相同的类型。

给定的输入对可能映射到零或多个输出对。

执行一次map只对一行记录进行处理，K1V1和K2V2不需要具有相同类型

Hadoop map - reduce框架为作业的InputFormat生成的每个InputSplit生成一个map任务。

Mapper实现可以通过JobContext.getConfiguration()访问作业的配置。

InputFormat对文件进行切分，一般情况文件有几个块就会被切分成几个InputSplit，每一个InputSplit产生一个map任务，文件130M ，2个块 128M 2M 1.1 InputSplit数是1

InputSplit是逻辑切分

Block是物理的

mapper框架的调用顺序

框架首先调用

setup(org.apache.hadoop.mapreduce.Mapper.Context)，

然后为InputSplit中的每个键/值对调用

map(Object, Object, org.apache. mapreduce. mapper . context)。

最后调用

cleanup(org.apache.hadoop.mapreduce.Mapper.Context)。

与给定输出键关联的所有中间值随后由框架分组，并传递给一个Reducer，以确定最终的输出。

用户可以通过指定两个关键的RawComparator类来控制排序和分组。

map输出按每个reduce进行分区

用户可以通过实现自定义分区器来控制哪个键(以及相应的记录)到哪个Reducer。

用户可以选择通过Job.setCombinerClass(Class)指定一个组合器来执行中间输出的本地聚合，这有助于减少从映射器到还原器的数据传输量。

如果reduce数为零，那么mapper的输出将直接写入OutputFormat，而无需按键排序。

Mapper的组成

setup(Context context)

在任务一开始的时候调用一次

map(KEYIN key, VALUEIN value, Context context)

对于inputslipt中的每个键/值对调用一次。大多数应用程序应该重写它，但是默认的是identity函数。

cleanup(Context context )

在任务结束的时候调用一次

run(Context context)

专家用户专用，以获取完成的控制权

reducer

减少一组中间值，这些中间值与一组较小的值共享一个键。

多个Mapper产生K2V2合并到一起具有相同的K2

reducer主要有三个阶段

1.Shuffle（一部分）：

Reducer通过网络使用HTTP从每个mapper复制排序的输出（K2V2）。

2.Sort：

框架合并按键对reducer输入进行排序(因为不同的mapper可能输出相同的键)。

shuffle和sort阶段是同时发生的，也就是说，在提取输出时，它们是合并的。

SecondarySort ：

要对值迭代器返回的值进行二级排序，应用程序应该使用二级键扩展键并定义一个分组比较器。

键将使用整个键进行排序，但将使用分组比较器进行分组，以决定在同一个调用中发送哪些键和值以进行缩减。

分组比较器是通过Job.setGroupingComparatorClass(Class)指定的。

排序顺序由Job.setSortComparatorClass(Class)控制。

例如，假设您希望找到重复的web页面，并将它们都标记为“最知名”示例的url。你会这样做:

地图输入键:url

地图输入值:文档

地图输出键:文档校验和，url pagerank

地图输出值:url

瓜分者:通过校验和

OutputKeyComparator:通过校验和然后减少pagerank

OutputValueGroupingComparator:通过校验和

3、Reduce

在这个阶段中，对于排序输入中的每个

调用reduce(对象、Iterable、org.apache.hadoop.mapreduce. reduce. context)方法。

reduce任务的输出通常通过上下文写入记录写入器。写(对象,对象)。

总结：

reducer个数由job.setNumReduceTasks(tasks)控制。

程序有多少个输出结果reducer个数，如果没有reducer那么由mapper个数

mapper个数由inputsplit控制，inputsplit数由块数控制

注意：如果一个文件大小小于块大小*1.1 大于块大小有2个块有1个inputsplit

10.26

InputFormat:

InputFormat描述了Map-Reduce作业的输入规范。

Map-Reduce框架依赖于作业的InputFormat:

1.验证job的输入规范。

2.将输入文件分解为逻辑inputsplit，每个inputsplit都被分配给一个单独的mapper。

3.提供RecordReader实现，用于从逻辑InputSplit中收集输入记录，以便mapper进行处理。

基于文件的inputformat(通常是FileInputFormat的子类)的默认行为是根据输入文件的总大小(以字节为单位)

将输入拆分为逻辑inputsplit。但是，输入文件的文件系统块大小被视为输入分割的上限。

可以通过mapreduce.input.fileinputformat.split.minsize设置分割大小的下界。

FileInputFormat:

isSplitable(FileSystem fs, Path filename)

是否切分

getSplits(JobConf job, int numSplits)

获取逻辑切分

TextInputFormat：

FileInputFormat默认使用这个

isSplitable是否可切分

判断是否压缩，如果没有压缩返回true

判断是否属于可以切分的压缩模式，若属于返回true

压缩

文件压缩的两大好处：减少存储文件所需要的磁盘空间，并加速数据网络和磁盘上的传输

详见权威指南99页

压缩格式对于Hadoop平台和MR计算时是透明的，Hadoop能够自动将压缩文件进行解压，不需要我们关心。Hadoop会根据文件扩展名自动选择解码器进行解压，也可以人为的指定输入格式。

压缩算法比较：

压缩格式	split	native	压缩率	速度	是否hadoop自带	linux命令	换成压缩格式后，原来的应用程序是否要修改
gzip	否	是	很高	比较快	是，直接使用	有	和文本处理一样，不需要修改
lzo	是	是	比较高	很快	否，需要安装	有	需要建索引，还需要指定输入格式
snappy	否	是	比较高	很快	否，需要安装	没有	和文本处理一样，不需要修改
bzip2	是	否	最高	慢	是，直接使用	有	和文本处理一样，不需要修改

压缩格式	codec类	算法	扩展名	多文件	splitable	native	工具	hadoop自带
gzip	GzipCodec	deflate	.gz	否	否	是	gzip	是
bzip2	Bzip2Codec	bzip2	.bz2	是	是	否	bzip2	是
lzo	LzopCodec	lzo	.lzo	否	是	是	lzop	否
snappy	SnappyCodec	snappy	.snappy	否	否	是	无	否
LZ4		LZ4	.lz4	否			无

性能对比

压缩格式	压缩比	压缩速率	解压速率
gzip	13.4%	21 MB/s	118 MB/s
lzo	20.5%	135 MB/s	410 MB/s
snappy	22.2%	172 MB/s	409 MB/s
bzip2	13.2%	2.4MB/s	9.5MB/s

LineRecordReader：

将键视为文件中的偏移量，将值视为行。

next（）

给下一个KV赋值

对aa.txt文件可能被分成两个块进行分析分别求奇数偶数行和

如何判断奇偶行？？？

重写TextInputFormat

isSplitable

getRecordReader

重写LineRecordReader

构造方法

编写mapper

编写reducer

编写驱动

注意版本选择老版本的

10.29

RecordReader：

记录阅读器将数据分解为键/值对，以供映射器输入。

Partitioner：

分区键空间。

Partitioner控制中间映射输出键的分区。键(或键的子集)用于派生

分区，通常通过哈希函数。分区的总数与任务的reduce任务的总数相同。因此,控制

哪个m reduce任务的中间键(因此记录)被发送到reduce任务。

getPartition获取分区的数量一定要小于等于reduce任务数

shuffle：

将map输出作为输入传递给reduce的过程：详情见权威指南7.3-------》详详情见源码

将map方法的结果写入到缓冲区

进行分区排序溢写到磁盘

合并到磁盘

reduce端请求数据（分区好的数据）

reduce端进行合并

传递给reduce方法

10.30

combiner：

称为map端reduce

减少磁盘IO和网络带宽的使用

如果实现combiner，继承reducer类，一般情况下和自定义的reducer为同一个类

10.31

WritableComparable:

writablecom可以相互比较，任何类型想要被当成hadoop

map-reduce框架的key需要实现此接口

11.01

yarn:

是hadoop的集群资源管理系统，hadoop2之后引进，入了支持mapreduce还支持其他的计算框架

运行机制：

参照权威指南79

与jobtracker和tasktracker相比

可扩展性：

mapreduce 1节点数4000，任务数4000达到瓶颈，yarn节点数10000，任务数100000

可用性：

守护进程失败，可以快速恢复工作

利用率：

mapreduce 1里面是固定分配资源的，yarn动态分配资源

三种调度策略（调度器）

FIFO：先进先出排队执行

容器调度器：

公平调度器：

mapreduce作业运行机制：权威指南185

运行job

向资源管理器请求一个新的应用id

将作业所需的资源上传到共享文件系统

提交作业

调度器分配一个容器，资源管理器在节点管理器帮助下启动一个app master

初始化作业

在共享文件系统获取输入分片

请求资源管理器分配资源

启动其他节点的容器为了map任务和reduce任务

获取共享文件系统里面的资源（作业的配置、jar文件等）

执行map任务和reduce任务

11.02

hadoop HA(高可用)

Quorum Journal Manager:

以共享活动和备用NameNode之间的编辑日志

影响了HDFS集群（导致namenode发生故障）

对于计划外事件（例如计算机崩溃），在操作员重新启动NameNode之前，群集将不可用。

计划维护事件（如NameNode计算机上的软件或硬件升级）将导致群集停机时间窗口。

注意：必须至少有3个JournalNode守护进程，因为编辑日志修改必须写入大多数JN。

这将允许系统容忍单个机器的故障。您也可以运行3个以上的JournalNodes，但为了实际增加系统可以容忍的失败次数，您应该运行奇数个JN（即3,5,7等）。

请注意，当使用N个JournalNodes运行时，系统最多可以容忍（N-1）/ 2个故障并继续正常运行。

ZooKeeper

致力于开发和维护开源服务器，实现高度可靠的分布式协调

故障检测

活跃的NameNode选举

ZKFailoverController (ZKFC)是一个新的组件，它是一个动物管理员客户端，还监控和管理NameNode的状态。

每个运行NameNode的机器也运行ZKFC, ZKFC负责:

Health monitoring

zookeeper会话管理

ZooKeeper-based选举

11.05

zookeeper:

是hadoop的分布式协调服务

特点：

是简单的 核心是精简的文件系统

富有表现力的 用于实现多种协调数据结构协议，包括：分布式队列、分布式锁、一组节点的领导者选举

高可用性

松耦合交互方式

资源库

高性能

zookeeper服务有两种不同运行模式：

一种是独立模式即只有一个zookeeper服务器。比较适合测试环境，但是不能保证高可用性和可恢复性。

一种是在生产环境中的zookeeper通常以复制模式运行在一个计算机集群上，这个计算机集群通常被称为集合体。通常使用复制来实现高可用性，只要集合体重半数以上的机器处于可用状态，就能提供服务。

在zookeeper设计中，以下几点考虑保证了数据一致性：

顺序一致性来自任意特定客户端的更新都会按其发送顺序被提交
原子性每个更新要么成功要么失败，如果一个更新失败则不会有客户端看到这个更新结果。
单一系统映象一个客户端无论连接到哪一台服务器，它看到的都是同样的系统视图。
持久性一个更新一旦成功，其结果就会持久存在且不会被撤销，表明更新不会受到服务器故障的影响。
及时性任何客户端所看到的滞后系统视图都是有限的，不会超过几十秒。

你可能感兴趣的:(简易hadoop知识点大纲)

深入解析：构建高效单页应用（SPA）的最佳实践与示例布兰妮甜 #Vue 单页应用 SPA Vue.js 前端
文章目录前言一、单页应用（SPA）的介绍二、单页应用（SPA）的优势三、构建单页应用（SPA）的基本步骤四、使用Vue.js构建一个简易的单页应用（SPA）：任务管理器结语前言随着互联网技术的发展，用户对于网页应用的交互性和响应速度提出了更高的要求。传统的多页面应用（MPA）在每次用户交互时需要重新加载整个页面，这不仅增加了服务器的负担，也降低了用户体验。而单页应用（SinglePageAppli
机器学习(二) 本文(2.5万字) | KNN算法原理及Python复现 | 小酒馆燃着灯机器学习算法 k近邻算法
文章目录一KNN算法原理二KNN三要素三机器学习中标准化四KNN分类预测规则五KNN回归预测规则六KNN算法实现方式七KDTree7.1构造KDtree7.2KDtree查找最近邻八KNN特点九KNN算法实现案例一案例二1.机器学习2.深度学习与目标检测3.YOLOv54.YOLOv5改进5.YOLOv8及其改进6.Python与PyTorch7.工具8.小知识点9.杂记一KNN算法原理K近邻分类
pdf怎么转换成word？解锁 PDF 转 Word 的高效转换方法，轻松搞定的实用指南 hello_simon 在线工具 php 工具效率 pdf word PDF转word pdf转换
PDF转换成Word的简易指南在日常的工作和学习中，我们经常需要将PDF文件转换为Word文档，以便于编辑和修改。今天，我将为大家介绍一个简单的方法，利用小白工具网站，轻松实现PDF到Word的转换。一、访问小白工具网站首先，打开你的浏览器，输入网址：https://www.xiaobaitool.net/files/pdf-word/，进入小白工具的PDF转Word页面。这个网站提供了一个在线转
Kubernetes集群版本升级后端java
集群升级注意事项升级集群版本建议逐步升级，比如v1.20.1–>v1.21.1–>v1.22.1–>v1.23.1–>v1.24.1，不能跨度过大，否则会报错。升级步骤查看集群版本[root@hadoop102~]#kubectlgetnodesNAMESTATUSROLESAGEVERSIONhadoop102Ready,SchedulingDisabledcontrol-plane,maste
Docker 构建 nginx-redis-alpine 项目详解 TechStack 创行者 #服务器容器 Linux docker 容器运维 nginx redis
Docker构建nginx-redis-alpine项目详解一、课程概述嘿，朋友们！今天咱们要深入探索一个超级实用的项目——nginx-redis-alpine！这个项目可不简单，它包含了好多重要的知识点，像文件目录结构、核心文件的作用及配置、自签名证书的生成，还有镜像构建和容器运行等等。我保证，跟着我一步步走，你就能彻底搞懂这个项目的实现原理和各种应用场景，让你在Docker世界里更加游刃有余！
【H2O2 | 软件开发】事件循环机制过期的H2O2 【H2O2】全栈面试题前端 javascript
目录前言开篇语准备工作正文概念流程事件队列类型示例结束语前言开篇语本系列为短篇，每次讲述少量知识点，无需一次性灌输太多的新知识点。该主题文章主要是围绕前端、全栈开发相关面试常见问题撰写的，希望对诸位有所帮助。准备工作概念篇，不对开发环境作要求。正文概念事件循环（EventLoop）是处理异步事件的一种机制，特别是在单线程环境中（如JavaScript在浏览器或Node.js中的运行）。它允许程序在
【H2O2 | 软件开发】Axios发送Http请求过期的H2O2 【H2O2】全栈面试题 Vue3 前端 http 交互 Axios
目录前言开篇语准备工作正文概念封装工具包示例结束语前言开篇语本系列为短篇，每次讲述少量知识点，无需一次性灌输太多的新知识点。该主题文章主要是围绕前端、全栈开发相关面试常见问题撰写的，希望对诸位有所帮助。如果您需要为面试八股文做准备，笔者建议重点关注加粗强调部分，它们是概念中的关键词。准备工作软件：【参考版本】VisualStudioCode第三方js库（框架）：【参考版本】Vue3，Axios（v
百度官方！打造「大模型全开发周期系列课程」，AI应用开发入门课率先发布！（内含英雄帖）
在这个大模型技术日新月异的时代，AI的潜力正被无限释放，改变着我们的工作和生活方式。你是否渴望成为这场变革的参与者？你是否也想在这个大模型时代中抢占先机？那“学习AI”、“使用AI”、“入局AI”我们真的可以受益吗？学习辅助：将AI使用融入学习当中，依据当前学习情况，整理重点难点，让复习有的放矢，更高效掌握知识点。效率提升：帮助处理繁琐重复的工具，如数据分析师使用AI识别数据中的关键信息，自动整理
Linux C++ 编程死锁详解 PM简读馆 Linux嵌入式驱动开发开发语言 c++linux
作者简介：程序员转项目管理领域优质创作者个人邮箱：[[email protected]]PMP资料导航：PM菜鸟（查阅PMP大纲考点）座右铭：上善若水，水善利万物而不争。绿泡泡：PM简读馆（包含更多PM常用免费资料）目录概要一、死锁的四个必要条件二、常见死锁场景三、代码解释1、资源申请顺序不一致问题描述解决方案2.优先级倒置问题描述解决方案3.线程间循环等待问题描述解决方案4.锁嵌套（LockNe
Linux之bash常用命令 Ssaty. linux bash unix
第1关：linux之bash常用命令基本知识任务描述本关任务：根据基本知识点，回答一些选择题。相关知识为了完成本关任务，你需要掌握：1.Linux简单介绍2.Linux的优缺点3.操作系统介绍4.UNIX操作系统5.MINIX操作系统6.GNU计划7.POSIX标准8.程序学习方法9.为什么学习Linux10.Linux发展历史Linux简单介绍Linux核心理念：万物皆文件。Linux：是一个内
C语言入门（大一笔记）函数篇考不上贰幺幺不改名 C语言笔记 c语言程序设计编程语言
第七章C语言函数前言一、基础知识点7.1什么是函数？概念我们将常用的代码以固定的格式封装（包装）成一个独立的模块，只要知道这个模块的名字就可以重复使用它，这个模块就叫做函数（Function）。用比较字符串大小的函数讲解函数的封装以及一些注意事项。库函数和自定义函数C语言自带的函数称为库函数（LibraryFunction）。库（Library）是编程中的一个基本概念，可以简单地认为它是一系列函数
鸿蒙(HarmonyOS)应用开发实战——数据库版本升级案例 CTrup 移动开发鸿蒙开发 HarmonyOS harmonyos 数据库华为鸿蒙开发装饰器模式 ArkUI 前端
往期推文全新看点学鸿蒙开发的优劣势，你清楚吗？建议你了解一下！鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中…
C#WPF的相关知识点 Documentlv C#wpf c#开发语言 windows
学习C#WPF的路线了解C#编程基础熟悉WPF界面设计原理掌握WPF控件的使用学习数据绑定和MVVM架构深入理解WPF动画和转换效果学习WPF中的多媒体和图形绘制掌握WPF中的布局和控件模板学习WPF中的自定义控件和样式了解C#编程基础如果你想开始学习C#编程语言，这里是一些关键的基础知识，可以帮助你快速上手。C#是什么C#是一种通用的、面向对象的编程语言，由微软公司开发。它在.NET框架上运行，
vue中修改子组件样式 dengling4813 javascript ViewUI
一、问题叙述项目里需要新添加一个表单页面，里面就只是几个select,这个几个select是原本封装好的组件，有自己原本的样式，而这次的原型图却没有和之前的样式统一起来，需要微调一下，这里就涉及到父组件修改子组件的样式。不想混用本地和全局样式，所以选择了>>>，但是并不起作用，就换成/deep/，其实到这里我也没有继续深入这个知识点，因为在浏览器里预览后已经实现了原型图的样式，直到打包在手机上测试
Hive高级SQL技巧及实际应用场景小技工丨大数据随笔 sql hive 数据仓库大数据
Hive高级SQL技巧及实际应用场景引言ApacheHive是一个建立在Hadoop之上的数据仓库基础设施，它提供了一个用于查询和管理分布式存储中的大型数据集的机制。通过使用类似于SQL（称为HiveQL）的语言，Hive使得数据分析变得更加简单和高效。本文将详细探讨一些Hive高级SQL技巧，并结合实际的应用场景进行说明。HiveSQL的高级使用技巧1.窗口函数描述：窗口函数允许我们在不使用GR
ctfshow做题笔记—前置基础—pwn13~pwn19 Yilanchia 笔记学习
文章目录前言一、pwn13二、pwn14三、pwn15(编译汇编代码到可执行文件，即可拿到flag)四、pwn16(使用gcc将其编译为可执行文件)五、pwn17六、pwn18七、pwn19(关闭了输出流，一定是最安全的吗?)前言记录一下pwn13~pwn19,巩固一下学到的知识。一、pwn13知识点：如何使用GCCgccmain.c-oprogram·gcc是调用GCC编译器的命令。·-opro
华为工程师带你实战C++：专业深度全面完整 6v6-博客华为 c++java
华为工程师带你实战C++：专业深度全面完整本课程以实战为主，课上全部代码均为边讲边手敲，学完此套课程，可以达到一个C++中高级开发者的水平。既适合于刚刚入门有一定的语言基础的人，也适合于有一定的开发经验的人。课程大纲第1章：C++基础与提高1-1C++学习开山篇1-2C到C++类型安全增强1-3Cout格式输出，函数重载初步1-4函数重载原理1-5C++运算符重载初步1-6C++函数默认参数1-7
计算机组成原理知识点精汇（一）计算机基础知识 A.sir啊计算机组成原理计算机组成原理冯诺依曼硬件架构 CPU
一、冯·诺伊曼计算机的特点(1)计算机由运算器、控制器、存储器、输人设备和输出设备五大部件组成。(2)程序和数据存放在同一存储器中，并按地址寻访。(3)指令和数据均采用二进制运算。(4)指令由操作码和地址码组成，操作码用来表示操作的类型，地址码用来表示操作数和操作结果的地址。(5)机器以运算器为核心，输人输出设备与存储器之间的数据传送都要通过运算器。二、机器字长CPU一次操作中能够处理的数据的位数
【自学笔记】讯飞星火基础知识点总览-持续更新 Long_poem 笔记
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录讯飞星火基础知识点总览一、讯飞星火简介二、核心功能1.语音识别2.自然语言处理3.知识图谱4.星火API三、基础概念1.AI模型2.数据处理3.交互方式四、应用场景示例1.办公场景2.学习场景3.生活场景五、总结总结讯飞星火基础知识点总览一、讯飞星火简介讯飞星火是科大讯飞推出的一款强大的AI技术平台，它集成了语音识别、自然语言
2024年5月份架构师考试论文真题完整版 Zoi Gil(学习) 大数据 flink hdfs hadoop python
三、论文1.关于大数据的，Lambda架构文老师押中了原题，几乎描述一致撰写关于Lambda架构的软考论文时，一个清晰且结构化的大纲是成功的关键。以下是一个简单的论文大纲示例，旨在覆盖Lambda架构的核心概念、设计原则、优缺点、实际应用案例以及对比其他架构（如Kappa架构）的分析：大纲简要介绍Lambda架构的基本概念及其在大数据处理领域的地位。概述论文的主要研究内容、目的及预期贡献。背景介绍
计算机组成原理与系统结构知识点总结-简答题3【中央处理器+Flynn分类法+指令级并行+线程级并行-多处理机】 Geometry Fu 计算机组成原理与系统结构算法
中央处理器42.流水线中有哪三种冒险？请简述，并至少举出一种解决冒险的方法。结构冒险：需要的资源被占用（硬件资源冲突）。将指令和数据分别存储；设计指令/数据高速缓存。数据冒险：需要等待前面指令完成其读写操作。转发（旁路）；代码重排；阻塞和冒泡。控制冒险：根据前面正在执行的指令决策控制操作。静态分支预测；动态分支预测；分支延迟。Flynn分类法43.请简述Flynn分类法将计算机系统结构分成哪四类。
Python面试题：如何在 Python 中反转一个字符串？超哥同学 Python系列 python windows 开发语言面试编程
在Python中反转一个字符串有多种方法，下面详细介绍几种常用的方法，并扩展相关的知识点。方法1：使用切片Python的切片（slice）功能强大，反转字符串可以通过负步长实现。#示例original_string="hello"reversed_string=original_string[::-1]print(reversed_string)#输出:"olleh"解释：original_str
Netty基础—4.NIO的使用简介二东阳马生架构 Netty应用与源码 Netty 网络 java
大纲1.Buffer缓冲区2.Channel通道3.BIO编程4.伪异步IO编程5.改造程序以支持长连接6.NIO三大核心组件7.NIO服务端的创建流程8.NIO客户端的创建流程9.NIO优点总结10.NIO问题总结4.伪异步IO编程(1)BIO的主要问题(2)BIO编程模型的改进(3)伪异步IO编程(4)伪异步IO的问题(5)伪异步IO可能引起的级联故障(1)BIO的主要问题BIO的主要问题在于
hive 数字转换字符串_Hive架构及Hive SQL的执行流程解读 weixin_39756416 hive 数字转换字符串
1、Hive产生背景MapReduce编程的不便性HDFS上的文件缺少Schema(表名，名称，ID等，为数据库对象的集合)2、Hive是什么Hive的使用场景是什么？基于Hadoop做一些数据清洗啊(ETL)、报表啊、数据分析可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。Hive是SQL解析引擎，它将SQL语句转译成M/RJob然后在Hadoop执行。由Facebook开源，
UniApp生命周期完全指南」：从应用启动到页面卸载，全过程详细解读「UniApp新手教程」：学会应用、页面与组件生命周期，开发更高效的跨平台应用 UniApp生命周期最全解析！手把手带你构建一个高南北极之间小程序 uni-app 前端 javascript vue.js 微信小程序小程序 uniapp
博客正文UniApp生命周期新手教程：从应用到组件，轻松掌握每个环节UniApp的生命周期函数是每个开发者必须掌握的重要知识点，它不仅帮助我们管理页面和数据，还可以提升应用的性能和用户体验。这篇文章将详细讲解UniApp的应用生命周期、页面生命周期和组件生命周期，并通过代码示例，带你逐步理解如何在实际开发中灵活运用这些生命周期函数。目录什么是生命周期？应用生命周期onLaunchonShowonH
neo4j图数据库坐吃山猪数据库 neo4j 数据库
neo4j图数据库学习neo4j图数据库的使用文章目录neo4j图数据库@[toc]1-核心知识点2-思路整理3-参考网址4-上手实操1-安装neo4j-docker2-要学习CQL语句3-解决cmake问题1-可能的原因及解决办法1.`cmake`未正确安装或者版本不兼容2.依赖库缺失3.环境变量配置问题4.网络问题2-具体操作步骤1.安装`cmake`2.安装VisualStudioC++构建
蓝桥杯Python组知识点好好学习、天天向上。 python 蓝桥杯算法
文章目录一、基础知识1.基本输入输出2.字符列表连接3.字母的大小写转换4.匿名函数lambda5.进制转换6.字符与整型之间的转换7.格式化保留小数点后几位小数8.列表排序9.str的内建函数10.list的内建函数二、常用内置模块1.阶乘factorial2.计数器Counter3.默认字典defaultdict4.双端队列deque5.全排列permutations6.组合combinati
【蓝桥杯备赛】Day07:循环结构程序设计（上）凯强同学蓝桥杯蓝桥杯 python
题目1:题目1151:C语言训练-计算一个整数N的阶乘计算一个整数N的阶乘输入格式一个整数N,(00.05:print('better')elifj-list1[i]>0.05:print('worse')else:print('same')知识点1.list.append():列表末尾补充元素
关于std::vector＜std::string＞的操作 android framework c++和ndk开发 c++算法开发语言
知识点1std::vectorstd::string作为返回参数voidGetConfigState(std::vectorstd::string&vtTemp)2对于std::vectorstd::string取值操作std::vectorstd::string::iteratortheIterator;for(theIterator=vtTemp.begin();theIterator!=vt
中级软件设计师2004-2024软考真题合集下载凡间晨光资源分享资源分享软考
中级软件设计师2004-2024软考真题合集下载资源亮点适用人群资源使用指南资源获取方式资源亮点「中级软件设计师历年真题及答案解析（2004-2024）」是全网最全、最新的备考资料合集，包含：21年完整真题（2004-2024年共42套）详细答案解析（含考点标注+解题思路）高频考点汇总（覆盖数据流图、设计模式等核心模块）考试大纲对照（2024版最新大纲匹配）适用人群✅正在备考软考中级的在职人员✅计
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end