Jones_aj

Hadoop大数据技术原理与运用学习笔记

Hadoop学习过程中的一些笔记

参考书籍《Hadoop大数据技术原理与应用》清华大学出版社黑马程序员/编著

1.什么是大数据？大数据的四个特征是什么？

答：一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合

具有海量数据规模、快速数据流转、多样数据类型一级价值密度四大特征。

2.另外，在Hadoop架构里面，元数据的含义是什么？

答：文件的大小、位置、权限

3.本书里面使用的Hadoop是哪个发行版本？

答：apache版本，优点：版本更迭快；缺点：更迭快带来的版本维护、兼容性、补丁不周到。

4.在1.x版本中，namenode和datanode作用？

答：namenode：集群中的主节点，管理元数据，主要用于管理集群中的各种数据；

datanode：集群当中的从节点，主要用于储存集群当中的各种数据。

配置集群时的一些命令：

ssh-keygen -t rsa //启用ssh

ssh-copy-id hadoop01

chkconfig iptables off //关防火墙

mac地址文件

# vi /etc/udev/rules.d/70-persistent-net.rules

第三章HDFS

Hadoop的核心是HDFS和MapReduce。其中，HDFS是解决海量大数据文件存储的问题，是目前应用最广泛的分布式文件系统。

HDFS 源于 Google 在2003年10月份发表的GFS（Google File System）论文。

解决传统文件储存瓶颈问题--》纵向扩容：加磁盘和内存。横向扩容：增加服务器数量。

基本概念：HDFS（Hadoop Distributed Filesystem）是一个易于扩展的分布式文件系统，运行在成百上千台低成本的机器上。它与现有的分布式文件系统有许多相似之处，都是用来存储数据的系统工具，而区别于HDFS具有高度容错能力，旨在部署在低成本机器上。HDFS主要用于对海量文件信息进行存储和管理，也就是解决大数据文件（如TB乃至PB级）的存储问题。

Namenode：NameNode是HDFS集群的主服务器。一旦NameNode关闭，就无法访问Hadoop集群。NameNode主要以元数据的形式进行管理和存储，用于维护文件系统名称并管理客户端对文件的访问；NameNode记录对文件系统名称空间或其属性的任何更改操作；HDFS负责整个数据集群的管理，并且在配置文件中可以设置备份数量，这些信息都由NameNode存储。

Datanode：DataNode是HDFS集群中的从服务器。文件系统存储文件的方式是将文件切分成多个数据块，这些数据块实际上是存储在DataNode节点中的，因此DataNode机器需要配置大量磁盘空间。它与NameNode保持不断的通信，DataNode在客户端或者NameNode的调度下，存储并检索数据块，对数据块进行创建、删除等操作，并且定期向NameNode发送所存储的数据块列表。

Block：每个磁盘都有默认的数据块大小，这是磁盘进行数据读/写的最小单位，HDFS同样也有块（block）的概念，它是抽象的块，而非整个文件作为存储单元，在Hadoop2.x版本下，默认大小是128M，且备份3份，每个块尽可能地存储于不同的DataNode中。按块存储的好处主要是屏蔽了文件的大小，提供数据的容错性和可用性。

Rack：是用来存放部署Hadoop集群服务器的机架，不同机架之间的节点通过交换机通信，HDFS通过机架感知策略，使NameNode能够确定每个DataNode所属的机架ID，使用副本存放策略，来改进数据的可靠性、可用性和网络带宽的利用率。

元数据：元数据从类型上分可分三种信息形式，一是维护HDFS文件系统中文件和目录的信息，二是记录文件内容存储相关信息，三是用来记录HDFS中所有DataNode的信息，用于DataNode管理。

HDFS优缺点

优点：高容错、流式数据访问、支持超大文件高数据、吞吐量

缺点：高延迟、不适合小文件存取、不适合并发写入

HDFS的架构和原理

HDFS存储架构

HDFS采用主从架构（Master/Slave架构）。HDFS集群是由一个NameNode和多个的 DataNode组成。

HDFS文件读写原理：Client（客户端）对HDFS中的数据进行读写操作，分别是Client从HDFS中查询数据，即Read（读）数据；Client从HDFS中存储数据，即为Write（写）数据。

HDFS写数据原理HD

客户端发起上传文件请求，通过RPC (远程过程调用)与NameNode建立通讯。
NameNode检查元数据文件的系统目录树。
若系统目录树的父目录不存在该文件相关信息，返回客户端可以上传文件。
客户端请求上传第一个Block数据块以及数据块副本的数量。
NameNode检测元数据文件中DataNode信息池，找到可用的数据节点。
NameNode检查元数据文件的系统目录树。
若系统目录树的父目录不存在该文件相关信息，返回客户端可以上传文件。
DataNode之间建立Pipeline后，逐个返回建立完毕信息。
客户端与DataNode建立数据传输流，开始发送数据包。
客户端向DataNode_ 01.上传第一个Block数据块，当DataNode_ _01收到一个Packet就会传给DataNode 02，DataNode_ 02传给DataNode_ 03，DataNode 01每传送一个Packet都会放入一个应答队列等待应答。
数据被分割成一个个Packet数据包在Pipeline. 上依次传输，而在Pipeline反方向上，将逐个发送Ack,最终由Pipeline中第- -个DataNode节点DataNode 01将Pipeline的Ack信息发送给客户端。
DataNode返回给客户端，第一个Block块传输完成。客户端则会再次请求NameNode.上传第二-个Block块和第三块到服务器上，重复上面的步骤，直到3个Block都.上传完毕。

HDFS读数据原理

客户端向NameNode发起RPC请求,来获取请求文件Block数据块所在的位置。
NameNode检测元数据文件，会视情况返回Block块信息或者全部Block块信息，对于每个Block块，NameNode都会返回含有该Block副本的DataNode地址。
客户端会选取排序靠前的DataNode来依次读取Block块，每一个Block都会进行CheckSum若文件不完整，则客户端会继续向NameNode获取下一-批的Block列表，直到验证读取出来文件是完整的，则Block读取完毕。
客户端会把最终读取出来所有的Block块合并成一个完整的最终文件(例如: 1.txt) 。

第四章MapReduce

1.MapReduce核心思想：“分而治之”

Map阶段：任务分解（小任务之间没有必然的依赖关系，可以单独执行）

Reduce阶段：合并任务，把Map阶段的结构进行全局汇总。

2.MapReduce编程模型

处理大规模数据集并行运算。借鉴函数式程序设计语言思想进行，分为

Map（）和Reduce（）两个函数

编程实列--词频统计

3.MapReduce工作原理

分片、格式化数据源

分片：将源文件划分为大小相等的小数据块（默认128M），Hadoop会为每个分片构建一个Map任务-->执行自定义map（）函数，来处理切片每条记录；

格式化：；

执行MapTask（四个阶段）

Map任务有一个内存缓冲区（100M），分片数据经过Map任务的中间数据会写入，达到阈值（80M）启动一个线程，写入磁盘，在溢写过程中，MapReduce会对Key进行排序，如果中间结果比较大会形成多个溢写文件----》最后合并为一个；

①Read阶段：MapTask通过RecordReder类，从输入的InputSplit中解析出一个个Key/value

②Map阶段：将解析出的键值对交给map()函数处理，产生一系列新的key/value

③Collect阶段：map（）处理完后一般调用outputCollector.collect()输出结果，在函数内部，生成新的key/value分片（通过调用partitioner），并写入环形内存缓冲区

④Spill阶段：溢写，环形内存缓冲区满后，写入磁盘（这之前进行本地排序，必要是对数据合并、压缩的操作），生成临时文件，

⑤Combiner阶段：最终合并

执行Shuffle过程

Shuffle工作原理

Map阶段

(1) MapTask处理的结果会暂且放人一个内存缓冲区中(该缓冲区默认大小是100MB) ,当缓冲区快要溢出时(默认达到缓冲区大小的80%),会在本地文件系统创建一个溢出文件,将该缓冲区的数据写入这个文件。

(2)写盘之前,线程会根据reduceTask的数量,将数据分区,一个Reduce任务对应一个分区的数据。这样做能避免有些reduce任务分配到大量数据,而有些reduce任务分到很少的数据,甚至没有分到数据的情况。

(3)分完数据后,排序每个分区的数据,如果设置了Combiner,将会对排序后的结果进行Combine操作,这样做能尽可能少地执行数据写盘的操作。

(4)当Map任务输出最后一个记录时,可能有很多溢出文件,这时需要将这些文件合并，合并的过程中会不断地进行排序和Combine操作,其目的有两个：一是尽量减少每次写盘的数据量;二是尽量减少下一复制阶段网络传输的数据量。最后合并成了一个已分区且已排序的文件。

Reduce阶段

(1) Reduce 会接收到不同map任务传来的数据,并且每个map传来的数据都是有序的。如果Reduce阶段接收的数据量相当小，则直接存储在内存中,如果数据量超过了该缓冲区大小的一定比例,则对数据合并后溢写到磁盘中。
(2)随着溢写文件的增多,后台线程会将它们合并成一个更大的有序的文件,这样做是为了给后面的合并节省时间。
(3)合并的过程中会产生许多的中间文件(写入磁盘了),但MapReduce会让写入磁盘的数据尽可能地少,并且最后- -次合并的结果并没有写人磁盘,而是直接输人到reduce函数。

ReduceTask原理

①Copy阶段：Reduce从各个MapTask上远程拷贝一片数据，并针对某一片数据，如果其大小超过一定阈值,则写到磁盘上,否则直接放到内存中。

②Merge阶段：在远程复制数据的同时,ReduceTask会启动两个后台线程,分别对内存和磁盘上的文件进行合并,以防止内存使用过多或者磁盘文件过多。

③Sort阶段：用户编写reduce()方法输人数据是按key进行聚集的一组数据。为了将key相同的数据聚在一起,Hadoop采用了基于排序的策略。由于各个MapTask已经实现对自己的处理结果进行了局部排序,因此,ReduceTask只需对所有数据进行一次归并排序即可。

④Reduce阶段：对排序后的键值对调用reduce()方法,键相等的键值对调用一次reduce()方法，每次调用会产生零个或者多个键值对,最后把这些输出的键值对写人到HDFS中。

⑤Write阶段：reduce()函数将计算结果写到HDFS上。

写入文件

传入OutputFormat

第五章 Zookeeper

Apache Zookeeper旨在减轻构建健壮的分布式系统的服务。Zookeeper是基于分布式计算的核心概念而设计的，主要目的是给开发人员提供一套容易理解和开发的接口，从而简化分布式系统构建的服务。

Zookeeper是一个分布式协调服务的开源框架，它是由Google的Chubby开源实现。Zookeeper主要用来解决分布式集群中应用系统的一致性问题和单点故障问题

Zookeeper特性

Zookeeper具有全局数据一致性、可靠性、顺序性、原子性以及实时性，可以说Zookeeper的其他特性都是为满足Zookeeper全局数据一致性这一特性。

Zookeeper集群角色

Zookeeper集群是一个主从集群，它一般是由一个Leader（领导者）和多个Follower（跟随者）组成。此外，针对访问量比较大的Zookeeper集群，还可新增Observer（观察者）。Zookeeper集群中的三种角色各司其职，共同完成分布式协调服务。

Leader：事务性请求（写操作）唯一调度者和处理者保证事务处理顺序性，负责进行投票的发起和决议，以及更新系统状态。

Follower：处理客服端非事务性（读操作）请求，接送事务性请求给leader处理，参与投票。

Observer：观察zookeeper集群最新状态变化，并将状态同步，可独自处理非事务性请求，事务性请求给leader处理

数据模型

Zookeeper是由节点组成的树，树中的每个节点被称为—Znode。每个节点都可以拥有子节点。每一个Znode默认能够存储1MB的数据（小数据），每个Znode都可以通过其路径唯一标识。

Zookeeper数据模型中每个Znode都是由三部分组成，分别是stat（信息）、data、children（子节点）。

Znode的类型在创建时被指定，一旦创建就无法改变。

Znode有两种类型

临时节点：该生命周期依赖于创建它们的会话，一旦会话结束，临时节点将会被自动删除，也可以手动删除。虽然每个临时的Znode都会绑定一个客户端，但它们对所有的客户端还是可见的。需要注意的是临时节点不允许拥有子节点。

永久节点：该生命周期不依赖于会话，并且只有在客户端显示执行删除操作的时候，它们才能被删除。

Znode的属性

属性名称	相关说明
czxid	节点被创建的时间
ctime	节点最后一次的修改的Zxid值
mzxid	节点最后一次的修改时间
mtime	与该节点的子节点最后一次修改的Zxid值
pZxid	子节点被修改的版本号
cversion	节点被创建的时间

属性名称	相关说明
dataVersion	数据版本号
aclVersion	ACL版本号
ephemeralOwner	如果此节点为临时节点，那么该值代表这个节点拥有者的会话ID；否则值为0
dataLength	节点数据域长度
numChildren	节点拥有的子节点个数

Zookeeper的Watcher机制

在ZooKeeper中，引入了Watch机制来实现这种分布式的通知功能。ZooKeeper允许客户端向服务端注册一个Watch监听，当服务端的一些事件触发了这个Watch，那么就会向指定客户端发送一个事件通知，来实现分布式的通知功能。

Watch机制的特点

一次性触发、事件封装、异步发送、先注册再触发

Watch机制的通知状态和事件类型

Zookeeper的选举机制

Zookeeper为了保证各节点的协同工作，在工作时需要一个Leader角色，而Zookeeper默认采用FastLeaderElection算法，且投票数大于半数则胜出的机制。

服务器ID：设置集群myid参数时，参数分别为服务器1、服务器2、服务器3，编号越大FastLeaderElection算法中权重越大。

选举ID：选举过程中，Zookeeper服务器有四种状态，分别为竞选状态、随从状态、观察状态、领导者状态。

数据ID：是服务器中存放的最新数据版本号，该值越大则说明数据越新，在选举过程中数据越新权重越大。

逻辑时钟：逻辑时钟被称为投票次数

选举机制的类型

假设有5台编号分别是1 ~ 5的服务器，全新集群选举过程如下:

全新集群选举：

步骤1:服务器1启动，先给自己投票;其次,发投票信息，由于其它机器还没有启动所以它无法接收到投票的反馈信息，因此服务器的状态一直属于竞选状态。

步骤2:服务器2启动，先给自己投票;其次,在集群中启动Zookeeper服务的机器发起投票对比，它会与服务器1交换结果，由于服务器2编号大，服务器2胜出，服务器1会将票投给服务器2,此时服务器2的投票数并没有大于集群半数，两个服务器状态依旧是竞选状态。

步骤3:服务器3启动，先给自己投票;其次，与之前启动的服务器1、2交换信息，服务器3的编号最大，服务器3胜出，服务器1、2会将票投给服务器3，此时投票数正好大于半数，所以服务器3成为领导者状态,服务器1、2成为追随者状态。

步骤4:服务器4启动，先给自己投票;其次，与之前启动的服务器1、2、3交换信息，尽管服务器4的编号大，但是服务器3已经胜，所以服务器4只能成为追随者状态。

步骤5:服务器5启动，同服务器4-样，均成为追随者状态。

非全新集群选举：

步骤1:统计逻辑时钟是否相同，逻辑时钟小，则说明途中可能存在宕机问题,
因此数据不完整，那么该选举结果被忽略,重新投票选举。
步骤2:统一逻辑时钟后，对比数据ID值，数据ID反应数据的新旧程度，因此
数据ID大的胜出。
步骤3:如果逻辑时钟和数据ID都相同的情况下，那么比较服务器ID (编号) ,
值大则胜出。

QT：QGraphicsView实现图片放缩、鼠标拖动移动和鼠标点击位置放大缩小 ikun的男人 QT fpga开发 qt
免责声明：本文所提供的信息和内容仅供参考。作者对本文内容的准确性、完整性、及时性或适用性不作任何明示或暗示的保证。在任何情况下，作者不对因使用本文内容而导致的任何直接或间接损失承担责任，包括但不限于数据丢失、业务中断或其他经济损失。读者在使用本文信息时，应自行验证其准确性和适用性，并对其使用结果负责。本文内容不构成专业技术咨询或建议，具体的技术实现和应用应根据实际情况和需要进行详细分析和验证。本文
Java程序员教你春招如何一击即中小韩学长yyds java 求职春招
✨✨✨这里是小韩学长yyds的BLOG(喜欢作者的点个关注吧)✨✨✨想要了解更多内容可以访问我的主页小韩学长yyds-CSDN博客目录春招“战场”，投递是“第一枪”知己知彼，百战不殆剖析春招形势解读企业需求打造吸睛简历明确求职意向突出专业技能优化项目经验其他要点投递策略与技巧选择合适渠道把握投递时间注意事项面试准备与应对基础知识复习项目经验梳理模拟面试面试技巧案例分析成功案例失败案例春招“战场”，
智能标注工具 T-Rex Label leo0308 基础知识目标检测和跟踪机器人计算机视觉目标检测
工具地址：https://trexlabel.com/该工具可以进行自动化标注，只需框选出一个标记，就可以自动标注出图片中所有的其他同类物体。支持导出YOLO和COCO格式。首先使用智能标注，可以标注出大部分的物体，如果有错的或者漏的，可以删除，也可以使用矩形框工具进行手动增加。
YOGA触控屏开启和关闭的操作方法 famous_pengfei 笔记本电脑电脑
随着科技的不断发展，触控技术已成为现代电子设备中不可或缺的一部分。对于联想YOGA系列的用户来说，触控屏的便捷性和直观性无疑为日常使用带来了极大的便利。然而，有时我们可能需要暂时关闭触控屏，以避免误触或其他特殊需求。那么，如何在YOGA设备上轻松开启和关闭触控屏呢？掌握触控屏的开启和关闭方法不仅能帮助我们更好地利用设备，还能在特定情况下提高效率和保护屏幕。本文将详细介绍在YOGA设备上如何操作以开
QT之QGraphicsView详细介绍小小怪同学の qt 开发语言
此篇文章来源于自己在完成一个图片编辑软件而遇到的三个类：QGraphicsScene、QGraphicsPixmapItem、QGraphicsView。此篇文章先介绍QGraphicsView，另外两个类在其他文章，大家可查看博主其他文章。本人能力有限，大家有任何问题可评论区评论，共同学习，共同进步。一、QGraphicsView介绍QGraphicsView是QtGUI库中的一个核心类，它是Q
ONNX GraphSurgeon详细介绍 Lntano__y 模型部署算法
ONNXGraphSurgeon(ONNX-GS)是一个用于操作和修改ONNX（OpenNeuralNetworkExchange）模型图的Python库。它允许开发者在ONNX模型的图结构中进行修改、优化、插入节点、删除节点以及其他图结构操作，是在深度学习推理部署过程中非常有用的工具。ONNXGraphSurgeon常用于TensorRT中，用来优化和调整ONNX模型，以便于模型可以高效地在GP
benchmark和baseline的联系与区别 Lntano__y 人工智能深度学习机器学习
在深度学习算法中，benchmark（基准）和baseline（基线）是两个常用的概念，用于评估算法的性能和进行比较。尽管它们有一些相似之处，但它们在定义和使用上有一些区别。Benchmark（基准）：基准是指作为参考标准的一组算法或数据集，通常是在特定任务或领域中广泛接受的准则。基准的目标是提供一个衡量算法性能的标准，以便其他算法可以与之进行比较。基准可以是一种算法、一个数据集或者是两者的结合。
静态路由原理与配置影龙帝皖网络
目录一.路由1.概述2.路由表的形成2.1直连网段2.2非直连网段1.定义和原理2.获取方式二.路由的种类及配置方式三.路由器转发数据包的封装过程四.小结一.路由1.概述从源主机到目标主机的转发过程。2.路由表的形成2.1直连网段在路由器的接口上配置IP地址，并开启接口，即可自动生成相关的直连网段路由。2.2非直连网段1.定义和原理路由器不是通过自身直连接口所获得的通往其他网络的路径信息，需要借助
手机无线投屏到windows11电脑 HAPPY酷智能手机 windows 音视频媒体网络安全网络
1安装无线投影组件2电脑端打开允许其他设备投影的开关3手机找到投屏选项4手机搜索可用设备连接即可这里的官方文档给的不太好,给了一些让人眼花撩乱的信息,以下是经过整合的有效信息
OpenCV连续数字识别—可运行验证正冬升 OpenCV opencv 人工智能计算机视觉
前言文章开始，瞎说一点其他的东西，真的是很离谱，找了至少两三个小时，就一个简单的需求：1、利用OpenCV在Windows进行抓图2、利用OpenCV进行连续数字的检测。3、使用C++，Qt3、将检测的结果显示出来就这么简单的需求，结果网上找了各种版本硬是找不到,要是代码可能没啥问题，但是运行不了，你这运行不了，我怎么知道你到底能不能用，我代码调半天能用了，结果你跟我说最后效果不好，为啥呢？因为图
必看！计算机毕设答辩高分技巧，让你脱颖而出源码姑娘毕业设计
必看！计算机毕设答辩高分技巧，让你脱颖而出一、答辩前的充分准备：技术与内容的“双向打磨”1.吃透项目，技术实现了然于胸计算机毕设的核心在于技术逻辑与系统设计的合理性。答辩前需反复回顾代码实现、架构设计、数据库模型等关键细节，确保能清晰阐述以下问题：技术选型依据：为何选择SpringBoot而非其他框架？所选算法的优势与局限性是什么？系统功能验证：如何通过测试用例或用户反馈验证系统可行性？若涉及机器
yolov5代码详解--1.python代码脚本三炭先生 yolo算法 YOLO python 算法
一、detect.py作为YOLOv5模型推理的核心执行文件，detect.py实现了从数据加载到结果输出的完整目标检测流水线。本文只讲代码中最主要的opt内函数的含义，这是detect最核心的东西，至于其他的代码注释我会放在下面，有什么不懂可以评论区提问。下面对每个命令行参数进行详细介绍，说明它们在检测推理过程中的含义和作用：--weights指定模型权重文件的路径（或多个路径），也可以是远程T
Manus AI Agent 技术解读：架构、机制与竞品对比智想天开 AI技术人工智能架构
目录1.Manus是什么？1.1研发背景1.2技术特点1.3工具调用能力1.4主要应用场景2.Manus一夜爆火的原因何在？2.1技术突破带来的震撼2.2完整交付的产品体验2.3生态与开源策略3.Manus与其他AIAgent的对比分析3.1技术架构3.2任务执行能力3.3工具调用能力3.4产品化进展3.5测试基准表现4.Manus的挑战与未来发展4.1现阶段的局限性4.2对人力市场和软件行业的影
DHCP 技术详解：动态主机配置协议的原理、应用与配置实践 leo·li 路由交换技术笔记网络 DHCP 动态地址获取 DHCP路由核心动态交换分配协议路径机制网络互联应用
动态主机配置协议（DynamicHostConfigurationProtocol，简称DHCP）是现代网络中不可或缺的核心技术之一。作为互联网协议族的重要组成部分，DHCP负责为网络中的设备动态分配IP地址及其他配置参数，从而简化网络管理并提高资源利用效率。在企业网络、校园网络乃至家庭网络中，DHCP的广泛应用使得设备能够快速接入网络，同时为管理员提供了灵活的管理手段。然而，DHCP的实现并非毫
L2-031 深入虎穴 (25 分) PTA GPLT 天梯题目集记忆数组+以尾顶点向上递归求解 C/C++ 题解陈一啊天梯
一、题目L2-031深入虎穴(25分)著名的王牌间谍007需要执行一次任务，获取敌方的机密情报。已知情报藏在一个地下迷宫里，迷宫只有一个入口，里面有很多条通路，每条路通向一扇门。每一扇门背后或者是一个房间，或者又有很多条路，同样是每条路通向一扇门……他的手里有一张表格，是其他间谍帮他收集到的情报，他们记下了每扇门的编号，以及这扇门背后的每一条通路所到达的门的编号。007发现不存在两条路通向同一扇门
解决电脑能连接正常WiFi，却无法上网的问题 dayang9605 电脑
今天笔记本突然上不了网了，WiFi可以正常连接，并且其他设备也可以使用WiFi上网，说明WiFi正常。就是笔记本连上了WiFi却无法使用网络，连基本的网页都无法打开。于是开始尝试解决问题：首先尝试第一个办法：确认网络设置中的IP和DNS是否为自动获取：【此电脑】→右键【网络】打开【属性】→【更改适配器设置】→右键【WLAN】打开【属性】→选择【Internet协议版本4】→打开【属性】→设置为【自
百兆网络变压器和RJ45接线应该参考那些原理 Hqst_Kevin 网络
在涉及百兆网络变压器（如100BASE-TX以太网）和RJ45接线相关的硬件设计时，需参考以下核心原理和规范：一、网络变压器（MagneticsModule）原理1.信号隔离（电气隔离）-网络变压器通过磁耦合隔离设备端（PHY芯片）与外部物理线缆（RJ45），防止静电（ESD）、浪涌或其他共模干扰损坏芯片。-高压耐压要求**：变压器绕组间的绝缘需满足安规标准（如2kV/1分钟或更高）。2.阻抗匹配
leetcode hot100 图论 yadanuof yy的刷题之路 leetcode 图论深度优先
9️⃣图论200.岛屿数量给你一个由'1'（陆地）和'0'（水）组成的的二维网格，请你计算网格中岛屿的数量。岛屿总是被水包围，并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。此外，你可以假设该网格的四条边均被水包围。题解:二维数组,遍历遇到当前值为1的,岛屿数加一,然后进行岛屿治理–dfs深度遍历当前值所在的岛屿,将该岛屿所在的其他值全部置为’2’,那么继续遍历时就不会重复计算cla
【人工智能】随机森林的智慧：集成学习的理论与实践蒙娜丽宁人工智能人工智能随机森林集成学习
随机森林（RandomForest）是一种强大的集成学习算法，通过构建多棵决策树并结合投票或平均预测提升模型性能。本文深入探讨了随机森林的理论基础，包括决策树的构建、Bagging方法和特征随机选择机制，并通过LaTeX公式推导其偏差-方差分解和误差分析。接着，我们详细描述了随机森林的算法流程，分析其在分类和回归任务中的适用性。文章还通过实验对比随机森林与单一决策树及其他算法（如SVM）的性能，探
振荡器简单介绍行然梦实毕业设计论文阅读制造能源笔记课程设计
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。文章目录前言1.简谐振子2.有阻尼的简谐振子3.LC电路（无阻尼）4.RLC电路（有阻尼）总结：振荡器是一种能够将能量在两种形式之间相互转换的设备或系统，从而产生周期性运动或信号。以下
用OpenCV写个视频播放器可还行？（C++版）程序员Linc OpenCV opencv 音视频 c++opencv 4.11
引言提到OpenCV，大家首先想到的可能是图像处理、目标检测，但你是否想过——用OpenCV实现一个带进度条、倍速播放、暂停功能的视频播放器？本文将通过一个实战项目，带你深入掌握OpenCV的视频处理能力，并解锁以下功能：基础播放/暂停动态倍速调节（0.5x~4x）交互式进度条实时时间戳显示文末提供完整代码，可直接运行！一、环境准备安装OpenCV请参考其他博客，C++版本的OpenCV安装，每个
Python发布自定义模块和包到PyPI 大数据张老师 Python程序设计 python java 服务器
Python拥有一个庞大的第三方库生态系统，其中大部分包都托管在PythonPackageIndex（PyPI）上。PyPI（https://pypi.org/）是Python官方的软件包仓库，开发者可以在这里发布、管理和共享Python模块，使其他人能够直接使用pipinstall命令安装和使用你的代码。本节将详细介绍如何创建并发布一个自定义Python模块到PyPI，包括打包、上传和管理的全过
k-Shape：高效准确的聚类方法优化算法侠Swarm-Opti 信号处理故障诊断聚类机器学习人工智能 matlab 数据挖掘
引言时间数据在许多学科中的扩散和无处不在，已经对时间序列的分析和挖掘产生了极大的兴趣。聚类是最流行的数据挖掘方法之一，不仅因为它的探索性，而且作为其他技术的预处理步骤或子程序。常用的有-means聚类算法。本文介绍了一种新的时间序列聚类算法k-Shape。k-Shape依赖于一个可扩展的迭代优化过程，它创建同质和良好分离的集群。作为距离度量，k-Shape使用标准化的交叉相关。基于距离度量的性质，
斯坦福UE4 + C++课程学习记录 9：蓝图-简易开关 Surkea C+++UE ue4 ue5 游戏引擎 c++学习
目录1.前言2.创建蓝图类3.改变把手角度4.打开宝箱UE中的蓝图是一种基于C++的可视化编程系统，它将大量常用的底层代码接口暴露出来，方便开发者在UE中快速调用，其可视化的呈现方式让那些不专攻编程的人员（如设计、美工、策划等）也能快速上手使用。从程序开发的角度，学习蓝图可以方便开发中的很多环节；从业务的角度，掌握蓝图也有利于开发和其他环节的同事进行交流。本部分的第一个示例，是使用操纵杆开关控制宝
比特币,区块链及相关概念简介(一) 湖光秋色区块链区块链比特币去中心化
目录什么是比特币比特币用来交易什么呢应用场景和黄金的关系相似之处：不同之处：如果是交易才会有比特币奖励那第一个持有者是怎么获取的呢又是怎么交易的呢其他加密货币该系列文章链接以下内容结合了chatgpt3.5以及网络文章。用于学习记录。简介：介绍了比特币的概念，比特币的交易对象，比特币的应用场景，以及和黄金的关系；其他加密货币等。什么是比特币比特币是一种数字货币，也是全球第一个去中心化的加密货币。它
LangChain 核心概念简介墨染辉大语言模型人工智能
2.1ComponentsandChainsComponents（组件）和Chains（链）是LangChain的基础构建块，用于创建复杂的语言模型应用程序。组件（Components）：定义：模块化的构建块，如语言模型、工具、记忆模块等。作用：单独使用或组合以实现特定功能，提升应用的灵活性和可扩展性。链（Chains）：定义：由一系列组件或其他链按特定顺序组合而成的工作流。作用：完成特定任务，如
Eclipse Kura：开源的物联网网关框架小赖同学啊智能硬件 eclipse 开源物联网
EclipseKura是一个开源的物联网（IoT）网关框架，旨在为物联网边缘设备提供强大的软件平台。Kura提供了设备管理、数据采集、通信协议支持、远程管理和安全性等功能，使得开发者能够轻松构建和管理物联网网关。以下是EclipseKura的核心功能、架构、使用场景和优势的详细介绍。1.EclipseKura的核心功能1.1设备管理设备连接：支持多种设备的连接，包括传感器、执行器和其他IoT设备。
xxssss 墨菲斯托888 xss 前端 javascript
XSS。这是一种将任意Javascript代码插入到其他Web用户页面中执行以达到攻击目的的漏洞。攻击者利用浏览器的动态展示数据功能，在HTML页面里嵌入恶意代码。当用户浏览该页时，这些潜入在HTML中的恶意代码会被执行，用户浏览器被攻击者控制，从而达到攻击者的特殊目的，为了执行javascirpt代码,XSS攻击的脚本通常被嵌入到网页的HTML、JavaScript代码中，或者通过URL参数传递
xXSS 墨菲斯托888 xss 前端
XSS漏洞：XSS又叫CSS（CrossSiteScript）跨站脚本攻击是一种针对网站应用程序的安全漏洞攻击技术，是代码注入的一种。它允许恶意用户将代码注入网页，其他用户在浏览网页时会受到影响。恶意用户利用xss代码攻击成功后，可能得到很高的权限：私密网页内容，会话和Cookiexss漏洞通常是通过php的输出函数将javascript代码输出到html页面中，通过用户本地浏览器执行的，所以xs
前端开发学习——CSS定位先吃点再说学习 css 前端
一、定位的基本介绍1、网页常见的布局方式1.标准流块级元素独占一行——垂直布局行内元素/行内块元素一行显示多个——水平布局2.浮动可以让原本垂直布局的块级元素变成水平布局3.定位可以让元素自由的摆放在网页的任意位置一般用于盒子之间的层叠情况2、定位的常见应用场景可以解决盒子与盒子之间的层叠问题（定位之后的元素层级最高，可以层叠在其他盒子的上面）可以让盒子始终固定在屏幕的某个位置二、定位的基本使用1
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #1413161683@qq.com (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

Hadoop大数据技术原理与运用学习笔记

Hadoop学习过程中的一些笔记

第三章HDFS

第四章MapReduce

第五章 Zookeeper

你可能感兴趣的:(其他,hadoop)