开着拖拉机回家

【Hadoop】HDFS读写流程和客户端命令使用

博主 "开着拖拉机回家"带您 Go to New World.✨

个人主页——开着拖拉机回家_Linux,Java基础学习,大数据运维-CSDN博客 ✨

希望本文能够给您带来一定的帮助文章粗浅，敬请批评指正！

感谢点赞和关注，每天进步一点点！加油！

一、HDFS产出背景及定义

1.1.HDFS产生背景

1.2.HDFS简介

1.3.HDFS的优缺点

1、优点

2、缺点

二、HDFS的特点

三、HDFS组成架构

1、Client：客户端

2、NameNode

3、 DataNode

4、 Secondary NameNode

四、HDFS读写过程

4.1.写入流程

4.2.读取流程

五、HDFS客户端常用命令

5.1.HDFS客户端访问命令使用

5.2.HDFS客户端管理命令使用

1、报告文件系统的基本信息和统计信息

2、fs_image 文件导出解析到本地

3、安全模式

4、文件健康检查和租约释放

5、har 归档

5.3. HDFS 命令总体划分

一、HDFS产出背景及定义

1.1.HDFS产生背景

随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。

1.2.HDFS简介

HDFS（Hadoop Distributed File System），它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。

HDFS的使用场景：适合一次写入，多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变。

1.3.HDFS的优缺点

1、优点

高容错性，自动保存默认的副本数，某个副本或者机器宕机都会完成自动复制，使副本数保持在设置的个数；
适合处理大数据，能够存储和处理TB，甚至 PB级别的数据量；
可构建在廉价机器上，使用普通服务器便可建设大数据平台。

2、缺点

不适合低延时数据访问，我们一般采用分布式的HBase 作为存储；
无法高效对大量小文件进行存储

a.大量小文件会占用 NameNode 大量内存来存储文件索引信息

b.小文件增加访问和写入寻址时间，大量小文件的存在无论是读取或者写入数

据都会都集群造成很大的压力

不支持并发写入、数据修改

a.一个文件只能一个写，不允许多个线程同时写。

b.仅仅支持数据append（追加），不支持文件的随机修改

二、HDFS的特点

高容错性：一个HDFS集群会包含非常多节点，HDFS将文件分块（Block）存储，并且会自动保存多个副本到不同的机器节点上以保证数据的安全，而且HDFS可以检测故障并且从故障中快速恢复。

高吞吐率：与一般文件系统的访问低延迟不同，HDFS的重点是存储和处理大量的数据，支持数据处理规模是GB、TB、甚至是PB的级别。因此，相比较用户交互式程序，HDFS更加适用批处理的应用程序。

一次写入多次读取模型：一个文件只支持单线程的文件写入，HDFS假定一个文件一旦被创建，写入完成之后除了追加和截断就不需要更改。这种设置简化了数据一致性的问题，从而也提高了数据访问的吞吐率，同时也不支持文件的随机修改。

大数据集：HDFS 中的典型文件大小为 GB 到 TB，对于大批量小文件HDFS无法做到高效存储，存储和检索会消耗NameNode内存。

可移植性：HDFS是由Java语言构建，任何支持Java的机器，都可以运行HDFS，因此HDFS可以轻松地从一个平台移植到另一个平台。

三、HDFS组成架构

1、Client：客户端

通过Client来访问文件系统，然后由Client与NameNode和DataNode进行通信。Client对外作为文件系统的接口

文件切分，上传HDFS文件的时候，Client将文件切分成一个一个 Block 然后进行上传；
负责与 NameNode 和 DataNode 交互，获取文件的位置信息；
Client 提供一些命令来管理HDFS，比如：banlance 数据均衡、 fsimage 元数据获取和解析、NameNode 格式化、checkpoint 等；
Clinet 提供一些命令来访问HDFS，比如：HDFS文件的增删改查

2、NameNode

管理者。用于存储和管理文件元数据、维护文件系统的目录树形结构，记录写入的每个数据块（Block）与其归属文件的对应关系。

管理文件系统命名空间；
配置副本策略，默认3副本策略；
管理数据块的映射信息（Blockmap）；
处理客户端的读写请求。

3、 DataNode

DataNode会通过心跳和NameNode保持通信，处理实际的操作。

存储实际的数据块；
执行数据块的读写操作。

4、 Secondary NameNode

Secondary NameNode的作用是消费EditsLog，定期地合并FsImage和EditsLog，生成新的FsImage文件，并推送给NameNode，降低了NameNode的压力。在紧急情况下，可辅助恢复NameNode。

SecondaryNameNode机制：

SecondaryNameNode不是NameNode挂了的备用节点
主要功能只是定期合并日志, 防止日志文件变得过大
合并过后的镜像文件在NameNode上也会保存一份

SecondaryNameNode工作过程:

SNN向NameNode发起同步请求, 此时NameNode会将日志都写到新的日志当中；
SNN向NameNode下载镜像文件和日志文件；
SNN开始Merge这两份文件并生成新的镜像文件；
SNN向NameNode传回新的镜像文件；
NameNode文件将新的镜像文件和日志文件替换成当前正在使用的文件

四、HDFS读写过程

4.1.写入流程

client向namenode通信，请求上传文件
namenode判断是否可上传： namenode检查用户是否有上传的权限、目标文件是否已存在、父目录是否存在
文件切分：client将文件切分成0~128M大小的block块（逻辑切分）
client请求block块的存储位置
namenode返回datanode地址dn1、dn2、dn3（默认三副本地址）
client通过FSDataOutputStream模块请求dn1上传数据，建立连接管道（本质上是一个 RPC 调用，建立 pipeline）
当dn1收到请求后会继续调用dn2， dn2调用dn3，将整个通信管道建立完成，然后逐级返回client，即图中的ack校验
client开始往dn1上传第一个Block（先从磁盘读取数据放到一个本地内存缓存），以Packet为单位(默认64k)，dn1收到一个Packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个应答队列等待应答
当一个Block传输完成之后，client再次请求NameNode上传第二个Block的服务器（重复执行4-8步）
传输完毕之后，客户端关闭流资源，并且会告诉hdfs数据传输完毕，然后hdfs收到传输完毕就恢复元数据

4.2.读取流程

Client 向 NameNode 发起 RPC 请求，来确定请求文件 block 所在的位置；
NameNode 会视情况返回文件的部分或者全部 block 列表，对于每个 block，NameNode 都会返回含有该 block 副本的 DataNode 地址；
这些返回的 DataNode 地址，会按照集群拓扑结构得出 DataNode 与客户端的距离，然后进行排序，排序两个规则：网络拓扑结构中距离Client近的排靠前；心跳机制中超时汇报的 DataNode 状态为 STALE，这样的排靠后；
Client 选取排序靠前的 DataNode 来读取 block，如果客户端本身就是 DataNode，那么将从本地直接获取数据；底层上本质是建立 Socket Stream（FSDataInputStream），重复的调用父类 DataInputStream 的 read 方法，直到这个块上的数据读取完毕；
当读完列表的 block 后，若文件读取还没有结束，客户端会继续向 NameNode 获取下一批的 block 列表；
读取完一个 block 都会进行 checksum 验证，如果读取 DataNode 时出现错误，客户端会通知 NameNode，然后再从下一个拥有该 block 副本的 DataNode 继续读。
read 方法是并行的读取 block 信息，不是一块一块的读取；NameNode 只是返回 Client 请求包含块的 DataNode 地址，并不是返回请求块的数据；
最终读取来所有的 block 会合并成一个完整的最终文件。（摘录博友）

五、HDFS客户端常用命令

5.1.HDFS客户端访问命令使用

对于客户端shell命令的具体使用可以查看 help 帮助，熟悉Linux 常用命令的人可能一看这些命令就会有种很熟悉对的感觉。

[winner_spark@hdp105 root]$ hdfs dfs -help

如下为常用的命令：

# 创建文件夹
hdfs dfs -mkdir -p   /tmp/kangll 

# 上传文件 test.sh 到HDFS 
hdfs dfs -put   test.sh   /tmp/kangll

# 查看文件
hdfs dfs -ls  /tmp/kangll

# 下载到本地 /tmp 文件夹
hdfs dfs -get   test.sh   /tmp/kangll  /tmp

# 查看test.sh 文件内容 -less 或者 -more也可以
hdfs dfs -cat    /tmp/kangll/test.sh

# 查看 文件或者文件夹 大小
hdfs dfs -du  -h /tmp/kangll

#判断当前路径是否存在
hadoop fs -test -d  /tmp/kangll

# 文件权限修改
hdfs dfs -chmod 775  /tmp/kangll/test.sh
hdfs dfs -chown  winner_spark:hadoop  /tmp/kangll/test.sh

# 删除test.sh 删除后的文件会先进入 垃圾桶
hdfs dfs -rm -r  /tmp/kangll/test.sh

# -cp：从HDFS的一个路径拷贝到HDFS的另一个路径
hdfs dfs -cp  /tmp/kangll/test.sh  /tmp/

# 移动
hdfs dfs -mv  /tmp/kangll/test.sh  /tmp/

5.2.HDFS客户端管理命令使用

如下介绍几个常用的管理命令：

1、报告文件系统的基本信息和统计信息

hdfs dfsadmin -report

执行部分结果如下：

[hdfs@hdp105 root]$ hdfs dfsadmin -report 
Configured Capacity: 2253195592704 (2.05 TB)
Present Capacity: 2103420218371 (1.91 TB)
DFS Remaining: 1194928602115 (1.09 TB)
DFS Used: 908491616256 (846.10 GB)
DFS Used%: 43.19%
Replicated Blocks:
	Under replicated blocks: 172
	Blocks with corrupt replicas: 0
	Missing blocks: 0
	Missing blocks (with replication factor 1): 0
	Low redundancy blocks with highest priority to recover: 0
	Pending deletion blocks: 0
Erasure Coded Block Groups: 
	Low redundancy block groups: 0
	Block groups with corrupt internal blocks: 0
	Missing block groups: 0
	Low redundancy blocks with highest priority to recover: 0
	Pending deletion blocks: 0

-------------------------------------------------
Live datanodes (3):  # 测试环境 3个datanode

Name: 192.168.2.152:1019 (hdp103)
Hostname: hdp103
Decommission Status : Normal        # 节点状态
Configured Capacity: 751065197568 (699.48 GB)
DFS Used: 302833778688 (282.04 GB)
Non DFS Used: 88004692992 (81.96 GB)
DFS Remaining: 359240115201 (334.57 GB)
DFS Used%: 40.32%
DFS Remaining%: 47.83%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 20
Last contact: Thu Aug 24 14:13:48 CST 2023
Last Block Report: Thu Aug 24 12:32:27 CST 2023
Num of Blocks: 38238

2、fs_image 文件导出解析到本地

获取Namenode元数据fsImage镜像文件，并且解析为CSV文件。

# 获取 fsimage, 获取到的数据到二进制文件
hdfs dfsadmin -fetchImage $BASEDIR/data
# 解析，数据解析为 csv 文件 , -o 为输出路径， -p输出文件格式     
hdfs oiv -i $BASEDIR/data/fsimage_*  -o $BASEDIR/fs_distribution/fs_deli   -p Delimited -delimiter ","


#可以 查看命令参数解释 hdfs oiv -i  -help

解析结果

包含的信息有：路径，副本数，日期，权限，所属用户和组等信息。

3、安全模式

HDFS中，安全模式是一种保护机制,它可以在NameNode节点出现故障或异常情况时,防止数据丢失或损坏。在安全模式下，HDFS集群只允许读取数据，禁止写入数据，同时也禁止执行元数据修改操作。这意味着，当NameNode节点处于安全模式下时，HDFS集群的数据将处于只读状态，直到NameNode节点恢复正常并退出安全模式为止。

 hdfs dfsadmin [-safemode enter | leave | get | wait | forceExit]

hdfs dfsadmin 的其他命令：

命令选项	描述
-report	报告文件系统的基本信息和统计信息。
-safemode enter \| leave \| get \| wait	安全模式维护命令。安全模式是Namenode的一个状态，这种状态下，Namenode 1. 不接受对名字空间的更改(只读) 2. 不复制或删除块 Namenode会在启动时自动进入安全模式，当配置的块最小百分比数满足最小的副本数条件时，会自动离开安全模式。安全模式可以手动进入，但是这样的话也必须手动关闭安全模式。
-refreshNodes	重新读取hosts和exclude文件，更新允许连到Namenode的或那些需要退出或入编的Datanode的集合。
-finalizeUpgrade	终结HDFS的升级操作。Datanode删除前一个版本的工作目录，之后Namenode也这样做。这个操作完结整个升级过程。
-upgradeProgress status \| details \| force	请求当前系统的升级状态，状态的细节，或者强制升级操作进行。
-metasave filename	保存Namenode的主要数据结构到hadoop.log.dir属性指定的目录下的文件。对于下面的每一项，中都会一行内容与之对应 1. Namenode收到的Datanode的心跳信号 2. 等待被复制的块 3. 正在被复制的块 4. 等待被删除的块
-setQuota ...	为每个目录设定配额。目录配额是一个长整型整数，强制限定了目录树下的名字个数。命令会在这个目录上工作良好，以下情况会报错： 1. N不是一个正整数，或者 2. 用户不是管理员，或者 3. 这个目录不存在或是文件，或者 4. 目录会马上超出新设定的配额。
-clrQuota ...	为每一个目录清除配额设定。命令会在这个目录上工作良好，以下情况会报错： 1. 这个目录不存在或是文件，或者 2. 用户不是管理员。如果目录原来没有配额不会报错。
-help [cmd]	显示给定命令的帮助信息，如果没有给定命令，则显示所有命令的帮助信息。

4、文件健康检查和租约释放

hdfs文件操作异常没有正确关闭连接，造成租约没有释放，而程序可以读取这个文件时获取不到租约就会报错。所以需要释放租约， -retries 3 表示重试三次。


# 健康检查
hdfs fsck    /tmp/kangll/test.sh

# hdfs文件操作异常没有正确关闭连接，造成租约没有方式 需要释放租约， -retries 3 重试三次
hdfs debug recoverLease -path $LINE -retries 3

执行结果

hdfs fsck 的其他命令：

命令选项	描述
-move	把损坏的文件移动到/lost+found
-delete	直接删除损坏的文件
-files	打印被检测的文件
-openforwrite	打印正在被写入的文件，可能是文件写入关闭异常
-includeSnapshots	检测的文件包括系统snapShot快照目录下的
list-corruptfileblocks	打印出丢失的块和它们所属的文件列表
-blocks	打印block 信息
-locations	打印 block 的位置，即在哪个节点
-racks	打印block 所在的 rack
-storagepolicies	打印 block 存储的策略信息
-blockId	打印 block所属块的位置信息

5、har 归档

Hadoop存档是特殊格式的存档。Hadoop存档映射到文件系统目录。Hadoop归档文件总是带有* .har扩展名

Hadoop存档目录包含元数据（采用_index和_masterindex形式）
数据部分data（part- *）文件。
_index文件包含归档文件的名称和部分文件中的位置。

hadoop archive -archiveName $fileName -p $src $subSrc $dest

归档启动MR任务执行完成后:

har 归档虽然对文件进行了归档减少了 block 数量，但是har 归档并没有压缩数据。

5.3. HDFS 命令总体划分

Admin Commands:

命令	描述
cacheadmin	配置 HDFS 缓存
crypto	配置HDFS加密区
debug	执行Debug Admin命令执行HDFS的Debug命令
dfsadmin	运行DFS管理客户端
dfsrouteradmin	管理基于路由的联邦
ec	运行HDFS ErasureCoding 客户端
fsck	运行DFS文件系统检查工具
haadmin	运行DFS HA 管理客户端
jmxget	从NameNode或DataNode获取JMX导出的值
oev	an edits file 应用于离线 edits viewer
oiv	an fsimage 应用于离线 fsimage viewer
oiv_legacy	apply the offline fsimage viewer to a legacy fsimage
storagepolicies	list/get/set block storage policies

Client Commands:

命令	描述
classpath	打印获取hadoop jar和所需库所需的类路径
dfs	在文件系统上运行filesystem命令
envvars	显示计算的Hadoop环境变量
fetchdt	从NameNode获取一个委托令牌
getconf	从配置中获取配置值
groups	获取用户所属的组
lsSnapshottableDir	列出当前用户拥有的所有可快照目录

Daemon Commands:

命令	描述
balancer	运行集群平衡实用程序
datanode	运行DFS datanode
dfsrouter	运行DFS路由器
diskbalancer	将数据均匀地分布在给定节点的硬盘上
httpfs	运行HttpFS server, HDFS的HTTP网关
journalnode	运行DFS journalnode
mover	运行实用程序以跨存储类型移动块副本
namenode	运行DFS namenode
nfs3	运行NFS v3网关
portmap	运行portmap服务

对于命令的具体可以可以使用 help 帮助查看具体使用，我们平时使用做多的就是 hdfs dfs :

[winner_spark@hdp105 root]$ hdfs dfs -help
Usage: hadoop fs [generic options]
	[-appendToFile  ... ]
	[-cat [-ignoreCrc]  ...]
	[-checksum  ...]
	[-chgrp [-R] GROUP PATH...]
	[-chmod [-R]  PATH...]
	[-chown [-R] [OWNER][:[GROUP]] PATH...]
	[-copyFromLocal [-f] [-p] [-l] [-d] [-t ]  ... ]
	[-copyToLocal [-f] [-p] [-ignoreCrc] [-crc]  ... ]
	[-count [-q] [-h] [-v] [-t []] [-u] [-x] [-e]  ...]
	[-cp [-f] [-p | -p[topax]] [-d]  ... ]
	[-createSnapshot  []]
	[-deleteSnapshot  ]
	[-df [-h] [ ...]]
	[-du [-s] [-h] [-v] [-x]  ...]
	[-expunge]
	[-find  ...  ...]
	[-get [-f] [-p] [-ignoreCrc] [-crc]  ... ]
	[-getfacl [-R] ]
	[-getfattr [-R] {-n name | -d} [-e en] ]
	[-getmerge [-nl] [-skip-empty-file]  ]
	[-head ]
	[-help [cmd ...]]
	[-ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [-e] [ ...]]
	[-mkdir [-p]  ...]
	[-moveFromLocal  ... ]
	[-moveToLocal  ]
	[-mv  ... ]
	[-put [-f] [-p] [-l] [-d]  ... ]
	[-renameSnapshot   ]
	[-rm [-f] [-r|-R] [-skipTrash] [-safely]  ...]
	[-rmdir [--ignore-fail-on-non-empty]  ...]
	[-setfacl [-R] [{-b|-k} {-m|-x } ]|[--set  ]]
	[-setfattr {-n name [-v value] | -x name} ]
	[-setrep [-R] [-w]   ...]
	[-stat [format]  ...]
	[-tail [-f] ]
	[-test -[defsz] ]
	[-text [-ignoreCrc]  ...]
	[-touch [-a] [-m] [-t TIMESTAMP ] [-c]  ...]
	[-touchz  ...]
	[-truncate [-w]   ...]
	[-usage [cmd ...]]

————————————————

参考链接：Hadoop --- HDFS介绍_hadoop hdfs_三水写代码的博客-CSDN博客

参考链接：Hadoop之HDFS简介_hadoop的hdfs_数新网络的博客-CSDN博客

你可能感兴趣的:(#,【====,HDFS&YARN,====】,hadoop,HDFS读取流程,har,HDFS客户端,HDFS,shell,安全模式)

从“建议者”到“执行者”：Manus如何重新定义AI代理的边界——基于GAIA基准测试的深度技术解析与行业启示 ByteForge 人工智能人工智能机器人 github chatgpt
引言：AIAgent的“GPT时刻”2025年3月6日，中国团队Monica.im推出的全球首款通用型AIAgent产品Manus正式开启内测，一夜之间引爆科技圈。不同于传统AI的“建议生成”模式，Manus实现了从任务分解、工具调用到成果交付的全流程自动化，被用户称为“数字世界中的全能实习生”本文将从技术架构、任务闭环能力、行业影响三个维度，对比Manus与现有AI产品的代际差异。一、技术架构革
python读取多张图片文字为表格_python批量给图片加图文水印+读取excel weixin_39612220
在python3.7环境实现给图片添加图片水印以及文字水印。另附python读取excel单元格内容。利用本程序修改后可以实现，给商品sku图片批量添加水印的功能。excel操作仅测试了读取单元格内容的代码。#fromPILimportImagefromPILimportImage,ImageDraw,ImageFont##pipinstallpillow##importdatetimeimpor
搞懂 Manus 技术原理，用开源的 Proxy Lite 你也可以构建自己的智能助理程序猿李巡天人工智能 neo4j 知识图谱机器人学习
Manus的技术并没有多么高大上，技术原理主要基于其创新的“多代理架构”（MultipleAgentArchitecture），这一架构通过将复杂任务分解为规划、执行和验证三个阶段，并由多个独立的AI代理协同完成，从而实现高效、可靠的任务处理。多代理架构：Manus的核心技术是其多代理架构，该架构模仿人类的“Plan-Do-Check-Act”（计划-执行-检查-行动）工作流程。具体来说，任务被拆
自动化流程的新星：Automatisch - 开源Zapier替代方案解然嫚Keegan
自动化流程的新星：Automatisch-开源Zapier替代方案去发现同类优质开源项目:https://gitcode.com/在日益数字化的商业世界中，高效的工作流程自动化是关键。Automatisch，一个强大的开放式业务自动化工具，应运而生，它允许您轻松地将Twitter、Slack等不同服务连接在一起，以实现您的业务流程自动化。项目介绍Automatisch不仅简单易用，而且无需编程知识
Python自动化识别与删除Excel表格空白行和列 Eiceblue Python XLS python 自动化 excel 开发语言
在处理Excel数据时，经常会遇到含有空白行和空白列的情况。这些空白区域不仅占用表格显示空间，还可能导致数据分析时出现偏差，影响数据处理的效率与结果的准确性，如空白行可能干扰数据聚合操作，导致统计计数不准确；空白列则可能误导数据解析逻辑，影响后续的数据分析流程。因此，删除Excel表格中的空白行和空白列也是数据预处理中的一项基础任务。本文将介绍如何利用Python来自动化识别并删除Excel文件中
Mysql高频面试题 GentleDevin #Java面试宝典 mysql java 数据库
MVCC相关面试题1.什么是MVCC？它解决了什么问题？答：MVCC是多版本并发控制机制，它通过维护数据多个版本，实现非锁定读，解决了读写互斥问题，通过保存数据的多个版本，让读操作可以在不获取锁的情况下读取数据，提高了并发性能。同时，MVCC还能保证事务的隔离性，例如在可重复读隔离级别下，事务在整个执行过程中看到的数据是一致的。2.InnoDB中MVCC的实现原理是什么？答：主要通过为每行数据增加
面试基础---微服务架构深度解析：服务拆分、数据一致性与服务调用 WeiLai1112 后端架构面试微服务职场和发展 java 后端分布式
微服务架构深度解析：服务拆分、数据一致性与服务调用引言：从抖音日活7亿看微服务架构的重要性在2023年，抖音日活用户突破7亿，其核心系统通过微服务架构实现了高并发、高可用的业务支撑。本文将深入探讨微服务架构的设计与实现，结合工业级实践与源码解析，揭示高并发场景下的微服务之道。一、微服务拆分原则1.1拆分策略业务能力：按业务领域划分数据边界：确保数据独立性团队结构：匹配团队职责1.2拆分流程单体应用
必看！C# 与 HALCON 构建基于轮廓模板匹配实战宝典 AI_DL_CODE 机器视觉 c#人工智能机器视觉 HALCON 模板匹配特征点匹配
摘要：本文专注于利用C#与HALCON实现基于轮廓的模板匹配技术。从环境搭建，即HALCON安装、C#项目创建及库引用配置，到核心步骤如初始化HALCON环境、读取图像、提取轮廓、创建模板、执行匹配及显示结果等，结合详尽代码示例进行阐述。还深入探讨在实际应用中的优化策略，包括图像预处理、参数精细调整、多模板匹配及实时匹配实现等。旨在助力读者全方位掌握技术，为机器视觉相关项目开发提供有力支撑，高效解
推荐一款好用的智能工单系统，有哪些智能化应用场景运维人工智能
AI在ITSM的应用已经成为it服务管理的必然趋势，其中智能工单不仅能够帮助企业快速响应和处理各类IT问题，还能优化服务流程，降低运营成本。今天，我们就来探讨一下智能工单系统有哪些典型应用场景？以目前市场上一款备受好评的智能工单SaaS产品——轻帆云为例，看看它是如何在这些场景中发挥作用的。智能工单场景一：事件管理，桌面运维服务的得力助手企业日常运营中，桌面运维服务是最常见也最需要效率的一环。员工
YashanDB TLCP连接配置数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...YashanDB启用TLCP连接要求由Gmssl工具生成相关证书，在完成相关证书的正确配置后，通讯时进行客户端到服务端的安全验证。Caution：一旦服务器开启TLCP连接，所有的客户端都必须正确配置证书才能连接到数据库。启用
YashanDB数据库服务端SSL连接配置数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...YashanDB启用SSL连接要求由服务器生成根证书、服务器证书和DH文件，客户端获取服务器的根证书，在通讯时进行客户端到服务端的安全验证。Caution：一旦服务器开启SSL连接，所有的客户端都必须有根证书才能连接到数据库。
一文读懂，外贸客户要的invoice是什么意思？如何制作？
在外贸领域，invoice这一词汇频繁出现，它对于国际贸易的顺利进行起着至关紧要的作用。本文将深入剖析外贸中invoice的具体含义、与商业发票的区别，以及其开具流程与注意事项，同时向大家推荐一款高效实用的发票制作工具——ZohoBooks。一、Invoice的定义和用途于外贸情境下，invoice不单单是咱们日常理解的发票，它更像是一份付款通知单或是收据。当卖家给买家开具了invoice，这就意
spring源码之源码之单例bean的创建流程 zangs_zangsheng spring源码 spring java 后端
单例bean是什么用人话讲就是你无论在哪调用这个bean注入这个bean，都是同一个bean。因此需要确保其线程安全。这通常通过无状态设计、同步机制或线程局部变量等方式实现在哪开始创建Bean？在刷新容器的时候，在刷新完成的前一步（finishBeanFactoryInitialization方法）创建Bean（非懒加载的单例bean）今天就从finishBeanFactoryInitializa
【设计模式】（21）策略模式 xiyubaby.17 Java教程设计模式策略模式
策略模式（StrategyPattern）教程一、模式定义策略模式定义一系列算法族，将每个算法封装成独立类，并使它们可以相互替换。核心目标：解耦算法的定义与使用，使算法能独立于客户端变化，消除复杂的条件判断。二、适用场景多算法切换：系统需要在多种算法中动态选择（如排序、加密、压缩算法）。替代条件分支：消除代码中大量的if-else或switch-case语句。扩展性需求：需要灵活添加新算法而不影响
Windows 图形显示驱动开发-WDDM 3.2- D3D12 AV1 视频编码（二）程序员王马 windows图形显示驱动开发 windows 驱动开发
AV1的预期位流标头值驱动程序/主机标头编码责任给定具有K个磁贴的编码帧，驱动程序将在压缩位流中写入K个decode_tile()AV1语法元素，这与EncodeFrame参数中请求的磁贴相对应。然后，API客户端利用tile_start_and_end_present_flag/tg_start/tg_end元素构建tile_group_obu()AV1语法元素，以便根据需要将磁贴排列为磁贴组，
Linux Shell编程傲雪凌霜，松柏长青 linux linux
LinuxShell编程LinuxShell介绍变量功能语句控制语句：顺序，条件，循环数组函数综合案例LinuxShell介绍1、是什么Shell是一个命令行解释器程序规范，他接受应用程序/用户命令，然后调用操作系统内核完成相关的功能。它是用户使用Linux的桥梁。简单来说Shell是指一种应用程序，这个应用程序提供了一个界面，用户通过这个界面访问操作系统内核的服务。也可以这样认为，linux中的
第八课：Scrapy框架入门：工业级爬虫开发 deming_su Python scrapy 爬虫 python
在当今大数据时代，数据抓取已成为信息获取的重要手段。Scrapy作为一个基于Python的开源网络爬虫框架，凭借其高效、灵活的特性，在工业级爬虫开发中占据重要地位。本文将详细介绍Scrapy框架的基本架构、工作流程、关键组件（如Spider类与ItemPipeline）以及中间件机制，并通过一个电商产品爬虫案例，展示如何使用Scrapy框架进行数据抓取。1.Scrapy架构与工作流程Scrapy架
【算法day7】 Z 字形变换（O2算法思路整理）舔甜歌姬的EGUMI LEGACY 算法算法
Z字形变换，算法思路整理https://leetcode.cn/problems/zigzag-conversion/将一个给定字符串s根据给定的行数numRows，以从上往下、从左到右进行Z字形排列。比如输入字符串为“PAYPALISHIRING”行数为3时，排列如下：PAHNAPLSIIGYIR之后，你的输出需要从左往右逐行读取，产生出一个新的字符串，比如：“PAHNAPLSIIGYIR”。请
C++设计模式-简单工厂模式：从原理、应用、实践指南与常见问题和解决方案深度解析牵牛老人 C++专栏 c++设计模式简单工厂模式
一、简单工厂模式的核心原理1.1模式定义与本质简单工厂模式（SimpleFactoryPattern）是一种创建型的设计模式，其核心思想是通过单一的工厂类根据传入的参数，动态决定创建哪种具体产品类的实例。该模式将对象的创建过程封装在工厂类中，使得客户端无需直接调用具体产品的构造函数，实际上是利用类的多态性，实现用子类的模型创建父类对象。其本质是将对象创建与使用解耦，通过引入中间层（工厂类）来隔离变
OTP单片机调试工具 zhongvv 应广单片机开发工具使用嵌入式硬件应广单片机开发 OTP开发工具 OLED显示双机通信单线通信
大部分的OTP单片机开发流程是先用仿真器进行仿真，f仿真完成之后再烧录OTP单片机芯片进行验证，但是很多少时候会发现有一个问题，仿真器仿真都是OK的，但是一旦焊接在板上了，就往往发现有问题，因为硬件条件变化，会出现，比如ADC不准，流程不对等，这要怎么样破解呢？解决方法就是去查看寄存器/内存，根据单片机状态去判断对应流程或是数据。那离开了仿真器，怎么样去查看这些数据呢？可以根据需要选择以下方法：1
HTTP与RPC深度解析：从入门到选型实战程序猿小白菜后端java生态圈 http rpc 服务间调用
一、先看两个生活场景场景1：网购快递（HTTP）你告诉快递员：“我要寄一个包裹到上海”（请求）快递员按标准流程收件、贴单、运输（标准协议）收件人签收后反馈结果（响应）场景2：公司内部协作（RPC）财务部直接喊：“小王，把上个月报表发我！”（直接调用）小王秒回：“已发邮箱”（快速响应）双方用内部术语沟通（高效编码）HTTP就像快递流程，RPC更像同事协作。接下来我们深入技术细节。二、核心概念大白话2
大模型: 流式会话的实现方式玉成226 【大模型】java-ee
文章目录一、什么是流式会话二、长轮询(LongPolling)三、WebSocket1、特定2、工作原理3、使用场景四、Server-SentEvents(SSE)1、特点2、工作流程3、使用场景4、OkHttpClient-sse五、gPRC流六、HTTP/2流一、什么是流式会话流式会话（StreamedConversation）指的是在人机交互的过程中，以流的形式进行信息传输，而不是将信息一次
Linux系统上快速上手SPI开发————新手入门指南飘逸小卤蛋 Linux开发 linux 驱动开发 iot 嵌入式硬件物联网
LinuxSPI开发新手整理的详细入门指南，涵盖从环境搭建到实际操作的完整流程：一、环境准备确认硬件支持运行ls/dev/spidev*检查是否存在SPI设备节点（如/dev/spidev0.0），若无输出说明驱动未加载，需在内核配置中启用SPI支持：bash#安装内核头文件（以Debian为例）sudoapt-getinstalllinux-headers-$(uname-r)#检查SPI内核配
从需求文档到测试点：基于 OCR 和智能接口的高效图片信息提取与分析 Python测试之道 ocr python
在软件测试的实际工作中，需求文档是测试工程师的重要工具。然而，随着项目规模的不断扩大，需求文档中的内容变得越来越复杂，特别是图片信息往往承载了核心的业务逻辑、流程图、UI设计、表格说明以及潜在测试点。这些图片信息是测试计划和测试用例设计的关键，但手动解析这些内容不仅耗费时间，还容易遗漏重要细节。为了帮助测试工程师高效、精准地提取图片信息，并结合智能分析技术实现测试点推理，本文将分享一套完整的技术解
iOS开发 - Quartz2D绘图陆讯 iOS开发实例 Quartz-2D 绘图控件 ios 开发
Quartz2D简介是一个二维绘图引擎，同时支持iOS和Mac系统Quartz2D能完成的工作绘制图形:线条\三角形\矩形\圆\弧等绘制文字绘制\生成图片(图像)读取\生成PDF截图\裁剪图片自定义UI控件……drawRect:方法的使用常见图形的绘制：线条、多边形、圆绘图状态的设置：文字颜色、线宽等图形上下文状态的保存与恢复图形上下文栈为了便于搭建美观的UI界面，iOS提供了UIKit框架，里面
打造AI流式处理利器：用SSE和RxJava搞定实时数据流程序媛雪儿人工智能 rxjava 前端
大家好，我是程序媛雪儿。现在AI已经在各大软件中广泛应用，你们有没有想过如何在AI应用中实时处理数据流？今天咱们聊聊怎么用SSE+Rxjava处理实时数据流。一、SSE是什么SSE（后端主动推送给前端）前端发请求并和后端建立连接，后端实时推动数据给前端SSE的重要特点单向通信：SSE只支持服务器向客户端的单向通信文本格式：SSE使用纯文本格式传输数据，HTTP响应的text/event-strea
FFmpeg入门：最简单的音频播放器 _多拉不懂A梦 ffmpeg 音视频
FFmpeg入门：最简单的音频播放器欢迎大家来到FFmpeg入门的第二章，今天只做一个最简单的FFmpeg音频播放器；同样，话不多说，先上流程图流程图以上流程和视频播放器的解码过程基本上是一致的；不同点在于SDL的渲染方式。下面我会重点说一下这个部分SDL音频渲染音频渲染的方式和视频不太一样的，我们对于音频的播放速度其实是根据采样率定义的（音频的采样率==视频的帧率），在初始化的时候SDL播放器就
WPF基础知识61-80 观无 c#
数据访问与处理61.如何在WPF应用程序中使用ADO.NET进行数据库访问？答案：首先需要引用System.Data.SqlClient（针对SQLServer数据库，若为其他数据库需引用相应的库）。然后创建数据库连接对象，根据数据库类型选择对应的连接字符串。使用SqlCommand对象来执行SQL查询或命令，通过SqlDataReader读取查询结果，或者使用SqlDataAdapter和Dat
软件实施工程师面试 XYZLHL GOOD JOB 面试
软件实施工程师面试引用原文：软件实施工程师的经验之谈（适合新手，老鸟请指正）实施干嘛的呢？说简单通俗点，开发就是研发生产电视机的，我们实施就是给买电视机的人去进行安装调试，试运行完了签验收单收款和后期的日常维护1.必会技能嘴：会说话数据库，还有Linux系统，WindowsServer系统，服务器等等实施流程：项目启动——需求调研——需求确认——部署软件环境，调试软件——导入数据（构库）——测试环
实战指南：利用电商API接口高效获取商品评论数据爱搞技术的猫猫 API 服务器 linux unix 数据库大数据
在数字化营销时代，商品评论数据已成为企业优化产品、洞察市场的核心资源。无论是分析消费者偏好、监控竞品动态，还是评估市场趋势，电商平台的评论数据都能提供关键洞察。本文将系统讲解如何通过主流电商平台（如淘宝、京东、拼多多）的API接口，合规、高效地获取评论数据，并提供完整的代码实现与实战技巧。一、电商API接口的核心价值与通用流程1.1数据价值用户洞察：分析好评关键词（如“续航强”“手感好”）与差评痛
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&