老师没讲

Hadoop分布式文件系统（HDFS）知识梳理（超详细）

气性不和平，则文章事功俱无足取
语言多矫饰，则人品心术尽属可疑

HDFS知识梳理

应用背景

当数据集的大小超过一台独立物理计算机的存储能力时，有必要对它进行分区并存储到若干台单独的计算机上
管理网络中跨多台计算机存储的文件系统称为分布式文件系统
分布式文件系统架构于网络之上，必然会引入网络编程的复杂性，分布式文件系统比普通磁盘文件系统更加复杂
Hadoop有一个抽象的文件系统概念，HDFS是其中的一个实现

简介

分布式存储系统HDFS（Hadoop Distributed File System）是一个文件系统，类似于Linux的文件系统。HDFS有目录，目录下可以存储文件，但它是一个分布式的文件系统。

基本原理

将文件切分成等大的数据块，分别存储到多台机器上
每个数据块存在多个备份
数据切分、容错、负载均衡等功能透明化
可将HDFS看成是一个巨大的、具有容错性的磁盘

优点

处理超大文件
流式访问数据
运行于廉价的商用集群上

缺点

不适合存储大量小文件
不适合低延迟数据访问
不支持多用户写入和任意修改文件

设计

HDFS以流式数据访问模式来存储超大文件，运行于商用硬件集群上

超大文件
- 几百MB、GB、TB大小的文件，现已有Hadoop集群存储PB级数据
流式数据访问
- 一次写入，多次读取是最高效的访问模式
- 数据集通常由数据源生成或者从数据源复制而来，会长时间在此数据集上进行分析，每次均会涉及大部分或者全部数据，读取整个数据集的时间延迟比读取第一条记录的时间延迟更重要
商用硬件
- HDFS设计运行在商用硬件上，即在各种零售店都能买到的普通硬件
- 节点故障几率高
- HDFS被设计成在遇到故障时能够继续运行，不让用户察觉到明显的中断
- 某些应用领域不适合使用HDFS
低延迟的数据访问
- HDFS为高数据吞吐量应用优化，以增加时间延时为代价
- 要求几十毫秒低时间延迟访问的应用，不适合在HDFS上运行，更适合于HBase
大量的小文件
- NameNode将存储文件系统的元数据存储在内存中，该文件系统所能存储的文件总数受限于NameNode的内存容量
- 每个文件、目录和数据块的存储信息大约占150字节
  存储上百万个文件是可行的，存储十亿个文件就超出了当前硬件的能力
多用户写入，任意修改文件
- 文件写入只支持单个写入者，不支持多个写入者
- 写操作以“只添加”的方式在文件末尾写数据，不支持在文件任意位置进行修改
- 以后可能支持这些操作，但相对比较低效

概念

HDFS架构图
注：Rack-机架 Replication-副本 Block-数据块 Metadata-元数据

数据块
- 每个磁盘有默认的数据块大小，是磁盘进行数据读写的最小单位
- 构建于单个磁盘之上的文件系统通过磁盘块来管理该文件系统中的块，该文件系统块的大小可以是磁盘块的整数倍
- HDFS同样有块（Block）的概念，默认为128MB
- 与单一磁盘上的文件系统相似，HDFS上的文件也被划分为块大小的多个分块（Chunk），作为独立的存储单元
- 与其他文件系统不同，HDFS中小于一个块大小的文件不会占据整个块的空间
- 优点
  - 一个大文件不用存储于整块磁盘上，可以分布式存储
  - 使用块抽象而非整个文件作为存储单元，大大简化了存储子系统的设计，对于故障种类繁多的分布式系统尤为重要
- 显示块信息的命令hdfs fsck / -files -blocks
NameNode
- HDFS架构中的主节点
- 管理各个从节点（DataNode）的状态
- 记录存储在HDFS上所有数据的元数据信息，如Block存储的位置、文件大小、文件权限、文件层级等
- 上述信息以两个文件的形式永久保存于本地磁盘
  - 命名空间镜像文件（FsImg）
    FsImage是HDFS文件系统存于硬盘中的元数据检查点，里面记录了自最后一次检查点之前HDFS文件系统中所有目录和文件的序列化信息
  - 编辑日志文件（Edit-logs）
    - 保存了自最后一次检查点之后所有针对HDFS文件系统的操作，如增加文件、重命名文件、删除目录等
    - NameNode将改动写入Edit-logs是由DataNode的写操作触发的，
- 记录存储在HDFS上文件的所有变化
- 接受DataNode的心跳和DataNode上的Blocak报告信息，确认DataNode是否存活
- 负责处理所有块的复制因子
- 如果DataNode节点宕机，NameNode会选择另外一个DataNode均衡复制因子，并做负载均衡
- 可参考官网
DataNode
- DataNode是HDFS架构的从节点，管理各自节点的Block信息
- 文件内的数据实际存储于DatNode
- DataNode分别运行于独立的节点
- DataNode执行客户端级别的读写请求
- DataNode向NameNode发送心跳（默认设置为3秒），报告各自节点的健康状况
Secondary NameNode
- Secondary NameNode是NameNode的助手，不是其备份
- Secondary NameNode在HDFS中提供Chekpoint Node，因此也称之为Chekpoint Node
- 定时从NameNode获取Edit-logs，更新到自己的FsImage上
- 一旦Secondary NameNode有新的FsImage文件，就将其拷贝回NameNode，NameNode在下次重启时会使用新的FsImage文件，从而减少重启时间
复制因子
- 复制因子使得HDFS提供可靠存储
- 默认复制因子为3
- DataNode定时发送心跳给NameNode，汇报各自节点的Block信息，NameNode手机这些信息后，对超出复制因子的Block进行删除，对复制份数不足的Block进行赋值
机架感知
- 分布式集群通常包含非常多的机器，收到机架槽位和交换机网口的限制，通常大型分布式集群会跨好几个机架
- 机架内机器之间的网络速度通常会高于跨机架机器之间的网络速度
- 机架之间机器的网络通信通常受到上层交换机间网络带宽的限制
- 文件块的放置
  - 假设一个Block有3份备份
  - 一份放在NameNode指定的DataNode上，一份放在与指定DataNode不在同一台机器上的DataNode上，最后一份放在与指定DataNode同一机架的DataNode上
  - 备份的目的是为了数据安全，采用这种配置方式主要是考虑同一机架内机器宕机的情况，以及不同机架之间进行数据复制会带来的性能降低问题
客户端（Client）
- 客户端是一个需要获取分布式文件系统文件的应用程序
- 客户端代表用户通过NameNode和DataNode访问整个文件系统
- 客户端提供一个类似于POSIX（可移植操作系统界面）的文件系统接口，用户在编程时无需知道NameNode和DataNode也可实现其功能
- 假设data.txt文件大小为238MB，现需要将其写入HDFS中，假设HDFS块大小设置为默认值128MB，则客户端会将此文件拆分成两个块，第一个块是128MB，第二个块是110MB

读写流程

文件写入

客户端向NameNode发起写入文件请求
NameNode根据文件大小和文件块配置情况，以及结合了DataNode的健康状态、复制因子、机架感知等因素，将可以写入数据的DataNode的IP地址列表返回给客户端，赋予客户端写权限
客户端将文件划分为多个块，根据所得的DataNode地址信息，按序将其写入DataNode块中

第3步的数据复制流程分为以下3个阶段

流水线建立
写入数据前，客户端要确认所得的IP列表是否准备好接收数据，然后连接各个块的IP列表创建流水线
复制数据
客户端向流水线写入数据时，将块复制到第一个DataNode节点，其他DataNode节点的复制是在DataNode节点之间完成
关闭流水线
当数据复制到所有的DataNode后，按照IP地址列表相反的方向依次写入成功信息，第一个DataNode节点将成功信息反馈给NameNode，NameNode更新编辑日志文件中的元数据信息，客户端将流水线关闭

注意：多个Block的写入是并行进行的，即多个Block同时写入

文件读取

客户端向NameNode发起文件写入请求
NameNode根据自己的元数据信息，将一个DataNode列表的信息（其块存储了该文件）返回给客户端
客户端连接DataNode，读取块中的数据
客户端将多个块中的数据进行合并

命令行接口

appendToFile
hadoop fs -appendToFile ...
添加（追加）一个或多个源文件到目标文件中，或者将标准输入中的数据写入目标文件
balancer
hdfs balancer [-threshold ] [-policy ] [-exclude [-f | ]] [-include [-f | ]] [-idleiterations ]
用于平衡Hadoop集群中各DataNode中的文件块分布，以避免出现部分DataNode磁盘占用率高的问题

选项名称	说明
-threshold	表示平衡的阀值，取值范围在0%到100%之间即每个DataNode中空间使用率与HDFS集群总的空间使用率的差距百分比
-policy	平衡策略，默认DataNode 应用于重新平衡HDFS存储的策略，默认DataNode策略平衡了DataNode 级别的存储，这类似于之前发行版的平衡策略 BlockPool 策略平衡了块池级别和DataNode级别的存储，BlockPool策略仅适用于Federated HDFS服务
-exclude/include	参数`-exclude`和`-include`是用来选择Balancer时，可以指定哪几个DataNode之间重分布也可以从HDFS集群中排除哪几个节点不需要重分布
-idleiterations	迭代检测的次数

cat
hadoop fs -cat URI [URI ...]
将路径指定文件的内容输入到stdout
chgrp
hadoop fs -chgrp [-R] GROUP URI [URI ...]
改变文件或目录的组信息
chmod
hadoop fs -chmod [-R] URI [URI ...]
修改文件权限，修改者必须拥有该目录权限，或者是拥护者的父用户
-R表示递归
chwon
hadoop fs -chwon [-R] [OWNER] [:[GROUP]] URI [URI ...]
修改文件拥有者，修改者必须拥有该文件或者是其父用户
-R表示递归
copyFromLocal
hadoop fs -copyFromLocal URI
拷贝本地文件到HDFS，类似于put命令，但可以拷贝目录
-f表示覆盖原来已存在目录
copyToLocal
hadoop fs -copyToLocal [-ignorecrc] [-crc] URI
拷贝HDFS文件到本地，类似于get命令，但可以拷贝目录
count``
hadoop fs -count [-q] [-h] [-v]
统计目录下的文件数和空间占用情况
-h表示输出格式化后的信息
-v表示输出表头

-count	-count -q	输出列	说明
	√	QUOTA	命名空间quota（创建的文件数目）
	√	REMAINING_QUOTA	剩余的命名空间quota（剩余能创建的文件数目）
	√	SPACE_QUOTA	物理空间quota（限制磁盘空间占用大小）
	√	REMAININNG_SPACE_QUOTA	剩余的物理空间
√	√	DIR_COUNT	目录数目
√	√	FILE_COUNT	文件数目
√	√	CONTEXT_SIZE	目录逻辑空间大小
√	√	PATHNAME	路径

cp
hadoop fs -cp [-f] [-p | -p[topax]] URI [URI ...]
将文件从源路径复制到目标路径
该命令允许有多个源路径，此时目标路径必须是一个目录
-f表示如果目标目录已存在，则覆盖之前的目录
distcp
hadoop distcp
分布式拷贝（DistCp）是用于大规模集群内部和集群之间拷贝的工具
它使用Map/Reduce实现文件分发、错误处理和恢复以及报告生成
它把文件和目录的列表作为Map任务的输入，每个任务会完成源列表中部分文件的拷贝
由于使用了Map/Reduce方法，这个工具在语义和执行上都会有特殊的地方

标识	描述	备注
-p[rbugp]	Preserve r:replication number b:blocak size u:user g:group p:permission	修改次数不会被保留当指定`-update`时，更新的状态不会被同步，除非文件大小不同，比如文件被重新创建
-i	忽略失败	该选项回避默认情况提供关于拷贝的更精确的统计，同时它还将保留失败拷贝操作的日志，这些日志信息可以用于调试如果一个Map失败了，但并没完成所有分块任务的尝试，这不会导致整个作业的失败
-log	记录日志到	DisCp为每个文件的每次尝试拷贝操作都记录入职，并把日志作为Map的输出如果一个Map失败了，当重新执行时这个日志不会被保留
-m	同时拷贝的最大数目	指定了拷贝数据时Map的数目并不是Map越多吞吐量越大
-overwrite	覆盖目标	如果一个Map失败并且没有使用`i`选项，不仅仅那些拷贝失败的文件，这个分块任务中的所有文件都会被重新拷贝它会改变生成目标路径的语义，用户需要小心使用该选项
-update	如果源和目标的大小不一样则进行覆盖	这不是“同步”操作，是否执行覆盖的唯一标准是源文件和目标文件大小是否相同如果不同，则源文件替换目标文件它会改变生成目标路径的语义，用户需要小心使用该选项
-f	使用作为源文件列表	等价于把所有文件名列在命令行中 urilist_uri列表应该是完整合法的URI

参考官网
12. df
hadoop fs -df [-h] URI [URI ...]
显示目录空闲空间
-h表示转换为更加易读的方式，比如67108864用64M代替
13. dfsadmin
hadoop dfsadmin [GENERIC_OPTIONS]
hadoop dfsadmin支持一些和HDFS管理相关的操作
hadoop dfsadmin -help能列出所有当前支持的命令

命令选项	描述
-report	报告文件系统的基本信息和统计信息
-safemode enter \| leave \| get \| wait	安全模式维护命令安全模式是NameNode的一个状态，在这种状态下，NameNode不接受对名字空间的更改（只读），并且不复制或者删除块 NameNode会在启动时自动进入安全模式，当配置的块最小百分比数满足最小的副本数条件时，会自动离开安全模式安全模式可以手动进入，但是这样的话也必须手动关闭安全模式
-refreshNodes	重新读取hosts和exclude文件更新允许连到NameNode的或那些需要退出或入编的DataNode的集合
-finalizeUpgrade	中街HDFS的升级操作，DataNode删除前一个版本的工作目录，之后NameNode也删除前一个版本的工作目录这个操作完结整个升级过程
-upgradeProgress status \| details \| force	请求当前系统的升级状态以及状态细节，或者强制进行升级操作
-metasave filename	保存NameNode的主要数据结构到hadoop.log.dir属性指定的目录下的文件对于下面每一项，中均有一行内容与之对应 1. NameNode收到的DataNode心跳信号 2. 等待被复制的块 3. 正在被复制的块 4. 等待被删除的块
-setQuota …	为每个目录设定配额，目录配额是一个长整型整数，强制限定了目录树下的名字个数下列情况之一会报错 1. N不是一个正整数 2. 用户不是管理员 3. 这个目录不存在或者是文件 4. 目录会马上超出新设定的配额
-clrQuota …	为每个目录清除配额设定下列情况之一会报错 1. 这个目录不存在或者是文件 2. 用户不是管理员如果目录原来没有配额则不会报错

expunge
hadoop fs -expunge
清空回收站
fsck
hdfs fsck [-list-corruptfileblocks |[-move | -delete | -openforwrite] [-files [-blocks [-locations | - racks]]] [-includeSnapshots] [-storagepolicies] [-blockId ]
检查HDFS上文件和目录的健康状态、获取文件的Block信息和位置信息等

选项名	说明
-list -corruptfileblocks	查看文件中损坏的块
-move	将损坏的文件移动至 /lost+found 目录
-delete	删除损坏的文件
-files	检查并列出所有文件状态
-openforwrite	检查并打印正在被打开执行写操作的文件
-blocks	打印文件的Block报告（需要和`-files`一起使用）
-locations	打印文件块的位置信息（需要和`-files -blocks`一起使用）
-racks	打印文件块位置所在的机架信息

get
hadoop fs -get [-ignorecrc] [-crc]
复制文件到本地文件系统
getConf
hdfs getconf
用于获取HDFS配置信息

命令选项	说明
path	从此路径开始检查
-delete	删除损坏的文件
-files	打印出正在检查的文件
-files -blocks	打印块报告
-files -blocks -locations	打印每个块的位置
-files -blocks -racks	打印出DataNode位置的网络拓扑
-includeSnapshots	如果给定路径指示快照表目录或其下有快照表目录，则包含快照数据
-list -corruptfileblocks	打印出丢失的块和它们所属的文件的列表
-move	将损坏的文件移至 /lost+found
-openforwrite	打印出已打开以供写入的文件
-storagepolicies	打印出块的存储策略摘要
-blockId	打印出该块的信息

参考官网

getmerge
hadoop fs -getmerge [addnl]
接受一个源目录和一个目标作为输入，并且将源目录中所有的文件连接成本地目标文件
addnl是可选的，用于指定在每个文件结尾添加一个换行符
ls
hadoop fs -ls
lsr
hadoop fs -lsr
ls命令的递归版本，类似于Unix中ls -R
mkdir
hadoop fs -mkdir
接受路径指定的URI作为参数，创建这些目录
其行为类似于Unix的mkdir -p，它会创建路径中的各级父目录
mv
hadoop fs -mv URI [URI ...]
将文件从源路径移动到目标路径
该命令允许有多个源路径，此时目标路径必须是一个目录
不允许在不同的文件系统间移动文件
oev
hdfs oev [OPTIONS] i INPUT_FILE -o OUTPUT_FILE
用于查看edits文件

参数名	说明	必选参数	可选参数
-i, –inputFile	输入edits文件，如果是xml后缀，表示XML格式，其他表示二进制	√
-o,–outputFile	输出文件，如果已存在，则会覆盖原文件	√
-p,–processor	指定转换类型：binary （二进制格式），xml （默认，XML格式），stats （打印edits文件的静态统计信息）		√
-f, –fix -txids	重置输入edits文件中的transaction IDs		√
-r, –recover	使用recovery模式，跳过eidts中的错误记录		√
-v, –verbose	打印处理过程的输出		√

oiv
hdfs oiv [OPTIONS] -i INPUT_FILE
用于将FsImage文件转换成其他格式文件，如文本文件、XML文件
参数名 | 说明 | 必选参数 | 可选参数
:-: | :-: | :-: | :-:
-i, –inputFile |输入FsImage文件|√|
-o, –outputFile |输出转换后的文件，如果已存在，则会覆盖原文件|√|
-p, –processor |将FsImage文件转换成其他格式（LS\XML\FileDistribution），默认为LS||√
-h, –help|显示帮助信息||√
put
hadoop fs -put ...
从本地文件系统中复制单个或多个源路径到目标文件系统，也支持从标准输入中读入输入写入目标文件系统
rm
hadoop fs -rm URI [URI ...]
删除指定的文件，只删除非空目录和文件
-r 表示递归删除
setrep
hadoop fs -setrep [-R] [-w]
改变一个文件的副本系数
-R选项用于递归改变目录下所有文件的副本系数
-w选项指定该请求等待操作执行结束
stat
hadoop fs -tail [-f] URI
返回执行路径的统计信息

`-f`选项	说明
%F	文件类型
%b	文件大小
%g	所属组
%o	Block大小
%n	文件名
%r	复制因子数
%u	文件所有者
%Y, %y	修改日期

tail
hadoop fa -tail [-f] URI
将文件尾部1KB字节内容输出到stdout
-f表示根据文件描述符进行追踪，当文件改名或被删除，追踪停止
text
hadoop fs -text
类似于cat，将源文件输出为文本格式
允许的格式是zip和TextRecordInputStream
touchz
hadoop fs -touchz URI [URI ...]
创建一个0字节的空文件
truncate
hadoop fs -truncate [-w]
文件截断
-w表示要求该命令等待回复完成
usage
hadoop fs -usage command
返回命令的帮助信息
find
hadoop fs - find ..
查找满足表达式的文件和文件夹
没有配置path，默认是全部目录/
没有配置表达式，默认为-print

expression选项	说明
-name pattern	不区分大小写，对大小写不敏感
-iname pattern	对大小写敏感
-print	打印
-print0	打印在一行

getfacl
hadoop fs -getfacl [-R]
获取文件的ACL权限
-R指定递归查找
HDFS快照

HDFS快照是一个只读的基于时间点文件系统拷贝，快照可以是整个文件系统的，也可以是其中的一部分，常用来作为数据备份和容灾，防止用户错误
在DataNode上面的Blocks不会被复制，做Snapshot 的文件纪录了Block的列表和文件的大小，但是没有数据的复制
Snapshot 并不会影响HDFS 的正常操作，即修改会按照时间的反序记录，这样可以直接读取到最新的数据，快照数据是根据当前数据减去修改的部分计算出来
快照会存储在snapshottable目录下，snapshottable存储的快照最多为65535个
snapshottable的目录数量没有限制，管理员可以将任何目录设置为snapshottable
如果snapshottable里面已存放快照，那么该文件夹不能删除或者改名

命令	说明
hdfs dfsadmin -allowSnapshot	建立快照目录如果该操作成功，那么目录会变成snapshottable
hdfs dfsadmin -disallowSnapshot	文件夹里面所有快照在快照失效前必须被删除，如果没有该目录，则会建立
hdfs dfsadmin -createSnapshot []	snapshottable目录创建一个快照该命令需要snapshottable目录的权限
hdfs dfsadmin -deleteSnapshot	从一个snapshottable目录删除快照该命令需要snapshottable目录的权限
hdfs dfsadmin -renameSnapshot	重命名快照该命令需要snapshottable目录的权限
hdfs lsSnapshottableDir	获取当前用户的所有snapshottable
hdfs snapshotDiff	得到两个快照之间的不同该命令需要两个目录的权限

Java接口

连接Hadoop集群

Eclipse

Eclipse连接Hadoop集群

IntelliJ IDEA

IntelliJ IDEA连接Hadoop集群

Hadoop分布式文件系统Java接口详细版

Hadoop分布式文件系统（HDFS）Java接口（HDFS Java API）详细版

简介

Hadoop的FileSystem类是与Hadoop的某一文件系统进行交互的API
DistributedFileSystem是HDFS实例
我们应该集成FileSystem抽象类，并编写代码，使其在不同文件系统中可移植，便于测试自己写的程序，例如可以使用本地文件系统中的存储函数快速进行测试

文件系统

Hadoop有一个抽象的文件系统概念，HDFS只是其中的一个实现
Java抽象类org.apache.hadoop.fs.FileSystem定义了Hadoop中一个文件系统的客户端接口，并且该抽象类有几个具体实现，其中和Hadoop紧密相关的见下表

文件系统	URI方案	Java实现（都在org.apache.hadoop包中）	描述
Local	file	fs.LocalFileSystem	使用客户端校验和的本地磁盘文件系统使用RawLocalFileSystem表示无校验和的本地磁盘文件系统
HDFS	hdfs	hdfs.DistributedFileSystem	Hadoop的分布式文件系统将HDFS设计成与MapReduce结合使用，可以实现高性能
WebHDFS	Webhdfs	Hdfs.web.WebHdfsFileSystem	基于HTTP的文件系统，提供对HDFS的认证读/写访问
Secure WebHDFS	swebhdfs	hdfs.web.SWebHdfsFileSystem	WebHDFS的HTTPS版本
HAR	har	fs.HarFileSystem	一个构件在其他文件系统之上用于文件存档的文件系统 Hadoop存档文件系统通常用于将HDFS中的多个文件打包成一个存档文件，以减少NameNode内存的使用使用Hadoop的`achive`命令来创建HAR文件
View	viewfs	viewfs.ViewFileSystem	针对其他Hadoop文件系统的客户端挂载表通常用于为联邦NameNode创建挂载点
FTP	ftp	fs.ftp.FTPFileSystem	由FTP服务器支持的文件系统
S3	S3a	fs.s3a.S3AFileSystem	由Amazon S3支持的文件系统，代替老版本的s3n（S3 原生）实现
Azure	wasb	fs.azure.NativeAzureFileSystem	由Microsoft Azure支持的文件系统
Swift	swift	fs.swift.snative.SwiftNativeFileSystem	由OpenStack Swift支持的文件系统

Hadoop对文件系统提供了许多接口，它一般使用URI方案来选取合适的文件系统实例进行交互
命令hadoop fs -ls file:////可以列出本地文件系统根目录下的文件

接口

Hadoop是用Java写的，通过Java API可以调用大部分Hadoop文件系统的交互操作，比如文件系统的命令解释器就是一个Java命令，它是用Java的FileSystem类来提供文件系统操作
下面是一些文件系统接口介绍，这些接口通常与HDFS一同使用，因为Hadoop中的其它文件系统一般有访问基本文件系统的工具，但它们大多数都能用于任何Hadoop文件系统

HTTP

由WebHDFS协议提供的HTTPP REST API使得其他语言开发的应用能够很方便地与HDFS交互
HTTP接口比原生的Java客户端要慢，尽量不要使用它来传输特大数据
通过HTTP访问HDFS有两种方法，两者都使用了WebHDFS协议
- 直接访问
  HDFS守护进程直接服务于来自客户端的HTTP请求
- 通过代理（一个或多个）访问
  客户端通常使用DistributedFileSystem API访问HDFS

C语言

Hadoop提供一个名为libhdfs的C语言库，该语言库是Java FileSystem接口类的一个镜像（它被写成访问HDFS的C语言库，但其实它可以访问任何一个Hadoop文件系统）
使用Java原生接口（JNI）调用Java文件系统客户端
还有一个libwebhdfs库，该库使用了WebHDFS接口
其开发滞后于Java API，一些新特性不支持

NFS

使用Hadoop的NFSv3网关将HDFS挂载为本地客户端的文件系统是可行的
可以使用Unix实用程序（如ls和cat）与该文件系统交互，上传文件，通过任意一种编程语言调用POSIX库来访问文件系统
关于如何配置和运行NFS网关，以及如何从客户端连接网关，可以参考Hadoop官网相关文档资料

FUSE

用户空间文件系统（Filesystem in Userspace）允许将用户空间实现的文件系统作为Unix文件系统进行集成
通过使用Hadoop的Fuse-DFS功能模块，HDFS（或任何一个Hadoop）文件系统均可以作为一个标准的本地文件系统进行挂载
Fuse-DFSS是用C语言实现的，使用libhdfs作为访问HDFS的接口
在写操作时，Hadoop NFS网关对于挂载HDFS来说是更健壮的解决方案，相比Fuse-DFS而言应优先选择

有疑问的朋友可以在下方留言或者私信我，我尽快回答
欢迎各路大神萌新指点、交流！
求关注！求点赞！求收藏！

你可能感兴趣的:(Hadoop)

大数据学习（67）- Flume、Sqoop、Kafka、DataX对比 viperrrrrrr 大数据学习 flume kafka sqoop datax
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦工具主要作用数据流向实时性数据源/目标应用场景Flume实时日志采集与传输从数据源到存储系统实时日志文件、网络流量等→HDFS、HBase、Kafka等日志收集、实时监控、实时分析Sqoop关系型数据库与Hadoop间数据同步关系型数据库→Hadoop生态系统（HDFS、Hive、
Kubernetes集群版本升级程序员Realeo Java后端 kubernetes 容器云原生
集群升级注意事项升级集群版本建议逐步升级，比如v1.20.1–>v1.21.1–>v1.22.1–>v1.23.1–>v1.24.1，不能跨度过大，否则会报错。升级步骤查看集群版本[root@hadoop102~]#kubectlgetnodesNAMESTATUSROLESAGEVERSIONhadoop102Ready,SchedulingDisabledcontrol-plane,maste
Kubernetes集群版本升级后端java
集群升级注意事项升级集群版本建议逐步升级，比如v1.20.1–>v1.21.1–>v1.22.1–>v1.23.1–>v1.24.1，不能跨度过大，否则会报错。升级步骤查看集群版本[root@hadoop102~]#kubectlgetnodesNAMESTATUSROLESAGEVERSIONhadoop102Ready,SchedulingDisabledcontrol-plane,maste
Hive高级SQL技巧及实际应用场景小技工丨大数据随笔 sql hive 数据仓库大数据
Hive高级SQL技巧及实际应用场景引言ApacheHive是一个建立在Hadoop之上的数据仓库基础设施，它提供了一个用于查询和管理分布式存储中的大型数据集的机制。通过使用类似于SQL（称为HiveQL）的语言，Hive使得数据分析变得更加简单和高效。本文将详细探讨一些Hive高级SQL技巧，并结合实际的应用场景进行说明。HiveSQL的高级使用技巧1.窗口函数描述：窗口函数允许我们在不使用GR
hive 数字转换字符串_Hive架构及Hive SQL的执行流程解读 weixin_39756416 hive 数字转换字符串
1、Hive产生背景MapReduce编程的不便性HDFS上的文件缺少Schema(表名，名称，ID等，为数据库对象的集合)2、Hive是什么Hive的使用场景是什么？基于Hadoop做一些数据清洗啊(ETL)、报表啊、数据分析可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。Hive是SQL解析引擎，它将SQL语句转译成M/RJob然后在Hadoop执行。由Facebook开源，
在hadoop上运行python_hadoop上运行python程序廷哥带你小路超车
数据来源：http://www.nber.org/patents/acite75_99.zip首先上传测试数据到hdfs：[root@localhost:/usr/local/hadoop/hadoop-0.19.2]#bin/hadoopfs-ls/user/root/test-inFound5items-rw-r--r--1rootsupergroup1012010-10-2414:39/us
ranger集成starrock报错蘑菇丁大数据+机器学习+oracle 大数据
org.apache.ranger.plugin.client.HadoopException:initConnection:UnabletoconnecttoStarRocksinstance,pleaseprovidevalidvalueoffield:{jdbc.driverClassName}..com.mysql.cj.jdbc.Driver.可能的原因JDBC驱动缺失：运行环境中没有安
深入大数据世界：Kontext.TECH的Hadoop之旅钱桦实Emery
深入大数据世界：Kontext.TECH的Hadoop之旅winutils项目地址:https://gitcode.com/gh_mirrors/winut/winutils在大数据的浩瀚宇宙中，Hadoop作为一颗璀璨的星辰，一直扮演着至关重要的角色。对于渴望探索这一领域的开发者和学习者而言，Kontext.TECH提供了一扇独特而便捷的大门，让你的学习之旅更加顺畅。项目介绍Kontext.Ha
大数据学习（61）-Impala与Hive计算引擎 viperrrrrrr 学习 impala hive yarn hadoop
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、impala与yarn资源管理YARN是ApacheHadoop生态系统中的一个资源管理器，它采用了master/slave的架构，使得多个处理框架能够在同一集群上共享资源。Impala作为Hadoop生态系统中的一个组件，可以与YARN集成，以便更好地管理
大数据学习（62）- Hadoop-yarn viperrrrrrr 大数据 yarn
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、YARN概述1.YARN简介Hadoop-YARN是ApacheHadoop生态系统中的一个集群资源管理器。它作为Hadoop的第二代资源管理框架，负责管理和分配集群中的计算资源。YARN的设计目标是提供一个通用的资源管理框架，使得Hadoop集群可以同时运
HBase2.6.1部署文档 CXH728 zookeeper hbase
1、HBase概述ApacheHBase是基于Hadoop分布式文件系统（HDFS）之上的分布式、列存储、NoSQL数据库。它适合处理结构化和半结构化数据，能够存储数十亿行和数百万列的数据，并支持实时读写操作。HBase通常应用于需要快速随机读写、低延迟访问以及高吞吐量的场景，例如大规模日志处理、社交网络数据存储等。HBase特性列存储模型：HBase的数据是按列族存储的，适合高稀疏数据。行键分区
Hive-4.0.1版本部署文档 CXH728 hive hadoop 数据仓库
1.前置要求操作系统：建议使用CentOS7或Ubuntu20.04（本试验使用的是CentOSLinuxrelease7.9.2009(Core)）Java环境：建议安装Java8或更高版本。Hadoop：Hive需要依赖Hadoop进行分布式存储，建议安装Hadoop3.x版本（本实验采用的是hadoop3.3.6）。数据库：HiveMetastore需要数据库支持，建议使用MySQL、Pos
hive-3.1.3部署文档 CXH728 hive hadoop 数据仓库
提前准备一个正常运行的hadoop集群java环境hive安装包下载地址：https://archive.apache.org/dist/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gzmysql安装包1、内嵌模式由于内嵌模式使用场景太少（基本不用），所以仅练习安装查看基础功能[root@master~]#tarxfapache-hive-3.1.3-bin
mySQL和Hive的区别 iijik55 面试学习路线阿里巴巴 hive mysql 大数据 tomcat 面试
SQL和HQL的区别整体1、存储位置：Hive在Hadoop上；Mysql将数据存储在设备或本地系统中；2、数据更新：Hive不支持数据的改写和添加，是在加载的时候就已经确定好了；数据库可以CRUD；3、索引：Hive无索引，每次扫描所有数据，底层是MR，并行计算，适用于大数据量；MySQL有索引，适合在线查询数据；4、执行：Hive底层是MapReduce；MySQL底层是执行引擎；5、可扩展性
flink-cdc实时增量同步mysql数据到elasticsearch 大数据技术派 #Flink elasticsearch flink mysql
什么是CDC？CDC是（ChangeDataCapture变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入INSERT、更新UPDATE、删除DELETE等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。1.环境准备mysqlelasticsearchflinkonyarn说明：如果没有安装hadoop，那么可以不用yarn，直
搭建分布式Hive集群逸曦玥泱大数据运维分布式 hive hadoop
title:搭建分布式Hive集群date:2024-11-2923:39:00categories:-服务器tags:-Hive-大数据搭建分布式Hive集群本次实验环境：Centos7-2009、Hadoop-3.1.4、JDK8、Zookeeper-3.6.3、Mysql-5.7.38、Hive-3.1.2功能规划方案一（本地运行模式）Master主节点（Mysql+Hive）192.168
Hadoop、Spark和 Hive 的详细关系夜行容忍 hadoop spark hive
Hadoop、Spark和Hive的详细关系1.ApacheHadoopHadoop是一个开源框架，用于分布式存储和处理大规模数据集。核心组件：HDFS(HadoopDistributedFileSystem)：分布式文件系统，提供高吞吐量的数据访问。YARN(YetAnotherResourceNegotiator)：集群资源管理和作业调度系统。MapReduce：基于YARN的并行处理框架，用
Windows系统下解压".tar"文件出错，提示：无法创建符号链接，可能需要以管理器身份运行winrar ruangaoyan
1、解压文件出错，如下信息：D:\tools\hadoop-3.1.2.tar.gz:无法创建符号链接D:\tools\hadoop-3.1.2\hadoop-3.1.2\lib\native\libhadoop.so您可能需要以管理器身份运行WinRAR!客户端没有所需的特权。2、解决方式如下：WIN+R快捷的打开命令窗口，输入CMD输入：cd/dD:\tools\hadoop-3.1.2这是我
大数据技术生态圈：Hadoop、Hive、Spark的区别和关系雨中徜徉的思绪漫溢大数据 hadoop hive
大数据技术生态圈：Hadoop、Hive、Spark的区别和关系在大数据领域中，Hadoop、Hive和Spark是三个常用的开源技术，它们在大数据处理和分析方面发挥着重要作用。虽然它们都是为了处理大规模数据集而设计的，但它们在功能和使用方式上存在一些区别。本文将详细介绍Hadoop、Hive和Spark的区别和关系，并提供相应的源代码示例。Hadoop：Hadoop是一个用于分布式存储和处理大规
ZooKeeper学习总结（1）——ZooKeeper入门介绍一杯甜酒 ZooKeeper学习总结 Zookeeper
1.概述Zookeeper是Hadoop的一个子项目，它是分布式系统中的协调系统，可提供的服务主要有：配置服务、名字服务、分布式同步、组服务等。它有如下的一些特点：简单Zookeeper的核心是一个精简的文件系统，它支持一些简单的操作和一些抽象操作，例如，排序和通知。丰富Zookeeper的原语操作是很丰富的，可实现一些协调数据结构和协议。例如，分布式队列、分布式锁和一组同级别节点中的“领导者选举
Zookeeper+kafka学习笔记 CHR_YTU Zookeeper
Zookeeper是Apache的一个java项目，属于Hadoop系统，扮演管理员的角色。配置管理分布式系统都有好多机器，比如我在搭建hadoop的HDFS的时候，需要在一个主机器上（Master节点）配置好HDFS需要的各种配置文件，然后通过scp命令把这些配置文件拷贝到其他节点上，这样各个机器拿到的配置信息是一致的，才能成功运行起来HDFS服务。Zookeeper提供了这样的一种服务：一种集
麒麟arm架构系统_安装nginx-1.27.0_访问500 internal server error nginx解决_13: Permission denied---Linux工作笔记072 添柴程序猿 java nginx-1.27.0 nginx最新版安装麒麟v10 arm架构麒麟v10 安装nginx
[[email protected]]#wget-chttp://nginx.org/download/nginx-1.27.0.tar.gz--2024-07-0509:47:00--http://nginx.org/download/nginx-1.27.0.tar.gzResolvingnginx.org(nginx.org)...3.125.197.172,52.58.19
Zookeeper与Kafka学习笔记上海研博数据 zookeeper kafka 学习
一、Zookeeper核心要点1.核心特性分布式协调服务，用于维护配置/命名/同步等元数据采用层次化数据模型（Znode树结构），每个节点可存储<1MB数据典型应用场景：HadoopNameNode高可用HBase元数据管理Kafka集群选举与状态管理2.设计限制内存型存储，不适合大数据量场景数据变更通过版本号（Version）控制，实现乐观锁机制采用ZAB协议保证数据一致性二、Kafka核心架构
phoenix无法连接hbase shell创建表失败_报错_PleaseHoldException: Master is initializing---记录020_大数据工作笔记0180 添柴程序猿 hbase连接报错 phoenix连接hbase phoenix PleaseHoldExcep
今天发现,我的phoenix,去连接hbase集群,怎么也连不上了,奇怪了...弄了一晚上org.apache.hadoop.hbase.PleaseHoldException:Masterisinitializing[root@hadoop120bin]#ll总用量184-rwxr-xr-x.1rootroot36371月222020chaos-daemon.sh-rwxr-xr-x.1root
Hadoop的运行模式对许 #Hadoop hadoop 大数据分布式
Hadoop的运行模式1、本地运行模式2、伪分布式运行模式3、完全分布式运行模式4、区别与总结Hadoop有三种可以运行的模式：本地运行模式、伪分布式运行模式和完全分布式运行模式1、本地运行模式本地运行模式无需任何守护进程，单机运行，所有的程序都运行在同一个JVM上执行Hadoop安装后默认为本地模式，数据存储在Linux本地。在本地模式下调试MapReduce程序非常高效方便，一般该模式主要是在
Hadoop的mapreduce的执行过程画纸仁大数据 hadoop mapreduce 大数据
一、map阶段的执行过程第一阶段：把输入目录下文件按照一定的标准逐个进行逻辑切片，形成切片规划。默认Splitsize=Blocksize（128M），每一个切片由一个MapTask处理。（getSplits）第二阶段：对切片中的数据按照一定的规则读取解析返回对。默认是按行读取数据。key是每一行的起始位置偏移量，value是本行的文本内容。（TextInputFormat）第三阶段：调用Mapp
Hadoop：分布式计算平台初探 dccrtbn6261333 大数据运维 java
Hadoop是一个开发和运行处理大规模数据的软件平台，是Apache的一个用java语言实现开源软件框架，实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是：MapReduce和HDFS。MapReduce提供了对数据的计算，HDFS提供了海量数据的存储。MapReduceMapReduce的思想是由Google的一篇论文所提及而被广为流传的，简单的一句话解释M
【Hadoop】如何理解MapReduce？ 2302_79952574 hadoop mapreduce 数据库
MapReduce是一种用于处理大规模数据集的编程模型和计算框架。它的核心思想是将复杂的计算任务分解为两个简单的阶段：Map（映射）和Reduce（归约）。通过这种方式，MapReduce可以高效地并行处理海量数据。一.MapReduce的核心概念1.Map（映射）：将输入数据分割成小块，并对每个小块进行初步处理。输出键值对（key-valuepairs），例如。2.Shuffle和Sort（洗牌
Hadoop：全面深入解析 CloudJourney hadoop 大数据分布式
Hadoop是一个用于大规模数据处理的开源框架，其设计旨在通过集群的方式进行分布式存储和计算。本篇博文将从Hadoop的定义、架构、原理、应用场景以及常见命令等多个方面进行详细探讨，帮助读者全面深入地了解Hadoop。1.Hadoop的定义1.1什么是HadoopHadoop是由Apache软件基金会开发的开源软件框架，用于存储和处理大规模数据。其核心组件包括Hadoop分布式文件系统（HDFS）
Hadoop介绍：什么是Hadoop？了解Hadoop的应用 Zzzxt007 hadoop 大数据分布式
一、认识Hadoop框架Hadoop是一个提供分布式存储和计算的开源软件框架，使用Java语言编写，具有高扩展性、高容错性、无共享和高可用（HA）等特点，非常适合处理海量数据。它基于Google发布的MapReduce论文实现，并且应用了函数式编程的思想。Hadoop框架主要包括HDFS（HadoopDistributedFileSystem，Hadoop分布式文件系统）、MapReduce、YA
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持