采用分布式文件系统可以将多个地点的文件系统通过网络连接起来,组成一个文件系统网络,结点之间通过网络进
行通信,一台文件系统的存储和传输能力有限,我们让文件在多台计算机上存储,通过多台计算共同传输。如下
图:
好处:
1、一台计算机的文件系统处理能力扩充到多台计算机同时处理。
2、一台计算机挂了还有另外副本计算机提供数据。
3、每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度。
1、NFS
1)在客户端上映射NFS服务器的驱动器。
2)客户端通过网络访问NFS服务器的硬盘完全透明
2、GFS
1)GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver组成。
2)master存储了数据文件的元数据,一个文件被分成了若干块存储在多个chunkserver中。
3)用户从master中获取数据元信息,从chunkserver存储数据。
3、HDSF
1)HDFS采用主从结构,一个HDFS集群由一个名称结点和若干数据结点组成。
名称结点存储数据的元信息,一个完整的数据文件分成若干块存储在数据结点。
2)客户端从名称结点获取数据的元信息及数据分块的信息,得到信息客户端即可从数据块来存取数据
FastDFS是用c语言编写的一款开源的分布式文件系统,它是由淘宝资深架构师余庆编写并开源。FastDFS专为互联
网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很
容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。
为什么要使用fastDFS呢?
上边介绍的NFS、GFS都是通用的分布式文件系统,通用的分布式文件系统的优点的是开发体验好,但是系统复杂
性高、性能一般,而专用的分布式文件系统虽然开发体验性差,但是系统复杂性低并且性能高。fastDFS非常适合
存储图片等那些小文件,fastDFS不对文件进行分块,所以它就没有分块合并的开销,fastDFS网络通信采用
socket,通信速度很快。
FastDFS架构包括 Tracker server和Storageserver。客户端请求Tracker server进行文件上传、下载,通过Tracker
server调度最终由Storage server完成文件上传和下载。
1)Tracker
Tracker Server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提
供文件上传服务。可以将tracker称为追踪服务器或调度服务器。FastDFS集群中的Tracker server可以有多台,Tracker
server之间是相互平等关系同时提供服务,Tracker server不存在单点故障。客户端请求Tracker server采用轮询方式,
如果请求的tracker无法提供服务则换另一个tracker。
2)Storage
Storage Server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己
的文件系统而是使用操作系统的文件系统来管理文件。可以将storage称为存储服务器。Storage集群采用了分组存储方式。
storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容量之和。一个组由一台或多台存储服务器组成,
组内的Storage server之间是平等关系,不同组的Storage server之间不会相互通信,同组内的Storage server之间会相互连接
进行文件同步,从而保证同组内每个storage上的文件完全一致的。一个组的存储容量为该组内的存储服务器容量最小的那个,
由此可见组内存储服务器的软硬件配置最好是一致的。
采用分组存储方式的好处是灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由
tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向
扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。
3)Storage状态收集
Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,包括磁盘剩余空间、文件同步
状况、文件上传下载次数等统计信息
客户端上传文件后存储服务器将 文件ID 返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息
包括:组名,虚拟磁盘路径,数据两级目录,文件名:group1/M00/00/00/rBAACV6mZdaAeJA-AABpx12j85U008.png
组名:文件上传后所在的 storage组名称,在文件上传成功后有 storage服务器返回,需要客户端自行保存。
虚拟磁盘路径: storage配置的虚拟路径,与磁盘选项 store_path* 对应。如果配置了store_path0则是M00,
如果配置了store_path1则是M01,以此类推。
数据两级目录: storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器 IP地址、文件创
建时间戳、文件大小、随机数和文件拓展名等信息。
tracker根据请求的文件路径即文件ID 来快速定义文件。
比如请求下边的文件:group1/M00/00/00/rBAACV6mZdaAeJA-AABpx12j85U008.png
1.通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客
户端访问。
2.存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到
客户端需要访问的文件。
参考链接 https://mp.csdn.net/console/editor/html/105789031
pom.xml
org.springframework.boot
spring-boot-starter-web
net.oschina.zcx7878
fastdfs-client-java
1.27.0.0
org.springframework.boot
spring-boot-starter-test
test
org.apache.commons
commons-io
1.3.2
在reources下面配置好信息
fastdfs.connect_timeout_in_seconds = 5 #设置连接超时
fastdfs.network_timeout_in_seconds = 30 #设置网络超时
fastdfs.charset = UTF-8 #编码格式
fastdfs.tracker_servers = 127.0.0.1:22122
@Test
public void testUpload() {
try {
ClientGlobal.initByProperties("config/fastdfs-client.properties");
//创建客户端
TrackerClient trackerClient=new TrackerClient();
//连接tracker server
TrackerServer trackerServer = trackerClient.getConnection();
//获取一个storage server
StorageServer storeStorage = trackerClient.getStoreStorage(trackerServer);
//创建一个storage 存储客户端
StorageClient1 storageClient1=new StorageClient1(trackerServer,storeStorage);
String filePath="d:/log.png";
String fileId = storageClient1.upload_file1(filePath, "png", null);
System.out.println(fileId);
//group1/M00/00/00/rBAACV6mZdaAeJA-AABpx12j85U008.png
} catch (Exception e) {
e.printStackTrace();
}
}
上传的图片链接可以访问:
http://alicewan.top:8888/group1/M00/00/00/rBAACV6mZdaAeJA-AABpx12j85U008.png
@Test
public void testDownload(){
try {
ClientGlobal.initByProperties("config/fastdfs-client.properties");
TrackerClient trackerClient=new TrackerClient();
TrackerServer trackerServer = trackerClient.getConnection();
StorageServer storeStorage = trackerClient.getStoreStorage(trackerServer);
StorageClient1 storageClient1=new StorageClient1(trackerServer,storeStorage);
String fileId="group1/M00/00/00/rBAACV6mZdaAeJA-AABpx12j85U008.png";
//通过文件id查找fastdfs的storage的文件字节流
byte[] bytes = storageClient1.download_file1(fileId);
FileOutputStream fileOutputStream=new FileOutputStream(new File("d:/log.png"));
fileOutputStream.write(bytes);
} catch (Exception e) {
e.printStackTrace();
}
}
配置application.xml
spring:
#SpringMVC上传文件配置
servlet:
multipart:
#默认支持文件上传.
enabled: true
#支持文件写入磁盘.
file-size-threshold: 0
# 上传文件的临时目录
location:
# 最大支持文件大小
max-file-size: 1MB
# 最大支持请求大小
max-request-size: 30MB
xuecheng:
fastdfs:
connect_timeout_in_seconds: 3000
network_timeout_in_seconds: 3000
charset: UTF-8
tracker_servers: 127.0.0.1:22122
初始化并且连接到fastdfs
@Service
public class FileSystemService {
@Value("${xuecheng.fastdfs.tracker_servers}")
String tracker_servers;
@Value("${xuecheng.fastdfs.connect_timeout_in_seconds}")
int connect_timeout_in_seconds;
@Value("${xuecheng.fastdfs.network_timeout_in_seconds}")
int network_timeout_in_seconds;
@Value("${xuecheng.fastdfs.charset}")
String charset;
private void initFdfsConfig(){
try {
ClientGlobal.initByTrackers(tracker_servers);
ClientGlobal.setG_charset(charset);
ClientGlobal.setG_network_timeout(network_timeout_in_seconds);
ClientGlobal.setG_connect_timeout(connect_timeout_in_seconds);
} catch (Exception e) {
e.printStackTrace();
ExceptionCast.cast(FileSystemCode.FS_INITFDFSERROR);
}
}
}
上传文件并且返回文件id
private String fdfs_upload(MultipartFile multipartFile) throws Exception{
initFdfsConfig();
//创建tracker client
TrackerClient trackerClient=new TrackerClient();
//获取trackerServer
TrackerServer trackerServer = trackerClient.getConnection();
//获取storage
StorageServer storeStorage = trackerClient.getStoreStorage(trackerServer);
//创建storage client
StorageClient1 storageClient1=new StorageClient1(trackerServer,storeStorage);
//上传文件的字节
byte[] bytes=multipartFile.getBytes();
//文件的原始名称
String originalFilename = multipartFile.getOriginalFilename();
//文件的扩展名
String ext=originalFilename.substring(originalFilename.lastIndexOf(".")+1);
//文件的id
String fileId=storageClient1.upload_file1(bytes,ext,null);
if (fileId!=null)
return fileId;
return null;
}