FastDFS 研究
什么是分布式文件系统
什么是文件系统
文件系统是负责管理和存储文件的系统软件,它是操作系统和硬件驱动之间的桥梁,操作系统通过文件系统
提供的接口去存取文件,用户通过操作系统访问磁盘上的文件。如下图:
什么是分布式文件系统
为什么会有分布文件系统呢?
分布式文件系统是面对互联网的需求而产生,互联网时代对海量数据如何存储?靠简单的增加硬盘的个数已经满足
不了我们的要求,因为硬盘传输速度有限但是数据在急剧增长,另外我们还要要做好数据备份、数据安全等。
采用分布式文件系统可以将多个地点的文件系统通过网络连接起来,组成一个文件系统网络,结点之间通过网络进
行通信,一台文件系统的存储和传输能力有限,我们让文件在多台计算机上存储,通过多台计算共同传输。如下
图:
好处:
1、一台计算机的文件系统处理能力扩充到多台计算机同时处理。
2、一台计算机挂了还有另外副本计算机提供数据。
3、每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度。
什么是fastDFS
FastDFS是用c语言编写的一款开源的分布式文件系统,它是由淘宝资深架构师余庆编写并开源。FastDFS专为互联
网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很
容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。
为什么要使用fastDFS呢?
上边介绍的NFS、GFS都是通用的分布式文件系统,通用的分布式文件系统的优点的是开发体验好,但是系统复杂
性高、性能一般,而专用的分布式文件系统虽然开发体验性差,但是系统复杂性低并且性能高。fastDFS非常适合
存储图片等那些小文件,fastDFS不对文件进行分块,所以它就没有分块合并的开销,fastDFS网络通信采用
socket,通信速度很快。
fastDSF 架构
FastDFS架构包括 Tracker server和Storageserver。客户端请求Tracker server进行文件上传、下载,通过Tracker
server调度最终由Storage server完成文件上传和下载。
1)Tracker
Tracker Server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提
供文件上传服务。可以将tracker称为追踪服务器或调度服务器。
FastDFS集群中的Tracker server可以有多台,Tracker server之间是相互平等关系同时提供服务,Tracker server
不存在单点故障。客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。
2)Storage
Storage Server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己
的文件系统而是使用操作系统的文件系统来管理文件。可以将storage称为存储服务器。
Storage集群采用了分组存储方式。storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容
量之和。一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系,不同组的Storage server
之间不会相互通信,同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件
完全一致的。一个组的存储容量为该组内的存储服务器容量最小的那个,由此可见组内存储服务器的软硬件配置最
好是一致的。
采用分组存储方式的好处是灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由
tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向
扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。
3)Storage状态收集
Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,包括磁盘剩余空间、文件同步
状况、文件上传下载次数等统计信息。
文件上传流程
客户端上传文件后存储服务器将 文件ID 返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息
包括:组名,虚拟磁盘路径,数据两级目录,文件名。
- 组名:文件上传后所在的 storage组名称,在文件上传成功后有 storage服务器返回,需要客户端自行保存。
- 虚拟磁盘路径: storage配置的虚拟路径,与磁盘选项 store_path* 对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
- 数据两级目录: storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
- 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器 IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。
文件下载流程
tracker根据请求的文件路径即文件ID 来快速定义文件。
比如请求下边的文件:
1.通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客
户端访问。
2.存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到
客户端需要访问的文件。
FastDFS环境搭建
关于FastDfs的搭建过程,我这里就不写出来了,我第一次也是专研一下午才弄明白。下面也把搭建好的成品Centos7分享出来,包括nginx的环境搭建。
fastDFS安装时,./make.sh编译时出错---perl:未找到命令
做fastDFS的案例的时候,在搭建分布式集群的模块的时候,使用 ./make.sh 编译的时候报错,错误如下:
错误原因:在执行make.sh的时候没有找到相应的命令
解决办法:安装相应的命令即可。执行以下命令
yum -y install zlib zlib-devel pcre pcre-devel gcc gcc-c++ openssl openssl-devel libevent libevent-devel perl unzip net-tools wget
Centos7成品:
链接:https://pan.baidu.com/s/1-yxZ_SHoq5k9BymaosTU-w
提取码:89ho
具体搭建过程完全按照这篇博客完成的:
https://www.cnblogs.com/yufeng218/p/8111961.html
感兴趣的可以试着做做。
另外,使用我搭建好的Centos7有几个地方需要注意一下。
配置和启动storage
- cd切换目录到: /etc/fdfs/ 目录下
- 修改storage.conf ; vi storage.conf
#配置tracker服务器:IP
tracker_server=192.168.172.20:22122
#如果有多个则配置多个tracker
#tracker_server=192.168.101.4:22122
这里的storage.conf配置文件要成自己虚拟机的ip地址
3. vi /etc/fdfs/mod_fastdfs.conf,改成虚拟机ip地址(同上)
base_path=/home/fastdfs tracker_server=192.168.172.20:22122 #tracker_server=192.168.172.20:22122 #(多个tracker配置多行) url_have_group_name=true #url中包含group名称 store_path0=/home/fdfs_storage #指定文件存储路径(上面配置的store路径)
4.修改nginx配置文件,改iP地址(同上)
cd /usr/local/nginx/conf/
vi nginx.conf
我的Centos7默认配置tracker,storage和nginx默认开机自动启动了
可以启动完成后进入 /home/fdfs_storage/data 目录下,可以看到已经启动了。
nginx可以通过ps -ef | grep nginx查看进程,
上传图片测试
拷贝一张图片1.jpg 到Centos服务器上的 root目录下,输入以下指令
/usr/bin/fdfs_test /etc/fdfs/client.conf upload /root/1.jpg
红色既是url地址,在浏览器上输入,可以看到上传图片成功!!
有问题的可以查看上面一篇博客,详解。
上传图片开发
需求分析
在很多系统都有上传图片/上传文件的需求,比如:上传课程图片、上传课程资料、上传用户头像等,为了提供系
统的可重用性专门设立文件系统服务承担图片/文件的管理,文件系统服务实现对文件的上传、删除、查询等功能
进行管理。
各各子系统不再开发上传文件的请求,各各子系统通过文件系统服务进行文件的上传、删除等操作。文件系统服务
最终会将文件存储到fastDSF文件系统中。
下图是各各子系统与文件系统服务之间的关系:
下图是课程管理中上传图片处理流程:
执行流程如下:
1、管理员进入教学管理前端,点击上传图片
2、图片上传至文件系统服务,文件系统请求fastDFS上传文件
3、文件系统将文件入库,存储到文件系统服务数据库中。
4、文件系统服务向前端返回文件上传结果,如果成功则包括文件的Url路径。
5、课程管理前端请求课程管理进行保存课程图片信息到课程数据库。
6、课程管理服务将课程图片保存在课程数据库。
Api接口
在api工程下创建com.xuecheng.api.filesystem包,
public interface FileSystemControllerApi { /** * 上传文件 * @param multipartFile 文件 * @param filetag 文件标签 * @param businesskey 业务key * @param metedata 元信息,json格式 * @return */ public UploadFileResult upload(MultipartFile multipartFile, String filetag, String businesskey, String metadata); }
Dao
将文件信息存入数据库,主要存储文件系统中的文件路径。
public interface FileSystemRepository extends MongoRepository{ }
Service
@Service public class FileSystemService { private static final Logger LOGGER = LoggerFactory.getLogger(FileSystemService.class); @Value("${xuecheng.fastdfs.tracker_servers}") String tracker_servers; @Value("${xuecheng.fastdfs.connect_timeout_in_seconds}") int connect_timeout_in_seconds; @Value("${xuecheng.fastdfs.network_timeout_in_seconds}") int network_timeout_in_seconds; @Value("${xuecheng.fastdfs.charset}") String charset; @Autowired FileSystemRepository fileSystemRepository; //加载fdfs的配置 private void initFdfsConfig(){ try { ClientGlobal.initByTrackers(tracker_servers); ClientGlobal.setG_connect_timeout(connect_timeout_in_seconds); ClientGlobal.setG_network_timeout(network_timeout_in_seconds); ClientGlobal.setG_charset(charset); } catch (Exception e) { e.printStackTrace(); //初始化文件系统出错 ExceptionCast.cast(FileSystemCode.FS_INITFDFSERROR); } } //上传文件 public UploadFileResult upload(MultipartFile file, String filetag, String businesskey, String metadata){ if(file == null){ ExceptionCast.cast(FileSystemCode.FS_UPLOADFILE_FILEISNULL); } //上传文件到fdfs 北京市昌平区建材城西路金燕龙办公楼一层 电话:400-618-9090 String fileId = fdfs_upload(file); //创建文件信息对象 FileSystem fileSystem = new FileSystem(); //文件id fileSystem.setFileId(fileId); //文件在文件系统中的路径 fileSystem.setFilePath(fileId); //业务标识 fileSystem.setBusinesskey(businesskey); //标签 fileSystem.setFiletag(filetag); //元数据 if(StringUtils.isNotEmpty(metadata)){ try { Map map = JSON.parseObject(metadata, Map.class); fileSystem.setMetadata(map); } catch (Exception e) { e.printStackTrace(); } } //名称 fileSystem.setFileName(file.getOriginalFilename()); //大小 fileSystem.setFileSize(file.getSize()); //文件类型 fileSystem.setFileType(file.getContentType()); fileSystemRepository.save(fileSystem); return new UploadFileResult(CommonCode.SUCCESS,fileSystem); } //上传文件到fdfs,返回文件id public String fdfs_upload(MultipartFile file) { try { //加载fdfs的配置 initFdfsConfig(); //创建tracker client TrackerClient trackerClient = new TrackerClient(); //获取trackerServer TrackerServer trackerServer = trackerClient.getConnection(); //获取storage StorageServer storeStorage = trackerClient.getStoreStorage(trackerServer); //创建storage client StorageClient1 storageClient1 = new StorageClient1(trackerServer,storeStorage); //上传文件 //文件字节 byte[] bytes = file.getBytes(); //文件原始名称 String originalFilename = file.getOriginalFilename(); //文件扩展名 String extName = originalFilename.substring(originalFilename.lastIndexOf(".") + 1); //文件id String file1 = storageClient1.upload_file1(bytes, extName, null); return file1; } catch (Exception e) { e.printStackTrace(); } return null; } }
Controller
@RestController @RequestMapping("/filesystem") public class FileSystemController implements FileSystemControllerApi { @Autowired FileSystemService fileSystemService; @Override @PostMapping("/upload") public UploadFileResult upload(@RequestParam("file") MultipartFile file, @RequestParam(value = "filetag", required = true) String filetag, @RequestParam(value = "businesskey", required = false) String businesskey, @RequestParam(value = "metedata", required = false) String metadata) { return fileSystemService.upload(file,filetag,businesskey,metadata); } }
测试
使用swagger-ui或postman进行测试。
下图是使用swagger-ui进行测试的界面: