Everything Search Engine这款软件如何做到如此快速的搜索的

转 https://www.zhihu.com/question/22862246/answer/23020795

Everything和Windows搜索是有区别的,以下列几点:

  1. Everything只能搜索文件名和文件夹名,Windows搜索可以搜索文件名和文件内容;
  2. Everything只能搜索NTFS格式的文件系统,Windows搜索可以搜索任意文件系统(例如FAT32,exFAT,NTFS);

但有时我们需要的恰好就是快速搜索文件名,那么Everything的工作原理是如何呢?
先简单介绍一下NTFS的两个功能,MFT和USN journal。

Master File Table (MTF)
在NTFS文件系统中,有一个特殊的表,称为MTF表。所有文件夹和文件的名称都被存储在该表中,访问该表的速度非常快,使应用程序可以不遍历文件系统就能获取当前卷(磁盘)中的所有文件的名称和路径。

USN journal
NTFS还有一个日志功能。所有对文件系统有修改的操作都被记录在了一个journal日志文件中。

Everything的原理
程序启动时,扫描系统所有NTFS卷(磁盘)的MTF表,将文件名称以一种利于字符串检索的算法形式存储在Everything的index索引数据库中。

系统运行过程中,Everything还会监控NTFS卷的journal日志文件,如果文件系统中的文件发生改变,Everything会更新它的index索引数据库。

当用户搜索文件时,Everything利用字符串查找算法,在index索引数据库中查找,可以直接搜索到文件。

那么,现在回答题主问题。
Q:Search Everything 这款软件如何做到如此快速的搜索的?
A:因为Everything在搜索时,根本没有遍历文件系统,它检索的是自己组织好的索引数据库,因此搜索速度飞快;

Q:Windows搜索时什么原理?
A:Windows搜索用的是普通的文件系统遍历查找。用的应该是标准WIN32 API,例如FindFirstFile/FindNextFile之类。当然,Windows7之后的版本现在已经内置带索引的搜索功能,这项功能非常复杂,不仅可以搜索文件名,还可以搜索文件内容,而且适用任意文件系统。但缺点就是需要一个后台服务爬虫不停的对文件系统进行索引,比较耗资源。

Q:为何微软不使用这种原理?
A:个人觉得是因为这种方法不具备普适性,无法应用与非NTFS文件系统,所以无法集成到Windows中。

Q:为何微软不收购这家公司?
A: 个人感觉还是技术含量不太高,而且微软自家的ActiveDirectory早就在使用MTF快速检索文件了。

你可能感兴趣的:(Everything Search Engine这款软件如何做到如此快速的搜索的)