这里我主要关注三个文件:app.js 、pdf_find_controller.js
function wordHighLight(hightLightWords) { // 目前只能匹配一个,不能全部高亮
let evt = {
// source: PDFFindBar, // PDFFindBar的实例,不确定是干嘛用的?
type: '', // 这里默认应该是空的
// 这里能默认跳转到query的位置,刚好能满足要求
query: hightLightWords, // 高亮的关键词
phraseSearch: false, // 支持整段文字匹配,如果时多个词的匹配只能是false
caseSensitive: false, // 默认为false,搜索时忽略大小写
highlightAll: true, // 设为true即关键词全部高亮
// findPrevious: true,
PDFViewerApplication.findController.executeCommand('find' + evt.type, {//搜索执行函数
query: evt.query,
phraseSearch: evt.phraseSearch,
caseSensitive: evt.caseSensitive,
highlightAll: evt.highlightAll,
findPrevious: evt.findPrevious,
2. wordHighLight函数的调用
this.findBar = new PDFFindBar(findBarConfig, this.l10n);// 实例化PDFFindBar
// 这时我要是时点击keydown就会触发查找事件
// 同样的,我可以在这里直接触发查找函数
let highLightWords = ['云林街菜鸟物流园职工,非人大代表或政协委员,租住雄楚市雄楚区金港一号小区11栋504室', '李毅', '张昌', '聊城', '犯罪经历', '犯罪嫌疑人张昌'];
在pdf_find_controller.js中,找到executeCommand(cmd, state)——》_nextMatch()——》calculateMatch(pageIndex)函数,由于query以前是单个词搜索(pdf.js提供的功能),这里我需要对涉及到query的做一些循环处理如下(我只是做了一些循环处理,请根据具体代码进行修改):
_calculateMatch(pageIndex) { // 计算结果都返回到了对象的属性里,所以不需要通过
// return 来获取想要的值
// _normalize应该是规范化的意思
let pageContent = this._normalize(this.pageContents[pageIndex]);
let query_words = this.state.query;
for (let i = 0; i < query_words.length; i++) {
query_words[i] = this._normalize(query_words[i]);
let caseSensitive = this.state.caseSensitive;
if (!caseSensitive) { // 判断是否对大小写敏感
// 如果不区分大小写,就把页面内容全部转为小写
// 这里pagecont
pageContent = pageContent.toLowerCase();
query_words[i] = query_words[i].toLowerCase();
// let query = this._normalize(this.state.query); // 这里只传只传了一个词,我需要传多个词
let phraseSearch = this.state.phraseSearch;
// let queryLen = query.length;
// 查询内容为空,返回
if (query_words.length === 0) {
// Do nothing: the matches should be wiped out already.
// 不区分大小写的话
// 以上内容规范了当前页和查询内容的规范化
// 以下为真正的匹配的内容
if (phraseSearch) { // 若为true则可匹配整段文字
this._calculatePhraseMatch(query_words, pageIndex, pageContent); // 词组匹配功能
} else { // 若为false则只能匹配单个的词,特征:单个的词一般 两边有空格
this._calculateWordMatch(query_words, pageIndex, pageContent); // 单词匹配功能
// 将计算的匹配结果,用来更新匹配结果
this._updatePage(pageIndex); // 清除以前的匹配结果,渲染最新的匹配结果
if (this.resumePageIdx === pageIndex) { // 如果恢复的页面索引等于当前索引
this.resumePageIdx = null; // 将恢复页面的索引设为空
this._nextPageMatch(); //
// Update the match count.
// 更新匹配个数
// this.pageMatches[pageIndex]里记录了第pageIndex页匹配的关键词的位置
// 通过下面这样就可以获得匹配的个数了
// 问题:我在搜索时,没有全部高亮时,就可以显示全部匹配的单词个数
// 那我为什么不能全部高亮呢
if (this.pageMatches[pageIndex].length > 0) {
this.matchCount += this.pageMatches[pageIndex].length;
_calculateWordMatch(query, pageIndex, pageContent) { // 单词匹配
let matchesWithLength = [];
// Divide the query into pieces and search for text in each piece.
// 把搜索的词分开,然后搜索分开的词,最小单位为字母
// query.match 清除了搜索值的空格,返回了一个有着被搜索词的数组
// 例:hello world -->"hello","world"
let test_query = query;
for (let x = 0; x < test_query.length; x++) {
// 只有在这里才可以给段落设置一个sign,后面我才能进行匹配,滚动到该段落位置
let queryArray = test_query[x].match(/\S+/g); // '/S':任何一个非空白字符
for (let i = 0, len = queryArray.length; i < len; i++) {
// 若果是英文单词,就是单个字母的循环
let subquery = queryArray[i];
let subqueryLen = subquery.length;
let matchIdx = -subqueryLen; // 这里设为负数是什么意思
while (true) {
// matchInd+subqueryLen == 0:为开始查找的位置
// matchIdx 为返回的匹配的的位置
matchIdx = pageContent.indexOf(subquery, matchIdx + subqueryLen);
if (matchIdx === -1) { // 说明没有匹配到
// Other searches do not, so we store the length.
matchesWithLength.push({ // 将搜索的索引存到 matchesWithLength里
match: matchIdx,
matchLength: subqueryLen,
skipped: false,
// Prepare arrays for storing the matches.
if (!this.pageMatchesLength) {
this.pageMatchesLength = []; // 清空这个要存储的数组
this.pageMatchesLength[pageIndex] = []; // 某一页的匹配结果,存到每一页上
this.pageMatches[pageIndex] = [];
// Sort `matchesWithLength`, remove intersecting terms and put the result
// into the two arrays.
// this.pageMatches[pageIndex] 存索引
// this.pageMatchesLength[pageIndex] 存对应的长度
// 还是和phrase一样,pageMatches用来存索引
this._prepareMatches(matchesWithLength, this.pageMatches[pageIndex],