【PDF.js应用】批量读取PDF文件中的文本,并添加索引到Elasticsearch中

为了实现PDF文件全文检索,需要将PDF文件所有文本内容添加进 Elasticsearch 中。

0、跨域配置

主要使用 ajax 发送 Post 请求,结合pdf.js实现。

发送请求时,存在跨域问题。找到配置文件 elasticsearch.yml,在文件末尾加上以下两行允许跨域访问,重启 Elasticsearch 服务器使修改生效。

http.cors.enabled: true
http.cors.allow-origin: "*"

1、文件目录结构(目录中有一些其他文件):

【PDF.js应用】批量读取PDF文件中的文本,并添加索引到Elasticsearch中_第1张图片

2、代码




    
    
    'Hello, world!' example


    

'Hello, world!' example

3、运行效果

【PDF.js应用】批量读取PDF文件中的文本,并添加索引到Elasticsearch中_第2张图片

你可能感兴趣的:(PDFjs,javascript)