Node convert pdf to json

node 版本 v10.9.0
npm 版本 v6.2.0
依赖包版本 "dependencies": { "fs": "0.0.1-security", "pdf2json": "^1.1.7" }

使用 pdf2json npm 包实现 PDF 转 JSON, 在 pdfParser_dataReady 回调函数中获取 json 数据

server.js

// pdf to json
let fs = require("fs"),
    PDFParser = require("pdf2json");

let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => {
  console.log(errData)
});
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./json/1.json", JSON.stringify(pdfData), 'utf8', (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});

pdfParser.loadPDF("./pdf/1.PDF");

也可以使用此包实现 PDF 转 TXT,在 pdfParser_dataReady 回调函数中使用 pdfParser.getRawTextContent() 获取文本数据

server.js

let fs = require("fs"),
    PDFParser = require("pdf2json");

let pdfParser = new PDFParser(this, 1);

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
  fs.writeFile("./txt/1.txt", pdfParser.getRawTextContent(), (err) => {
    if (err) throw err;
    console.log('The file has been saved!')
  });
});

pdfParser.loadPDF("./pdf/1.PDF");

你可能感兴趣的:(Node convert pdf to json)