PHP读取word文档 导入word文档

PHP读取word文档 导入word文档

  • PHP读取word文档 导入word文档
    • libreoffice把word转html
    • 用phpquery读取html的内容

PHP读取word文档 导入word文档

前一段时间在工作中遇见了一个棘手的需求,客户要求把word里的数据导入,对数据进行统计。
刚开始觉得挺简单用phpword应该能够实现,后在网上各处询问也没发现phpword能够导入word,
然后我就转换了思路,先用libreoffice把word转换成html

libreoffice把word转html

安装libreoffice就不多做介绍
openoffice命令
用这个命令就可以把word文档转为html

用phpquery读取html的内容

获取到html了下面就是读取里边的内容了 大家应该都用过jquery,jQuery可以在html中获取html里的内容
可以在php后端我们改如何操作呢,用phpQuery就可以让php处理html代码像jQuery一样方便。
项目地址:https://code.google.com/p/phpquery/

github地址:https://github.com/TobiaszCudnik/phpquery

DEMO

下载库文件:https://code.google.com/p/phpquery/downloads/list

我下的是onefile版:phpQuery-0.9.5.386-onefile.zip

官方demo:https://code.google.com/p/phpquery/source/browse/branches/dev/demo.php

然后在项目中引用。
PHP读取word文档 导入word文档_第1张图片
phpquery的文档特别少,但是和jquery的差别并不大
pq($param, $context = null);

pq(); 相当于 jQuery的$();。它主要完成三件事情:

  1. 载入标记资源:

// 输入到载入的文档:
// 对于最开始输入的字符串不接收文本类型的节点:pq(’

’)
// 从$pq->getDocumentID()根据ID载入到文档: pq(’
’, $pq->getDocumentID())
// 根据DOM节点的归属将同样的文档载入:pq(’
’, DOMNode)
// 从phpQuery 对象载入文档: pq(’
’, $pq)

  1. 运行查询

// 根据最后一个选择的文档执行查询:pq(‘div.myClass’)
// 根据$pq->getDocumentID()的ID从文档中进行查询:pq(‘div.myClass’, $pq->getDocumentID())
// 在同样的文档上根据DOM节点的归属进行查询并且使用节点作为查询的根节点:pq(‘div.myClass’, DOMNode)
// 在文档上使用phpQuery对象进行查询
// 同时使用对象的栈作为根节点进行查询: pq(‘div.myClass’, $pq)

  1. 使用phpQuery对象对DOM节点进行原型化操作

foreach(pq(‘li’) as $li) // $ li是纯DOM节点, 将它变为phpQuery对象: pq($li);。

原创文章,码字不易,转载请注明出处

你可能感兴趣的:(php)