Day2 summary by hu guangda

完成工作:

    完成了在Mac上arm的交叉编译工具,和一个c++库,但是编译出来的东西在itouch上完全不能用,所以又卸掉。

    开始阉割poppler,手工configure一些宏开关,现在已经提取出了pdftotext所需的所有代码,并在没有任何库(fontconfig之类,poppler所需的)支持的条件下,在Mac里编译成功。

     我觉得完全可以移植到iOS上,理由有二:

       1. 基本上提取出来的程序就是一堆很正常的.h和.cc,编译就直接用g++ *.cc。这些程序全都手工检查过了,只用了一些最基本的c++标准库。唯一一个稍微不标准点的是poppler内部文件操作的库(打开目录、文件等函数),即使这个在iOS上有问题也可以很方便的重写。

       2. 在xcode里面建了一个iphone的工程,把这一堆代码加进去。在main函数一开始call一下pdftotext。这个东西build成功了,说明提取出来的代码并没有用到不支持的库。(这里pdftotext的input和output文件都是瞎给的,测试肯定不行。进一步测试有待于一个简单的iphone程序框架。)

明天工作:

  1. 继续阉割poppler。现在源代码有150多个文件,2M多,虽然每一个文件都被用到了,但对于我们所需要的简单功能来说,还是有很多废代码。

  2. 测试,完善接口。

如果一切正常的话,我能提供的接口大概就是,输入一个文件名,输出文件里每个单词的位置、大小、内容。当然可以再优化,比如只输出某一页、某一部分的wordlist。

你可能感兴趣的:(SUM)