在安卓平台,PDFium 早已开源,第三方阅读器demo破数千赞,然而尽管相关的API已经包含在在SDK的头文件中,这么多年了文本选择基本处于零开发状态。
我为什么要开启这个系列,努力试着从源头开始,用 PDFium 制作一款阅读器?有人喜欢问这个做了有什么用,这个是唯一的吗?
当然不是唯一的,底层技术更不是我的。不过我认为在维护者的推动下,PDFium 越来越完善,功能越来越多,不真正拿来做些什么实在是可惜了。另一个重要原因则是,其他APP要么臃肿或者简陋,要么用着磕手、滑动卡顿、误触频发,而且大多还不免费。( 更正,近年来倒是多了好多免费的PDF阅读器 )
目标期望:
- 滑动不卡。
- 文本选择媲美Opera浏览器。
- 拥有超卓的文本操作体验,查词典、段落翻译、文本分享等更加方便。
项目地址:https://github.com/KnIfER/PolymPic
一、处理超链接
热身运动:当检测到单击( GestureDetector )时,若点击处存在超链接,则打印出超链接的对象。
头文件:fpdf_doc.h
- 获取点击处的超链接
JNI_FUNC(jlong, PdfiumCore, nativeGetLinkAtCoord)(JNI_ARGS, jlong pagePtr, jdouble width, jdouble height, jdouble posX, jdouble posY){
double px, py;
FPDF_DeviceToPage((FPDF_PAGE)pagePtr, 0, 0, width, height, 0, posX, posY, &px, &py);
return (jlong)FPDFLink_GetLinkAtPoint((FPDF_PAGE)pagePtr, px, py);
}
需要将屏幕坐标转换为页面坐标,然后再次在native层转换为所谓的user space、page space。别问我那是啥我也不知道。不过在论坛提问后,有人替我指出了相关文档所在,有时间去看看!
"User space" is defined in section 8.3.2.3 of the PDF 32000-1:2008 specification.
屏幕坐标:[event.getX(), event.getY()]
页面坐标:先前提过将整本PDF当作一张超级大图,subsampling-scale-imageview 有一系列的 viewToSource 坐标转换方法。屏幕转换得到 source 坐标后,减去点击页面的左上角坐标,就是页面坐标。
原始页面坐标需用 FPDF_DeviceToPage
再次转换,才能传给FPDFLink_GetLinkAtPoint,获取坐标处的链接指针。
- 链接指针不为空时,可以提取超链接对象。
JNI_FUNC(jstring, PdfiumCore, nativeGetLinkTarget)(JNI_ARGS, jlong docPtr, jlong linkPtr){
DocumentFile *doc = reinterpret_cast(docPtr);
FPDF_LINK link = reinterpret_cast(linkPtr);
FPDF_DEST dest = FPDFLink_GetDest(doc->pdfDocument, link);
if (dest != NULL) {
int pageIdx = FPDFDest_GetDestPageIndex(doc->pdfDocument, dest);
char buffer[16]={0};
buffer[0]='@';
sprintf(buffer+1,"%d",pageIdx);
return env->NewStringUTF(buffer);
}
FPDF_ACTION action = FPDFLink_GetAction(link);
if (action == NULL) {
return NULL;
}
size_t bufferLen = FPDFAction_GetURIPath(doc->pdfDocument, action, NULL, 0);
if (bufferLen <= 0) {
return NULL;
}
std::string uri;
FPDFAction_GetURIPath(doc->pdfDocument, action, WriteInto(&uri, bufferLen), bufferLen);
return env->NewStringUTF(uri.c_str());
}
超链接对象统一返回字符串,可以是Uri地址,也可以是页码@页码
。
二、在单击处获取一个单词
热身运动2:在单击处获取一个英文单词或者汉语词组,需要用到安卓的 BreakIterator。
头文件:fpdf_text.h
首先实现 nativeGetCharIndexAtCoord 方法,获取单击附近的文字索引,需进行同样的坐标转换。
JNI_FUNC(jint, PdfiumCore, nativeGetCharIndexAtCoord)(JNI_ARGS, jlong pagePtr, jdouble width, jdouble height, jlong textPtr, jdouble posX, jdouble posY, jdouble tolX, jdouble tolY){
double px, py;
FPDF_DeviceToPage((FPDF_PAGE)pagePtr, 0, 0, width, height, 0, posX, posY, &px, &py);
return FPDFText_GetCharIndexAtPos((FPDF_TEXTPAGE)textPtr, px, py, tolX, tolY);
}
若返回的文字index大于等于零,则此 index 指向该页面全部文本当中的一个字符。全部文本用 FPDFText_GetText 获取(实现 nativeGetText):
JNI_FUNC(jstring, PdfiumCore, nativeGetText)(JNI_ARGS, jlong textPtr) {
int len = FPDFText_CountChars((FPDF_TEXTPAGE)textPtr);
//unsigned short* buffer = malloc(len*sizeof(unsigned short));
unsigned short* buffer = new unsigned short[len+1];
FPDFText_GetText((FPDF_TEXTPAGE)textPtr, 0, len, buffer);
jstring ret = env->NewString(buffer, len);
delete []buffer;
return ret;
}
接下来就可以用 BreakIterator 分词了:
... @@@ public void prepareText()
allText = pdfiumCore.nativeGetText(tid);
if(pageBreakIterator==null) {
pageBreakIterator = new BreakIteratorHelper();
}
pageBreakIterator.setText(allText);
... @@@ public String getWordAtPos(float posX, float posY)
int charIdx = pdfiumCore.nativeGetCharIndexAtCoord(pid.get(), size.getWidth(), size.getHeight(), tid
, posX, posY, 10.0, 10.0);
String ret=null;
if(charIdx>=0) {
int ed=pageBreakIterator.following(charIdx);
int st=pageBreakIterator.previous();
获得的单词就是 allText.substring(st, ed)
}
...
三、实现文本选择
1. 绘制选框
与绘制PDF本身差不多,不过 bitmap 换成 rect 而已。用到的API依次是FPDFText_CountRects、FPDFText_GetRect。
直接将选框覆盖绘制在前。若要绘制在后面的背景上,就需要三层透明视图了,那么加载铺块和缩略图的时候就要用透明色清空 bitmap,页面的白色背景等也需要另外绘制(Google PDF Viewer应该就是这样,还给背景加了阴影)。这些较为复杂,到时候再说。
有个问题可能需要解决:同一行的选框,部分没有合并。
都是小事儿,暂时不在这上面花时间。
2. 绘制控点
之前做过类似的事情,将普通 TextView 自带的文本选择功能禁用了,然后用API自己做出一个来,包括单击选词,长按托选,放大镜等等。所以相关的内容还是熟悉的。
绘制 Selection Handle 可以用 AppCompat 支持库中的图标资源:
handleLeft=getResources().getDrawable(R.drawable.abc_text_select_handle_left_mtrl_dark);
handleRight=getResources().getDrawable(R.drawable.abc_text_select_handle_right_mtrl_dark);
控点的触控操作也很简单,在 Action_Down 中检测落点是否在其中一个 handle 内。若是,则在 Action_Move 中一边移动该 handle,一边检测新的字符索引,作为文本选择的新边界。
由于PDF的复杂性,页面上的字符索引可能间杂排列,比如头一段开头是100,下一段开头50,再下一段150。这就造成先前简单的选择系统“失效”了:
没什么解决方案,API 就这么点。而且,静读天下、Google PDF 查看器都是这样的,唯有 ezpdfreader 没有这个问题。