Java预览PDF时的文件名称问题及解决

Java预览PDF时的文件名称

问题场景

今天在做新项目的时候,测试提交过来一个bug:在谷歌浏览器上预览一些客户上传的pdf文件时,发现浏览器的标签上展示的要么不是我们看到的文件名,要么就直接是方法名,看起来不太合适,让我想想办法优化优化。 

Java预览PDF时的文件名称问题及解决_第1张图片

刚开始看到这个问题的时候确实很头疼,因为之前尝试过去解决这个问题,但是当时因为一些其他的原因,没有仔细的去思考这些个问题,这会做新项目刚好有时间去琢磨一下这个问题,

解决思路

看了一下一个有问题的PDF文件之后发现文件的名称和文件的属性名其实不一致,浏览器默认展示的是文件的属性名,而不是我们看到的文件名称

Java预览PDF时的文件名称问题及解决_第2张图片

这也就让我定位到了问题的所在,出现这个bug的原因就是PDF文件的属性名称与文件名称不一致

定位到问题之后就很好解决了

解决方案

从pdfbox的 官网文档 我们可以看到有一个静态方法专门用于将输入流解析为PDF文档,我们就是用这个方法来进行操作

Java预览PDF时的文件名称问题及解决_第3张图片

接下来看代码

/**
     * 预览PDF文件
     *
     * @param filePath
     * @param originFileName
     * @return void
     * @author ss.xin
     * @date 2021/2/5 9:27
     */
    private void viewPdfFile(String filePath, String originFileName) {
        File file = new File(filePath);
        try (OutputStream outputStream = response.getOutputStream();
             //加载pdf附件到PDF流中
             PDDocument document = PDDocument.load(new FileInputStream(file))) {
            response.setCharacterEncoding(Constant.UTF8);
            String showName = StringUtils.isNotBlank(originFileName) ? originFileName : file.getName();
            showName = URLEncoder.encode(showName, Constant.UTF8);
            response.setHeader("Content-Disposition", "inline;fileName=" + showName + ";fileName*=UTF-8''" + showName);
            //从PDF流中获得PDF文档属性对象
            PDDocumentInformation info = document.getDocumentInformation();
            //设置PDF文档属性对象的文件名称(最重要的环节)
            info.setTitle(StringUtils.isNotBlank(originFileName) ? originFileName : file.getName());
            document.setDocumentInformation(info);
            //修改完直接输出到响应体中
            document.save(outputStream);
        } catch (Exception e) {
            log.error(this.getClass().getName() + ".viewPdfFile:", e);
        }
    }

设置完成之后,我们就可以看到在浏览器的页签上文件的名称已经正常了

Java预览PDF时的文件名称问题及解决_第4张图片

至此,就达到了我们整个想要的一个效果。

预览pdf时中文乱码

项目在预览pdf时,中文乱码。

处理方式:

第一步

首先检查是否设置了 request.setCharacterEncoding(“UTF-8”);

response.setContentType(“application/pdf; charset=UTF-8”);

第二步

如果部署在win上没有乱码,部署在linux上有乱码,可能是在linux上面可能没有对应的字体,拷贝字体上去(我这个版本的字体不用安装),指定路径即可 FontSettings.setFontsFolder("/usr/share/fonts/", true);

如果有使用liberoffice,使用下面的方式:

liberoffice默认读取的时这个路径下的字体/usr/share/fonts,把字体拷贝导这个路径下面,chmod 777 * 进行授权,然后sudo fc-cache -fv刷新缓存,重启系统

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

你可能感兴趣的:(Java预览PDF时的文件名称问题及解决)