小下和

java操作pdf>>>pdfBox使用体验

pdfBox对中文非常不友好,如果各位同学最进要对pdf进行插入文字操作的话,建议你们使用itext,如果你操作的pdf没有中文,或者只是对pdf文件插入图片,删除页面等操作,那么请继续看下去~~~~

前言:

前段时间在完成公司安排的任务同时,利用空余时间做了一个使用java操作pdf的功能
刚开始没什么头绪,直到在网上找到了pdfBox,
pdfBox是apach提供的免费,开源的pdf操作工具,使用起来也挺方便,github可下载
我也上传了一份, [ pdfbox-1.8.9.zip ]

1首先,导入jar

我是maven方式导入
PS:
这个jar里面囊括了所有的pdfbox操作工具类,导入这一个就够了
(我在找工具类的时候,看到别的博主导了pdfbox的很多类,然后一股脑也导了进去,结果jar包冲突,原来只导入一个,那就是官方已经整合好的那个,就够了)

        <dependency>
            <groupId>org.apache.pdfboxgroupId>
            <artifactId>pdfbox-appartifactId>
            <version>1.8.10version>
        dependency>

2.在你的项目中创建一个工具类

2.1这个类的取名:随意,
我是取的pdfUtil

2.2当然,如果你想将操作记录入录到数据库的话,你也可以创建一个pdf的实体类
这个实体类创不创建大家随意,我贴一下我的实体类的属性,供参考

    //实体类的名称:pdfDomainVO

    private Integer id;//id

    private Date time;//操作时间

    private String filename;//文件名

    private String filesize;//文件大小

    private String filetype;//文件类型

    private String details;//操作详情

    private String content;//pdf中内容

    private String outputfile;//输出路径(保存路径)

    private String inputfile;//要操作的pdf路径

    private String strtofind;//需要替换的文本

    private String message;//替换的文本

    private String imagefile;//图片路径

    private String imagelist;//图片集合

    private Integer pageno;//指定页码

    private Integer pages;//总页数

    private Integer rid;//...

    private Integer pageoperation;//操作页数

    private Integer pagestart;//开始页

    private Integer pageend;//结束页

    private String position;//位置:X,Y

    private String fileSizeAfter;//操作后文件大小

    private Integer status;//状态

    private Integer afterPages;//操作后页码

    private Integer imgSize;//图片大小

3.在pdfUtil写代码

PS:我下面会有用到pdfDomainVO实体类的时候,大家参考下上面贴的属性

大家可以在pdfbox-1.8.9.zip文件夹中,找到examples文件夹
里面有很多事例,比如:: 1创建一个pdf文件; 2读取pdf中,全部文字信息(可用String接收); 3替换pdf中字符(中文我还没有解决好,不好意思啊); 4在pdf中插入图片; 等等操作……
PS:我现在贴一下我的代码

—–1创建1到多个空白页面

/***
     * 创建1到多个空白页面
     * @param file
     * @throws IOException
     * @throws COSVisitorException
     */
    public static void createBlank( String outputFile ) throws IOException, COSVisitorException
    {
        //首先创建pdf文档类
        PDDocument document = null;
        try
        {
            document = new PDDocument();
            //实例化pdf页对象
            PDPage blankPage = new PDPage();
            PDPage blankPage1 = new PDPage();
            PDPage blankPage2 = new PDPage();
            //插入文档类
            document.addPage( blankPage );
            document.addPage( blankPage1 );
            document.addPage( blankPage2 );
            //记得一定要写保存路径,如"H:\\text.pdf"
            document.save( outputFile );
            System.out.println("over");
        }
        finally
        {
            if( document != null )
            {
                document.close();
            }
        }
    }

—–2读取pdf中文字信息(全部)

    /**
     * 读取pdf中文字信息(全部)
     */
    public static void READPDF(String inputFile){
        //创建文档对象
        PDDocument doc =null;
        String content="";
        try {
            //加载一个pdf对象
            doc =PDDocument.load(new File(inputFile));
            //获取一个PDFTextStripper文本剥离对象  
            PDFTextStripper textStripper =new PDFTextStripper("GBK");
            content=textStripper.getText(doc);
            vo.setContent(content);
            System.out.println("内容:"+content);
            System.out.println("全部页数"+doc.getNumberOfPages());  
            //关闭文档
            doc.close();
        } catch (Exception e) {
            // TODO: handle exception
        }
    }

—–3读取pdf中文字信息(指定页面)

    /**
     * 读取pdf中文字信息(指定从第几页开始)
     */
    public static pdfDomainVO readPageNO(pdfDomainVO vo){   
        String content="";        
        try{
            PDDocument document = PDDocument.load(vo.getInputfile());
            // 获取页码
            int pages = document.getNumberOfPages();
             // 读文本内容
             PDFTextStripper stripper=new PDFTextStripper();
             // 设置按顺序输出
             stripper.setSortByPosition(true);
             stripper.setStartPage(vo.getPageno());
             stripper.setEndPage(vo.getPageno());
             //获取内容
             content = stripper.getText(document);
             vo.setContent(content);
             System.out.println("function : readPageNO over");
        } catch (Exception e) {
            e.printStackTrace();
        }
        return vo;
    }

—–4替换指定pdf文件的文字内容(这个比较复杂,当时看api看了好久,然后一个一个的吧注释添了上去)

/**
     * 替换指定pdf文件的文字内容
     * @param args
     */
    public static pdfDomainVO replaceContent(pdfDomainVO vo)
    throws IOException,COSVisitorException{
        //创建一个文档对象
        PDDocument doc =null;
        try {
            //加载文件
            doc =PDDocument.load(vo.getInputfile());
            //获取全部页数
            List pages= doc.getDocumentCatalog().getAllPages();
            //获取与i对应的页面
            PDPage page = (PDPage)pages.get( vo.getPageno() );
            //流对象来接收当前page的内容
            PDStream contents = page.getContents();
            //PDF流对象剖析器(这将解析一个PDF字节流并提取操作数,等等)
            PDFStreamParser parser =new PDFStreamParser(contents.getStream());
            //这将分析流中的标记
            parser.parse();
            //用list存流中的所有标记
            List tokens =parser.getTokens();
            for (int j = 0; j < tokens.size(); j++) {
                //创建一个object对象去接收标记
                Object next = tokens.get( j );
                //instanceof判断其左边对象是否为其右边类的实例
                if(next  instanceof PDFOperator ) {
                    //pdf操作器对象
                    PDFOperator op =(PDFOperator)next;
                    //TJ和TJ是显示的两个操作符。 
                    //PDF中的字符串 
                    if(op.getOperation().equals("Tj")){
                        //COSString对象>>创建java字符串的一个新的文本字符串。
                        COSString previous = (COSString)tokens.get( j-1 );
                        //将此字符串的内容作为PDF文本字符串返回。 
                        String string=previous.getString();
                        //replaceFirst>>替换第一个字符
                        string = string.replaceFirst( vo.getStrtofind(), vo.getMessage() );
                        System.out.println(string);                           
                        System.out.println(string.getBytes("GBK"));
                        //重置COSString对象
                        previous.reset();
                        //设置字符编码格式
                        previous.append(string.getBytes("GBK") );
                    }else if(op.getOperation().equals("TJ")){
                        //COSArray是pdfbase对象数组,作为PDF文档的一部分
                        COSArray previous  =(COSArray)tokens.get( j-1 );
                        //循环previous
                        for (int k = 0; k < previous.size(); k++) {
                            //这将从数组中获取一个对象,这将取消引用该对象
                            //如果对象为cosnull，则返回null
                            Object arrElement = previous.getObject( k );
                            if( arrElement instanceof COSString ){
                                //COSString对象>>创建java字符串的一个新的文本字符串。
                                COSString cosString =(COSString)arrElement;
                                //将此字符串的内容作为PDF文本字符串返回。 
                                String string =cosString.getString();
                                //替换
                                string = string.replaceFirst(  vo.getStrtofind(), vo.getMessage());
                                //重置COSString对象
                                cosString.reset();
                                //设置字符编码格式
                                cosString.append(string.getBytes("GBK") );
                            }
                        }
                    }
                }
            }
             //创建一个PDStream 流对象
             PDStream updatedStream = new PDStream(doc);
             //创建一个输出流接收updatedStream
             OutputStream out =updatedStream.createOutputStream();
             //将接受一个列表并写出它们的流。 
             ContentStreamWriter tokenWriter  =new ContentStreamWriter(out);
             //写入一系列标记，后面跟着一行新行
             tokenWriter.writeTokens(tokens);
             //当前页设置新的内容
             page.setContents( updatedStream );
            //修改后保存的路径
            doc.save(vo.getOutputfile());
            //操作后的页数
            vo.setAfterPages(doc.getNumberOfPages());
        } catch (Exception e) {
            e.printStackTrace();
        }finally{
            if( doc != null ){
                //关闭文档
                doc.close();
            }
        }
        return vo;
    }

—–5在pdf中插入图片(按指定页数插入)

/**
     * 在pdf中插入图片
     * @param inputFile
     * @param image
     * @param outputFile
     * @throws IOException
     * @throws COSVisitorException
     */
    public static pdfDomainVO  insertImage( pdfDomainVO vo ) 
              throws IOException, COSVisitorException{
        //偏移量设置
        String[] position =vo.getPosition().split(",");
        int x =Integer.valueOf(position[0]);
        int y =Integer.valueOf(position[position.length-1]);
        //创建一个文档对象
        PDDocument doc =null;
        try {
            //加载
            doc = PDDocument.load(vo.getInputfile());
            //获取加载进来的pdf文件的页面
            PDPage page = (PDPage)doc.getDocumentCatalog().getAllPages().get( vo.getPageno() );
            //pdfbox中图片对象类
            PDXObjectImage ximage = null;
            //判断是否是.jpg格式的图片
            if( vo.getImagefile().toLowerCase().endsWith( ".jpg" ) ){
                //传入一张图片
                 ximage = new PDJpeg(doc, new FileInputStream( vo.getImagefile() ) ); 
            }//如果是tif或tiff格式
            else if (vo.getImagefile().toLowerCase().endsWith(".tif") || vo.getImagefile().toLowerCase().endsWith(".tiff")){
                 ximage = new PDCcitt(doc, new RandomAccessFile(new File(vo.getImagefile()),"r"));
            }else{
                //Image和BufferedImage的主要作用就是将一副图片加载到内存中
                BufferedImage awtImage = ImageIO.read( new File( vo.getImagefile() ) );
                ximage = new PDPixelMap(doc, awtImage);
            }
            //这是选择如何处理流：覆盖、追加
            PDPageContentStream contentStream = new PDPageContentStream(doc, page, true, true);
            //控制图片的大小
            float scale = vo.getImgSize();
            scale = scale/10;//(这个值最好是0.1~1,0.5就已经很大了)

            //ximage.setHeight(ximage.getHeight()/5);
            //ximage.setWidth(ximage.getWidth()/5);
             System.out.println(ximage.getHeight());
             System.out.println(ximage.getWidth());
             //设置位移等参数
             contentStream.drawXObject(ximage, x, y, ximage.getWidth()*scale, ximage.getHeight()*scale);
             //关闭流对象
             contentStream.close();
             //保存路径
             doc.save( vo.getOutputfile() );
             //操作后的页数
             vo.setAfterPages(doc.getNumberOfPages());
        } catch (Exception e) {
            e.printStackTrace();
        }finally{
            if( doc != null ){
                //关闭文档
                doc.close();
            }
        }   
        return vo;
     }

—–6指定页数的PDF文件转换为图片

/***
     * 指定页数的PDF文件转换为图片：
     * @param inputFile
     * @param outputFile 这里指定文件夹
     */
    public static pdfDomainVO toImage( pdfDomainVO vo ) {
        try {
            //加载
            PDDocument doc = PDDocument.load(vo.getInputfile());
            //
            //int pageCount = doc.getPageCount();
            ////获取全部页数
            //指定单页转pdf
            List pages = doc.getDocumentCatalog().getAllPages();
            if(vo.getPageno()!=null){
                String count=(int)(Math.random()*1000)+"-"+(int)(Math.random()*1000);
                //接收页面
                PDPage page = (PDPage) pages.get(vo.getPageno());
                //定义图片操作对象来设置图片
                BufferedImage image = page.convertToImage();
                //定义迭代器对象存储
                Iterator iter = ImageIO.getImageWritersBySuffix("jpg");
                //图片写入器对象写入图片
                ImageWriter writer = (ImageWriter) iter.next();
                //循环保存图片
                File outFile = new File(vo.getOutputfile()+vo.getFilename()+"-"+(vo.getPageno()+1)+".jpg");
                //创建文件输出流对象
                FileOutputStream out = new FileOutputStream(outFile);
                //ImageIO去实现ImageOutputStream获取当前图片
                ImageOutputStream outImage = ImageIO.createImageOutputStream(out);
                writer.setOutput(outImage);
                writer.write(new IIOImage(image, null, null));
            }else{
                //循环
                for (int i = 0; i < pages.size(); i++) {
                    //接收页面
                    PDPage page = (PDPage) pages.get(i);
                    //定义图片操作对象来设置图片
                    BufferedImage image = page.convertToImage();
                    //定义迭代器对象存储
                    Iterator iter = ImageIO.getImageWritersBySuffix("jpg");
                    //图片写入器对象写入图片
                    ImageWriter writer = (ImageWriter) iter.next();
                    //循环保存图片
                    File outFile = new File(vo.getOutputfile()+i+".jpg");
                    //创建文件输出流对象
                    FileOutputStream out = new FileOutputStream(outFile);
                    //ImageIO去实现ImageOutputStream获取当前图片
                    ImageOutputStream outImage = ImageIO.createImageOutputStream(out);
                    writer.setOutput(outImage);
                    writer.write(new IIOImage(image, null, null));
                }
            }
            //关文档
            doc.close();
            //操作后的页数
            vo.setAfterPages(doc.getNumberOfPages());
            System.out.println("over");
        } catch (Exception e) {
            e.printStackTrace();
        }
        return vo;
    }

—–7指定页插入一段文字(大家可自调字体,插入文字的位置)

/***
     * 指定页插入一段文字
     * @param inputFile
     * @param message
     * @param outputFile
     * @throws IOException
     * @throws COSVisitorException
     */
    public static pdfDomainVO InsertPageContent (pdfDomainVO vo ) throws IOException, COSVisitorException
    { 
        // the document
        PDDocument doc = null;
        try
        {
            doc = PDDocument.load( vo.getInputfile() );
            List allPages = doc.getDocumentCatalog().getAllPages();
            PDFont font = PDType1Font.HELVETICA_BOLD;
            //字体大小
            float fontSize = 36.0f;
            PDPage page = (PDPage)allPages.get( vo.getPageno() );
            PDRectangle pageSize = page.findMediaBox();
            float stringWidth = font.getStringWidth( vo.getMessage() )*fontSize/1000f;
            // calculate to center of the page
            int rotation = page.findRotation(); 
            boolean rotate = rotation == 90 || rotation == 270;
            float pageWidth = rotate ? pageSize.getHeight() : pageSize.getWidth();
            float pageHeight = rotate ? pageSize.getWidth() : pageSize.getHeight();
            double centeredXPosition = rotate ? pageHeight/2f : (pageWidth - stringWidth)/2f;
            double centeredYPosition = rotate ? (pageWidth - stringWidth)/2f : pageHeight/2f;
            // append the content to the existing stream
            PDPageContentStream contentStream = new PDPageContentStream(doc, page, true, true,true);
            contentStream.beginText();
            // set font and font size
            contentStream.setFont( font, fontSize );
            // set text color to red
            contentStream.setNonStrokingColor(255, 0, 0);
            if (rotate)
            {
                // rotate the text according to the page rotation
                contentStream.setTextRotation(Math.PI/2, centeredXPosition, centeredYPosition);
            }
            else
            {
                contentStream.setTextTranslation(centeredXPosition, centeredYPosition);
            }
            contentStream.drawString( vo.getMessage() );
            contentStream.endText();
            contentStream.close();
            vo.setAfterPages(doc.getNumberOfPages());
            doc.save( vo.getOutputfile() );
            System.out.println("over");
        }
        finally
        {
            if( doc != null )
            {
                doc.close();
            }
        }
        return vo;
    }

—–8提取图片并保存

/**
     * 提取图片并保存
     * @param pdfDomainVO 
     * @throws IOException 
     * 
     */
    public static pdfDomainVO extractImage(pdfDomainVO vo ) throws IOException{
        //创建文档  
        PDDocument doc=null;
        try{
            //加载 pdf 文档,获取PDDocument文档对象
            doc=PDDocument.load(vo.getInputfile());           
            /** 文档页面信息 **/  
            //获取PDDocumentCatalog文档目录对象
            PDDocumentCatalog catalog = doc.getDocumentCatalog();
            //获取文档页面PDPage列表
            List pages = catalog.getAllPages();  
            int pageNum=pages.size();   //文档页数
            PDPage page = null;
            if(vo.getPageno()!=null){
                 page = ( PDPage ) pages.get( vo.getPageno() ); 
                 if( null != page ){  
                     PDResources resource = page.findResources();                      
                     //获取页面图片信息 
                     Map imgs = resource.getImages();                    
                     for(Map.Entry me: imgs.entrySet()){
                         //System.out.println(me.getKey());
                         PDXObjectImage img = me.getValue();  
                         //保存图片，会自动添加图片后缀类型
                         img.write2file( vo.getOutputfile() + vo.getFilename()+"-"+(vo.getPageno()+1) );     
                     }  
                 }  
            }else{
                //遍历每一页
                for( int i = 0; i < pageNum; i++ ){  
                    //取得第i页
                     page = ( PDPage ) pages.get( i ); 
                    if( null != page ){  
                        PDResources resource = page.findResources();                      
                        //获取页面图片信息 
                        Map imgs = resource.getImages();                    
                        for(Map.Entry me: imgs.entrySet()){
                            String count=(int)(Math.random()*1000)+"-"+(int)(Math.random()*1000);
                            //System.out.println(me.getKey());
                            PDXObjectImage img = me.getValue();  
                            //保存图片，会自动添加图片后缀类型
                            img.write2file( vo.getOutputfile() + count );  
                        }  
                    }  
                } 
            }
            //操作后的页数
            vo.setAfterPages(doc.getNumberOfPages());
            System.out.println("extractImage:over");
        }  finally
        {
            if( doc != null )
            {
                doc.close();
            }
        }
        return vo;
    }

—–9PDF文档中删除页面(不能删除最后一页！)

    /***
     * PDF文档中删除页面
     * 一个PDF文档必须至少有一页，且不能删除最后一页！
     * @param inputFile
     * @param outputFile
     * @throws Exception
     */
    public static pdfDomainVO removePage(pdfDomainVO vo) throws Exception
    {
        vo.setStatus(Details.FailStatus);
        PDDocument document = null;
        try
        {
            document = PDDocument.load(vo.getInputfile() );
            if( document.isEncrypted() )
            {
                throw new IOException( "Encrypted documents are not supported for this example" );
            }
            if( document.getNumberOfPages() <= 1 )
            {
                throw new IOException( "Error: A PDF document must have at least one page, " +
                                       "cannot remove the last page!");
            }
            document.removePage( vo.getPageno() );
            document.save(vo.getOutputfile() );
            //操作后的页数
            vo.setAfterPages(document.getNumberOfPages());
            //设置成功状态
            vo.setStatus(Details.SuccessStatus);
            System.out.println("over");
        }
        finally
        {
            if( document != null )
            {
                document.close();
            }
        }
        return vo;
    }

pdfbox很强大,最主要是开源,(就是TMD不支持中文)以上只是部分功能,大家如果还想拓展,可以参考官方的事例和api

PS:遗憾的是,我没有处理好,替换文字或者是插入文字时,中文乱码问题,有处理好的同学记得和博主说一下,大家共同进步

这有一篇文:http://blog.csdn.net/undergrowth/article/details/39136673是对于pdfbox各个方法,属性解析的比较好的文,大家可以去看下

利用apache-pdfbox库修改pdf文件模板，进行信息替换区块链攻城狮 pdf 合同模板 pdf生成合同生成
publicStringcreateSignFile(Longid)throwsIOException{//1.验证企业信息CompanyDOcompany=validateCompanyExists(id);//2.验证签约状态if(company.getSignStatus()!=0){throwexception(COMPANY_SIGN_STATUS_NOT_ZERO);}//3.获取合同
Java pdf转jpg tanzongbiao Java java eureka 开发语言
org.apache.pdfboxfontbox2.0.26org.apache.pdfboxpdfbox2.0.26PdfToJpgUtil.jpgpackagecom.qyj.utils;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox.pdmodel.PDPageTree;importorg.apache.p
java pdf转jpg gonepoo 工具类 java pdf pdf转jpg jpg 代码
packagecom.xxx;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox.pdmodel.PDPageTree;importorg.apache.pdfbox.rendering.PDFRenderer;importjavax.imageio.ImageIO;importjava.awt.image.Buff
用SpringBoot API实现识别pdf文件是否含有表格战族狼魂 java Springboot python spring boot pdf 后端
要使用SpringBootAPI实现一个识别PDF文件是否含有表格的功能，你可以结合PDF解析库（如ApachePDFBox）来解析PDF文件内容，并通过分析文本或线条来判断PDF是否包含表格。然后使用SpringBoot提供的RESTAPI来实现上传和检测功能。目录实现步骤1.配置pom.xml2.实现SpringBoot文件上传和检测API3.配置SpringBoot启动类4.使用Postma
Apache PDFBox 使用教程洪淼征
ApachePDFBox使用教程pdfboxMirrorofApachePDFBox项目地址:https://gitcode.com/gh_mirrors/pdfbo/pdfbox项目介绍ApachePDFBox是一个开源的Java库，专门用于处理PDF文档。它允许用户创建全新的PDF文件、编辑现有的PDF文档以及从PDF文件中提取内容。PDFBox提供了丰富的API，支持创建、渲染、打印、合并、
java解决PDF中的XSS攻击蓝色土耳其love java pdf xss 开发语言前端
1、依赖org.apache.pdfboxpdfbox2.0.262、publicStringuploadFile(MultipartFilefile)throwsException{if(file.getContentType().equals(MediaType.APPLICATION_PDF_VALUE)&&FileUtils.containsJavaScript(FileUtils.mul
java-PDF与图片互转（pdfbox）[添加批注后合成pdf] Jayin_chan 开发中碰到的问题 pdfbox pdf转图片 java
importjava.awt.image.BufferedImage;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.util.Date;importjava.util.Iterator;importjava.util.List;importjava.util.TreeSe
SpringBoot实现 PDF 添加水印 A尘埃 spring boot pdf 后端水印
方案一：使用ApachePDFBox库①、依赖org.apache.pdfboxpdfbox2.0.24②、添加水印publicclassPdfoxWatermark{publicstaticvoidmain(String[]args)throwsIOException{//读取原始PDF文件PDDocumentdocument=PDDocument.load(newFile("original.
java实现 pdf转word 空╯﹏╰白
这里使用ApachePDFBox是Java开源PDF文档第三方库工具集,主要特征提取提取pdf提取文本、分隔合并、填写表单、保存为图片、PDF数字签名及创建PDF文件。添加maven依赖org.apache.pdfboxpdfbox2.0.4附上代码packagecom.zk;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.p
java tika pdf_java解析pdf获取pdf中内容信息 weixin_39653717 java tika pdf
项目中需要将pdf中的数据获取到进行校验数据，于是前往百度翻来覆去找到以下几种办法，做个笔记,方便日后查询。talkischeap,showmethecode第一种使用开源组织提供的开源框架pdfbox特点:免费，功能强大，解析中文或许会存在乱码，格式有点乱，没有国产解析的那么美化。可以按照指定的模板，对pdf进行修改添加删除等操作，总之操作很骚，很强大。1pdfbox需要带入依赖org.apac
java利用pdfbox实现PDF转为图片 Li_XiaoJin java
这个是我之前做发票业务时弄的，记录一下。当时需求是要将发票的pdf转化为图片让用户预览，并支持长按图片进行保存。使用pdfbox实现，用起来很方便。1.引用jar包org.apache.pdfboxpdfbox2.0.16org.apache.pdfboxfontbox2.0.162.实现代码代码里有个方法是用icepdf转换的，有兴趣也可以研究icepdf是开源的，但是好像字体支持要收费。imp
开源PDF工具 Apache PDFBox 认识及使用(知识点+案例) 长路 ㅤ 开源 pdf apache
文章目录前言源码获取一、认识PDFBox二、导入依赖三、基础功能demo1：读取pdf所有内容demo2：读取所有页内容（分页）demo3：添加页眉、页脚demo4：添加居中45°文字水印demo5：添加图片到右上角参考文章资料获取前言博主介绍：✌目前全网粉丝2W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、算法
python：xml.etree 生成思维导图 Freemind文件 belldeep python xml etree Freemind python
请参阅：java:pdfbox读取PDF文件内书签或者python：从PDF中提取目录请注意：书的目录.txt编码：UTF-8，推荐用Notepad++转换编码。xml是python标准库，在D:\Python39\Lib\xml\etreepython用xml.etree.ElementTree生成思维导图Freemind（.mm）文件编辑txt_xml_etree_mm.py如下#-*-cod
python：xml.etree，用 xmltodict 转换为json数据，生成jstree所需的文件 belldeep python xml etree xmltodict jinja2 python
请参阅：java:pdfbox读取PDF文件内书签或者python：从PDF中提取目录请注意：书的目录.txt编码：UTF-8，推荐用Notepad++转换编码。xml是python标准库，在D:\Python39\Lib\xml\etreepipinstallxmltodict;python用xml.etree.ElementTree，用xmltodict转换为json数据，jinja2生成js
node.js 读目录.txt文件，用 xml2js 转换为json数据，生成jstree所需的文件 belldeep nodejs javascript node.js elementtree json xml2js ejs
请参阅：java:pdfbox读取PDF文件内书签请注意：书的目录.txt编码：UTF-8，推荐用Notepad++转换编码。npminstallelementtree;npminstallxml2js;node.js用elementtree读目录.txt文件，用xml2js转换为json数据，ejs生成jstree模板所需的文件。编写txt_etree_json.js如下//读目录.txt文件，
python：lxml 读目录.txt文件，用 xmltodict 转换为json数据，生成jstree所需的文件 belldeep python javascript python lxml etree xmltodict jinja2
请参阅：java:pdfbox读取PDF文件内书签请注意：书的目录.txt编码：UTF-8，推荐用Notepad++转换编码。pipinstalllxml;lxml-5.1.0-cp310-cp310-win_amd64.whl(3.9MB)pipinstallxmltodict;lxml读目录.txt文件，用xmltodict转换为json数据，生成jstree模板所需的文件。编写txt_etr
node.js 使用 elementtree 生成思维导图 Freemind 文件 belldeep nodejs javascript node.js readline elementtree Freemind
请参阅:java:pdfbox读取PDF文件内书签npminstallelementtree--save编写txt_etree_mm.js如下//读目录.txt文件，使用elementtree生成思维导图Freemind（.mm）文件varfs=require('fs');varprocess=require('process');varpath=require('path');varreadli
Java使用pdfbox将PDF转成JPG格式图片唐三藏 java java maven
Java使用pdfbox将PDF转成JPG格式图片使用的jar依赖：org.apache.pdfboxpdfbox1.7.1org.apache.pdfboxfontbox1.7.1Java代码demo：importjava.awt.image.BufferedImage;importjavax.imageio.ImageIO;importorg.apache.pdfbox.pdmodel.PDD
使用pdfbox实现PDF转JPG 清苦后端
引入依赖org.apache.pdfboxpdfbox1.7.1org.apache.pdfboxfontbox1.7.1实现简单的PDF转JPGpublicstaticvoidmain(String[]args){StringpdfFilePath="D:/aaa.pdf";//pdf文件路径StringdestFormat="jpg";//最终希望PDF文件转成的文件格式intdpi=144;
使用PDFBox实现pdf转其他图片格式银氨溶液 pdf 算法 spring boot java idea postman
最近在做一个小项目，项目中有一个功能要把pdf格式的图片转换为其它格式，接下来看看用pdfbox来如何实现吧。首先导入pdfbox相关依赖：org.apache.pdfboxpdfbox2.0.1org.apache.pdfboxfontbox2.0.0org.apache.pdfboxjempbox1.8.11org.apache.pdfboxxmpbox2.0.0org.apache.pdfb
python：lxml 生成思维导图 Freemind（.mm）文件 belldeep python python lxml etree
请参阅：从PDF中提取目录或者java:pdfbox读取PDF文件内书签pipinstalllxml;lxml-5.1.0-cp310-cp310-win_amd64.whl(3.9MB)读目录.txt文件，使用lxml生成思维导图Freemind（.mm）文件编写txt_etree_mm.py如下#-*-coding:utf-8-*-"""读目录.txt文件，使用lxml生成思维导图Freemi
pdfbox 第一页加内容_java 用PDFBox 删除 PDF文件中的某一页清柳梨莉 pdfbox 第一页加内容
依赖：org.apache.pdfboxpdfbox-app1.8.10java用PDFBox删除PDF文件中的某一页，前n页，后n页，效率低，不推荐使用packagecom.everjiankang;importjava.io.File;importorg.apache.pdfbox.pdmodel.PDDocument;/**运行效率很慢，因为每次删除一页就读取和保存一次文件,初始文件名格式：
x-easypdf 基于pdfbox/fop 封装的框架 ejinxian Java java 前端 javascript PDF
x-easypdf是一个基于pdfbox/fop二次封装的框架，目前拥有两大模块：【pdfbox模块】与【fop模块】。【pdfbox模块】主打pdf编辑功能，以组件化的形式进行pdf的构建；【fop模块】主打pdf导出功能，采用数据源的方式对xsl-fo模板进行转换，同时提供java对象的方式构建dom模板文档，即使完全不懂xsl-fo的语法，也能轻松上手写出对应的模板。两个模块均可单独使用，也
业务场景实战(五)PDF生成后来丶_a24d
思维导图思维导图.png系列总目录业务场景实战汇总背景随着公司的快速发展，业务需要沉淀出根据模板生成PDF的通用能力根据Word/PDF模板，填充对应信息，生成PDF技术选型PDF相关的各个框架text:基于AGPL协议，商业版需要开源项目代码或者收费spire.doc:商业版收费，免费版有水印PDFbox:提供pdf操作，创建PDF，合并PDF功能，但是对中文支持不是很好OpenPDF:demo
Java PDFBox 提取页数、PDF转图片冲上云霄的Jayden java pdf pdfbox pdf转图片 apache 页面提取
PDF提取使用Apache的pdfbox组件对PDF文件解析读取和转图片。Maven依赖导入下面的maven依赖：org.apache.pdfboxpdfbox2.0.30读取总页数和转图片dpi越大转换后越清晰，相对转换速度越慢，建议取值500-800。图片类型可以选择jpg或者png：jpg图片大小比png要小很多jpg图片转换速度比png快相同dpijpg和png清晰度差别不大package
【java问题解决】-word转pdf踩坑睁开眼睛去看这个世界 word pdf
问题情境：项目中采用word转pdf，最开始使用的pdf相关的apache的pdfbox和itextpdf，后面发现对于有图片背景的word转pdf的情景，word中的背景图会直接占用位置，导致正文不会正确落在背景图上。解决方案：采用aspose的word转pdf方式：具体操作为：1:引入依赖：com.asposeaspose-words20.32:需要引入证书方法使用起来就很简单：Documen
java 提取pdf表格内容_在Java中使用tabula提取PDF中的表格数据九边 java 提取pdf表格内容
问题：如何将pdf文件中指定的表格数据提取出来？尝试过的工具包有：pdfbox、tabula。最终选用tabula两种工具的比较pdfbox其中，pdfbox能将pdf中的内容直接提取成String，代码片段：publicstaticvoidreadPdf(Stringpath){try{PDDocumentdocument=PDDocument.load(newFile(path));PDFTe
java 调用打印机 fmi110 springboot java 开发语言 pdf打印 java打印
在网上找了不少通过jdk的printService服务打印pdf的博客，都大同小异，打印调用了但是没有真的打印，最后终于找到一个可用的,这里记录一下。首先通过maven引入依赖：org.apache.pdfboxpdfbox2.0.6最后使用工具类：packagecom.ruoyi.mrs.utils;importcom.itextpdf.text.Document;importcom.itext
SpringBoot 实现 PDF 添加水印有哪些方案小白养成记￥ java spring boot pdf
SpringBoot实现PDF添加水印有哪些方案方式一：使用ApachePDFBox库方式二：使用iText库方式三：用Ghostscript命令行方式四：FreeSpire.PDFforJava方式五：Aspose.PDFforJava简介PDF（PortableDocumentFormat，便携式文档格式）是一种流行的文件格式，它可以在多个操作系统和应用程序中进行查看和打印。在某些情况下，我们
Java使用PDFBox为PDF填加水印亲测一路走来_负重前行实用工具 java
Java使用PDFBox为PDF填加水印亲测1、maven依赖java代码部分效果图片中文微软雅黑TTF1、maven依赖org.apache.pdfboxpdfbox2.0.12java代码部分importcom.jerehsoft.ums.AuthContext;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地