关于apache poi 抽取word文本的问题,

用如下的方法

   WordDocument wd = new WordDocument(is);
  StringWriter docTextWriter = new StringWriter();
  wd.writeAllText(new PrintWriter(docTextWriter));
  docTextWriter.close();
  bodyText = docTextWriter.toString();  
    // bodyText = new WordExtractor().extractText(is);
  System.out.println(bodyText);



抽取不出所有的文件, 好像有字数限制, 只能抽取前面部分字符. 是不是bug啊,



使用过poi的, 有没有遇到这种问题啊, 有没有好的办法呢, 路过的给点建议. 谢谢

你可能感兴趣的:(apache)