提取网页文本(1)

   最近公司要从网上下载一些资料,用JAVA写成了一个下载的小程序。在NETBEAN上中跑的很好,可以一做成JAR就不行了。杯具,研究一上午。不过后来看到一篇文章提到,平台编码。再看一下自己写的,原来是没有规定编码。大喜,果然。//分析URL public void parserHtml(String urls) { try { URL url=new URL(urls); System.out.println(urls); //提取的编码是UTF-8 InputStreamReader isr=new InputStreamReader(url.openStream(),"UTF-8"); BufferedReader br=new BufferedReader(isr); String temp=null; String tempStr=""; while(null!=(temp=br.readLine())) { tempStr+=temp; } analyze(tempStr.replaceAll("/r","").replaceAll("/n","")); //aa //osw.write(tempStr); } catch (Exception e) { } }

你可能感兴趣的:(java,exception,String,jar,null,url)