E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
nekohtml
利用lucene,
nekohtml
,为rss新闻建立索引
import java.io.BufferedReader; import java.io.File; import java.io.IOException; import java.io.InputStreamReader; import java.net.URL; import java.util.ArrayList; import java.util.List; imp
yuhai.china
·
2009-12-02 12:00
apache
xml
swing
Lucene
sun
利用lucene,
nekohtml
,为rss新闻建立索引
import java.io.BufferedReader; import java.io.File; import java.io.IOException; import java.io.InputStreamReader; import java.net.URL; import java.util.ArrayList; import java.util.List; imp
yuhai.china
·
2009-12-02 12:00
apache
xml
swing
Lucene
sun
乱码问题总算解决了
下面这段代码用来获取文章内容,并通过
NekoHTML
来解析获得去掉HTML标签的文章内容.标红的地方就是用来设置字符集的,第一个是XML格式的字符集(似乎没什么用),第二个地方是将字符串的内容通过输入流读入
北溟有鱼
·
2009-11-04 01:00
nekohtml
使用笔记
1、透明地创建HTML解析器 利用Xerces2.0为基础,应用程序通过JAXP实例化解析器对象时,可以透明地创建HTML解析器,此时只需要将
NekoHTML
的jar文件,在CLASSPATH中放在
gcgmh
·
2009-09-22 11:00
apache
html
框架
xml
浏览器
nekohtml
经典小例子一个
public class Demo { public static String TextExtractor(Node root){ //若是文本节点的话,直接返回 if (root.getNodeType() == Node.TEXT_NODE) { return root.getNodeValue().trim(); } if(root.getN
gcgmh
·
2009-09-22 10:00
html
脚本
nekohtml
的2个小例子
//获取网页里面的keywords和description public static void main(String[] argv) throws Exception { BufferedReader in = new BufferedReader(new FileReader("d:/163.html")); DOMParser parser
gcgmh
·
2009-09-22 10:00
html
nekohtml
用法
//
nekohtml
结合xpath用法 DOMParser parser = new DOMParser(); try { //设置网页的默认编码
gcgmh
·
2009-09-21 15:00
html
xml
XHTML
使用
NekoHTML
和XPath获取网页特定标签
如果需要在HTML页面中提取数据,那么
NekoHTML
是个不错的工具。
·
2009-09-11 00:00
java
html
xml
htmlparser使用指南
htmlparser使用指南 需要做一个垂直搜索引擎,比较了
nekohtml
和htmlparser 的功能,尽管
nekohtml
在容错性、性能等方面的口碑好像比htmlparser好(htmlunit
lukang
·
2009-08-18 10:00
html
数据结构
搜索引擎
Google
单元测试
htmlparser 使用手册
需要做一个垂直搜索引擎,比较了
nekohtml
和htmlparser的功能,尽管
nekohtml
在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是
nekohtml
),
xyf_84
·
2009-07-24 10:00
html
.net
css
Google
单元测试
htmlparser 使用手册
需要做一个垂直搜索引擎,比较了
nekohtml
和htmlparser的功能,尽管
nekohtml
在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是
nekohtml
),
xyf_84
·
2009-07-24 10:00
html
.net
css
单元测试
Google
htmlparser 处理