解析网页利器组合(正则、jsoup、beanshell、dozer)资源

由于项目需要使用java正则、jsoup、dozer、beanshell组合用来解析网页,现把相关资源整理记录:

 

dozer : 基于beanUtils实现的对象转化工具,实现各种类型之间对象的深层次复制。

beanshell : 一种完全符合java语法的松散类型的脚本语言,可以用来完成简单或复杂对象的逻辑判断。

dozer和beanshell之前接触的少,需要的话网上找资料,附件为入门word。

 

jsoup资源 : http://www.open-open.com/jsoup/selector-syntax.htm,语法类似jquery,基于document,

网上很多例子。

 

java正则表达式的文章整理如下:

 

1. 正则表达式学习网 : http://www.regexbook.net/book/jckc/index.htm


2. 大名鼎鼎的《正则表达式30分钟入门教程》:http://deerchao.net/tutorials/regex/regex.htm

3. Java正则表达式详解:http://edu.yesky.com/edupxpt/18/2143018.shtml

 

4. Java正则表达式应用总结:http://lavasoft.blog.51cto.com/62575/179324

5. java.util.regex.Pattern类:http://docs.oracle.com/javase/6/docs/api/java/util/regex/Pattern.html

6. java.util.regex包:http://docs.oracle.com/javase/6/docs/api/java/util/regex/package-summary.html

7. Java Regex Tutorial:http://www.vogella.com/articles/JavaRegularExpressions/article.html

8. Lesson: Regular Expressions:http://docs.oracle.com/javase/tutorial/essential/regex/

9. Linux/Bash下正则表达式:http://codingstandards.iteye.com/blog/1195592

 

再来几个较好的正则测试工具(前2个都不错我觉得):

 

1、https://code.google.com/p/qre/

2、http://regexpal.com/
3、http://www.gskinner.com/RegExr/

你可能感兴趣的:(shell)