比较我的ITEYE和OSCHINA博客异同的代码来自rank项目:https://github.com/ysc/rank/commit/d8583f9d4c1edd4f871c83b0da2ee18888915a10
1、11大Java开源中文分词器的使用方法和分词效果对比 oschina iteye
2、1208个合成词 oschina iteye
3、192本软件著作用词分析(五)用词最复杂99级 oschina iteye
4、2000个软件开发领域的高频特殊词及精选例句(一) oschina iteye
5、30个JDK类库源代码中最频繁出现的词的深度分析 oschina iteye
6、312个免费高速HTTP代理IP(能隐藏自己真实IP地址) oschina iteye
7、36本Java英文原版电子书 oschina iteye
8、APDPlat中业务日志和监控日志的设计与实现 oschina iteye
9、APDPlat中备份文件异地容灾机制之FTP上传 oschina iteye
10、APDPlat中数据库备份恢复的设计与实现 oschina iteye
11、APDPlat中的机器码生成机制 oschina iteye
12、APDPlat中的用户密码安全策略 oschina iteye
13、APDPlat中领域模型的自描述机制与事件通知机制 oschina iteye
14、APDPlat如何自动建库建表并初始化数据? oschina iteye
15、APDPlat拓展搜索之集成ElasticSearch oschina iteye
16、APDPlat拓展搜索之集成Solr oschina iteye
17、APDPlat的日志国际化实现方式 oschina iteye
18、APDPlat的系统启动和关闭流程剖析 oschina iteye
19、Amazon Dynamo的NWR模型 oschina iteye
20、Cygwin运行nutch报错:Failed to set permissions of path oschina iteye
21、HBase on CAP oschina iteye
22、Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同? oschina iteye
23、Hadoop发行版的比较与选择 oschina iteye
24、HtmlExtractor 1.1 发布,网页信息抽取组件 oschina iteye
25、ITEYE博文抄袭检查 oschina iteye
26、JAVA调用CSDN接口发博文 oschina iteye
27、JDK源代码中最重要的4646个英语单词 oschina iteye
28、JDK源代码以及200多部软件著作中出现的以连字符构造的1011个合成词 oschina iteye
29、Java8全新打造,英语学习supertool oschina iteye
30、Java中的null引用,超乎你想象 oschina iteye
31、Java分布式中文分词组件word分词v1.2发布 oschina iteye
32、Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor oschina iteye
33、Java应用系统中自动实时检测资源文件内容变化 oschina iteye
34、Java开源项目cws_evaluation:中文分词器分词效果评估 oschina iteye
35、Nutch抓取需要登录的网站 oschina iteye
36、Nutch的发展历程 oschina iteye
37、OSCHINA博文抄袭检查 oschina iteye
38、QuestionAnsweringSystem v1.1 发布,人机问答系统 oschina iteye
39、SOLR4.2+NUTCH1.6 oschina iteye
40、The Design of HDFS oschina iteye
41、The Future of Compass & ElasticSearch oschina iteye
42、Ubuntu上安装HADOOP单机伪分布式集群 oschina iteye
43、Ubuntu上安装HADOOP多机完全分布式集群 oschina iteye
44、Windows上安装HADOOP单机伪分布式集群 oschina iteye
45、cws_evaluation v1.1 发布,中文分词器分词效果评估对比 oschina iteye
46、new一个Object对象占用多少内存? oschina iteye
47、nutch2.1+mysql报错及解决 oschina iteye
48、struts2和spring mvc,孰优孰劣? oschina iteye
49、word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器分词效果评估 oschina iteye
50、一个月的时间让你的词汇量翻一翻 oschina iteye
51、一种利用ngram模型来消除歧义的中文分词方法 oschina iteye
52、一种基于词性序列的人名识别方法 oschina iteye
53、一种通用的网页相似度检测算法 oschina iteye
54、一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 oschina iteye
55、中文分词之11946组同义词 oschina iteye
56、中文分词之9271组反义词 oschina iteye
57、中文分词效果对比 oschina iteye
58、中文分词算法 之 基于词典的全切分算法 oschina iteye
59、中文分词算法 之 基于词典的正向最大匹配算法 oschina iteye
60、中文分词算法 之 基于词典的正向最小匹配算法 oschina iteye
61、中文分词算法 之 基于词典的逆向最大匹配算法 oschina iteye
62、中文分词算法 之 基于词典的逆向最小匹配算法 oschina iteye
63、中文分词算法 之 词典机制性能优化与测试 oschina iteye
64、二百多部软件著作中最重要的9224个英语单词 oschina iteye
65、人机问答系统介绍 oschina iteye
66、使用CountDownLatch来模拟马拉松比赛 oschina iteye
67、使用JSoup+CSSPath采集和讯网人物信息 oschina iteye
68、使用Java8实现自己的个性化搜索引擎 oschina iteye
69、使用Java调用百度搜索 oschina iteye
70、使用Java调用谷歌搜索 oschina iteye
71、关于解析配置文件的一点思考 oschina iteye
72、分布式内存文件系统:Tachyon oschina iteye
73、分布式搜索算法 oschina iteye
74、分析113个前缀在各大考纲词汇中的作用(二)总结精选篇 oschina iteye
75、分析151个后缀在各大考纲词汇中的作用(三)总结精选篇 oschina iteye
76、分析996个词根在各大考纲词汇中的作用(五)总结精选篇 oschina iteye
77、分析在各大考纲词汇中同时拥有前缀后缀和词根的词(一) oschina iteye
78、分析在各大考纲词汇中既没有词根也没有前缀和后缀的独立单词 oschina iteye
79、利用1189个精选句子彻底掌握2190个单词 oschina iteye
80、动态索引结构和索引更新机制 oschina iteye
81、基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎 oschina iteye
82、大数据系列10:Spark – 内存计算 oschina iteye
83、大数据系列11:Gora – 大数据持久化 oschina iteye
84、大数据系列12:Hadoop2 – 全新的Hadoop oschina iteye
85、大数据系列1:在win7上安装配置Hadoop伪分布式集群 oschina iteye
86、大数据系列2:建立开发环境编写HDFS和Map Reduce程序 oschina iteye
87、大数据系列3:用Python编写MapReduce oschina iteye
88、大数据系列4:Hive – 基于HADOOP的数据仓库 oschina iteye
89、大数据系列5:Pig – 大数据分析平台 oschina iteye
90、大数据系列6:HBase – 基于Hadoop的分布式数据库 oschina iteye
91、大数据系列7:Storm – 流计算 oschina iteye
92、大数据系列8:Sqoop – HADOOP和RDBMS数据交换 oschina iteye
93、大数据系列9:Mahout – 机器学习 oschina iteye
94、如何使用Eclipse在Github上开发使用Java8的Maven项目? oschina iteye
95、如何使用HtmlExtractor实现基于模板的网页结构化信息精准抽取? oschina iteye
96、如何使用Intellij IDEA开发Maven项目? oschina iteye
97、如何利用多核提升分词速度 oschina iteye
98、如何在你的应用中使用Jasypt来保护你的数据库用户名和密码 oschina iteye
99、如何在你的应用中集成人机问答系统QuestionAnsweringSystem? oschina iteye
100、如何解决BUG? oschina iteye
101、对Nutch2.1抽象存储层的一些看法 oschina iteye
102、技术框架太多,多的眼花缭乱,如何在众多选择中找到自己的方向? oschina iteye
103、搜索引擎的分片(shard)和副本(replica)机制 oschina iteye
104、根据76大细分词性对单词进行归组(一) oschina iteye
105、根据76大细分词性对单词进行归组(二) oschina iteye
106、模拟浏览器的神器 - HtmlUnit oschina iteye
107、测试人机问答系统智能性的3760个问题 oschina iteye
108、给JAVA源代码文件统一地添加licence信息头 oschina iteye
109、给LUKE增加word分词器 oschina iteye
110、网络机器人的识别与攻防的经典案例(也即爬虫与反爬虫的经典案例) oschina iteye
111、网络爬虫面临的挑战 之 链接构造 oschina iteye
112、自动更改IP地址反爬虫封锁,支持多线程 oschina iteye
113、英语单词前缀规则总结 oschina iteye
114、英语单词后缀规则总结 oschina iteye
115、英语单词音近形似转化规律研究 oschina iteye
116、计算ITEYE博文在百度的收录与排名情况 oschina iteye
117、词组习语3054组 oschina iteye
118、软件业的奥斯卡奖:JOLT奖 之 最好的书 oschina iteye
119、软件熵:软件开发中推倒重来的过程就是软件熵不断增加的过程 oschina iteye
120、运行nutch报错:unzipBestEffort returned null oschina iteye
121、运行nutch提示:0 records selected for fetching, exiting oschina iteye
122、配置Cygwin支持无密码SSH登陆 oschina iteye
123、配置Nutch模拟浏览器以绕过反爬虫限制 oschina iteye
124、采集电子报纸 oschina iteye
1、13054个词及其词义数
2、192本软件著作用词分析(一)
3、192本软件著作用词分析(三)
4、192本软件著作用词分析(二)
5、2000个软件开发领域的高频特殊词及精选例句(七)
6、2000个软件开发领域的高频特殊词及精选例句(三)
7、2000个软件开发领域的高频特殊词及精选例句(二)
8、2000个软件开发领域的高频特殊词及精选例句(五)
9、2000个软件开发领域的高频特殊词及精选例句(六)
10、2000个软件开发领域的高频特殊词及精选例句(四)
11、3211个词及其反义词(一)(精选考纲词)
12、3211个词及其反义词(三)(精选考纲词)
13、3211个词及其反义词(二)(精选考纲词)
14、803个词及其反义词(精选非考纲词)
15、986组同义词辨析
16、CSDN博客飙升秘籍
17、Java中文分词组件 - word分词
18、Java远程调试
19、Linux Netcat command – The swiss army knife of net
20、What a Wonderful Code
21、common prefix different suffix
22、idioms
23、代码评审脚本
24、分析113个前缀在各大考纲词汇中的作用(一)
25、分析151个后缀在各大考纲词汇中的作用(一)
26、分析151个后缀在各大考纲词汇中的作用(二)
27、分析996个词根在各大考纲词汇中的作用(一)
28、分析996个词根在各大考纲词汇中的作用(三)
29、分析996个词根在各大考纲词汇中的作用(二)
30、分析996个词根在各大考纲词汇中的作用(四)
31、分析在各大考纲词汇中同时拥有前缀后缀和词根的词(三)
32、分析在各大考纲词汇中同时拥有前缀后缀和词根的词(二)
33、分析在各大考纲词汇中同时拥有前缀后缀和词根的词(五)
34、分析在各大考纲词汇中同时拥有前缀后缀和词根的词(六)
35、分析在各大考纲词汇中同时拥有前缀后缀和词根的词(四)
36、在考纲词汇中利用复数规则找出的65个词
37、开源项目中如何同时支持Git@OSC和Github
38、我的ITEYE和OSCHINA博客的异同(截止2015年5月17日)
39、搜索引擎优化之语义标签 (microdata, microformats, RDFa)
40、汉英双语的差异
41、英语中有哪些前缀可以用来表示否定呢?
42、计算OSCHINA博文在百度的收录与排名情况
1、APDPlat v2.5正式发布,开源的Java应用级产品开发平台
2、Apache Nutch v1.8发布,Java实现的网络爬虫
3、Java分布式中文分词组件 - word分词
4、NUTCH公开课:从搜索引擎到网络爬虫
5、Nutch相关框架安装使用最佳指南