E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Nutch1.0
nutch-JE分词
阅读更多先下载
Nutch1.0
的源文件:cohttp://svn.apache.org/repos/asf/lucene/nutch/tags/release-1.0.
deepfuture
·
2009-12-23 19:00
Ant
Apache
lucene
Java
Hadoop
nutch-JE分词
阅读更多先下载
Nutch1.0
的源文件:cohttp://svn.apache.org/repos/asf/lucene/nutch/tags/release-1.0.
deepfuture
·
2009-12-23 19:00
Ant
Apache
lucene
Java
Hadoop
Nutch1.0
Ui启动在tomcat中的配置
<!-- @page { margin: 2cm } P { margin-bottom: 0.21cm } A:link { so-language: zxx } --> 1 、下载 nutch-1.0.tar.gz. http://apache.etoak.com/lucene/nutch/ 2 、解压缩 nutch-1.0.tar.gz, 放在自己熟悉的目录
p_x1984
·
2009-12-07 14:00
tomcat
UI
Web
hadoop
Lucene
Nutch1.0
Ui启动在tomcat中的配置
<!-- @page { margin: 2cm } P { margin-bottom: 0.21cm } A:link { so-language: zxx } --> 1 、下载 nutch-1.0.tar.gz. http://apache.etoak.com/lucene/nutch/ 2 、解压缩 nutch-1.0.tar.gz, 放在自己熟悉的目录
p_x1984
·
2009-12-07 14:00
tomcat
UI
Web
hadoop
Lucene
nutch1.0
之前只知道一点lucene,准备用nutch做搜索,后来看了才发现,她主要是网络爬虫搜索,主要是针对网页,对我们从数据库里取出数据建索引是不适合的,后来改成compass了,也看了几天nutch,网上好多的nutch资料说的很清楚 http://blog.csdn.net/wooyz/archive/2009/09/23/4585620.aspx这篇介绍的比较清楚,入门用法 &
crazycat03
·
2009-12-02 11:00
html
.net
Blog
Lucene
在eclipse中如何配置
nutch1.0
<1>: 首先从http://apache.etoak.com/lucene/nutch/ 下载最新的nutch.在这里我使用的是nutch1.0. <2>: 在eclipse中新建立一个Java Project. 名字自己定义(Nutch). 选择"Create project from existing source",指向自己nutch
p_x1984
·
2009-11-25 11:00
apache
eclipse
XP
Lucene
cvs
在eclipse中如何配置
nutch1.0
<1>: 首先从http://apache.etoak.com/lucene/nutch/ 下载最新的nutch.在这里我使用的是nutch1.0. <2>: 在eclipse中新建立一个Java Project. 名字自己定义(Nutch). 选择"Create project from existing source",指向自己nutch
p_x1984
·
2009-11-25 11:00
apache
eclipse
XP
Lucene
cvs
nutch1.0
“Invalid first character”异常
根据http://lucene.apache.org/nutch/tutorial8.html中的tutorial,下载nutch-1.0,cygwin等进行配置。在使用bin/nutchcrawlurls-dircrawl-depth3-topN50进行抓取的时候,出现了Invalidfirstcharacter,google到一些文章,说可能是craw-urlfilter.txt文件中的URL
moxuansheng
·
2009-10-15 14:00
windows
String
list
Google
regex
character
Nutch1.0
开源搜索引擎与Paoding在eclipse中用plugin方式集成(终极篇)
本文主要描述的是如何将paoding分词用plugin方式集成到
nutch1.0
中去,在集成之前首先要在eclipse中把
nutch1.0
编译通过。
banditjava
·
2009-09-14 13:00
apache
eclipse
ant
搜索引擎
Lucene
Nutch1.0
的那些事
很久没有更新博客了,应该快一年了。现在呢,我把去年研究过的Nutch重新拾掇起来,开始了新的开源搜索引擎研究旅程。更多感慨是,Nutch已经在今年3月份已经发布了1.0版本,之前研究的Nutch还是0.9版本,其最大的变化并不是版本的升级,而是Nutch已经正式成为了Apache.org的子项目,并且可爱的Hadoop发的速度甚至超过了
banditjava
·
2009-09-10 12:00
apache
hadoop
搜索引擎
项目管理
Lucene
在Eclipse中运行
Nutch1.0
Run Nutch In Eclipse on Linux and Windows nutch version 1.0 Tested with · Nutch release 1.0 · &nb
p_x1984
·
2009-08-05 23:00
apache
eclipse
hadoop
windows
XP
在Eclipse中运行
Nutch1.0
Run Nutch In Eclipse on Linux and Windows nutch version 1.0 Tested with · Nutch release 1.0 · &nb
p_x1984
·
2009-08-05 23:00
apache
eclipse
hadoop
windows
XP
Nutch1.0
的配置与运行
配置软件:1、 Java jdk-1.61.1 下载安装from: http://www.sun.com安装目录:C:\Java\jdk1.6.0_031.2 修改环境变量JAVA_HOME=C:\Java\jdk1.6.0_03\bin CLASSPATH=C:\Java\jdk1.6.0_03\lib\dt.jar;C:\Java\jdk1.6.0_03\lib\tools.jar1.3 测试
p_x1984
·
2009-08-05 23:00
apache
C++
c
C#
Lucene
Nutch1.0
的配置与运行
配置软件:1、 Java jdk-1.61.1 下载安装from: http://www.sun.com安装目录:C:\Java\jdk1.6.0_031.2 修改环境变量JAVA_HOME=C:\Java\jdk1.6.0_03\bin CLASSPATH=C:\Java\jdk1.6.0_03\lib\dt.jar;C:\Java\jdk1.6.0_03\lib\tools.jar1.3 测试
p_x1984
·
2009-08-05 23:00
apache
C++
c
C#
Lucene
搭建基于
Nutch1.0
的搜索引擎说明文档
搭建基于
Nutch1.0
的搜索引擎说明文档 一、简介Nutch是一个开源的Web搜索引擎。 主要分为两个部分:爬虫crawler和查询searcher,两者之间的接口是索引。
东北大学计算机应用技术研究所Web信息处理小组
·
2009-06-04 11:00
windows下配置
nutch1.0
1.需要安装的软件 (1)jdk1.6 (2)Cygwin (3)
nutch1.0
(4)tomcat 6.0 2.安装过程。
dragon0929
·
2009-06-03 16:00
java
apache
windows
hadoop
Security
自己动手搭建搜索引擎(基于
Nutch1.0
)
网上发现很多关于Nutch配置搜索引擎的文章,但我觉得对于很多新手来说。配置的话有时往往不知如何下手,下面推荐两个视频。帮助大家可以一步一步搭建自己的搜索引擎。 自己动手搭建搜索引擎 - 1 在线观看: http://www.boobooke.com/v/bbk2817 自己动手搭建搜索引擎 - 2 在线观看: http://www.boobooke.com
cqllang
·
2009-05-07 10:00
搜索引擎
Nutch1.0
配置笔记
配置软件: 1、 Java jdk-1.6 1.1 下载安装 from: http://www.sun.com 安装目录:C:\Java\jdk1.6.0_03 1.2 修改环境变量 JAVA_HOME=C:\Java\jdk1.6.0_03\bin CLASSPATH=C:\Java\jdk1.6.0_03\lib\dt.jar;C:\Java\jdk1.6.0
cqllang
·
2009-05-02 01:00
tomcat
C++
c
C#
Lucene
一,准备工作,nutch 1.0 的下载与抽取
).本专题使用中文分词为ikanalyzer,感谢其作者为java中文事业做出的巨大贡献.我的个人资料http://www.google.com/profiles/solomon.royarr1)下载
nutch1.0
zolomon
·
2009-04-23 09:00
工作
lucene
SVN
Eclipse
CVS
nutch搏斗之一
问题描述: 在用
nutch1.0
做generate 包括5亿url的crawldb时,它默认按照64M分块,分成777个map task,在运行的后期出现 Could not find taskTracker
yuhai.china
·
2009-03-26 19:00
java
apache
jsp
互联网
servlet
nutch搏斗之一
问题描述: 在用
nutch1.0
做generate 包括5亿url的crawldb时,它默认按照64M分块,分成777个map task,在运行的后期出现 Could not find taskTracker
yuhai.china
·
2009-03-26 19:00
java
apache
jsp
互联网
servlet
上一页
1
2
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他