E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
TIKA
Linux配置本地网络YUM源
配置环境:系统版本:[root@localhost~]#cat/etc/issueRedHatEnterpriseLinuxServerrelease5.8(
Tika
nga)Kernel\ronan\m
慈爱
·
2015-06-08 11:18
linux
网络
Linux配置本地网络YUM源
配置环境:系统版本:[root@localhost~]#cat/etc/issueRedHatEnterpriseLinuxServerrelease5.8(
Tika
nga)Kernel\ronan\m
慈爱
·
2015-06-08 11:18
linux
网络
solr配置参考
solrConfig.xml4.71000001024true50200solr010rocks010staticnewSearcherwarmingqueryfromsolrconfig.xmlfalse4explicit
tika
-data-config.xmlexplicitsolrpingqueryall
超人学院66
·
2015-06-05 17:18
Hadoop
solr
超人学院
深入理解Linux修改hostname
实验环境:RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga),其它版本Linux可能有所不同。请以实际环境为准。其实我多次修改过hostname,一般只需要修
hanruikai
·
2015-06-05 10:00
solr从pdf、office文档中建立索引
使用solr从pdf、office文档中建立索引和从数据库中建立相似,只不过这里需要
tika
来解析这些文档。
超人学院66
·
2015-05-28 16:19
hadoop
Solr
超人学院
solr从pdf、office文档中建立索引
使用solr从pdf、office文档中建立索引和从数据库中建立相似,只不过这里需要
tika
来解析这些文档。
超人学院
·
2015-05-28 16:00
hadoop
Solr
超人学院
跟益达学Solr5之使用
Tika
从PDF中提取数据导入索引
阅读更多开始此篇之前,我假定你已经学会了如何在Tomcat下部署Solr5啦。即启动Tomcat后你能看到Solr5的WebUI界面。OK,下面直接进入正题。首先你需要在你的core根目录下新建一个lib目录来存放依赖的jar包,当然你也可以直接到依赖的jar包扔到Tomcatwebapps目录下部署的solr程序的WEB-INF\lib目录下即如图:这里我采用了另外一种方式,把依赖的jar包放当
lxwt909
·
2015-05-26 23:00
Solr
Tika
PDF
跟益达学Solr5之使用
Tika
从PDF中提取数据导入索引
阅读更多开始此篇之前,我假定你已经学会了如何在Tomcat下部署Solr5啦。即启动Tomcat后你能看到Solr5的WebUI界面。OK,下面直接进入正题。首先你需要在你的core根目录下新建一个lib目录来存放依赖的jar包,当然你也可以直接到依赖的jar包扔到Tomcatwebapps目录下部署的solr程序的WEB-INF\lib目录下即如图:这里我采用了另外一种方式,把依赖的jar包放当
lxwt909
·
2015-05-26 23:00
Solr
Tika
PDF
跟益达学Solr5之使用
Tika
从PDF中提取数据导入索引
开始此篇之前,我假定你已经学会了如何在Tomcat下部署Solr5啦。即启动Tomcat后你能看到Solr5的WebUI界面。OK,下面直接进入正题。 首先你需要在你的core根目录下新建一个lib目录来存放依赖的jar包,当然你也可以直接到依赖的jar包扔到Tomcatwebapps目录下部署的solr程序的WEB-INF\lib目录下即如图: 这里我采用了另外一种方式,把依
lxwt909
·
2015-05-26 23:00
Solr
tika
pdf
跟益达学Solr5之使用
Tika
从PDF中提取数据导入索引
开始此篇之前,我假定你已经学会了如何在Tomcat下部署Solr5啦。即启动Tomcat后你能看到Solr5的WebUI界面。OK,下面直接进入正题。 首先你需要在你的core根目录下新建一个lib目录来存放依赖的jar包,当然你也可以直接到依赖的jar包扔到Tomcatwebapps目录下部署的solr程序的WEB-INF\lib目录下即如图: 这里我采用了另外一种方式,把依
lxwt909
·
2015-05-26 23:00
Solr
tika
pdf
shmmax
内核参数定义是系统允许的单个共享内存段的最大值现在模拟设置shmmax很小:[root@localhostkernel]#cat/etc/redhat-releaseRedHatEnterpriseLinuxServerrelease5.5(
Tika
nga
BAT_os
·
2015-05-11 17:00
驳PHP优于Node.js的五大理由
当搜索Node.js与PHP比较时,总能找到JaniHar
tika
inen写的PHP优于Node.js的五大理由,这也让勇于挑战新事物新技术的同学犹豫不前,这里也让多年在WEB领域耕耘的码农谈谈不同看法
dancingleaf
·
2015-05-06 15:00
创建表对象时,oracle做了些什么?
我们通过10046事件来分析:[oracle@localhost~]$ cat/etc/redhat-releaseRedHatEnterpriseLinuxServerrelease5.5(
Tika
nga
BAT_os
·
2015-05-03 02:00
几种backup小结
[oracle@localhost~]$cat/etc/redhat-releaseRedHatEnterpriseLinuxServerrelease5.5(
Tika
nga)SQL>select*fromv
BAT_os
·
2015-04-29 14:00
冷备下模拟rm -rf *.dbf恢复案例
[oracle@localhost~]$cat/etc/redhat-releaseRedHatEnterpriseLinuxServerrelease5.5(
Tika
nga)SQL>select*fromv
BAT_os
·
2015-04-27 17:00
Lucene+
Tika
文件索引的创建与搜索
使用Lucene+
Tika
进行文件索引的创建与查询,在Windows环境下测试没问题,可以解析各种文件(
Tika
支持的),另外从源代码可以看出还对zip压缩文件解析支持!
learn_more
·
2015-04-23 17:00
Lucene
tika
文件索引创建与搜索
Linux下配置Tomcat,及JDK
RedhatLinux安装JDK1.7本篇主要介绍在RedhatLinux(RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga))系统上安装JDK1.7,其它Linux
Lemon_C
·
2015-04-21 18:00
Apache
Tika
1.8 发布,内容抽取工具集合
http://www.oschina.net/news/61711/apache-
tika
-1-8-released
Tika
是一个内容抽取的工具集合(a toolkit for text extracting
pyzheng
·
2015-04-21 08:00
apache
Apache
Tika
1.8 发布,内容抽取工具集合
http://www.oschina.net/news/61711/apache-
tika
-1-8-released
Tika
是一个内容抽取的工具集合(a toolkit for text extracting
pyzheng
·
2015-04-21 08:00
apache
Tika
基本使用
Tika
是一个内容抽取的工具集合(atoolkitfortextextracting)。它集成了POI,Pdfbox并且为文本抽取工作提供了一个统一的界面。
Victor_Cindy1
·
2015-03-30 16:00
rhel yum 本地配置
cat/etc/redhat-releaseRedHatEnterpriseLinuxServerrelease5.7(
Tika
nga)uname-aLinuxftsgw-022.6.18-274.17.1
zhouguixiao_001
·
2015-03-18 17:11
linux
File
release
enabled
Lucene实战(第2版)》
Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用
Tika
·
2015-03-17 16:00
Lucene
Tika
文本提取工具的使用(word、pdf、excel等)
出处:http://blog.csdn.net/wxwzy738/article/details/8882391
Tika
是Apache的Lucene项目下面的子项目,在lucene的应用中可以使用
tika
arenzhj
·
2015-03-13 14:00
pdf
excel等)
apache 在 加载openssl 模块时出现 “/usr/local/ssl/lib/libssl.a: could not read symbols: Bad value”错误解决方案
正式环境:系统:RedHatEnterpriseLinuxServerrelease5.6(
Tika
nga)内核:2.6.18-238.31.1.el5位数:64测试环境:系统:CentOSrelease5.8
nyist327
·
2015-02-06 16:00
apache
OpenSSL
python命令行添加Tab键自动补全
system:RedHatEnterpriseLinuxServerrelease5.6(
Tika
nga)1、获取python目录[root@test ~]# python Python 2.4.3 (
传奇库子
·
2015-01-31 16:27
python
tab
python命令行添加Tab键自动补全
system:RedHatEnterpriseLinuxServerrelease5.6(
Tika
nga)1、获取python目录[root@test ~]# python Python 2.4.3 (
传奇库子
·
2015-01-31 16:27
python
tab
python命令行添加Tab键自动补全
system:RedHatEnterpriseLinuxServerrelease5.6(
Tika
nga)1、获取python目录[root@test ~]# pythonPython 2.4.3 (#1
传奇库子
·
2015-01-31 16:27
python
tab
Python
JS错误的诊断与修复
作者简介:JaniHar
tika
inen,拥有十数年的网页应用开发经验,曾经为nokia和低调神秘的startups。(一个创业孵化公司)除了编程和玩游戏,他经常在自己的站点书写JS和高质量的代码。
whqet
·
2015-01-28 06:00
js
优化
前端开发
调试
关于Apache
Tika
解析txt文件乱码的研究
tika
提取正文不乱码,但是当正文内容特别少时候,比如只有一个汉字时就会乱码,感觉他的编码的识别方法应该是基于一种策略。这种策略,是根据正文内容来计算的,所以当内容特别少时,编码计算容易失败!
earbao
·
2015-01-26 12:00
Linux Tomcat 6.0安装配置实践总结
原文:http://www.cnblogs.com/kerrycode/p/3588816.html 系统环境: RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga
chenhao_asd
·
2015-01-16 10:53
linux
博客
官方网站
release
链接地址
Linux Tomcat 6.0安装配置实践总结
原文:http://www.cnblogs.com/kerrycode/p/3588816.html 系统环境: RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga
chenhao_asd
·
2015-01-16 10:53
linux
博客
官方网站
release
链接地址
oracle 11gR2 安装 在redhat 5.8上的安装
环境需求:Xmanager Enterprise 4 VMware 11.0.0 build-2305329 Red Hat Enterprise Linux Server release 5.8 (
Tika
nga
ilove_vc
·
2015-01-05 23:02
oracle
redhat
安装
5.8
11gr2
hadoop2.6版本集群环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
Stark_Summer
·
2015-01-05 17:00
java
jdk
hadoop
linux
hadoop2.6版本集群环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
Stark_Summer
·
2015-01-05 17:00
java
jdk
hadoop
linux
hadoop2.6.0版本集群环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
stark_summer
·
2015-01-05 17:00
mapreduce
hadoop
hdfs
yarn
NameNode
2014-12
新浪新闻评论系统架构的演进与技术总结)http://card.weibo.com/article/h5/s#cid=1001603789147444803230&vid=&extparam=.net版的
Tika
Smalltalk
·
2014-12-24 23:00
2014-12
新浪新闻评论系统架构的演进与技术总结)http://card.weibo.com/article/h5/s#cid=1001603789147444803230&vid=&extparam=.net版的
Tika
Smalltalk
·
2014-12-19 21:00
python 升级到2.7.8 导致yum 运行异常:No module named yum
osversion:[root@lixoraetc]#catredhat-releaseRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga)---运行yum报错[
royjj
·
2014-12-16 22:00
【
Tika
基础教程之一】
Tika
基础教程
一、快速入门1、
Tika
是一个用于文本解释的框架,其本身并不提供任何的库用于解释文本,而是调用各种各样的库,如POI,PDFBox等。
yangzongzhuan
·
2014-12-08 20:00
使用
tika
对各种文档进行内容抽取
public static String extractData(String path){ String str = null; Parser p= new AutoDetectParser(); BodyContentHandler hand= new BodyContentHandler(10000); Metadata me=new Metadata(); ParseConte
sameLuo
·
2014-12-08 17:00
使用mongodb做数据存储的graylog2日志系统搭建
一、安装准备服务器:RedHatEnterpriseLinuxServerrelease5.6(
Tika
nga)java运行环境:jdk1.6ruby运行环境:ruby1.9.2graylog2-server
iecho
·
2014-11-26 19:00
mongodb
日志
graylog2
深入理解Linux修改hostname
实验环境:RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga),其它版本Linux可能有所不同。请以实际环境为准。其实我多次修改过hostname,一般只需要修
驰驰的老爸
·
2014-11-25 17:36
linux
java
深入理解Linux修改hostname
实验环境:RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga),其它版本Linux可能有所不同。请以实际环境为准。其实我多次修改过hostname,一般只需要修
huoyunshen88
·
2014-11-25 17:00
elastciSearch源码分析——集成分词器
code.google.com/p/ik-analyzer/downloads/list,可以检查到项目源码结构如图刚好集成到elasticSearch中:集成进去之后,添加测试用例:@Testpublicvoidtes
tIKA
nalyzer
yucang52555
·
2014-11-18 16:00
elasticSearch
java开源
ansj分词器
插件集成
mysql+drbd+heartbeat高可用配置说明
环境描述:系统版本:RedHatEnterpriseLinuxServerrelease5.5(
Tika
nga)x86_642.6.18-164.el5mysql版本:mysql-5.1.49.tar.gzdrbd
Magicleesir
·
2014-11-14 18:12
mysql
高可用
mysql+drbd+heartbeat高可用配置说明
环境描述:系统版本:RedHatEnterpriseLinuxServerrelease5.5(
Tika
nga)x86_642.6.18-164.el5mysql版本:mysql-5.1.49.tar.gzdrbd
Magicleesir
·
2014-11-14 18:12
mysql
高可用
mysql
linux系统优化加固
本文系统:[root@xxxxxx~]# cat /etc/issue Red Hat Enterprise Linux Server release 5.8 (
Tika
nga) [root@xxxxxx
shuocaocao
·
2014-11-13 18:44
ulimit
limit
sysctl
linux系统优化加固
本文系统:[root@xxxxxx~]# cat /etc/issueRed Hat Enterprise Linux Server release 5.8 (
Tika
nga)[root@xxxxxx
西索oO
·
2014-11-13 18:44
ulimit
limit
sysctl
LinuxSys
tika
提取pdf信息异常
org.apache.
tika
.sax.WriteOutContentHandler$WriteLimitReachedException: Your document contained more than
·
2014-11-08 10:00
pdf
Linux下用unixODBC连接Oracle数据库的配置
1.环境1[root@bakdbserver~]#cat/etc/redhat-release RedHatEnterpriseLinuxServerrelease5.9(
Tika
nga)[root@bakdbserver
lichangzai
·
2014-10-20 17:00
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他