E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
TIKA
infobright源码安装
安装环境为RedHatEnterpriseLinuxServerrelease5.2(
Tika
nga)一、安装boost在安装infobright之前先要安装一下高版本的boost,需要在1.42以上,
linuxblind
·
2015-11-04 20:06
infobright
源码安装
infobright源码安装
安装环境为RedHatEnterpriseLinuxServerrelease5.2(
Tika
nga)一、安装boost在安装infobright之前先要安装一下高版本的boost,需要在1.42以上,
linuxblind
·
2015-11-04 20:06
infobright
源码安装
hypertable编译安装
环境: 操作系统:Red Hat Enterprise Linux Server release 5.4 (
Tika
nga) (cat /etc/redhat-release
·
2015-11-02 19:33
table
Apache
Tika
Tika
是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。
·
2015-11-02 18:37
apache
Apache
Tika
源码研究(八)
本文主要分析
tika
的语言检测以及
tika
解决随机访问读取的问题,由于语言检测功能的实现设计一些算法,我这里就不贴出
tika
的源码了
tika
的语言检测的相关接口和类的uml模型图如下 如果要获取文档内容和语言
·
2015-11-02 12:18
apache
Apache
Tika
源码研究(七)
tika
怎样加载Parser实现类的,怎样根据文档的mime类型调用相应的Parser实现类,本文接着分析 先熟悉一下
tika
的解析类的相关接口和类的UML模型: Parser接口的源码如下
·
2015-11-02 12:17
apache
Apache
Tika
源码研究(六)
上文还没有来得及分析Apache
Tika
是怎样检测文档的mime类型的,以及怎样根据mime类型找到相应的Parser解析类的,下面接着说 在
tika
-parsers.jar路径文件META-INF
·
2015-11-02 12:16
apache
Apache
Tika
源码研究(五)
Apache
Tika
是怎么识别待解析文档的mime类型的,是怎么根据mime类型得到相应的解析类Parser的,如果我们添加自定义mime类型以及相应的解析类,又该怎么处理呢?
·
2015-11-02 12:15
apache
Apache
Tika
源码研究(四)
上文分析了具体的解析类HtmlParser对网页文档的解析实现源码,了解到了Apache
Tika
的编码识别的处理方式。
·
2015-11-02 12:15
apache
Apache
Tika
源码研究(三)
上文我们基本知道
Tika
是通过SAXParser来解析XHTML文档的,下面我通过一个具体的解析类HtmlParser入手,来看看网页文件的解析过程。
·
2015-11-02 12:14
apache
Apache
Tika
源码研究(一)
因为采用Apache
Tika
解析网页文件时产生乱码问题,所以后来仔细看了一下Apache
Tika
源码 先浏览一下
tika
编码识别的相关接口和类的UML模型 下面是编码识别接口,EncodingDetector.java
·
2015-11-02 12:13
apache
Apache
Tika
:通用的内容分析工具
项目介绍
Tika
是一个内容分析工具,自带全面的parser工具类,能解析基本所有常见格式的文件,得到文件的metadata,content等内容,返回格式化信息。
·
2015-11-02 12:11
apache
Drag and Drop Grid (ExtJS - 2)
Pas
tika
n anda sudah memiliki /
·
2015-11-01 12:26
ExtJs
redhat 5.4 下rabbitMQ单机安装.md
系统版本 `cat /etc/redhat-release` `Red Hat Enterprise Linux Server release 5.4 (
Tika
nga) `
·
2015-10-31 17:33
rabbitmq
用 Apache
Tika
理解信息内容
简介 在本教程中,我们将通过解释性的例子介绍 Apache
Tika
框架并解释它的概念(比如 N-gram、解析、mime 检测以及内容分析),这些例子不仅适用于老练的软件开发人员,而且也同样适用于内容分析和编程的初学者
·
2015-10-31 16:16
apache
AOP有感
cnblogs提到了NAOP开源项目,本人之前并没听过AOP“面向方面编程”,于是就看了dudu推荐的入门文章: http://wwwse.fhs-hagenberg.ac.at/se/berufsprak
tika
·
2015-10-31 12:46
AOP
Apache
Tika
源码研究(二)
上文分析了Apache
Tika
的编码识别相关接口和实现类 本文接着分析Apache
Tika
用到的一个关键类ParseContext,这里要明白
Tika
解析文档的方式,
Tika
将文件都解析为XHTML
·
2015-10-31 10:38
apache
【
Tika
基础教程之一】
Tika
基础教程
一、快速入门 1、
Tika
是一个用于文本解释的框架,其本身并不提供任何的库用于解释文本,而是调用各种各样的库,如POI,PDFBox等。
·
2015-10-31 08:45
基础
堪称2008年最漂亮的50组图标(下)
Prac
tika
32. Website Icons 33. Glossy Member Icons 34. Aeon 35. RSS f
·
2015-10-30 21:14
2008
2011 美丽的网站(下)
1MD Prakash Soni Pablo Gonzalez Doorstep Dairy Clover Cottage vtravelled Blog Kul
tika
Przeznaczenie
·
2015-10-30 11:12
网站
强悍!使用Flash和Silverlight制作控件
NE
TiKA
TECH。
·
2015-10-30 10:38
silverlight
语言检测工具language-detection
一个是Apache
Tika
,一个是language-detection。
·
2015-10-27 16:53
language
memcached服务器搭建(RedHat5)
0.开始之前 这篇文档描述的是在linux环境下安装部署memcached服务 操作系统: Red Hat Enterprise Linux Server release 5.4 (
Tika
nga
·
2015-10-27 16:22
memcached
ORACLE10g安装报i386/libawt.so: libXp.so.6: cannot open shared object file.....
操作系统:Red Hat Enterprise Linux Server release 5.4 (
Tika
nga) x86_64 修改完系统相关配置,执行runInstaller时报错
·
2015-10-27 14:43
oracle10g
Linux mysql 5.6: ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO)
操作系统 :Red Hat Enterprise Linux Server release 5.7 (
Tika
nga
·
2015-10-27 11:17
localhost
深入理解Linux修改hostname
实验环境:Red Hat Enterprise Linux Server release 5.7 (
Tika
nga) ,其它版本Linux可能有所不同。请以实际环境为准。 其实我多次修改过hos
·
2015-10-27 11:58
hostname
Linux iptables配置错误导致ORA-12535 & ORA-12170
实验环境: 操作系统 : Red Hat Enterprise Linux Server release 5.7 (
Tika
nga
·
2015-10-27 11:47
iptables
Apache Nutch 1.6 发布
,该版本修复了超过 20 个 bug,新功能包括:新的 HostNormalizer,可通过 MIME-type 和 Indexer API 的功能增强来动态设置 fetchInterval ,更新
Tika
·
2015-10-23 09:38
apache
在SolrNet中使用Apache
Tika
抽取文件元数据
1.添加jar文件:
tika
-core-0.10.jar
tika
-parsers-0.10.jar ..... 2.修改solrconfig.xml,修改完成后重启solr实例: &
·
2015-10-23 08:27
apache
memcached服务器搭建
0.开始之前 这篇文档描述的是在linux环境下安装部署memcached服务操作系统:Red Hat Enterprise Linux Server release 5.4 (
Tika
nga)内存:
·
2015-10-21 12:24
memcached
.net 下如何将文档文件(Word, Pdf等) 中的文本提取出来
Java 版本的 lucence 提供了一个
tika
的工具用于将 word, excel, pdf 等文档转换为文本,然后进行索引。
·
2015-10-21 12:18
.net
同一台主机实现物理Data Guard配置安装
操作系统:ora10g@linux5 /home/oracle$ cat /etc/redhat-releaseRed Hat Enterprise Linux Server release 5.1 (
Tika
nga
·
2015-10-21 10:52
data guard
Perl 脚本报Can't locate Mail/Sender.pm 解决办法
在新的Linux Server(Red Hat Enterprise Linux Server release 5.7 (
Tika
nga))上配置磁盘空间告警的perl
·
2015-10-19 11:08
perl
TextExtract(1)
Tika
Basic
TextExtract(1)
Tika
Basic1.Introduction
Tika
supportsalotofdifferentfileformats,includingaudio,video,picturesandtextfiles.
Tika
bundlehas
tika
-appforjar
sillycat
·
2015-10-13 23:00
Redhat5.8 环境下编译安装 Redis 并将其注册为系统服务
系统环境:$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.8(
Tika
nga)Kernel\ronan\m1.下载安装1.1下载官方下载地址:http
defonds
·
2015-09-17 18:00
Redis安装
redis编译安装
redis注册服务
Redhat安装Redis
Redis服务注册
深入探讨下Linux下修改hostname的五个问题(一)
实验环境:RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga),其它版本Linux可能有所不同。请以实际环境为准。
Foundation
·
2015-09-17 16:00
Tika
1.
Tika
类 (1)
tika
类的基本用法detect:获取文档格式String detect(File|String|URL|InputStream)parse:获取Reader(Lucene
ystyaoshengting
·
2015-08-14 13:00
tika
读取文件内容
Tika
是一个内容抽取的工具集合(atoolkitfortextextracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。
m635674608
·
2015-08-13 12:00
读取文件
RedHat5.8系统安装SFTP功能
搭建SFTP功能本例系统环境:RedHatEnterpriseLinuxServerrelease5.8(
Tika
nga)提示:RedHat5.8版本自带的openssh版本太旧,不支持sftp的“MatchUseranoncvs
lionelshen
·
2015-08-07 16:00
JAVA和PDF的那点东西
最近整理学习资料,归纳下有关PDF的工具: 1.PDFBOXhttp://pdfbox.apache.org/ 2.
TIKA
http://
tika
.apache.org/ 3.POIhttp://poi.apache.org
sbl2255
·
2015-07-26 14:00
深入理解Linux修改hostname
实验环境:RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga),其它版本Linux可能有所不同。请以实际环境为准。其实我多次修改过hostname,一般只需要修
zh_ka
·
2015-07-21 15:00
hostname
Strom的配置安装
1.准备环境1.1配置列表 配置项版本信息OSRedHat EnterpriseLinuxServerrelease5.5(
Tika
nga)IP192.168.1.191/~.192/~.193JDKjava
蚂蚁快跑
·
2015-07-17 11:00
Hadoop2.6.0环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
dengxin919820
·
2015-06-30 17:11
java
linux
虚拟机
version
Hadoop2.6.0环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
dengxin919820
·
2015-06-30 17:11
java
虚拟机
linux
version
Hadoop2.6.0环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
dengxin919820
·
2015-06-30 17:58
java
linux
虚拟机
version
Hadoop2.6.0环境搭建
一、环境说明1、机器:一台物理机和一台虚拟机2、linux版本:[spark@S1PA11~]$cat/etc/issueRedHatEnterpriseLinuxServerrelease5.4(
Tika
nga
dengxin919820
·
2015-06-30 17:58
java
linux
虚拟机
version
javascript检验工具的比较
作者是 Jani Har
tika
inen,英文好的同学直接阅读原文。 原文 当写js代码的时候,一个校验工具可以帮助我避免愚蠢的错误。
·
2015-06-26 11:00
JavaScript
Apache
Tika
1.9 发布,内容抽取工具集合
Apache
Tika
1.9发布,此版本包括一些改进和bug修复,详细改进请看更新日志:* The ability to use the cTAKES clinical text knowledge
·
2015-06-24 06:00
软件更新新闻
Linux 下Oracle 无法DBCA的问题。
实验环境:RedHatEnterpriseLinuxServerrelease5.7(
Tika
nga),其它版本Linux可能有所不同。请以实际环境为准。其实我多次修改过hostname,一般只需要修
HeavenBen
·
2015-06-11 16:19
Oracle
HBase安装手册
192.168.210.95\192.168.210.86部署手册见zookeeper安装手册)l Hbase版本号0.96.1l 操作系统RedHatEnterpriseLinuxServerrelease5.5(
Tika
nga
超人学院
·
2015-06-09 16:00
hadoop
hbase
超人学院
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他