E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ictclas
天书般的
ICTCLAS
分词系统代码
ICTCLAS
分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,该版的Free版开放了源代码,为初学者提供了宝贵的学习材料。
·
2015-11-01 15:12
Tcl
数组类型EDT的元素个数
在Axapta中有一些类封装了对AOT的查询操作,比如Dictionary,DictRelation,D
ictClas
s,DictType等.如果想知道某个扩展数据类型的有几个元素组成的,可以用如下代码
·
2015-11-01 14:34
数组
中科院分词
ICTCLAS
5.0_JNI 使用方法
1.简介 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统
ICTCLAS
(Institute of Computing Technology
·
2015-11-01 12:41
jni
java在文本处理中的相关辅助工具类
1,java分词 package com.bobo.util; import
ICTCLAS
.I3S.AC.
ICTCLAS
50; public class Cutwords {
·
2015-11-01 11:36
java
文本分类(二)特征权重量化器(文档转向量表示)
上一节做了分词器的实现,并实现了Simple、Standar、Cn、
ICTCLAS
几个分词算法。
·
2015-11-01 10:27
文档
基于朴素贝叶斯分类器的文本分类算法C#版(一)
该程序用到了Lucene.Net,用到了基于词典的
ICTCLAS
中文分词1.0.
·
2015-11-01 10:22
C#
用python调用
ICTCLAS
50进行中文分词
直接上源码吧 tokenizer类: #_*_encoding:utf-8_*_ from ctypes import * class tokenizer: def __init__(self): &
·
2015-10-31 16:07
python
中文字符串的编码转换(c实现)
中文字符串在c/c++中表示为字节序列,在分词的时候需要根据不同的编码方式进行分词,一般分词器需要转换成统一的编码方式再进行转换,有些分词器如
ICTCLAS
在分词的时候可以不显示定义编码方式
·
2015-10-31 14:42
编码转换
免费开源的全文索引与检索平台(FirteX)、中文分词系统(
ICTCLAS
)
ICTCLAS
简介: 国内和国际权威的公开评测、五万客户的认可——
ICTCLAS
在国内973专家组组织的评测中活动获得了第一名,在第一届国际中文处理研究机构SigHan组织的评测中都获得了多项第一名
·
2015-10-31 11:27
中文分词
ictclas
4j for lucene analyzer
原文出处:http://blog.chenlb.com/2009/01/
ictclas
4j-for-lucene-analyzer.html 在 lucene 的中文分词域里,有好几个分词选择,有:
·
2015-10-31 10:36
Lucene
Cygwin中通过RJB在Ruby下调用
ICTCLAS
(JAVA)
参考文章: ruby 下使用
ICTCLAS
(JAVA) RJB 在windows下的一些安装事项
ICTCLAS
4J 的编译脚本 参考文章1中,在windows中成功在Ruby
·
2015-10-31 10:40
cygwin
ICTCLAS
4J 的编译脚本
因需要要编译
ICTCLAS
4J 需要: 1. JRE 2.
·
2015-10-31 10:39
Tcl
ruby 下使用
ICTCLAS
(JAVA)
ICTCLAS
并没有RUBY开发版本,RUBY可以使用C版本和JAVA版本的
ICTCLAS
来做分词 RUBY用C的代码,涉及到重写接口和包装的问题,比较麻烦 在此讨论RUBY用JAVA版本的
ICTCLAS
·
2015-10-31 10:39
java
Nutch-0.9加入
ICTCLAS
支持中文分词等
a. 安装 svn , 从 apache 中下载这最新版本,(http://svn.apache.org/repos/asf/lucene/nutch/branches/branch-0.9/ )这样可以用ant工具进行编译,直接下载的包文件好不能用antb. 安装 ant. http://ant.apache.org/ 下载最新编译工具c. 安装 javacc https://jav
·
2015-10-31 09:08
Nutch
Python解析XML
/bin/python#coding=utf-8import xml.dom.minidomfrom collections import defaultd
ictclas
s Configure:
·
2015-10-31 09:38
python
基于朴素贝叶斯分类器的文本分类算法C#版
该程序用到了Lucene.Net,用到了基于词典的
ICTCLAS
中文分词1.0.
·
2015-10-31 08:18
C#
让中科院中文分词系统
ICTCLAS
为lucene所用的简单程序(C#版)
我利用了 吕震宇 根据Free版
ICTCLAS
改编而成 .net平台下的
ICTCLAS
,把
ICTCLAS
的分词为lucene所用。以下是我写的程序,比较简单。
·
2015-10-31 08:43
Lucene
转:Lucene与搜索引擎技术--Analysis包分析
算法:基于机械分词 1-gram,2-gram,HMM(如果使用
ICTCLAS
·
2015-10-30 14:21
Lucene
中文分词免费源码资源
网上很多人向Lucene中添加中文分词时用的都是中科院
ICTCLAS
的接口
·
2015-10-30 14:41
中文分词
RavenDb进行全文检索实现及数据统计
实现目标:项目中使用到了ravendb进行数据的保存,而ravendb对字段的检索是经过lucene进行处理的,而默认的分词器是小写分词器,查找网上的资料看中了中科院的
ictclas
分词器和盘古分词。
·
2015-10-30 13:20
全文检索
蛙蛙推荐:蛙蛙教你索引邮件
用MAPI把邮件读取到数据库里,用Sharp
ICTCLAS
做一个lucene的中文的语汇单元分析器,用lucene建立索引及查询索引。
·
2015-10-30 12:13
索引
K-means文本聚类系列(已经完成)
(注意: 大家下载我的程序源码以后,可能需要从网络上下载一个新的
ictclas
3.0包,然后覆盖原工程文件中的
ictclas
3.0组件,可能是因为
ictclas
3.0的license许可,一份
ictclas
3.0
·
2015-10-30 12:49
聚类
N
ICTCLAS
:词法分析系统
ICTCLAS
的.NET版(源码提供下载)
源码在文末下载N
ICTCLAS
是大名鼎鼎的中科院计算所语词法分析系统
ICTCLAS
免费版的.NET包装版本,在原有免费EXE源码的基础上使用C++/CLI封装成N
ICTCLAS
.dll,将原CResult
·
2015-10-30 12:06
.net
10分钟开始使用
ICTCLAS
Java版
http://www.blogjava.net/zhenandaci/archive/2008/12/17/230269.html
ICTCLAS
是中科院计算所出品的中文分词程序包,在国内一直有着良好的口碑和很高的使用率
·
2015-10-30 11:18
java
加入
ICTCLAS
4J,一起学习分词系统
ICTCLAS
是中科院计算所出品的中文分词程序包,在国内一直有着良好的口碑和很高的使用率。之前一直只有 C++的版本提供,而现在C#,Delphi和Java版本已经纷纷出炉。
·
2015-10-30 11:18
Tcl
黄聪:
ICTCLAS
分词系统研究(一)
ICTClAS
分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码
·
2015-10-28 08:30
Tcl
写一点应用关于 Lucene.Net,snowball的重新组装(一)在Lucene.Net中加入词性标注与词根还原功能
我在《也谈贝叶斯分类C#版》中给出了如何在Lucene中嵌入河北理工大学吕震宇老师(根据张华平老师的
ICTCLAS
分词开源版本改写成)的sharp
·
2015-10-28 08:44
Lucene
NLP的两种工具的java版使用:复旦FudanNLP,中科院计算所
ICTCLAS
2013
编程语言:java 三种工具的简要介绍: FudanNLP google project上的介绍是: FudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。FudanNLP及其包含数据集使用LGPL3.0许可证。 If you're new to FudanNLP, check out the Quick Start (使用说明) page,
·
2015-10-27 16:02
java
lucene下的一个自定义分词
public class
ICTCLAS
Analyzer : Analyzer {  
·
2015-10-27 14:42
Lucene
NLP
之前我们都知道中科院的
ictclas
,能够实现分词、词性标注功能,而且最新版的还增加了几个篇章级的功能,如新词识别,关键词抽取等,在接口方面
ictclas
有java, c++, python
·
2015-10-27 13:16
nl
[分词]Java开源中文分词器ANSJ_SEG初次试用
近日需要对大众点评网60万+的景点评论进行语义分析,所以必须使用分词工具,刚刚开始时我是选择使用NLPIR汉语分词系统(又名
ICTCLAS
2014),NLPIR的教程在[分词]NLPIR/
ICTCLAS
2014
·
2015-10-27 11:26
开源中文分词
ZH奶酪:Java调用NLPIR汉语分词系统
NLPIR工具 支持自定义词表; 可以离线使用; 下载地址:http://
ictclas
.nlpir.org/newsdownloads?
·
2015-10-26 15:12
java
有关Lucene的问题(1):为什么能搜的到“中华 AND 共和国”却搜不到“中华共和国”?
回答: 我下载了http://
ictclas
.org/Download.html中科院的词
·
2015-10-21 12:20
Lucene
解决
ICTCLAS
2009 Windows_JNI_32 在 Web Project无法使用的方法
终于解决 在 MyEclipse 下 的Web Project 中的 一个 jsp 文件中 使用
ICTCLAS
2009 Windows_JNI_32。
·
2015-10-21 12:33
windows
改动下
ICTCLAS
4J 0.9.1 提供了分词速度
改动下
ICTCLAS
4J 0.9.1,简化代码并做了一个提高了性能的不死机的DOS 命令segtag.bat
ICTCLAS
4J_0.9.1 是中科院张华平的分词系统的Java
·
2015-10-21 12:33
Tcl
ICTCLAS
2009 JNI_32 遇到MyEclipse Web Project下无法运行
但是,在MyEclipse中创建WebProject 测试时出现问题, Cannot initialize
ICTCLAS
.I3S.AC.
ICTCLAS
30.
·
2015-10-21 12:33
MyEclipse
jsp中使用
ICTCLAS
4J
前几天我修改了
ictclas
4j中文分词系统,将其在JSP中调用,在加载词库时出现路径问题,调用方法是在JSP中实例化JAVA类,然后调用JAVA类的方法,完成中文分词,JSP代码如下::<%@page
·
2015-10-21 12:32
jsp
把以"文本文件(制表符分割)"保存的EXCEL文件导进SQLSERVER2000的DEMO!
http://www.cnblogs.com/Rimbaud/archive/2006/04/30/389716.html N
ICTCLAS
:词法分析系统
ICTCLAS
的.NET版(源码提供下载
·
2015-10-21 10:28
文本文件
使用Java调用中科院分词NLPIR/
ICTCLAS
官方地址:http://
ictclas
.nlpir.org/1.
u013147600
·
2015-09-08 16:00
分词
ictclas
nlpir
ictclas
分词系统的使用,java调用,附带连接mysql进行读写。
1.进入官网下载
ictclas
2013下载包,目前更新到0416版,
ictclas
2013-Win-32-jni或者64位的。
a1b2c3d4123456
·
2015-08-23 21:00
java
mysql
ictclas
ICTCLAS
分词关键技术
总体流程考虑输入的一句话,sSentence="张华平欢迎您",分词流程如下1、分词"张/华/平/欢迎/您"2、posTagging"张/q华/j平/j欢迎/v您/r"3、NE识别:人名识别,音译名识别,地名识别"张/q华/j平/j欢迎/v您/r""张华平/nr"4、重新分词:"张华平/欢迎/您"5、重新posTagging:"张华平/nr欢迎/v您/r" 技术细节一、分词1、原始句子:sSe
renyp8799
·
2015-08-21 17:00
技术
分词
分词器之NLPIR加密文件在哪
官方网站http://
ictclas
.nlpir.org/newsdownloads?DocId=389既然官方承诺对个人用户永久免费,那拿来做科研还是可以的。
xuxiuning
·
2015-08-18 20:00
分词器
关于NLPIR(
ICTCLAS
2015)配置
关于NLPIR(
ICTCLAS
2015)配置一、开发工具、环境、原料VisualStudio2013WindowsNLPIR(
ICTCLAS
2015)二、路径配置将Data文件夹及NLPIR.dll放到与
AwakeningWolf
·
2015-08-06 11:15
引用插件
中科院分词系统整理笔记
NLPIR分词系统前身为2000年发布的
ICTCLAS
词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统,增加了十一项功能
renyp8799
·
2015-08-04 17:00
分词
自然语言
中科院
ICTCLAS
2015 Java版本的使用方法
ICTCLAS
2015Java版本的安装可以参考以下链接地址:http://www.68idc.cn/help/buildlang/ask/20150104157420.htmlhttp://m.blog.csdn.net
dm_ml
·
2015-06-26 18:00
ICTCLAS
分词系统
ICTCLAS
的官网是http://
ictclas
.nlpir.org/。下面是我程序。下载的压缩包中包括c/c++,c#,java,python。这些语言有对应的包。里面有详细的pdf文档。
浪朗森
·
2015-06-09 15:00
ictclas
文本挖掘
分词工具
张华平
自然语言处理课程作业 中文文本情感分类
本文主要是基于机器学习方法的中文文本情感分类,主要包括:使用开源的Markup处理程序对XML文件进行分析处理、中科院计算所开源的中文分词处理程序
ICTCLAS
对文本进行分词处理、去除停用词等文本预处理
蒋_X_X
·
2015-06-03 16:17
研究生课程设计
科研项目之经验之谈
在掌握基本方法(SVM,HMM,CRF,RF,LR等分类,聚类,回归工具)与工具(语言工具python,分词工具
ictclas
,crfsutie,
u010454729
·
2015-06-02 16:00
python
自然语言处理
NLP
ictclas
用IKAnalyzer替换nutch分词组件
本来是想用
ICTCLAS
了,但是遇到许多其它问题,最后选用IKAanalyzer作为替换分词组件,
erliang20088
·
2015-05-17 16:00
java
linux
搜索
Nutch
Solr分词器大补贴:mlcsseg
1.设计Java系的中文分词挺多了,ik,paoding,mmseg4j,
ictclas
4j,ansj等等,目前选取实现的是ik和ansj。将分词器扩展到solr易用模式
meng_philip
·
2015-05-06 16:11
solr
分词器
solr
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他