- 最新JAVA的NLP工具DJL
莫轻言舞
算法java算法
零、其他:NLP工具包LingPipe是alias公司开发的一款自然语言处理软件包。主题分类(TopClassification)命名实体识别(NamedEntityRecognition)词性标注(Part-ofSpeechTagging)句题检测(SentenceDetection)查询拼写检查(QuerySpellChecking)兴趣短语检测(IntersetingPhraseDetect
- java自然语言处理_Java自然语言处理NLP工具包
朱moyimi
java自然语言处理
自然语言处理1.Java自然语言处理LingPipeLingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、词性标注(Part-ofSpeechTagging)、句题检测(SentenceDetection)、查询拼写检查(QuerySpellCh
- LingPipe's Competition
lionzl
DLP计算机安全
LingPipe'sCompetitionContributingtothisPageIfyouknowofanaturallanguagetoolkitthat'snotlistedonthispage,orifyouhaveaclarificationorcorrectionforwhatwelist,pleasecontactus.Onthispage,webreakourcompetiti
- 深度学习-自然语言处理(NLP):Q&A
忍者の乱太郎
#自然语言处理/NLP人工智能深度学习自然语言处理
一、神经网络1、简述几种自然语言处理开源工具包LingPipe、FudanNLP、OpenNLP、CRF++、StandordCoreNLP、IKAnalyzer2、比较Boosting和Bagging的异同二者都是集成学习算法,都是将多个弱学习器组合成强学习器的方法。Bagging:从原始数据集中每一轮有放回地抽取训练集,训练得到k个弱学习器,将这k个弱学习器以投票的方式得到最终的分类结果。Bo
- LingPipe学习: Spelling Correction(1)
fancyerII
NLP搜索
LingPipe是一个很好的NLP的工具,是由Alias-i公司开发的一个NLP系统,里面有很多NLP常用的东西:比如ME,CRFs,LDA,SVMs等常用模型;并且可以用它们来做很多NLP的事情:分词,词性标注,情感分析,文本分类等等。更为难得的是这个工具文档详尽(可能开发者确实想把它做成一个商用的系统,而不像很多科研人员提供的系统,只是用来演示论文)。所以借这个工具,自己用来复习一下以前学习过
- 与数据挖掘及推荐引擎相关的开源项目
ssisse
数据挖掘
粗略分来,目前与数据挖掘及推荐引擎相关的开源项目主要有如下几类:数据挖掘相关:主要包括Weka、R-Project、Knime、RapidMiner、Orange等文本挖掘相关:主要包括OpenNLP、LingPipe、FreeLing、GATE、Carrot2等,具体可以参考LingPipe’sCompetition推荐引擎相关:主要包括ApacheMahout、Duineframework、S
- java 语义分析 开源
iteye_11910
语义分析LingPipe的优势是:比较全面的覆盖自然语言处理的各个分支,文本分词,聚类,语义情感分析,领域知识学习等等具有全套在research上免费的源码,样列代码,测试代码(商业与非商业均同一套代码),并且文档详细,对于其中模型所参考的论文都引用出来,适合研究学习.作为相对开源资源缺少的领域,项目一直持续更新中.包含的模块:主题分类(TopClassification):基于文本语言模型训练,
- LingPipe White Papers
iteye_14216
ThefollowingwhitepapersdiscusssomeofthemathematicsandbakeoffevaluationsofsomeoftheLingPipemodules.Carpenter,Bob.2011.Sampling,ModelingandMeasurementErrorinInferencefromClinicalText.InvitedtalkatICML20
- 某公司自然语言处理算法笔试题
海天一树X
1请列出几种文本特征提取算法答:文档频率、信息增益、互信息、X^2统计、TF-IDF2简述几种自然语言处理开源工具包答:LingPipe、FudanNLP、OpenNLP、CRF++、StandordCoreNLP、IKAnalyzer3简述无监督和有监督算法的区别答:(1)有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分
- 某公司自然语言处理算法笔试题
海天一树
MachineLearning
1请列出几种文本特征提取算法答:文档频率、信息增益、互信息、X^2统计、TF-IDF2简述几种自然语言处理开源工具包答:LingPipe、FudanNLP、OpenNLP、CRF++、StandordCoreNLP、IKAnalyzer3简述无监督和有监督算法的区别答:(1)有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分
- 以后坚持用java
hansongjiang
1.不要贪多,现在专心学习java。读一些jvm的书。2.研究lucene,hadoop.mahout,和日后用的自然语言分析lingpipe.3.对于数据挖掘方向,专注与weka的学习,同时注意机器学习并行化学习。4,确定毕业题目,现在主要搞评论挖掘推荐。时刻坚持。总之,以java为主要实现语言,特别是以后的算法实现部分。
- 文本挖掘工具的介绍
u011955252
文本挖掘工具
1、商业文本挖掘的工具2、开源的数据挖掘工具ROSTCM确实是一个很好用的工具。主要用于写论文,真的很好用。LingPipe主要用于自然语言的处理:主题分类(TopClassification)命名实体识别(NamedEntityRecognition)词性标注(Part-ofSpeechTagging)句题检测(SentenceDetection)查询拼写检查(QuerySpellCheckin
- 基于LingPipe的文本倾向性分析–LingPipe学习笔记
u011955252
lingpipe文本挖掘
http://www.huangyunkun.com/2012/06/17/LingPipe_1/文本倾向性分析文本倾向性分析(情感分析)是将用户的观点分为“正面”和“负面”,有时候会多一个“中性”。文本倾向性分析一个比较直观的应用就是追踪用户对于一个事物的观点和偏好,比如分析豆瓣上一个电影的评论进行分析。正因为如此情感分析又被称为观点挖掘。LingPipelingpipe是alias公司开发的一
- 使用lingpipe自然语言处理包进行文本分类/** * 使用 lingpipe的tf/idf分类器训练语料 * * @author laigood */ public class trai
qq_26562641
/** *使用lingpipe的tf/idf分类器训练语料 * *@authorlaigood */publicclasstraintclassifier{//训练语料文件夹privatestaticfiletdir=newfile("f:\\data\\category");//定义分类privatestaticstring[]categories={"金融","军事","医学","饮食"};
- 基于LingPipe的文本基本极性分析【demo】
qq_26562641
酒店评论情感分析系统(四)——基于LingPipe的文本基本极性分析【demo】(Positive(favorable)vs.Negative(unfavorable))这篇文章为LingPipe官方网站对于SentimentAnanlysis的学习所给出学习材料;http://alias-i.com/lingpipe/demos/tutorial/sentiment/read-me.html官方
- [转载][工具]Java自然语言处理 LingPipe
qq_26562641
原文地址:[工具]Java自然语言处理 LingPipe作者:小鱼头LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、词性标注(Part-ofSpeechTagging)、句题检测(SentenceDetection)、查询拼写检查(Quer
- LingPipe-TextClassification(文本分类)
Class
What is Text Classification?
Text classification typically involves assigning a document to a category by automated or human means. LingPipe provides a classification facility that takes examples of
- 搜索引擎
搜索引擎
Mustru
Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。
点击进入详细页面
ictclas4j
ictclas4j中文分词系统是sinboy在中科院张华平和刘群老师的研制的FreeICTCLA
- 使用lingpipe自然语言处理包进行文本分类
u010029983
lingpipe
TrainTClassifier,基于TF/IDF算法的分类器,必须先把要语料库放到各自所属的分类文件夹中,比如:与金融相关的文章就放到金融这个文件夹中,我这的根目录是f:/data/category,训练完后会生成一个分类器模型tclassifier,之后其它文本的分类的确定就是通过它。[java] viewplaincopy/** * 使用 Lingpipe的TF/IDF分类器训练语料 *
- 数据挖掘、推荐引擎、搜索引擎开源项目列表
Big-Data
目前与数据挖掘及推荐引擎相关的开源项目主要有如下几类: 数据挖掘相关: 主要包括Weka、R-Project、Knime、RapidMiner、Orange 等 文本挖掘相关: 主要包括OpenNLP、LingPipe、FreeLing、GATE 、Carrot2 等,具体可以参考LingPipe’sCompetition 推荐引擎相关: 主要包括ApacheMahout、Dui
- java语义分析开源
wbj0110
自然语言处理
语义分析
LingPipe的优势是:
比较全面的覆盖自然语言处理的各个分支,文本分词,聚类,语义情感分析,领域知识学习等等具有全套在research上免费的源码,样列代码,测试代码(商业与非商业均同一套代码),并且文档详细,对于其中模型所参考的论文都引用出来,适合研究学习.作为相对开源资源缺少的领域,项目一直持续更新中.
包含的模块:
主题分类(Top Classificati
- java语义分析开源
wbj0110
自然语言处理
语义分析
LingPipe的优势是:
比较全面的覆盖自然语言处理的各个分支,文本分词,聚类,语义情感分析,领域知识学习等等具有全套在research上免费的源码,样列代码,测试代码(商业与非商业均同一套代码),并且文档详细,对于其中模型所参考的论文都引用出来,适合研究学习.作为相对开源资源缺少的领域,项目一直持续更新中.
包含的模块:
主题分类(Top Classificati
- java语义分析开源
wbj0110
自然语言处理
语义分析
LingPipe的优势是:
比较全面的覆盖自然语言处理的各个分支,文本分词,聚类,语义情感分析,领域知识学习等等具有全套在research上免费的源码,样列代码,测试代码(商业与非商业均同一套代码),并且文档详细,对于其中模型所参考的论文都引用出来,适合研究学习.作为相对开源资源缺少的领域,项目一直持续更新中.
包含的模块:
主题分类(Top Classificati
- [lingpipe学习笔记]基于LingPipe的文本倾向性分析
lionzl
lingpipe是一个非常全面的自然语言处理工具包,它包含很多自然语言处理常用的功能,如命名实体识别,分词,词性标注,分类聚类等。下文主要讲述的是将lingpipe用到文本倾向性分析。文本倾向性分析转自:http://www.cnblogs.com/htynkn/archive/2012/06/17/lingpipe_1.html文本倾向性分析(情感分析)是将用户的观点分为“正面”和“负面”,有时
- JAVA自然语言处理NLP工具包
javaex999
1. Java自然语言处理LingPipeLingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、词性标注(Part-ofSpeechTagging)、句题检测(SentenceDetection)、查询拼写检查(QuerySpellCheckin
- JAVA自然语言处理NLP工具包
usenrong
NLP
1. Java自然语言处理LingPipeLingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、词性标注(Part-ofSpeechTagging)、句题检测(SentenceDetection)、查询拼写检查(QuerySpellCheckin
- java 语义分析 开源
fengbin2005
java自然语言分析
语义分析
LingPipe的优势是:
比较全面的覆盖自然语言处理的各个分支,文本分词,聚类,语义情感分析,领域知识学习等等
具有全套在research上免费的源码,样列代码,测试代码(商业与非商业均同一套代码),并且文档详细,对于其中模型所参考的论文都引用出来,适合研究学习.
作为相对开源资源缺少的领域,项目一直持续更新中.
包含的模块:
- LingPipe White Papers
fuliang
pip
The following white papers discuss some of the mathematics and bakeoff evaluations of some of the LingPipe modules.
Carpenter, Bob. 2011. Sampling, Modeling and Measurement Error in Inference from
- LingPipe White Papers
fuliang
pip
The following white papers discuss some of the mathematics and bakeoff evaluations of some of the LingPipe modules.
Carpenter, Bob. 2011. Sampling, Modeling and Measurement Error in Inference from
- LingPipe White Papers
fuliang
阅读更多ThefollowingwhitepapersdiscusssomeofthemathematicsandbakeoffevaluationsofsomeoftheLingPipemodules.Carpenter,Bob.2011.Sampling,ModelingandMeasurementErrorinInferencefromClinicalText.InvitedtalkatIC
- 解读Servlet原理篇二---GenericServlet与HttpServlet
周凡杨
javaHttpServlet源理GenericService源码
在上一篇《解读Servlet原理篇一》中提到,要实现javax.servlet.Servlet接口(即写自己的Servlet应用),你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ,也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet(这就是为什么我们自定义的Servlet通常是exte
- MySQL性能优化
bijian1013
数据库mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度,减少占用的磁盘空间。性能优化包含很多方面,例如优化查询速度,优化更新速度和优化MySQL服务器等。本文介绍方法的主要有:
a.优化查询
b.优化数据库结构
- ThreadPool定时重试
dai_lm
javaThreadPoolthreadtimertimertask
项目需要当某事件触发时,执行http请求任务,失败时需要有重试机制,并根据失败次数的增加,重试间隔也相应增加,任务可能并发。
由于是耗时任务,首先考虑的就是用线程来实现,并且为了节约资源,因而选择线程池。
为了解决不定间隔的重试,选择Timer和TimerTask来完成
package threadpool;
public class ThreadPoolTest {
- Oracle 查看数据库的连接情况
周凡杨
sqloracle 连接
首先要说的是,不同版本数据库提供的系统表会有不同,你可以根据数据字典查看该版本数据库所提供的表。
select * from dict where table_name like '%SESSION%';
就可以查出一些表,然后根据这些表就可以获得会话信息
select sid,serial#,status,username,schemaname,osuser,terminal,ma
- 类的继承
朱辉辉33
java
类的继承可以提高代码的重用行,减少冗余代码;还能提高代码的扩展性。Java继承的关键字是extends
格式:public class 类名(子类)extends 类名(父类){ }
子类可以继承到父类所有的属性和普通方法,但不能继承构造方法。且子类可以直接使用父类的public和
protected属性,但要使用private属性仍需通过调用。
子类的方法可以重写,但必须和父类的返回值类
- android 悬浮窗特效
肆无忌惮_
android
最近在开发项目的时候需要做一个悬浮层的动画,类似于支付宝掉钱动画。但是区别在于,需求是浮出一个窗口,之后边缩放边位移至屏幕右下角标签处。效果图如下:
一开始考虑用自定义View来做。后来发现开线程让其移动很卡,ListView+动画也没法精确定位到目标点。
后来想利用Dialog的dismiss动画来完成。
自定义一个Dialog后,在styl
- hadoop伪分布式搭建
林鹤霄
hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
- gdb调试命令
aigo
gdb
原文:http://blog.csdn.net/hanchaoman/article/details/5517362
一、GDB常用命令简介
r run 运行.程序还没有运行前使用 c cuntinue 
- Socket编程的HelloWorld实例
alleni123
socket
public class Client
{
public static void main(String[] args)
{
Client c=new Client();
c.receiveMessage();
}
public void receiveMessage(){
Socket s=null;
BufferedRea
- 线程同步和异步
百合不是茶
线程同步异步
多线程和同步 : 如进程、线程同步,可理解为进程或线程A和B一块配合,A执行到一定程度时要依靠B的某个结果,于是停下来,示意B运行;B依言执行,再将结果给A;A再继续操作。 所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回,同时其它线程也不能调用这个方法
多线程和异步:多线程可以做不同的事情,涉及到线程通知
&
- JSP中文乱码分析
bijian1013
javajsp中文乱码
在JSP的开发过程中,经常出现中文乱码的问题。
首先了解一下Java中文问题的由来:
Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,
- js实现页面跳转重定向的几种方式
bijian1013
JavaScript重定向
js实现页面跳转重定向有如下几种方式:
一.window.location.href
<script language="javascript"type="text/javascript">
window.location.href="http://www.baidu.c
- 【Struts2三】Struts2 Action转发类型
bit1129
struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action,配置如下
<!DOCTYPE struts PUBLIC
"-//Apache Software Foundation//DTD Struts Configurat
- 【HBase十一】Java API操作HBase
bit1129
hbase
Admin类的主要方法注释:
1. 创建表
/**
* Creates a new table. Synchronous operation.
*
* @param desc table descriptor for table
* @throws IllegalArgumentException if the table name is res
- nginx gzip
ronin47
nginx gzip
Nginx GZip 压缩
Nginx GZip 模块文档详见:http://wiki.nginx.org/HttpGzipModule
常用配置片段如下:
gzip on; gzip_comp_level 2; # 压缩比例,比例越大,压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
- java-7.微软亚院之编程判断俩个链表是否相交 给出俩个单向链表的头指针,比如 h1 , h2 ,判断这俩个链表是否相交
bylijinnan
java
public class LinkListTest {
/**
* we deal with two main missions:
*
* A.
* 1.we create two joined-List(both have no loop)
* 2.whether list1 and list2 join
* 3.print the join
- Spring源码学习-JdbcTemplate batchUpdate批量操作
bylijinnan
javaspring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法,Spring只是做了一下改造和封装
JDBC的batch操作:
String sql = "INSERT INTO CUSTOMER " +
"(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
- [JWFD开源工作流]大规模拓扑矩阵存储结构最新进展
comsci
工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出.........
竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
- base64编码和url编码
cuityang
base64url
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.io.StringWriter;
import java.io.UnsupportedEncodingException;
- web应用集群Session保持
dalan_123
session
关于使用 memcached 或redis 存储 session ,以及使用 terracotta 服务器共享。建议使用 redis,不仅仅因为它可以将缓存的内容持久化,还因为它支持的单个对象比较大,而且数据类型丰富,不只是缓存 session,还可以做其他用途,一举几得啊。1、使用 filter 方法存储这种方法比较推荐,因为它的服务器使用范围比较多,不仅限于tomcat ,而且实现的原理比较简
- Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式']
dcj3sjt126com
数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
- solr StatsComponent(聚合统计)
eksliang
solr聚合查询solr stats
StatsComponent
转载请出自出处:http://eksliang.iteye.com/blog/2169134
http://eksliang.iteye.com/ 一、概述
Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能
二、参数
- 百度一道面试题
greemranqq
位运算百度面试寻找奇数算法bitmap 算法
那天看朋友提了一个百度面试的题目:怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字.
我这里复制的是原话,当然顺序是不一定的,很多拿到题目第一反应就是用map,当然可以解决,但是效率不高。
还有人觉得应该用算法xxx,我是没想到用啥算法好...!
还有觉得应该先排序...
还有觉
- Spring之在开发中使用SpringJDBC
ihuning
spring
在实际开发中使用SpringJDBC有两种方式:
1. 在Dao中添加属性JdbcTemplate并用Spring注入;
JdbcTemplate类被设计成为线程安全的,所以可以在IOC 容器中声明它的单个实例,并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱,泛型,可变长度
- JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节
justjavac
json
2013年5月,Yehuda Katz 完成了JSON API(英文,中文) 技术规范的初稿。事情就发生在 RailsConf 之后,在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
- 网站项目建设流程概述
macroli
工作
一.概念
网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。
二.需求分析
项目立项
我们接到客户的业务咨询,经过双方不断的接洽和了解,并通过基本的可行性讨论够,初步达成制作协议,这时就需要将项目立项。较好的做法是成立一个专门的项目小组,小组成员包括:项目经理,网页设计,程序员,测试员,编辑/文档等必须人员。项目实行项目经理制。
客户的需求说明书
第一步是需
- AngularJs 三目运算 表达式判断
qiaolevip
每天进步一点点学习永无止境众观千象AngularJS
事件回顾:由于需要修改同一个模板,里面包含2个不同的内容,第一个里面使用的时间差和第二个里面名称不一样,其他过滤器,内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not,继续追究其源码。
var b = "{{",
a = "}}";
this.startSymbol = function(a) {
- Spark算子:统计RDD分区中的元素及数量
superlxw1234
sparkspark算子Spark RDD分区元素
关键字:Spark算子、Spark RDD分区、Spark RDD分区元素数量
Spark RDD是被分区的,在生成RDD时候,一般可以指定分区的数量,如果不指定分区数量,当RDD从集合创建时候,则默认为该程序所分配到的资源的CPU核数,如果是从HDFS文件创建,默认为文件的Block数。
可以利用RDD的mapPartitionsWithInd
- Spring 3.2.x将于2016年12月31日停止支持
wiselyman
Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x(包含tomcat 6.x)的支持。在此之前spring团队将持续发布3.2.x的维护版本。
请大家及时准备及时升级到Spring
- fis纯前端解决方案fis-pure
zccst
JavaScript
作者:zccst
FIS通过插件扩展可以完美的支持模块化的前端开发方案,我们通过FIS的二次封装能力,封装了一个功能完备的纯前端模块化方案pure。
1,fis-pure的安装
$ fis install -g fis-pure
$ pure -v
0.1.4
2,下载demo到本地
git clone https://github.com/hefangshi/f