E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Ngram
细数百度公司的知名开源项目
其中一些如UEditor、Ta
ngram
已经在业界非常知名。作为国内技术领先的互联网企业,百度公司也陆续开源了不少项目。其中一些如UEditor、Ta
ngram
已经在业界非常知名。
libaineu2004
·
2015-08-06 14:00
开源
百度
[Elasticsearch] 向已存在的索引中添加自定义filter/analyzer
在sense中进行更新时会抛出异常:PUT/symbol{"settings":{"analysis":{"filter":{"edge
ngram
":{"type":"edge
NGram
","min_gram
dm_vincent
·
2015-07-22 01:45
Elasticsearch
Search
[Elasticsearch] 向已存在的索引中添加自定义filter/analyzer
在sense中进行更新时会抛出异常:PUT/symbol { "settings":{"analysis":{"filter":{"edge
ngram
":{"type":"edge
NGram
","min_gram
dm_vincent
·
2015-07-22 01:00
elasticsearch
索引
analyzer
维护
2015.7.8努比亚My布拉格发布 5.5毫米全金属机身售价2392元
布拉格(国内名称暂未定,业内相关人士猜测或为努比亚M5),目前该机已经正式登陆捷克市场,其中经典版售价349欧元(约2394元人民币),精英版售价429欧元(约2943元人民币),将联合捷克公开渠道商I
ngram
Micro
佚名
·
2015-07-09 08:41
文本建模常用的预处理方法
以MeTa代码为例:[[analyzers]] method="
ngram
-word"
ngram
=1 [[analyzers.filter]] type="whitespace-tokenizer"
mmc2015
·
2015-07-02 19:00
数据挖掘
机器学习
特征预处理
文本建模
NGram
Probability API
class
NGram
Probability 代表一个字的id(字在一个N-gram中的位置)。一个N-Gram概率id。
taiyb
·
2015-06-16 21:00
sphinx
语音识别
NGram
Buffer API
class
NGram
Buffer 实现了一个保护
NGram
s的缓存。它假定每一个n-gram项的前两个字节是n-gram的id。
taiyb
·
2015-06-16 21:00
sphinx
语音识别
Large
NGram
Model API 语言模型
publicclassLarge
NGram
ModelimplementsLanguageModel,BackoffLanguageModel 使用一个二进制
NGram
(n元)语言模型文件(”DMP文件”
taiyb
·
2015-06-16 21:00
sphinx
语音识别
BinaryLoader API
publicclassBinaryLoader 读取由cmuSphinxBasesphinx_lm_convert产生的一个二进制
NGram
语言模型文件(”DMP文件”)。
taiyb
·
2015-06-16 21:00
sphinx
语音识别
Canvas学习
var ta
ngram
=[ {p:[{x:0,y:0},{x:800,y:0},{x:400,y:400}],color:"#caff67"}, {p:[{x:0,y:0},{
Hacker_zzm
·
2015-06-02 09:12
canvas
html5
前端开发
solr4.7.2开发实践 ——拼音检索【需要用到的包pinyin4j-2.5.0.jar和pinyinAnalyzer.jar;只需要配置schema.xml文件、solrj的java代码测试】
my.oschina.net/MrMichael/blog/261231 拼音检索的大致思路是这样的: ①将需要使用拼音检索的字段汇集到一个拼音分词字段里(我的拼音分词字段使用pinyin4j+
NGram
buster2014
·
2015-05-17 16:00
一种利用
ngram
模型来消除歧义的中文分词方法
这里的歧义是指:同样的一句话,可能有两种或者更多的切分方法,这些切分结果,有的正确,有的不正确。 消除歧义的目的就是从切分结果中挑选切分正确的。 假设我们要切分句子:结婚的和尚未结婚的,使用逆向最大匹配和正向最大匹配算法的结果如下: ? 1 2 逆向最大匹配:[结婚, 的, 和, 尚未, 结婚, 的]
yangshangchuan
·
2015-05-06 04:00
word
中文分词
词义消歧
ngram
一种利用
ngram
模型来消除歧义的中文分词方法
这里的歧义是指:同样的一句话,可能有两种或者更多的切分方法,这些切分结果,有的正确,有的不正确。 消除歧义的目的就是从切分结果中挑选切分正确的。 假设我们要切分句子:结婚的和尚未结婚的,使用逆向最大匹配和正向最大匹配算法的结果如下: ? 1 2 逆向最大匹配:[结婚, 的, 和, 尚未, 结婚, 的]
yangshangchuan
·
2015-05-06 04:00
word
中文分词
ngram
词义消歧
一种利用
ngram
模型来消除歧义的中文分词方法
这里的歧义是指:同样的一句话,可能有两种或者更多的切分方法,这些切分结果,有的正确,有的不正确。 消除歧义的目的就是从切分结果中挑选切分正确的。 假设我们要切分句子:结婚的和尚未结婚的,使用逆向最大匹配和正向最大匹配算法的结果如下: ? 1 2 逆向最大匹配:[结婚, 的, 和, 尚未, 结婚, 的]
yangshangchuan
·
2015-05-06 04:00
word
中文分词
词义消歧
ngram
一种利用
ngram
模型来消除歧义的中文分词方法
这里的歧义是指:同样的一句话,可能有两种或者更多的切分方法,这些切分结果,有的正确,有的不正确。 消除歧义的目的就是从切分结果中挑选切分正确的。 假设我们要切分句子:结婚的和尚未结婚的,使用逆向最大匹配和正向最大匹配算法的结果如下: ? 1 2 逆向最大匹配:[结婚, 的, 和, 尚未, 结婚, 的]
yangshangchuan
·
2015-05-06 04:00
word
中文分词
ngram
词义消歧
一种利用
ngram
模型来消除歧义的中文分词方法
这里的歧义是指:同样的一句话,可能有两种或者更多的切分方法,这些切分结果,有的正确,有的不正确。消除歧义的目的就是从切分结果中挑选切分正确的。假设我们要切分句子:结婚的和尚未结婚的,使用逆向最大匹配和正向最大匹配算法的结果如下:逆向最大匹配:[结婚, 的, 和, 尚未, 结婚, 的] 正向最大匹配:[结婚, 的, 和尚, 未结, 婚, 的]再比如,这几块地面积还真不小:逆向最大匹配:[这, 几块,
杨尚川
·
2015-05-06 04:00
word
中文分词
ngram
词义消歧
一种利用
ngram
模型来消除歧义的中文分词方法
这里的歧义是指:同样的一句话,可能有两种或者更多的切分方法,这些切分结果,有的正确,有的不正确。消除歧义的目的就是从切分结果中挑选切分正确的。假设我们要切分句子:结婚的和尚未结婚的,使用逆向最大匹配和正向最大匹配算法的结果如下:逆向最大匹配:[结婚, 的, 和, 尚未, 结婚, 的] 正向最大匹配:[结婚, 的, 和尚, 未结, 婚, 的]再比如,这几块地面积还真不小:逆向最大匹配:[这, 几块,
·
2015-05-05 20:00
search
Java分布式中文分词组件word分词v1.2发布
阅读更多word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
jsczxy2
·
2015-04-20 12:00
java
分词
Java分布式中文分词组件word分词v1.2发布
阅读更多word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
jsczxy2
·
2015-04-20 12:00
java
分词
Java分布式中文分词组件word分词v1.2发布
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
jsczxy2
·
2015-04-20 12:00
java
分词
Java分布式中文分词组件word分词v1.2发布
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
yangshangchuan
·
2015-04-16 00:00
elasticsearch
Lucene
Solr
word分词
中文分词
Java分布式中文分词组件word分词v1.2发布
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
yangshangchuan
·
2015-04-16 00:00
elasticsearch
Lucene
Solr
word分词
中文分词
Java分布式中文分词组件word分词v1.2发布
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
yangshangchuan
·
2015-04-16 00:00
elasticsearch
Solr
Lucene
word分词
中文分词
Java分布式中文分词组件word分词v1.2发布
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
yangshangchuan
·
2015-04-16 00:00
elasticsearch
Solr
Lucene
word分词
中文分词
Java分布式中文分词组件word分词v1.2发布
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用
ngram
模型来消除歧义。
杨尚川
·
2015-04-15 23:00
elasticsearch
Solr
Lucene
word分词
中文分词
还是这个说的清楚ramfs and tmpfs
OverviewofRAMFSandTMPFSonLinuxbyRameshNatarajanonNovember6,2008TweetThisisaguestpostwrittenbySathiyaMoorthy.Usi
ngram
fsortmpfsyoucanallocatepartofthephysicalmemorytobeusedasapartition.Youcanmountthis
wonder4
·
2015-04-04 22:00
常用前端开发框架介绍
Ta
ngram
Baidu开发的一套简单可依赖的Javascript库,主要分为Base和Component两部分。Base提供了开发时常用功能的封装,是核心的工具库。
小丑鱼0703
·
2015-03-24 13:00
前端开发
Pa
ngram
#include#include#includeusingnamespacestd;intmain(){//freopen("i.txt","r",stdin);//freopen("o.txt","w",stdout);inta[26];memset(a,0,sizeof(a));chars[200];intn;scanf("%d",&n);scanf("%s",s);for(inti=0;s[
qq_24489717
·
2015-03-23 21:00
520A Pa
ngram
【implement】
A.Pa
ngram
timelimitpertest2secondsmemorylimitpertest256megabytesinputstandardinputoutputstandardoutputAwordorasentenceinsomelanguageiscalledapa
ngram
ifallthecharactersofthealphabetofthislanguageappearin
u014787301
·
2015-03-09 21:00
String
Pa
ngram
A.Pa
ngram
timelimitpertest2secondsmemorylimitpertest256megabytesinputstandardinputoutputstandardoutputAwordorasentenceinsomelanguageiscalleda
u014355480
·
2015-03-03 18:00
ACM
codeforces
Pa
ngram
(简单水题)
Link:http://codeforces.com/problemset/problem/520/AA.Pa
ngram
timelimitpertest2secondsmemorylimitpertest256megabytesinputstandardinputoutputstandardoutputAwordorasentenceinsomelanguageiscalleda
Enjoying_Science
·
2015-03-02 22:00
算法
ACM
[Codeforces #295(Div 2)]简要题解
A.Pa
ngram
Awordorasentenceinsomelanguageiscalledapa
ngram
ifallthecharactersofthealphabetofthislanguageappearinitatleastonce.Pa
ngram
sareoftenusedtodemonstratefontsinprintingortesttheoutputdevices.Youareg
qpswwww
·
2015-03-02 18:00
[Elasticsearch] 部分匹配 (四) - 索引期间优化
ngram
s及索引期间的即时搜索
本章翻译自Elasticsearch官方指南的PartialMatching一章。索引期间的优化(Index-timeOptimizations)目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(IndexingPatterns);它们只是简单地工作在已经存在于索引中的数据之上。查询期间的灵活性是有代价的:搜索性能。有时,将这些代价放到查询之外的地方是有价值的。在一个实
dm_vincent
·
2014-12-22 09:00
elasticsearch
搜索引擎
搜索
全文搜索
即时搜索
ssh-keygen+ssh-copy-id 在linux下实现ssh无密码登录访问
i
ngram
@DN1:~$ssh-keygen-trsaGeneratingpublic/privatersakeypair.Enterfileinwhichtosavethekey(/home/i
ngram
tswisdom
·
2014-12-12 14:00
LPeg
IntroductionLPeg isanewpattern-matchinglibraryforLua,basedon ParsingExpressio
nGram
mars (PEGs).Thistextisareferencemanualforthelibrary.ForamoreformaltreatmentofLPeg
S.l.e!ep.¢%
·
2014-11-03 22:00
Canvas之画七巧板
varta
ngram
=[ {p:[{x:0,y:0},{x:800,y:0},{x:400,y:400}],color:"#caff67"}, {p:[{x:0,y:0},{x:400,y:400},{
c__ilikeyouma
·
2014-10-25 15:00
canvas
发掘自我潜力的乔哈里之窗
20世纪50年代,美国心理学家乔瑟夫・勒夫(JosephLuft)和哈里・英格拉姆(HarryI
ngram
)在从事一项组织动力学研究的时候,就沟通的技巧和理论建立起一个以他俩的名字合并而成的“JoHari
tangtaozhanshen
·
2014-10-15 15:25
个人发展
心理学家
沟通的技巧
动力学
宠物狗
发掘自我潜力的乔哈里之窗
20世纪50年代,美国心理学家乔瑟夫·勒夫(JosephLuft)和哈里·英格拉姆(HarryI
ngram
)在从事一项组织动力学研究的时候,就沟通的技巧和理论建立起一个以他俩的名字合并而成的“JoHari
tangtaozhanshen
·
2014-10-15 15:25
个人发展
沟通的技巧
心理学家
职场
Sphinx武林秘籍(中)
/configure sudomake sudomakeinstall默认安装在/usr/local/bin下面,可以看到下面这些生成文件id
ngram
2lm id
ngram
2stats
mirkerson
·
2014-09-01 14:00
纯HTML5绘制的七巧板
纯HTML5绘制的七巧板varta
ngram
=[{p:[{x:0,y:0},{x:800,y:0},{x:400,y:400}],color:"#caff67"},{p:[{x:0,y:0},{x:400
trigkit4
·
2014-08-29 00:00
html5
前端框架汇总(含国内各大公司)
CompanyJSFramework百度ta
ngram
谷歌AngularJS网易nej淘宝KISSYTwitterBootstrap微软TypeScript,MetroUICSS支付宝SeaJS雅虎Mojito
qiaolevip
·
2014-07-24 09:00
学习永无止境
每天进步一点点
framework
纵观千象
乔乐共享
前端框架汇总(含国内各大公司)
CompanyJSFramework百度ta
ngram
谷歌AngularJS网易nej淘宝KISSYTwitterBootstrap微软TypeScript,MetroUICSS支付宝SeaJS雅虎Mojito
qiaolevip
·
2014-07-24 09:00
每天进步一点点
学习永无止境
framework
纵观千象
乔乐共享
【企业开源】细数百度公司的知名开源项目
其中一些如UEditor、Ta
ngram
已经在业界非常知名。
liu1164316159
·
2014-06-11 09:00
细数百度公司的知名开源项目
其中一些如UEditor、Ta
ngram
已经在业界非常知名。
caihongshijie6
·
2014-06-10 21:00
【企业开源】细数百度公司的知名开源项目
其中一些如UEditor、Ta
ngram
已经在业界非常知名。
chengzhuo1827
·
2014-06-10 18:00
【企业开源】细数百度公司的知名开源项目
其中一些如UEditor、Ta
ngram
已经在业界非常知名。
crossbell
·
2014-06-10 18:00
lucene的拼写检查的实现原理
建索引时, 使用
ngram
的方式创建索引 SpellChecker的indexDictionary方法 private static void addGram(String
jimmee
·
2014-06-08 18:00
Lucene
拼写检查
spellchecker
lucene的拼写检查的实现原理
建索引时, 使用
ngram
的方式创建索引 SpellChecker的indexDictionary方法 private static void addGram(String
jimmee
·
2014-06-08 18:00
Lucene
拼写检查
spellchecker
字符串相似算法-(3)
NGram
Distance
就是N-Gram version of edit distance public float getDistance(String source, String target) { final int sl = source.length(); final int tl = target.length(); if (sl == 0 ||
jimmee
·
2014-06-08 17:00
ngram distance
字符串相似性
字符串相似算法-(3)
NGram
Distance
就是N-Gram version of edit distance public float getDistance(String source, String target) { final int sl = source.length(); final int tl = target.length(); if (sl == 0 ||
jimmee
·
2014-06-08 17:00
字符串相似性
ngram distance
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他