E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词频统计
乔布斯传中的英文
词频统计
0: 1 0.9: 1 0006939: 1 03.html: 1 1: 49 1,000: 9 1,200: 1 1,299: 1 1,300: 1 1,500: 3 1,995: 3 1-866-248-3049: 1 1.0: 4 1.04: 1 1.2: 3 1.3: 2 1.5: 1 1.7: 2 1.79: 1 1.8-inch: 3 10: 6
yujiaao
·
2013-09-30 08:00
english
Trie字典树的一个实现
Trie典型应用是用于统计和排序、查询大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本的
词频统计
等。
yingtju
·
2013-09-20 20:47
trie
字典树
Trie字典树的一个实现
Trie典型应用是用于统计和排序、查询大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本的
词频统计
等。
yingtju
·
2013-09-20 20:47
Trie
字典树
Java
数据结构---各种树模板 持续更新···
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
MetalSeed
·
2013-09-20 13:00
Trie树的构建
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
,还可以用来求单词的前缀。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
u010064842
·
2013-09-13 00:00
Trie树
Trie树
典型应用是用于统计和排序、查询大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本的
词频统计
等。
风刃
·
2013-09-08 16:19
hash
Trie树
#coding4fun#
词频统计
优化思路
关于这期的coding4fun,我选择的是hashmap方式实现。整体思路和流程大家可能都差不多,C++同学们的总结写的很好,一些逻辑优化都有总结,我这里介绍下java实现的一些优化吧。使用ByteString代替String开始读出文件转成String对象,然后通过String对象操作,代码写起来都比较方便。但是有一个问题,文件读取出来的byte[]转成String对象非常耗时,一个1G的Str
阿里中间件
·
2013-09-06 10:00
词频统计
优化思路
Coding4Fun
#coding4fun#
词频统计
优化思路
关于这期的coding4fun,我选择的是hashmap方式实现。整体思路和流程大家可能都差不多,C++同学们的总结写的很好,一些逻辑优化都有总结,我这里介绍下java实现的一些优化吧。使用ByteString代替String开始读出文件转成String对象,然后通过String对象操作,代码写起来都比较方便。但是有一个问题,文件读取出来的byte[]转成String对象非常耗时,一个1G的Str
阿里中间件
·
2013-09-06 10:00
coding4fun
词频统计
优化思路
Uncategorized
coding4fun
词频统计
的优化思路
在这次的coding4fun活动中已经有很多同学分享了精彩的优化思路。我的思路其实大同小异,下面就挑一些于众不同的地方分享吧:第一个不同点:在结构上选择了简化版的Trie作为查找结构。简化版Trie的结构就是一颗n叉树,每个节点对应一个状态。选择简化版Trie的原因是它的树状结构很容易用CAS实现无锁并行,而相比hashtable没有hash冲突和rehash的问题,相比复杂Trie结构如Doub
阿里中间件
·
2013-09-05 17:00
数据结构
树
trie
Coding4Fun
coding4fun
词频统计
的优化思路
在这次的coding4fun活动中已经有很多同学分享了精彩的优化思路。我的思路其实大同小异,下面就挑一些于众不同的地方分享吧:第一个不同点:在结构上选择了简化版的Trie作为查找结构。简化版Trie的结构就是一颗n叉树,每个节点对应一个状态。选择简化版Trie的原因是它的树状结构很容易用CAS实现无锁并行,而相比hashtable没有hash冲突和rehash的问题,相比复杂Trie结构如Doub
阿里中间件
·
2013-09-05 17:00
数据结构
Trie
树
coding4fun
开发技巧和教训
字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
fjy4328286
·
2013-08-01 09:00
字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
lezong2011
·
2013-07-20 13:00
Trie树及其应用
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。Trie树的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
·
2013-07-11 17:00
trie
Trie树及其应用
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。Trie树的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
Big_Wang5
·
2013-07-11 15:00
字典树,后缀树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie的核心思想是空间换时间。
utimes
·
2013-07-09 22:00
字典树
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
zhanghaotian2011
·
2013-05-21 20:00
字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,
zkzxmzk
·
2013-05-10 16:00
成长
ACM
struts2实现的简单的Trie树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。这是百度百科做的概述。
doliangzhe3
·
2013-04-04 14:00
struts2
Trie树
struts2实现的简单的Trie树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。这是百度百科做的概述。
doliangzhe
·
2013-04-04 13:00
java 字符串
词频统计
实例代码
复制代码代码如下:packagecom.gpdi.action;importjava.util.ArrayList;importjava.util.Collections;importjava.util.HashMap;importjava.util.List;importjava.util.Map;publicclassWordsStatistics{classObj{intcount;Obj(
·
2013-03-30 09:29
从Trie树说到后缀树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie的核心思想是空间换时间。
imzoer
·
2013-02-26 17:00
使用VS2012 performance analysis tool优化你的程序 by Yan Zhao
例子程序是一个简单的对文本的
词频统计
程序。写完程序后,我们点击ANALYZE-->StartPerformanceAnalysis可以进行分析。
L_serein
·
2012-12-24 23:00
Hadoop上的中文分词与
词频统计
实践
首先来推荐相关材料:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-count-on-hadoop/。小虾的这个统计武侠小说人名热度的段子很有意思,照虎画猫来实践一下。与其不同的地方有:0)其使用HadoopStreaming,这里使用MapReduce框架。1)不同的中文分词方法,这里使用IKAnalyzer,主页在htt
·
2012-12-16 19:00
hadoop
数据结构和算法系列 - Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l 性质n 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
initphp
·
2012-12-11 18:00
Daily Scrum 2012/12/05
组员今天任务明天任务胡仁君任务428正文分词任务429
词频统计
任务428正文分词任务429
词频统计
彭笑东 任务374翻译语料库 任务374翻译语料库李斌任务373翻译语料库 任务373翻译语料库隋宇豪任务
·
2012-12-05 23:00
Scrum
字典树学习材料
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
zhoutongchi
·
2012-12-03 16:00
学习使用字典树(JAVA)
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
128kj
·
2012-11-22 09:00
java
数据结构
编程
算法
Java
词频统计
算法(使用单词树)
许多英语培训机构(如新东方)都会出几本“高频词汇”的书,主要内容是统计近几年来各类外语考试中屡次出现的高频词汇,帮助考生减少需要背的生词的数量。但这些高频是如何被统计出来的呢?显然不会用手工去计算。假如我们已经将一篇文章存在一字符串(String)对象中,为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果
chengyingzhilian
·
2012-11-19 09:00
字典树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 Trie的核心思想是空间换时间。
crazyhacking
·
2012-11-07 23:00
eclipse运行wordcount参数配置
输入路径是我们要进行
词频统计
的文本文件,在这里我们的文件名是20417.txt。而输出路径是
词频统计
结果存放的路径。
hnzhangshilong
·
2012-11-05 11:00
Trie树:应用于统计和排序
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 Trie的核心思想是空间换时间。
hguisu
·
2012-10-31 17:00
数据结构
算法
Trie三兄弟——标准Trie、压缩Trie、后缀Trie
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。用于存储字符串以便支持快速模式匹配,主要应用在信息检索中,Trie支持的主要查询操作是模式匹配和前缀匹配。
DSQiu
·
2012-10-26 01:00
标准Trie
压缩Trie
后缀Trie
Trie树/字典树的简介及实现
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
wojiushiwo987
·
2012-10-22 11:00
Trie树(字典树)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie的核心思想是空间换时间。
jiutianhe
·
2012-10-16 13:00
java
算法
String
搜索引擎
null
词频统计
小程序
写了自己的第一个具有使用意义的小程序⋯⋯预计时间8小时,实际时间12小时由于开始时对需求理解有误,导致过滤掉了很多本来应该出现的词语主要写了两个函数,一个用来比较是否重复,另一个函数用来提取每个文件夹中的合法文件上网学习了一下递归遍历文件夹最后尝试了一下性能分析热路径的东西没看懂⋯⋯还需要多多学习
·
2012-10-10 17:00
程序
字典树--字符串快速检索法
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
MetalSeed
·
2012-09-07 01:00
struct
null
include
数据结构之字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
huangxy10
·
2012-09-05 13:00
数据结构
搜索引擎
null
search
insert
iostream
Trie树的C++实现
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。性质:1.根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
luxiaoxun
·
2012-09-03 13:00
C++
tree
delete
iterator
insert
functor
搜索引擎网页排序算法
2.1基于
词频统计
——词位置加权的搜索引擎 利用关键词在文档中出现的频率和位置排序是搜索引擎最早期排序的主要思想,其技术发展也最为成熟,是第一阶段搜索引擎的主要排序技术,应用非常广泛
xiaoyu714543065
·
2012-09-01 14:00
算法
搜索引擎
网络
Google
文档
Hyperlink
字典树(TrieTree)
字典树(TrieTree),常见应用于大量字符串的保存,统计,查找等操作,由于字符串的公共前缀没有重复保存,所以操作起来比较方便,效率很高,搜索引擎的文本
词频统计
就是它的经典应用之一。
l04205613
·
2012-08-14 13:00
struct
搜索引擎
null
delete
2010
字典树
/07/18/2596730.html(秦神的博客)字典树(Trie树) 字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
rowanhaoa
·
2012-08-13 17:00
Trie (prefix tree) 实现 (Java)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。它有3个基本性质:根节点不包含字
beiyetengqing
·
2012-08-13 10:00
java
数据结构
String
tree
search
character
海量数据处理之Tire树(字典树)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高
ts173383201
·
2012-08-13 09:23
海量数据处理
海量数据处理之Tire树(字典树)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈
ts173383201
·
2012-08-13 09:00
算法
搜索引擎
null
search
insert
iostream
在大连做安天技术论坛 GuessMe5
无耻的看了答案,发现作者的高明之处在于使用了
词频统计
,收效显著。解答如下
wangyi_lin
·
2012-08-07 11:00
工作
工具
金山
hdu 1247 字典树
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
azheng51714
·
2012-08-06 20:00
搜索引擎
struct
null
search
存储
insert
基于boost正则表达式:对目录下所有文本文件的中文
词频统计
首先得得到我们的常用词频,保存在ciku.ini中里面保存32280个词汇,保存形式如下至于怎么得到词库,办法各异了,我这里是从xp自带的拼音和五笔输入法的码表文件中提取的词汇,去除两个码表相同的词汇,得到的总词汇有32280个,1)在C盘建立ciku文件夹,拷贝“词库提取”文件夹中的词库文件ciku.ini到ciku目录,最终得到的结果也会在C盘的ciku下面的ou
lilien1010
·
2012-08-02 22:00
c
正则表达式
String
iterator
文档
regex
HDU-1251-统计难题
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希
Cambridgeacm
·
2012-07-16 16:00
搜索引擎
null
search
存储
insert
字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
wangkechuang
·
2012-07-12 16:00
Trie树 单词查找树 键树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
jaychang
·
2012-06-12 08:00
trie
上一页
32
33
34
35
36
37
38
39
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他