E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词频统计
字典树学习材料
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
cavenkaka
·
2012-05-30 14:00
字典树
使用单词树进行
词频统计
算法
许多英语培训机构(如新东方)都会出几本“高频词汇”的书,主要内容是统计近几年来各类外语考试中屡次出现的高频词汇,帮助考生减少需要背的生词的数量。但这些高频是如何被统计出来的呢?显然不会用手工去计算。假如我们已经将一篇文章存在一字符串(String)对象中,为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如
竹林风
·
2012-04-24 09:36
java
一个通用的Trie树,标准C++实现
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
Harry_lyc
·
2012-04-03 13:00
数据结构
C++
String
null
token
tokenize
中文分词原理
主要的方法有三种:基于词典匹配的分词方法,基于语义理解的分词,基于
词频统计
的分词. 1.基于词典分配的分词算法 基于字典匹配的分词算法按一定的匹配策略将输入的字符串与机器字典词条进行匹配
fjg0427
·
2012-02-28 14:00
中文分词
字典树模板
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
Ares_晓越
·
2012-01-19 15:19
Poj
字典树模板
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
Detective_Xin
·
2012-01-19 15:00
搜索引擎
struct
null
存储
字典树
典型应用于统计、排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。字典树的结构特点:1、根结点不包含字符,除根结点外其他结点都只包含一个字符。
furney
·
2011-12-24 12:00
struct
搜索引擎
null
search
存储
insert
Trie 数结构
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
lxzo123
·
2011-11-26 19:00
算法
搜索引擎
存储
trie树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
iwebcode
·
2011-11-25 14:00
trie
Trie的java实现
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。它有3个基本性质:根节点不包含字
beiyeqingteng
·
2011-11-17 14:00
java
数据结构
String
search
Class
insert
Chindle内容设计【2】
简单的
词频统计
并不能很好地用于知识发现,例如下面的,高频词汇基本都是垃圾信息。怎么搞?
maray
·
2011-10-17 12:00
Chindle内容设计【2】
简单的
词频统计
并不能很好地用于知识发现,例如下面的,高频词汇基本都是垃圾信息。怎么搞?
sabolasi
·
2011-10-17 12:00
设计
ubuntu下hadoop配置指南
目录1.实验目的2.实验内容(hadoop伪分布式与分布式集群环境配置)3.运行wordcount
词频统计
程序一.实验目的通过学习和使用开源的ApacheHadoop工具,亲身实践云计算环境下对海量数据的处理
xw13106209
·
2011-10-09 15:00
mapreduce
hadoop
集群
ssh
ubuntu
eclipse插件
eclipse运行wordcount参数配置
输入路径是我们要进行
词频统计
的文本文件,在这里我们的文件名是20417.txt。而输出路径是
词频统计
结果存放的路径。
xw13106209
·
2011-10-09 14:00
eclipse
hadoop
properties
input
deprecated
output
trie树—字典树详细讲解和模板总结,poj trie树 基础练习题!!!!!
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
youngyangyang04
·
2011-10-02 13:00
数据结构
搜索引擎
tree
null
存储
Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。性质 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
G_BrightBoy
·
2011-09-27 15:00
算法
搜索引擎
tree
存储
insert
functor
Trie树(单词查找树或键树)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 Trie是一颗存储多个字符串的树。
Dev|il
·
2011-09-21 12:00
trie
Trie树(单词查找树或键树)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie是一颗存储多个字符串的树。
Dev|il
·
2011-09-21 12:00
大并发搜索下关键词前缀匹配值得考虑的一种数据结构---Trie
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。散列是一种常见的高效查找方法,
m2000hsf
·
2011-09-12 23:00
数据结构
用Trie树实现
词频统计
和单词查询
/* 文件名:trie.c 功能描述:用trie树实现单词
词频统计
以及单词查询 说明: 对统计对象,要求符合正则"[a-z]*"的格式的单词 若考虑大写,标点和空白字符(空格.TAB.回车换行符
zhulei632
·
2011-08-20 16:00
c
struct
null
search
insert
Google 开始决定 Google Labs 里各个实验产品的生死存亡
生还者:GoogleBooksNgramViewer:全球书籍
词频统计
器GoogleScribe:实时打字建议(Blogger已经开始整合)
musiXboy D31T4
·
2011-08-10 02:00
APP
Google
Google
ngram
breadcrumb
viewer
Google新闻
books
labs
Inventor
字典树学习
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
swm8023
·
2011-06-15 08:00
Hadoop平台实验报告
1.前言通过基于MapReduce云计算平台的海量数据处理实验,我们了解了Hadoop的基本架构,已经如何编写MapReduce程序,本实验中我主要使用到的两个程序分别是WordCount(
词频统计
)和
xw13106209
·
2011-06-10 12:00
Hadoop
hadoop
平台
集群
作业
框架
存储
Hadoop平台实验报告
平台实验报告1.前言通过基于MapReduce云计算平台的海量数据处理实验,我们了解了Hadoop的基本架构,已经如何编写MapReduce程序,本实验中我主要使用到的两个程序分别是WordCount(
词频统计
我为卒
·
2011-06-10 12:00
[转]Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l 性质n 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
heiyeshuwu
·
2011-05-17 17:00
c
算法
搜索引擎
存储
insert
functor
[转]Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l性质n根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
wapysun
·
2011-05-17 17:00
trie
Trie树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
robertin
·
2011-05-07 11:00
文本分类基础
文本分类系统的总体功能模块为:(1)预处理:将原始语料格式化为同一格式,便于后续的统一处理;(2)索引:将文档分解为基本处理单元,同时降低后续处理的开销;(3)统计:
词频统计
,项(单词、概念)与分类的相关概率
shangzhenhui
·
2011-04-25 09:00
文档
算法
自然语言处理
数据挖掘
vector
优化
文本分类的数据预处理相关知识介绍
在进行文本分类时,毫无疑问会涉及到对文本数据进行预处理,包括文档切分、文本分词、去停用词(包括标点、数字、单字和其它一些无意义的词)、文本特征提取、
词频统计
、文本向量化等操作。
beifenggo
·
2011-04-06 10:00
C++
c
算法
C#
F#
文本分类的数据预处理相关知识介绍
在进行文本分类时,毫无疑问会涉及到对文本数据进行预处理,包括文档切分、文本分词、去停用词(包括标点、数字、单字和其它一些无意义的词)、文本特征提取、
词频统计
、文本向量化等操作。
beifenggo
·
2011-04-06 10:00
C++
c
算法
C#
F#
词性标注程序探讨
程序设计主要分为五个部分,即
词频统计
和词性符号统计、状态转移概率的计算、发射概率的计算、词性标注、性能评价。
androidssh
·
2011-03-07 20:00
算法
J#
词性标注程序探讨
阅读更多程序设计主要分为五个部分,即
词频统计
和词性符号统计、状态转移概率的计算、发射概率的计算、词性标注、性能评价。
androidssh
·
2011-03-07 20:00
J#
算法
字典树(讲解+模版)
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
hz_chenwenbiaoTMB
·
2011-02-22 13:00
数据结构
算法
struct
list
搜索引擎
null
度老总李彦宏提出了所谓的搜索引擎三大定律
第一定律相关性定律情报检索、信息检索或全文检索的相关性都是基于
词频统计
的。
isping
·
2011-02-16 17:23
搜索
百度
职场
李彦宏
休闲
度老总李彦宏提出了所谓的搜索引擎三大定律
第一定律相关性定律情报检索、信息检索或全文检索的相关性都是基于
词频统计
的。
isping
·
2011-02-16 17:23
职场
百度
搜索
智能推荐技术
C#
词频统计
usingSystem;usingSystem.Drawing;usingSystem.Collections;usingSystem.ComponentModel;usingSystem.Windows.Forms;usingSystem.Data;namespaceWindowsApplication1{ /// ///Form1的摘要说明。 ///
xhp007
·
2010-12-22 15:53
职场
统计
词频
休闲
字典树(讲解+模版)
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
Tanky Woo的程序人生
·
2010-09-24 09:00
字典树
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
topcoder1234
·
2010-09-16 09:00
String
搜索引擎
null
search
存储
insert
词频统计
的C++实现(使用stl--map)
#include#include#include#includeusingnamespacestd;voiddisplay_map(map&wmap);intmain(){constchar*szInputFileName="Text.txt";ifstreamifs(szInputFileName);stringszTemp;mapwmap;while(ifs>>szTemp)wmap[szTe
Deutschester
·
2010-09-15 01:00
C++
String
iterator
include
iostream
Trie—单词查找树 转
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l 性质n 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
Tinysun
·
2010-05-02 11:00
Sicilly 1194 Message Flood(字典树+搜索)
//典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。//它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
ChinaCzy
·
2010-04-18 02:00
搜索引擎
tree
delete
search
Build
Terminal
AC算法使用例子
/** *实现测试:串匹配和
词频统计
功能 */ public voidlargerTextExample() { Stringtext="你好abc,ac,abc,def,ac,okt,ac,dfdfe
与心灵对话
·
2010-01-21 23:00
转:资本2010《CCTV财经频道中国证券市场投资策略报告》发布
在关键词的产生过程中,央视财经频道《市场分析室》栏目收集了4000余份最新报告,使用专门设计的
词频统计
软件进行全
SwiftHorse
·
2010-01-18 23:00
金融
能源
腾讯
文化产业
转:资本2010《CCTV财经频道中国证券市场投资策略报告》发布
在关键词的产生过程中,央视财经频道《市场分析室》栏目收集了4000余份最新报告,使用专门设计的
词频统计
软件进行全面扫
SwiftHorse
·
2010-01-18 23:00
金融
文化产业
能源
腾讯
单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l 性质n 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
lengthBYlength
·
2009-11-13 15:00
c
算法
搜索引擎
存储
insert
functor
Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。 含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l 性质n 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
lewutian
·
2009-08-10 14:00
Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l性质n根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
BlogDown
·
2009-08-10 14:00
trie
基于网页关键词的SEO分析
基于
词频统计
是对关键词的出现次数进行加权分析,根据各特征项对网页内容的贡献,经过多次统计学习完成。在HTML文档中,各词条在不同内容的网页中所呈现出的频率分布是不
huhai
·
2009-04-18 22:00
算法
搜索引擎
Trie—单词查找树
应用于字符串的统计与排序,经常被搜索引擎系统用于文本
词频统计
。含有单词“tea”“tree”“A”“ZSU”的一棵Trie。l 性质n 根节点不包含字符,除根节点外的每一个节点都只包含一个字符。
忽若流星
·
2009-03-27 23:00
复旦大学语料库的一些统计信息Part 2词频
经过
词频统计
,看到复旦大学中文语料库的总词数为116558个(而且还是去掉了停止词及代词,介词,数词和时间短语等无关内容之后的结果),数量十分巨大.而各个类别的词汇数量分别为: 类别名称:Agriculture
Jasper's Java Jacal
·
2008-11-13 14:00
上一页
32
33
34
35
36
37
38
39
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他