E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词频统计
Trie树
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
·
2015-11-13 11:54
trie
Trie树:应用于统计和排序
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。 它的优点是:最大限
·
2015-11-12 23:51
trie
HDU-1251-统计难题
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效
·
2015-11-12 20:01
HDU
Trie树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以常常被搜索引擎系统用于文本
词频统计
。
·
2015-11-12 11:40
trie
PHP:计算文件或数组中单词出现频率
一:如果是小文件,可以一次性读入到数组中,使用方便的数组计数函数进行
词频统计
(假设文件中内容都是空格隔开的单词): <?
·
2015-11-12 11:15
PHP
【原创】海量数据处理问题(一) ---- 外排,堆排,K查找的应用
这篇博客源自对一个内存无法处理的
词频统计
问题的思考,最后给出的解决办法是自己想的,可以肯定这不是最好的解法。但是通过和同学的讨论,仍然感觉这是一个有意义及有意思的问题,所以和大家分享与探讨。
·
2015-11-12 10:24
海量数据
在Spark上运行TopK程序
._ /** * @author hadoop * 对文本进行
词频统计
,并返回出现频率最高的K个词
·
2015-11-11 19:36
spark
字典树的实现与简单使用演示
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-11 12:13
字典树
字典树(Trie tree)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
·
2015-11-11 10:25
tree
动态字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:利用
·
2015-11-11 09:50
字典树
字典树c++实现
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-11 08:59
C++
mapreduce 利用InverseMapper.class对key,value进行 交换实现词频排序
本程序的功能是对输入的数据进行
词频统计
然后再根据词频大小对出现的单词进行排列 1.实现的map类  
·
2015-11-11 08:49
mapreduce
字典树(讲解+模版)
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-11 05:43
字典树
字典树trie
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-11 00:22
trie
小玩具——单词
词频统计
小玩具——单词
词频统计
该程序是在我学习JAVA过程中的一个偶然想法,距离现在很久了,现在回顾一下这个程序的编写过程,有一天我正在背CET-4单词,实在是很煎熬啊,看着好厚一本俞敏洪的CET-4,我实在是感到很不开心
·
2015-11-11 00:46
统计
字典树的学习(剪辑的博客文章)
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-11 00:01
字典树
第一次作业
词频统计
首先这是软件工程的第一次作业. 1)计划时间: C#语法熟悉:1天准备时间 辨别单词:1.5 h 功能函数:0.5h 2)实际时间:C#语法熟悉:3天 辨别单词:4h 功能函数:4h 在最终测试的时候采用了6份测试数据: 第一次测试规模很小,仅仅是满足第一次要求时的基础功能。 第二次测试数据直接引用了自己的一个存储电子书、课件的文件夹,程序运行了
·
2015-11-09 14:53
统计
Trie树入门及训练
典型应用是用于统计,排序和保存大量的 字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-09 12:26
trie
词频统计
分析器
1.编程用时: 1)计划用时:编码4小时; 调试3小时; 整理1小时; 2)实际用时:编码4小时; 调试6小时; 整理1.5小时; 2.性能测试: 3.测试样例: 1) 2) 3)
·
2015-11-08 16:02
分析
字典树 ZOJ1109 HDU1251 PKU1204 HDU1075
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-07 15:33
HDU
字典树
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-07 12:08
字典树
Trie树详解
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-07 10:34
trie
词频统计
工程有关
//=======================开始干之前======================= 模块Word Set 词表。Seek Files 搜索文件。Parse Files 分词记录。Sort and Print 排序打印。 打算用C++写预计8个小时能写完吧 //=======================开始干之后===================
·
2015-11-03 21:06
统计
词频统计
工程有关(2)
听说需求改了,那正好重新怒写一版。 一、首先是对于需求和基本方案: 重新列一下需求,国行中文版。 Word 单词定义: i.至少含有三个字符、且开头三个字符必须是字母; eg.hao123 == word;123hao!=word ii.不包含任何非字母或者数字的字符; 助教后来说这个本质就是认为除了
·
2015-11-03 21:06
统计
Homework01-Individual Project-Summary
现代软件工程课第一次作业: 个人项目——
词频统计
器(WordTally) 由于小组分好后大家商量决定要用 C# 来写最终的Team Project ,所以在完成个人作业的这一周我的时间规划如下
·
2015-11-03 21:06
project
软件工程基础-个人项目2014
项目要求:http://www.cnblogs.com/jiel/p/3978727.html 1.项目预计时间 虽然大二时java写过比这个复杂的
词频统计
程序,但是现在对c++或者c#都不熟,因此还是有一定挑战性
·
2015-11-02 16:18
软件工程
词频统计
工程的准备工作和实际完成情况
一、工程开始之前的初步预估 虽然以前基本没写过C#,对C#的语法了解甚少,但是基于以前写过一些java的代码已经两门语言间的一些类似性,在工程开始以前我还是做了一个预估和整体规划: ①由于个人习惯,先有一个Program类,作为整个工程的主类,通过方法调用完成整个过程。这部分应该不是一个太复杂的工作,预计时间不超过一小时,顺利的话半小时左右就够; ②主要工作由一个文件操作类来完成
·
2015-11-02 16:19
工作
第二次作业词频分析之王冬篇
(一) 一老师布置了
词频统计
及其拓展的作业,本来以为不是那么麻烦,用一些类方法就能搞定,结果发现想错了.首先悲剧的是装不上Vs2012.我试了很多次和很多办法 ,包括把所有的Vs2010卸载,安装4.5
·
2015-11-02 15:29
分析
词频统计
报告
里面有5个对正常的输入进行不同模式下
词频统计
的样例,一个样例针对中文输入统计,两个测试对“单词的判断
·
2015-11-02 15:12
统计
个人项目滴总结
写,而这两个以前几乎没有接触过,所以我计划阅读题目之后,对题目大概有了自己的想法之后,先是学习一下C#语言,大概一天的时间,方便写程序时好上手,然后,在计划完成项目时,计划把较大的时间用在写收集单词和
词频统计
方面
·
2015-11-02 14:16
总结
Daily Scrum 2012/12/04
组员 今天任务 明天任务 胡仁君 任务428 正文分词 任务429
词频统计
任务428 正文分词 任务429
词频统计
彭笑东 
·
2015-11-02 14:51
Scrum
Individual Project - Word frequency program
上课的时候第一次看到这个Project的题目,心中原有一点小窃喜,因为上学期面向对象课程上用java写过一个类似的关于
词频统计
的project,不过后来在老师的博客上看到具体的要求之后,发现我太天真了
·
2015-11-02 14:12
project
字典树(Trie树)
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-02 14:36
trie
c#
词频统计
命令行程序
这里将用c#写一个关于
词频统计
的命令行程序。 预计时间分配:输入处理3h、词条排序打印2h、测试3h。 实际时间分配:输入处理1h、词条排序打印2h、测试3h、程序改进优化6h。
·
2015-11-02 13:36
命令行
软件工程作业--
词频统计
预计用时:在刚接到这个作业的时候,根据上学期的经验,我预计完成这份作业需要的时间为:查找资料1小时,学习c#基础知识2小时,写代码4小时,调试测试1小时实际用时:但是,当我真正开始写这份作业之后,才意识到这次的作业远比我想象预计中的复杂,于是,等做完作业之后,我的实际用时是:查找资料2小时,学习c#基础知识2小时,写代码6小时……调试测试之类的2小时,再加上研究性能测试写测试用例用的2小时,总共完
·
2015-11-02 13:12
软件工程
个人项目之
词频统计
写在前面 这大概算是我第一次写博客。主要是对软件工程的第一次个人项目作一下总结,项目的具体要求见http://www.cnblogs.com/jiel/p/3978727.html 总的来说这次作业做的很虐心,但是能够总结点经验也算是对得起我前几天耗在这上面的时间。如果有错误,希望大家提出来,多多交流 ^-^ 项目时间预估 开发环境的搭建 2h
·
2015-11-02 13:19
项目
第一次软工:individual_project_word_frequency 也是第一次cnblogs
大二的时候跟刘超老师学习“面向对象建模”这门课,然后有一个小作业时要写一个
词频统计
器。
·
2015-11-02 12:20
project
Daily Scrum 2012/12/07
组员 今天任务 明天任务 胡仁君 任务428 正文分词 任务429
词频统计
彭笑东  
·
2015-11-02 10:02
Scrum
个人项目总结 By 张雄
内容是写一个
词频统计
的命令行程序。当然统计单词不涉及语义,只要是被非[A-Z a-z]的字符分开的都可以算为单词。实现的语言不限,我是用C#写的。
·
2015-11-02 10:13
总结
字典树
字典树,又称单词查找树,Trie树,是一种树形结构,典型应用是用于统计,排序和保存大量的字符串,所以经常被搜索引擎系统用于文本
词频统计
。
·
2015-11-02 10:48
字典树
词频统计
工程相关
(the format of this article is from SkYjoKEr) //=======================开始干之前======================= 模块1、WordClass 一个存放单词以及实现相关操作的类,其中单词以二元组<word, freq>的形式存储。 (20min) 2、WordCounter 完成单
·
2015-11-02 09:57
统计
初学Hadoop之中文
词频统计
1、安装eclipse 准备 eclipse-dsl-luna-SR2-linux-gtk-x86_64.tar.gz 安装 1、解压文件。 2、创建图标。 ln -s /opt/eclipse/eclipse /usr/bin/eclipse #使符号链接目录 vim /usr/share/applications/eclipse.d
·
2015-11-02 09:40
hadoop
初学Hadoop之WordCount
词频统计
1、WordCount源码 将源码文件WordCount.java放到Hadoop2.6.0文件夹中。 import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Pat
·
2015-11-02 09:39
wordcount
词频统计
工程部分心得
纠结了这么多天,终于能写点字出来了,我是有多不会写东西啊。。。 一、工程开始之前 没有着手开始码代码之前,我一直都很怀疑自己能不能在规定时间内把工程完成。在仔细思考过整个工程的实现方法后,我大致预计的使用时间为: ①一个主类,仅包含一个Main方法,处理和输出结果;(半小时) ②一个fileoperate类,顾名思义,用作文件处理,包括findallfiles方
·
2015-11-02 09:43
心得
软工
词频统计
总结<原来文章是看不到的,随笔才行>
首先是需求分析与时间预算: 读需求分析30分钟;思考算法1小时;写代码,查询资料半天;软件优化半天。 实际上一共用了我将近两天的时间。主要是开始需求分析理解的有点偏差,写出的第一个版本删除了很多符合条件的单词。 同时单词的排序有问题。之后再MSDN读文档发现使用map输出的就是按字典序排好的,省去了很多的麻烦。 再之后在控制台转到命令行是出现了问题,一直报错,是Directory()函数的
·
2015-11-01 15:44
总结
软工
词频统计
小结<原来文章是看不到的,随笔才行>
周一老师布置了
词频统计
及其拓展的作业,本来以为不是那么麻烦,用一些类方法就能搞定,结果发现想错了.
·
2015-11-01 15:43
随笔
【tips】【
词频统计
】中可能用到的资源,以C++为例
前言 我不知道C#什么情况,不过C++里面,什么参数都不传时,argc=1,argv里面是当前程序名。当你传入dir时,argc=2,当你传入-e dir时,argc=3。 这个文章十分适合有一点C语言基础,然后想自己独立完成这个作业的童鞋。预计只有一点点C语言基础的童鞋只需要5个小时左右就能搞定~ 如果有帮助请点赞。。还有哦。。blog里肯定不能给出代码的是吧,blog里面
·
2015-11-01 14:49
tips
Individual Project - Word frequency program
第一次软件工程作业,要写个
词频统计
。鉴于之前(包括现在)还不太会C#,开始以为写起来会很困难,实际操作并没有开始想的那没困难,虽然也不是那么轻松。 在开始工作之前估计是用时间是大概整个一周??
·
2015-11-01 14:16
project
海量数据处理之Tire树(字典树)
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是
·
2015-11-01 14:48
海量数据
使用Actor模型对
词频统计
程序进行多线程优化
词频统计
程序是一个相当简单的程序:它读一个文件夹里的所有指定类型的文件,统计其中出现的英文单词的次数,并排序输出。 但是它却有很大的优化余地,甚至可以分布式到多台机器中(Map-Reduce模型)。
·
2015-11-01 13:21
多线程
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他