E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词频统计
python复合数据类型以及英文
词频统计
这个作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753。1.列表,元组,字典,集合分别如何增删改查及遍历。列表操作如下所示:#列表string='list'#字符串->列表list1=list(string)#['l','i','s','t']#列表->字符串string1=''.join(list1)#lis
buildings
·
2019-03-25 21:00
中文
词频统计
与词云生成
中文
词频统计
:作业连接:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/28221.下载一长篇中文小说。2.从文件读取待分析文本。
linSeek
·
2019-03-25 19:00
课后作业3:个人项目(
词频统计
及其效能分析)
1)博客开头给出自己的基本信息,格式建议如下:学号:2017****7217;姓名:卢冠宇本次作业码云:https://gitee.com/The_Old_Cousin/word_frequency_count/tree/master2)程序分析,对程序中的四个函数做简要说明。要求附上每一段代码及对应的说明。1usingMicrosoft.Win32;2usingSystem;3usingSyst
老表弟OvO
·
2019-03-23 23:00
中文
词频统计
(2)生成
词频统计
(3)排序(4)排除语法型词汇,代词、冠词、连词等停用词。(5)输出词频最大TOP20,把结果存
sakitam!
·
2019-03-18 21:00
使用jieba分词对文档进行
词频统计
1.对CSV文件进行处理步骤2.对TXT文件进行处理步骤3.进行分词处理4.保存文件为CSV5.效果展示
阿清_bd8d
·
2019-03-13 20:35
Hadoop之
词频统计
WordCount
参考文章:Ubuntu16.04安装Hadoop单机和伪分布式环境超详细1.启动HDFSstart-all.sh2.查看HDFS下包含的文件目录hadoopdfs-ls/由于是第一次运行,没有文件3.在HDFS中创建一个文件目录input,将/usr/local/hadoop/README.txt上传至input中,此时再用ls查看就发现多了个input目录hdfsdfs-mkdir/inputh
倏然希然_
·
2019-03-06 21:14
hadoop
大数据
Trie 简介
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。
|旧市拾荒|
·
2019-02-20 17:00
中国大学MOOC课程《Python语言程序设计》第6章 文本
词频统计
hamlet代码及解析
以下内容为嵩天老师在课堂上讲解的,为方便童鞋们拷贝,我把代码及解析放到下面:defgetText():txt=open("hamlet.txt","r").read()#以只读方式打开这个文件txt=txt.lower()#将所有字符转化为小写forchin'!"#$%&()*+,-./:;?@[\\]^_’‘“”{|}~`':#将所有特殊符号替换为空格txt=txt.replace(ch,'')
qlovepeng1314
·
2019-02-12 00:05
python
training
从文本中提取单词生成单词本
词频统计
及单词提取对一段英文文本做
词频统计
,提取单词,查词,最终生成一个单词本,生成的单词本可以导入Anki中学习。问题分析考虑到单词的变形,分词后先做词形还原,之后再进行
词频统计
。
木华生
·
2019-02-06 16:35
字典树(Trie树):应用于统计和排序
典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本
词频统计
。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie的核心思想是空间换时间。
Csoap994
·
2019-02-02 15:57
数据结构
基于Python的文本分析
Python编程语言可以做到快速高效地对不同语言的文献进行
词频统计
,获取高频词,从而体现文献资料中的主旨。Python是一种面向对象编程语言,语法简洁清晰,是目前最受欢迎
青春不迷、夜半听雨
·
2019-01-23 18:17
Python学习馆
Python学习馆
python爬取数据并存入excel
爬虫存入excel项目需求公司的爬虫项目:爬取数据,以满足文本分析,
词频统计
的需要。由同事整理好所需链接存入excel,我直接打开连接,爬取网站数据。
Not丶Perfect
·
2019-01-17 15:51
文本挖掘
PYTHON
课堂练习:用户场景与体验
典型用户:文字工作者、高校学生、教师功能线索:1、实现中、英文单词总数统计,及单词
词频统计
,数据能保存;2、将热点词汇及对应词频生成柱状图,图表能保存;3、划词统计:后台运行时,选定文本特定区域(任意文本区域
严康为
·
2019-01-17 09:00
spark编程实战(四) ——
词频统计
(WordCount)和 Top K
最近正在看《Spark大数据处理:技术、应用与性能优化》这本书,然后对于最后一章的编程实战比较感兴趣。但是上面写的算法个人觉得还不是很简洁,无法体现出scala的优点,所以稍作了一些修改,仅供参考。TopK算法有两步,一是统计词频,二是找出词频最高的前K个词。1.实例描述假设取Top1,则有如下输入和输出。输入:HelloWorldByeWorldHelloHadoopByeHadoopByeHa
BigCabbageFy
·
2019-01-08 20:49
spark
Trie树分词
Trie树也称字典树,能在常数时间O(len)内实现插入和查询操作,是一种以空间换取时间的数据结构,广泛用于
词频统计
和输入统计领域。Ansj作者
weixin_33701294
·
2019-01-08 07:21
java
数据结构与算法
第2次作业(个人项目):
词频统计
-PSP设计
一、团队介绍合作人:严康为、崔峰瑞合作人情况简介:见文末分工安排:基本功能点:各自完成升级功能点:严康为完成1、2,崔峰瑞完成3二、项目计划功能点说明:基本功能点:设计一个控制台程序,用于统计一个TXT文档(例如input.txt)中的以下几个指标:1、统计文件的字符数:只需要统计ASCII码,汉字不需考虑。空格,水平制表符,换行符,均算字符。2、统计文件的单词总数,单词:以英文字母开头,跟上字母
严康为
·
2019-01-03 09:00
NABCD
N(Need需求)此次项目的需求为学生,老师,图书管工作人员等人创建一个具有
词频统计
功能的程序项目,可以检索自己所需要的数据信息所出现的个数,以减轻工作上带来的一些不便。
BUBBLE睿
·
2018-12-26 10:00
博客一
GIT地址:https://gitee.com/Helen_en/practical_training_two博客地址:https://i.cnblogs.com/组内合照:项目名称:
词频统计
队员风采:
BUBBLE睿
·
2018-12-26 10:00
COCA 词频表使用
神奇的是,我在以前的英语学习时从没接触过这个目前可以说是最知名的英语词汇
词频统计
库,虽然目测词汇量尚可,但是这个也不是绝对准确的,因为我测的时候感觉差不多认识的单词我就勾了,所以结果肯定有不少水分,而且统计方法还因人而异吧
juniway
·
2018-12-26 08:29
python 文本单词提取和
词频统计
的实例
这些对文本的操作经常用到,那我就总结一下。陆续补充。。。操作:strip_html(cls,text)去除html标签separate_words(cls,text,min_lenth=3)文本提取get_words_frequency(cls,words_list)获取词频源码:classDocProcess(object):@classmethoddefstrip_html(cls,text)
超级杰哥
·
2018-12-22 09:56
《十小时入门大数据》学习笔记之Hadoop核心组件MapReduce
目录MapReduce概述MapReduce编程模型2.1案例分析:WordCount=>
词频统计
2.2执行步骤MapReduce架构3.1MapReduce1.x的架构3.2MapReduce2.x架构
腊月的梅花
·
2018-12-19 17:35
2018-12-12
词频统计
Hamlet
词频统计
(含Hamlet原文文本)#CalHamletV1.pydefgetText():txt=open("hamlet.txt","r").read()txt=txt.lower()forchin
子小亦大
·
2018-12-16 16:47
2018-12-12
词频统计
Hamlet
词频统计
(含Hamlet原文文本)#CalHamletV1.pydefgetText():txt=open("hamlet.txt","r").read()txt=txt.lower()forchin
子小亦大
·
2018-12-16 16:47
第一次实训
gitee.com/bhma/first_training/tree/master小组成员:16012115白惠民(领航员)16012122齐洪飞(驾驶员)2.我们编程时候的图片:3.我们选择的是第二道题:2.
词频统计
HM"
·
2018-12-13 15:00
词频统计
------实训一
词频统计
老五在寝室吹牛他熟读过《鲁滨逊漂流记》,在女生面前吹牛热爱《呼啸山庄》《简爱》和《飘》,在你面前说通读了《战争与和平》。但是,他的四级至今没过。
lixuell
·
2018-12-11 15:00
实训一——
词频统计
1.学号:16012019姜海睿16012006刘晨GIT的提交地址:https://gitee.com/bubblerui/0619/tree/master2.实训照片3.本次作业的解题思路老五在寝室吹牛他熟读过《鲁滨逊漂流记》,在女生面前吹牛热爱《呼啸山庄》《简爱》和《飘》,在你面前说通读了《战争与和平》。但是,他的四级至今没过。你们几个私下商量,这几本大作的单词量怎么可能低于四级,大家听说你
BUBBLE睿
·
2018-12-11 15:00
软工作业 5:结对项目之
词频统计
——增强功能
一、基本信息1、编译环境:python3.6、pycharm2、结对成员:1613072032-赵亦明、1613072033-王楠楠3、本次作业的地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2300二、项目分析1、接口封装—将基本功能封装成函数importreclassworkCount:defproces
萸凉
·
2018-11-30 15:00
作业 5:
词频统计
——增强功能
一、基本信息1.1本次作业地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/20881.2项目的Git地址:https://gitee.com/ntucs/PairProg1.3合作:1613072005蒋晓明1613072006陈扬二、项目分析程序运行模块(方法、函数)介绍Task1:接口封装——将基本功能封
魔鬼筋肉银
·
2018-11-30 15:00
软工作业 5:结对项目之
词频统计
——增强功能
一、基本信息1、编译环境:Python3.8、Pycharm2018项目:结对项目之
词频统计
——增强功能作者:1613072007周磊1613072008俞林森2、本次作业地址:https://edu.cnblogs.com
俞林森
·
2018-11-30 15:00
2018(秋)软工作业 5:结对项目之
词频统计
——增强功能
一、基本信息(1)编译环境:python3.7.1、pycharm2018(2)结对同学:1613072013刘赛、1613072011蒋兆丰(3)本次作业地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2088(4)项目Git地址:https://gitee.com/ntucs/PairProg/tree/S
刘赛
·
2018-11-30 15:00
作业 5:
词频统计
——增强功能
一、基本信息(一)本次作业的地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2300(二)项目Git的地址:https://gitee.com/ntucs/PairProg/tree/SE016_017(三)开发环境:Pycharm2018、Python3.6(四)结对成员:1613072016高耀、16130
高耀
·
2018-11-30 13:00
结对项目之
词频统计
——增强功能
一、基本信息1.1作者及其他#编译环境:pycharm2017python3.6#项目:结对项目之
词频统计
——增强功能#作者:1613072034陈原#1613072035周怡峰#编程日期:2018年11
通大Kennys
·
2018-11-30 12:00
使用Spark Streaming完成
词频统计
,并将结果写入到MySQL数据库中
首先在maven工程的pom.xml文件加入以下依赖:2.2.0org.apache.sparkspark-streaming_2.11${spark.version}org.apache.sparkspark-sql_2.11${spark.version}ForeachRDDApp.scalapackagesparkimportjava.sql.DriverManagerimportorg.a
29DCH
·
2018-11-28 21:33
Scala学习
大数据平台Spark生态系统
BigData
Spark
Streaming
使用Spark Streaming完成
词频统计
,并将结果写入到MySQL数据库中
首先在maven工程的pom.xml文件加入以下依赖:2.2.0org.apache.sparkspark-streaming_2.11${spark.version}org.apache.sparkspark-sql_2.11${spark.version}ForeachRDDApp.scalapackagesparkimportjava.sql.DriverManagerimportorg.a
29DCH
·
2018-11-28 21:33
Scala学习
大数据平台Spark生态系统
BigData
Spark
Streaming
使用Spark Streaming整合Spark SQL完成
词频统计
操作
首先在maven工程的pom.xml文件加入以下依赖:2.2.0org.apache.sparkspark-streaming_2.11${spark.version}org.apache.sparkspark-sql_2.11${spark.version}SqlNetworkWordCount.scalapackagesparkimportorg.apache.spark.SparkConfi
29DCH
·
2018-11-28 21:34
Scala学习
大数据平台Spark生态系统
BigData
Spark
Streaming
Python实例--文本
词频统计
今天所记得是文本
词频统计
-Hamlet文本
词频统计
。英文文本Hamlet
词频统计
文件链接:https://python12
安静的奋斗着丶
·
2018-11-22 11:47
Python语言
爱丽丝梦游仙境---python云图
目录WordCloud功能文章和底片来源无底片云图有底片云图中文云图WordCloud功能(1)文本预处理(2)
词频统计
(3)将高频词以图片形式进行彩色渲染文章和底片来源https://github.com
水木本源
·
2018-11-09 18:22
数据清洗
python进行数据分析
词频统计
词频统计
:"""@file:cipin.py@Time:2018/11/08@Author:hnq"""importos,codecsimportjiebafromcollectionsimportCounterdefget_words
Doris_H_n_q
·
2018-11-08 22:55
自然语言处理
词频统计
词频统计
:"""@file:cipin.py@Time:2018/11/08@Author:hnq"""importos,codecsimportjiebafromcollectionsimportCounterdefget_words
Doris_H_n_q
·
2018-11-08 22:55
自然语言处理
基于spark streaming的流数据处理和分析
Streamcontext相当于sparkcontext做实时处理就得用到setup之后如果close你需要重新创建一个,重启是不行的
词频统计
,streamcontextssc.start()执行之后,
null_水金admin
·
2018-11-06 14:15
大数据的点点滴滴
汉字分词
3:
词频统计
。种种,说白了就是让文章变成一个个词语,使得能够操作。(3)有什么方法?1-基于词表(1)最大匹配法正向最大匹配(MM)反向最大匹配(RMM)长词优先。
Milkmilkmilk
·
2018-11-04 21:01
第二次结对编程-
词频统计
我们小组使用python完成本次作业,采取分工的方式,其中我负责初期的功能实现,队友负责后期的性能改善和测试。代码发布在了:https://github.com/Turtlesyu-27/ASE_Course/blob/master/pairProject2/main.py我们约定了一个时间来讨论本次实现,包括:具体实现什么样的功能和大致思路、每个人负责的模块和功能、接口形式等细节。为了实现好的性
于达
·
2018-11-03 16:00
软件工程之
词频统计
词频统计
:https://www.cnblogs.com/xinz/archive/2011/11/27/2265000.html代码:https://github.com/jackroos/word_frequencyhowyoucollaborate
kangnichaluo
·
2018-11-03 16:00
第二次结对编程
我和队友在一周的时间内完成了“
词频统计
”程序的编写、调试与性能优化。
RubikCube!!!
·
2018-11-03 15:00
Week3 结对编程总结-
词频统计
Week3结对编程总结-
词频统计
这篇总结是关于上周的结对编程作业(
词频统计
)的一个总结。文中会大致介绍我们组的任务、分工方式、实现的细节,过程中遇到的问题及解决方法,和自己和收获与感悟。
azshue
·
2018-11-03 15:00
AIMER天猫商城数据分析
第一部分、商品名称、类目、价格分布分析1、对TOP60商品名称进行
词频统计
,高频词汇如下高频词汇.png从这些高频词汇中可以看出,消费者在选择内衣时更喜欢性感的款式,有聚拢功能及蕾丝装饰;而针对内裤而言
大力SAMA
·
2018-10-24 16:28
软工作业4:
词频统计
一、基本信息#编译环境:Pycharm2018、Python3.7#项目名称:
词频统计
——基本功能(结对编程)#作者:1613072050:马钰#1613072051:朱佳豪#1613072052:申可佳二
软嵌162-朱佳豪
·
2018-10-21 16:00
作业4:
词频统计
——基本功能
一、基本信息1.本次作业的地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/20882.项目Git的地址:https://gitee.com/ntucs/PairProg/tree/SE016_0173.开发环境:Pycharm2018、Python3.64.结对成员:1613072013刘赛、161307201
刘赛
·
2018-10-21 14:00
软工作业 4:结对项目之
词频统计
——基本功能
一、基本信息1.1本次作业地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/20881.2项目的Git地址:https://gitee.com/ntucs/PairProg1.3合作:1613072005蒋晓明1613072006陈扬二、项目分析2.1程序运行模块(方法、函数)介绍Task1:基本任务(1)统计文
魔鬼筋肉银
·
2018-10-21 14:00
作业
词频统计
——基本功能
一、基本信息作业地址:https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2088项目git地址:https://gitee.com/ntucs/PairProg/tree/SE032_033/结对成员:1613072032赵亦明1613072033王楠楠二、项目分析2.1程序运行模块(方法、函数)介绍2.2.1读取文件
萸凉
·
2018-10-21 10:00
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他