E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
jieba
python学习第三天
目录1.利用
jieba
和词云做三国人物TOP10的词云图2.匿名函数和列表推导式3.正弦余弦曲线图,柱状图,饼图,散点图内容利用
jieba
和词云做三国人物TOP10的词云图代码:importimageioimport
jieba
fromwordcloudimportWordCloudmask
不困_4d49
·
2023-11-03 19:45
16.pyecharts词云图
的时候,容易出现问题.参考链接:https://blog.csdn.net/weixin_45231460/article/details/104273699安装方法参考:importjsonimport
jieba
importmatplotlib.pyplotasp
无聊的兔子
·
2023-11-03 08:42
python数据挖掘之中文分词和可视化展示(NLP应用初探)
本文用到两个第三方库,
jieba
、wordcloud、numpy,推荐pip方式安装(如命令行下:pipinstallji
小白学习手帐
·
2023-11-02 21:54
python实现词云及导出词频到excel
实现词云及导出词频到excel需要用到的几个包停顿词的更新词频的汇总及排序将词频打出到excel词云部分完整代码输入的文字结果展示文件结构需要用到的几个包importwordcloudaswcimport
jieba
fromPILimportImageimportnumpyasnpimportmatplotlib.pyplotaspltf
soul,,,明灵
·
2023-11-02 20:22
瞎搞
python
开发语言
numpy
解决WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conn
afterconnectionbrokenby‘SSLError(SSLEOFError(8,‘EOFoccurredinviolationofprotocol(_ssl.c:1129)’))’:/simple/
jieba
东东啊zsy
·
2023-11-02 17:16
python
使用
jieba
、wordCloud制作自定义形状的中文词云
工具集1.Python:https://www.python.org/downloads/release/python-374/2.结巴中文分词
jieba
3.词云生成wordCloud4.在线抠图,抠出想要的词云形状
yielruse
·
2023-11-01 21:43
python学习 - day3
1、三国演义Top10人物分析import
jieba
fromwordcloudimportWordCloudimportimageio#1.读取小说内容withopen('.
小猫咪拍案而起
·
2023-10-31 13:23
sklearn适配版本
cycler0.11.0fonttools4.31.2
jieba
0.42.1joblib1.3.1kiwisolver1.4.4matplotlib3.5.2mysql-connector-python8.0.30numpy1.22.4packaging23.1pandas2.0.3Pillow10.0.0pip23.1.2psutil5.9.5py4j0.10.9.5pyparsing3.1.0
MARSERERER
·
2023-10-31 11:02
sklearn
人工智能
python
我用python分析王冰冰B站视频,和冰冰一起逛北京!!
]完整代码#大作业b站弹幕分析系统fromimageioimportimread#加载图片importrequests#发出请求importcsv#文件格式importre#正则表达式筛选import
jieba
Cache_wood
·
2023-10-30 16:06
[nlp] 小傻学数据预处理
[nlp]小傻学数据预处理1.分词1.1分词方法1.1.1基于规格(词典、词库)1.1.2基于知识理解1.1.3基于(词频)统计1.2分词工具1.3
jieba
分词原理1.3.1前缀词典1.3.2有向无环图生成
邓蹇超
·
2023-10-30 10:28
nlp
自然语言处理
nlp
人工智能
算法
Docker 部署 elasticsearch + kibana + 分词器(版本7.7.0)
相关官方链接:es7.7文档docker部署es7.7文档docker部署kibana7.7文档elasticsearch
jieba
elasticsearch_ik自说自话好像es和kibana都可以设置账户
Abandon_first
·
2023-10-30 00:49
elasticsearch
elasticsearch
docker
kibana
中文分词库-
jieba
问题1:(8分)用
jieba
分词,计算字符串s中的中文词汇个数,不包括中文标点符号。显示输出分词后的结果,用”/”分隔,以及中文词汇个数。
greatau
·
2023-10-29 08:07
计算机等级二级Python
中文分词
自然语言处理
算法
python
开发语言
全国计算机等级考试
人工智能
深度学习(2):中文分词(
jieba
)(Tensorflow)
目录中文分词的难点中文分词方法简单使用三种分词模式结巴分词使用结巴分词使用目前中文分词一共有三种方式进行实现:
jieba
(结巴分词)THULAC(清华大学自然语言处理与社会人文计算实验室)pkuseg(
牧子川
·
2023-10-27 16:31
深度学习
中文分词
自然语言处理
nlp
NLP自然语言处理之AI深度学习实战-分词:
jieba
/Stanford NLP/Hanlp-01
分词、词性标注及命名实体识别介绍及应用分词中文分词(ChineseWordSegmentation)指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。中文/n分词/n是/v其他/p中文/n(信息,n)处理/v的基础,搜索引擎、机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到分词。词性标注词性标注(Part-of-Spee
gemoumou
·
2023-10-27 16:30
人工智能
自然语言处理
机器学习
编程语言
java
python学习的第3天
/novel/threekingdom.txt','r',encoding='utf-8')asf:words=f.read()分词words_list=
jieba
.lcut(words)每个词出现的次数
2016计师文进
·
2023-10-27 00:25
Python通过pyecharts对爬虫房地产数据进行数据可视化分析(一)
库:numpy、pandas、pyecharts、
jieba
图形:Bar(柱状图)、Pie(饼图)、Histogram
rubyw
·
2023-10-26 17:17
数据分析
Python网络爬虫入门到实战
python
爬虫
pandas
数据分析
数据可视化
文本多任务分类
导入工具包:importh5pyimport
jieba
asjbimportnumpyasnpimportkerasask
远洋之帆
·
2023-10-26 01:45
机器学习
python问答系统实践
分词这边我喜欢用的两个分词包,一个是
jieba
,另一个是foolnltk首先看
jieba
的用法raw=open(u'..
幻影123!
·
2023-10-25 22:57
NLP
知识图谱
自然语言处理
自然语言处理
知识图谱
知识推理
python
中文分词
python实验12_中文文本分析
实验12:中文文本分析1.实验目标及要求(1)掌握
jieba
库的常用方法。(2)掌握使用WordCloud库绘制词云的方法。(3)掌握使用networkx库绘制关系图的方法。
生而逢时
·
2023-10-24 21:21
课程设计和实验报告
1024程序员节
开发语言
笔记
python
其他
Python学习笔记4---IDLE快捷键和python库纵览
快捷键一、python库二级考试中标准库是必考的,PyInstaller、
jieba
也在必考的范围里,其他的第三方库虽然不会细考怎么用,但也会考到,一般就是考
老鲤
·
2023-10-24 20:20
Python文本聚类分析
常见的文本预处理方法有:1、去除停用词和标点符号,如“的”、“了”等,可以减小文本的维度,加快计算速度;import
jieba
importre#去除停用词和标点符号defc
api_ok
·
2023-10-24 19:07
1024程序员节
大数据
数据分析
java
开发语言
python
python数据可视化热度词云
目录一.项目简介1.词云2.wordcloud介绍3.数据二.项目实施步骤1.安装相应的第三方库2.导入相关的模块3.读取爬取的数据4.创建热度统计函数5.使用
jieba
分词器分词6.热度统计代码及结果
db-冯春香-2064
·
2023-10-24 01:59
python
python
pip
pandas
大数据
Spark系列之(五)——案例一:搜索引擎日志分析
1.数据描述2.业务分析3.
jieba
入门4.需求1:搜索关键词统计5.需求2:用户和关键词组合分析6.需求3:热门搜索时间段7.提交集群运行
浩 k
·
2023-10-23 05:58
大数据
spark
spark案例分析-搜索引擎日志分析案例
utf8frompysparkimportSparkConf,SparkContextfrompyspark.storagelevelimportStorageLevelfromdefsimportcontent_
jieba
菜鸟一千零八十六号
·
2023-10-23 05:54
spark
c#
大数据
Python切词
Python中有很多成熟的中文分词工具和库,比如:
jieba
:是目前最流行的中文分词工具之一,支持中、英文分词和词性标注,开源免费。
r_martian
·
2023-10-20 19:12
Python与网络爬虫
python
切词
中文分词
如何在
jieba
分词中加自定义词典_常见中文分词包比较
1
jieba
jieba
.cut方法接受三个输入参数:需要分词的字符串;cut_all参数用来控制是否采用全模式;HMM参数用来控制是否使用HMM模型
jieba
.cut_for_search方法接受两个参数
weixin_39771791
·
2023-10-20 12:16
文本分类
1、首先使用
Jieba
分词工具将文本进行分词segment,得到。2、分别针对分词后的文本和类别构建字典dictX和dictY,构建词典就相当于给所有词汇添加索引index,给类别标序号。
是小橙子呀
·
2023-10-19 22:16
Python实战:打造属于你的词云图生成器
首先,我们需要安装Python的两个库,分别是
jieba
和wordcloud。
jieba
库是中文分词库用于对文本进行分词处理;wordcloud
代码编织匠人
·
2023-10-19 10:04
python
开发语言
python初级教程 doc_3分钟教你用python制作一个简单词云|python基础教程|python入门|python教程...
https://www.xin3721.com/eschool/pythonxin3721/首先需要安装三个包:#安装:pipinstallmatplotlib#安装:pipinstall
jieba
#安装
weixin_39538536
·
2023-10-19 07:09
python初级教程
doc
python制作的简单程序_python制作一个简单词云
首先需要安装三个包:#安装:pipinstallmatplotlib#安装:pipinstall
jieba
#安装pipinstallwordcloud1.制作英文字母的词云效果图:代码实现:importmatplotlib.pyplotaspltimport
jieba
fromwordcloudimportWordCloud
Lin jk
·
2023-10-19 07:38
python制作的简单程序
《你好,旧时光》数据分析
用到的技术聚类分析wordcount工具包词云主要函数
jieba
工具包,分词函数停用词实验步骤实验步骤tf-idf主题模型图解LDALDA生成过程实验内容代码如下,完整版https://download.csdn.net
撸码的xiao摩羯
·
2023-10-18 20:29
Python
java
开发语言
NLP学习------HanLP使用实验
我跟据词向量的作者[6]所使用的分词工具来分词,会比不同工具(
jieba
)的效果要好,因为都是同一模式的分词,分出来的词应该都会存在于大型语料库中。
gladosAI
·
2023-10-18 12:03
NLP
NLP
hanlp
jieba
2020-02-14:伯禹打卡笔记
伯禹文本预处理课程学习文本预处理一般的文本预处理步骤:分词(中英文不同,中文分词难度大一些,有一些分词工具:spaCy、NLTK、
jieba
等,还可以在分词之后去除停用词等,根据语料及使用场景决定)词的向量表示
hc2zzcj
·
2023-10-15 04:38
golang实现中文分词,scws,
jieba
一、scws1、安装scws官网以及文档https://github.com/hightman/scwswget-q-O-http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2|tarxjf-cdscws-1.2.3./configure--prefix=/usr/local/scws--enable-sharedmake&&makeinstal
raoxiaoya
·
2023-10-15 00:26
golang
golang
中文分词
开发语言
如何使
jieba
自定义词典持久化
jieba
分词是利用python进行自然语言处理中必不可少的常用工具,添加自定义词典也是
jieba
分词中的的常用功能。
菜菜鑫
·
2023-10-14 17:13
计算机毕业设计Python+Flask+LSTM招聘爬虫可视化大数据分析系统
3Python所需的库:flask、pymysql、pandas、numpy、time、datetime、requests、etree、
jieba
、re、json、decimal(没有的话pip或conda
计算机毕业设计大神
·
2023-10-14 16:49
Python【
jieba
】词性标注表
文章目录
jieba
词性标注表(0.39版)读取
jieba
词库,生成词性标注表,保存为excel带词性的分词词与词性间映射en2cn字典映射0.42版后paddle模式词性和专名类别标签其它词性标注表nltk
小基基o_O
·
2023-10-14 15:18
自然语言处理
自然语言处理---------
jieba
调整词频与词性标注
寻找志同道合的朋友如果觉得有帮助记得一键三连┗|`O′|┛嗷~~有些句子中出现了一些词语,但是被分开为两个单独的字,虽然这样可以调整词库,只需要重新加载自定义的词库即可,除此之外我们还可以用”调整词频来解决这个问题”import
jieba
import
jieba
.possegaspg
不良使
·
2023-10-14 15:45
python
自然语言处理
python
自然语言处理
python:
jieba
分词+词性标注
python:
jieba
分词+词性标注处理数据
jieba
分词导入相关包创建停用词
jieba
.cut分词进行词性标注文件读取写入做实验室的一个项目,暂时要做的内容:对文本数据作摘要(<8)。
Cactus_xixi
·
2023-10-14 15:14
python
python
自然语言处理
【自然语言处理】-
jieba
库学习笔记(二)
jieba
三种分词方法精确模式精确模式将句子最精确的切分开,每个词都只有一种含义。
勤奋努力的野指针
·
2023-10-14 15:42
python
python
自然语言处理
python
jieba
词性标注 中文词性分类 nlp
jieba
.posseg
参考:https://blog.csdn.net/yellow_python/article/details/83991967from
jieba
.possegimportdtdt.word_tag_tab
mohana48833985
·
2023-10-14 15:39
python
自然语言处理
开发语言
TypeError: parse() got an unexpected keyword argument 'transport_encoding'
在anaconda3环境下,安装
jieba
词库,在cmd下输入pipinstall
jieba
,出现提示:TypeError:parse()gotanunexpectedkeywordargument'transport_encoding
3f31023436c0
·
2023-10-14 13:14
在Hanlp词典和
jieba
词典中手动添加未登录词
在使用Hanlp词典或者
jieba
词典进行分词的时候,会出现分词不准的情况,原因是内置词典中并没有收录当前这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作呢,下面我们来看一下
lanlantian123
·
2023-10-14 04:51
文本向量化方法比较:tf-idf、doc2bow、doc2vec、lsi、lda
效果时好时坏,偶然性大,不稳lsi、lda效果好且较稳,但lda计算量偏大fromgensim.modelsimportdoc2vecfromgensimimportcorpora,modelsimport
jieba
帅气的学术狗
·
2023-10-13 14:48
python借助
jieba
、addressparser第三库准确提取省市区地址
内容包含“地址”一列,我想提取省市区三个部分的内容总体思路:---------->(1)安装jiabapipinstall-ihttps://pypi.mirrors.ustc.edu.cn/simple/
jieba
weixin_43718742
·
2023-10-13 02:33
python
开发语言
后端
Python利用
jieba
分词提取字符串中的省市区(字符串无规则)
目录背景库(
jieba
)代码拓展结尾背景今天的需求就是在一串字符串中提取包含,省、市、区,该字符串不是一个正常的地址;,如下字符串"安徽省、浙江省、江苏省、上海市,冷运标快首重1kg价格xx元,1.01kg
一晌小贪欢
·
2023-10-13 02:59
自己的笔记
python
windows
开发语言
Python词频统计——《红楼梦》人物出场次数统计
目录代码实现运行结果代码讲解代码实现import
jieba
asjnames=['贾母','贾珍','贾蓉','贾赦','贾政','袭人','王熙凤','紫鹃','翠缕','香菱','豆官','薛蝌','
Corone
·
2023-10-12 21:22
#
Python词频统计
python
python通过tkinter制作词云图工具
本地上传的图片需要进行抠图处理,并将抠图结果保存到本地4.背景图形颜色可通过调节RGB值和十六进制颜色值的方式进行设置5.绘制好的词云图可供预览,并且可保存到本地二、python程序importreimportioimport
jieba
黑小慕
·
2023-10-12 15:01
python
python
开发语言
【问题】WARNING: There was an error checking the latest version of pip.
目录1、问题描述:2、解决办法:3、结果:参考文献:1、3、4可以解决问题今天在学习NLP是需要安装
jieba
库和word2vec库,但是在安装的时候出现了一下问题。
空城老祖
·
2023-10-11 22:17
Bug
pip
词云图大揭秘:如何从文本中挖掘热点词汇?
废话不多说,直接上源码:一、源码import
jieba
importmatplotlib.pyplotaspltimportrefromwordcl
White-Legend
·
2023-10-11 14:00
人工智能
python
数据挖掘
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他