E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
jieba
jieba
库里的字典常用的各词性
本文详细介绍了
jieba
库里的字典中常用的各词性一常用词性介绍1.名词(n):用于指示人、事、物或抽象概念的词汇。1.1人名(nr)在
jieba
库中,词性标注中的nr表示人名。
Algorithm_Engineer_
·
2024-01-19 22:56
python
python期末:常见模块的使用及计算生态
A.
Jieba
B.SnowNLPC.LosoD.TensorFlow4.以下关于
illusionbigdata
·
2024-01-19 16:11
python
python
开发语言
hanlp,pkuseg,
jieba
,cutword分词实践
总结:只有
jieba
,cutword,baidulac成功将色盲色弱成功分对,这两个库字典应该是最全的hanlp[持续更新中]https://github.com/hankcs/HanLP/blob/doc-zh
回到工作狂状态
·
2024-01-19 13:08
分词
NLP
基于网络爬虫的微博热点分析,包括文本分析和主题分析
为了更好地理解微博热点话题,我们采用LDA主题分析方法,结合
jieba
分词工具将文本分割成有意义的词语。此外,我们还使用snownlp情感分析库来评估微博热点话题的情感倾向。
叫我:松哥
·
2024-01-19 09:15
爬虫
信息可视化
python
网络爬虫
Python(wordcloud):根据词频信息(xlsx、csv文件)绘制词云图
二、安装并引入相关的库1、安装相关的库pipinstall
jieba
pipinstallmatplotlibpipinstallwordcloudpipinstallnumpypipinstallImagepipinstallpandas2
十八只兔
·
2024-01-18 15:22
Python
python
pandas
wordcloud
词云图
激光雷达植被叶片入射角效应/地基高光谱激光雷达植被叶片入射角效应
2.Poullain模型3.KaiTan等多项式模型4.Kaasalainen等提出的改进的与波长相关的Poullain模型5.
JieBa
i等提出入射角效应满足同时与波长和入射角大小相关的改进的Poullain
B博士
·
2024-01-18 14:29
激光雷达
遥感
激光雷达
入射角效应
植被叶片
Poullain模型
Beckmann定律
Python文本向量化入门(四):中文词袋问题
因为之前的学习中发现Scikit-learn的CountVectorizer不支持中文分词,所以在本篇文章中,我们将介绍如何使用
jieba
分词和Scikit-learn的CountVectorizer进行中文文本的特征提取
Dxy1239310216
·
2024-01-17 17:04
Python
python
开发语言
毕业设计:基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法(源码)✅
1、项目介绍技术栈:Python语言+Django框架+数据库+
jieba
分词+scikit_learn机器学习(K-means聚类算法)+
vx_biyesheji0001
·
2024-01-15 14:44
biyesheji0001
biyesheji0002
毕业设计
python
算法
课程设计
大数据
毕业设计
django
kmeans
2018-10-27
Python文本词频统计:英文文本需将字母变小写并将特殊字符和标点符号替换成空格再提取单词,而中文文本需先用
jieba
库分词。
5c8e2b8217ae
·
2024-01-15 12:32
【迅搜16】SCWS分词(一)概念、词性、复合分词等级
即使你将来要用
Jieba
分词或者IK分词,它们所有的原理和SCWS都是大差不差的。其实之前已经说过一点分词的问题了,这回咱们再来详细的说说。中文分词搜索引擎最大的特点
码农老张Zy
·
2024-01-15 03:11
【迅搜17】SCWS分词(二)自定义字典及分词器
而对于分词器来说,不管是SCWS还是现在流行的IK、
Jieba
,其实概念方面都是差不多的。比如说它们都需要字典来做为分词的依据,也会有停用词库这一类的附加字典。
码农老张Zy
·
2024-01-15 03:11
软件测试|如何使用Python取句中中英文内容
准备工作我们可以使用Python自带的re模块或者借助
jieba
、nltk库来实现该功能,
jieba
以及nltk是第三方库,所以我们需要通过命令来安装这两个库,命令如下:pipinstallj
测试萧十一郎
·
2024-01-14 20:02
软件测试
python
开发语言
功能测试
软件测试
自动化测试
程序人生
职场和发展
自然语言处理笔记
文章目录情感词典中文分词情感词典英文的情感词典有:LIWC,SentiWordNet等中文的情感词典有:NTUSD,正文褒贬词典TSING,知网HowNet等中文分词中文分词的工具有:
jieba
(核心算法是张华平的
zoujiahui_2018
·
2024-01-14 09:37
#
自然语言处理
自然语言处理
笔记
人工智能
Python分词介绍
在Python中,有许多分词工具可以使用,其中最常用的是
jieba
分词。
jieba
分词是一个基于Python的中文分词库,它可以将中文文本拆分为单独的词,以便进行后续的分析和处理。
Dxy1239310216
·
2024-01-13 16:27
Python
python
开发语言
[源码和文档分享]基于python的B站弹幕数据分析(爬虫+可视化)
2环境的安装本项目实在pycharm中实现,使用到的第三方库有requests,bs4,pandas,
jieba
.posseg,py
ggdd5151
·
2024-01-13 02:37
python个性化词云图案绘制
#coding=gbkimport
jieba
import
jieba
.analysefromwordcloudimportWordCloud,ImageColorGeneratorimportmatplotlib.pyplotaspltimportmatplotlibasmpl
loong_XL
·
2024-01-11 18:32
python
知识点
词云可视化(摘录)
1号词云:《葛底斯堡演说》黑色背景词云(4行代码上手)美化词云2号词云:面朝大海,春暖花开(配置词云参数)常用参数从外部文件读入文本3号词云:乡村振兴战略中央文件(句子云)中文分词中文分词第三方模块`
jieba
Sparky*
·
2024-01-11 08:34
廖雪峰爬虫笔记
ES7.9.3整合结巴分词插件
ES7.9.3安装centos7安装ES-CSDN博客1.下载elasticsearch-
jieba
-plugin下载地址:GitCode-开发者的代码家园我使用elasticsearch-
jieba
-plugin7.4.2
hahaha 1hhh
·
2024-01-11 07:06
elasticsearch
jieba
中文分词、去停用词、发现新词
中文分词目前使用过snownlp、
jieba
,简单对比下,
jieba
的默认模识更好用,snownlp分的过细了。
废柴社
·
2024-01-11 06:06
基于Python爬虫的B站弹幕可视化
介绍这是一个基于Python的B站弹幕可视化项目,主要使用了pythondjango、requests、
jieba
等库。
沐知全栈开发
·
2024-01-10 14:45
python
爬虫
开发语言
Python采集微博评论做词云图
Python3.10Pycharm第三方模块使用:importrequests>>>pipinstallrequestsimportwordcloud>>>pipinstallwordcloudimport
jieba
魔王不会哭
·
2024-01-09 22:28
python
python
开发语言
pycharm
学习
大数据毕业设计:新闻情感分析系统 舆情分析 NLP 机器学习 爬虫 朴素贝叶斯算法(附源码+论文)✅
1、项目介绍技术栈:Python语言、django框架、vue框架、scrapy爬虫框架、
jieba
分词、nlp算法、爬虫抓取机器学习、朴素
vx_biyesheji0001
·
2024-01-08 08:20
biyesheji0002
毕业设计
biyesheji0001
大数据
课程设计
自然语言处理
python
机器学习
毕业设计
爬虫
使用
jieba
库进行中文分词和去除停用词
jieba
.lcut
jieba
.lcut()和
jieba
.lcut_for_search()是
jieba
库中的两个分词函数,它们的功能和参数略有不同。
一壶浊酒..
·
2024-01-07 17:53
自然语言处理
中文分词
自然语言处理
Python(wordcloud):根据文本数据(.txt文件)绘制词云图
二、相关库的介绍1、安装相关的库pipinstall
jieba
pipinstallmatplotlibpipinstallwordcloudpipinstallnumpypipinstallImage2
十八只兔
·
2024-01-05 17:24
Python
python
词云图
数据可视化
wordcloud
使用TF-IDF对文本集中的单篇文本制作词云
(1)导入
Jieba
分词工具importosimport
jieba
(2)文本
MilkLeong
·
2024-01-05 11:43
自然语言处理
python
机器学习
sklearn
词云的生成
首先要安装wordcloud(用于生成词云),matplotlib(用于绘图),
jieba
(用于分词),PIL(用于连接图片,进行词云轮廓的选择)。
丘小羽
·
2024-01-05 07:35
深度学习
实现中文
jieba
分词
目录问题描述:代码实现:问题描述:使用中文分词库
jieba
从给定的文本中提取指定范围内的前后词语。特殊的,如果前面是‘的’即再向前取一位,这个可根据自己的实际需求做出更改。
薰珞婷紫小亭子
·
2024-01-04 18:27
程序
自然语言处理
python
关键词提取
node
jieba
关键词提取库本来想在centos上安装node
jieba
,奈何Centos7上面的gcc的动态库太老,一直没办法更新动态库。
. . . . .
·
2024-01-03 07:46
node.js
自然语言处理
三国演义人名统计及可视化
1.人名统计首先,三国演义.txt需要各位自行下载,然后我们需要导入
jieba
(结巴)库,在后续完成代码的过程中我们需要使用
jieba
来帮我们自动分词然后是对于一些不需要分词的词语我们需要剔除:1.单字成词的我们不需要
在远方的眺望
·
2024-01-02 11:53
生鸡蛋23大计の题
python
算法
python实现文本词频统计分析,计算距离重心和词云可视化
在这里插入图片描述import
jieba
importmathimportwordcloudimportmatplotlib.pyplotasplt#构建停用词列表defstopword(path1):file
Cache_wood
·
2024-01-02 08:54
jieba
库
jieba
库是的中文分词第三方库。中文文本需要通过分词获得单个的词语。安装:(cmd命令行)pipinstall
jieba
jieba
分词依靠中文词库。
cd4254818c94
·
2024-01-01 09:08
Python爬虫豆瓣网热门话题保存文本本地数据,并实现简单可视化。
前言今天给大家分享Python爬虫豆瓣网热门话题保存文本本地数据开发环境:windows10python3.6.4开发工具:pycharm库:requests、WordCloud、pandas、
jieba
千寻编程
·
2024-01-01 09:47
Python数据爬虫案例
python
爬虫
数据可视化
经验分享
【小沐学NLP】Python实现TF-IDF算法(nltk、sklearn、
jieba
)
文章目录1、简介1.1TF1.2IDF1.3TF-IDF2.1TF-IDF(sklearn)2.2TF-IDF(nltk)2.3TF-IDF(
Jieba
)2.4TF-IDF(python)结语1、简介TF-IDF
爱看书的小沐
·
2024-01-01 00:26
Python
AI
python
自然语言处理
tf-idf
jieba
nltk
sklearn
分词
【Python篇】python库讲解(wordcloud |
jieba
)
文章目录
jieba
库wordcloud库解释
jieba
库
jieba
库是一个流行的中文分词工具,它基于统计算法和词频字典,能够将连续的汉字序列切割成有意义的词语。
在下小吉.
·
2023-12-31 11:29
Python基础
python
开发语言
Python
jieba
库的使用方法
jieba
库是一个python的第三方词库,是用来中文分词的这个库是需要下载的,我们需要在命令行输入pipinstall
jieba
来下载pipinstall
jieba
需要找到python安装路径的Scripts
又蓝
·
2023-12-29 02:05
python
python
人工智能python 模块_python机器学习和人工智能,基础模块和环境搭建
本文搭建包括numpy、pandas、gensim、matplotlib、tensorflow、sklearn、
jieba
、NLTK常用机器学习库,打造一个基础和全面的机器学习环境。
weixin_39560064
·
2023-12-28 21:54
人工智能python
模块
Python项目实战:通过
jieba
分词统计招聘大数据帮你找工作.md
前言:一切不经过项目验证的代码都是耍流氓,今天我们就通过一个简单的招聘网站的数据归档(数据来源请参考我的上一篇文章)进行当前热门岗位的大数据分析,最后以wordcloud进行显示。帮你分析一名合格的Python从业者到底要掌握什么样的技能。当然,这篇文章说是大数据是有点严重夸张的,看官勿深纠。相关代码下载地址请见文末整理归档文件上一篇文章中,我们采集了拉勾网的岗位数据,保存到了代码目录的./dat
明哥玩编程
·
2023-12-28 11:41
WeNet语音识别分词制作词云图
在线体验,点击识别语音需要等待一会,文件太大缓存会报错—介绍本篇博客将介绍如何使用Streamlit、
jieba
、wenet和其他Python库,结合语音识别(WeNet)和词云生成,构建一个功能丰富的应用程序
陈增林
·
2023-12-28 11:00
语音识别
人工智能
python之红楼梦词频统计并生成图云
Hlm.pystop_words.txt红楼梦.txt(tips:txt文件已放在文章最后)废话不多说,直接上效果图和代码:效果图Hlm.py代码部分:importmatplotlib.pyplotaspltimport
jieba
importwordcloudimportmatplotlibmatplotlib.rcParams
秋澄orange
·
2023-12-27 20:37
python
python
list
python
jieba
load_userdict 不起效果
如果字典是加载成功,没有报错,可能是自定义的词典词频不够高:可以看下
jieba
自带的词典中的词频,将自定义词典中词频调大如word999999999999n。
qq_36120059
·
2023-12-27 12:55
python
python
Python语法知识的笔记
Python语法知识的笔记一、re.sub函数的用法作用:字符串替换字符,sub是单词substitute的缩写二、.strip()函数的用法作用:去除字符串两侧的空白字符(空格、制表符、换行符等)三、
jieba
.cut
LinlyZhai
·
2023-12-27 11:24
windows
数据库
服务器
Python生成圣诞节词云-代码案例剖析【第17篇—python圣诞节系列】
❄️Python制作圣诞树词云-中文展示效果代码#-*-coding:UTF-8-*-import
jieba
importrefromstylecloudimportgen_stylecloudfromPILimportImageimportnumpyasnpwitho
一见已难忘
·
2023-12-27 07:02
python
圣诞节
圣诞节词云
节日
圣诞树
圣诞节代码
【NLP】⚠️学不会打我! 半小时学会基本操作 1⚠️ 分词
半小时学会基本操作1⚠️分词概述分词器
jieba
安装精确分词全模式搜索引擎模式获取词性概述从今天开始我们将开启一段自然语言处理(NLP)的旅程.自然语言处理可以让来处理,理解,以及运用人类的语言,实现机器语言和人类语言之间的沟通桥梁
我是小白呀
·
2023-12-25 17:34
#
NLP
自然语言处理
深度学习
自然语言处理
机器学习
深度学习
今日无更新
现在梳理一下自己手里的锤子:转到Pytorch,使用AllenNLP了解Transformer、了解LSTM了解
jieba
等分词工具了解Gensim等NLP处理工具接下来要做的:基于Pytorch搞定LSTM
我的昵称违规了
·
2023-12-25 02:21
词云(附带操作实例)
一、主要目的:学会词云图的制作方法,要求熟悉
jieba
分词库的使用,会使用wordcloud绘图,以及了解.generate()和.fit_words()方法的区别。
xixixi77777
·
2023-12-23 14:12
大数据
python
数据分析
人工智能
Jieba
+collections中英文混合语言文章词频统计
Jieba
+collections中英文混合语言文章词频统计前言前几个星期写了“WordCount-词频统计-英语考级必备-超好用-开源-Python”想着只能统计英文有局限性,就想着把中文的加上。
ZehangZhu Studio
·
2023-12-22 18:26
Python高效办公
python
算法
pip
使用Gensim训练Word2vec模型
1、训练Gensim模型importgensim#gensim==4.3.2import
jieba
importreimportwarningsimportloggingwarnings.filterwarnings
Shy960418
·
2023-12-21 17:20
word2vec
人工智能
自然语言处理
pycharm或anaconda安装第三方库的办法
jieba
这个包也可以在清华镜像下载哇塞!我下载的是
jieba
.tar.gz的压
LinlyZhai
·
2023-12-20 13:11
pycharm
ide
python
Python爬虫实战-采集微博评论,看看大家都在讨论什么
嗨喽,大家好呀~这里是爱看美女的茜茜呐开发环境:python3.8:解释器pycharm:代码编辑器模块使用:requests:发送请求parsel:解析数据
jieba
pandasstylecloud如何安装
茜茜是帅哥
·
2023-12-20 09:27
python爬虫
python
爬虫
开发语言
pycharm
学习
jieba
-fenci 结巴分词与繁简体转换 segment
拓展阅读DFA算法详解为了便于大家学习,项目开源地址如下,欢迎fork+star鼓励一下老马~敏感词sensitive-word分词segment结巴分词请参考结巴分词原理。结巴分词的不足这里是针对如果使用繁简体转换,仅仅想使用分词。那么结巴分词会有哪些不足呢?HMM是一种面向未来的分词(预测),但是繁体是一种面向过去的(词组/字固定)看似非常有用的HMM,到了繁简体转换全部成为了鸡肋。词库较大。
老马啸西风
·
2023-12-20 08:50
nlp
word
开发语言
安全
github
开源
中文分词
nlp
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他