E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
jieba
jieba
分词
jieba
(结巴)是一个强大的分词库,完美支持中文分词,本文对其基本用法做一个简要总结。
她即我命
·
2023-08-02 11:05
python 关键词提取 (
jieba
+sklearn)
#!/usr/bin/python#coding=utf-8#TF-IDF提取文本关键词#http://scikit-learn.org/stable/modules/feature_extraction.html#tfidf-term-weightingimportsysimportosfromconfig_chimport*importchardetimportnumpyasnpimportp
laod_wh
·
2023-08-01 12:02
jieba
分词
jieba
主要用于Python中文分词,主要有以下3种特性:支持3种分词模式:精确模式、全模式、搜索引擎模式支持繁体分词支持自定义词典#导入
jieba
import
jieba
import
jieba
.possegaspseg
米小河123
·
2023-08-01 02:49
文本计算
2.2中文分词分词模式2import
jieba
#精准模式print("|".join(
jieba
.cut("今天天气不错,我来到北京野生动物园,在野生动物园看到有很多凶猛的动物",cut_all=False
叫兽吃橙子
·
2023-07-31 10:53
计算机毕业设计Python+Vue.js+Flask+Scrapy电影大数据分析 电影推荐系统 电影爬虫可视化 电影数据分析 大数据毕业设计
协同过滤推荐算法集成(ItemCF推荐算法和UserCF推荐算法)2.专业美工整体设计的细腻的酷黑主题,前后端分离一体化系统(爬虫→MySQL→Flask→Vue);实现影片库搜索,多种Echarts图形分析、
jieba
计算机毕业设计大神
·
2023-07-31 01:55
Django haystack + whoosh +
jieba
全文搜索
简介业务场景搜索栏输入塑料玩具时,希望优先搜索出名称或简介中带有塑料玩具的条目,并同时匹配出塑料、玩具、玩具塑料、塑料玩巨等信息,按照匹配度排序,且支持匹配英文大小写。技术选型Django自带的模糊匹配icontains表示Mysql的like,不满足业务分词需求,且随着数据量增大,消耗的资源和时间都会线性增长,因此考虑使用专门的搜索框架haystack搜索框架,用于接入搜索引擎,而无需关注索引建
李霖弢
·
2023-07-29 01:38
利用
jieba
库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化
目录利用
jieba
库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化安装
jieba
库安装wordcloud打开pycharm编写代码利用
jieba
库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化安装
潆勖
·
2023-07-28 06:53
python
python
pycharm
开发语言
Python之pip install安装失败问题
问题一:在windows的命令窗口使用pipinstall
jieba
-ihttps://pypi.doubanio.com/simple/安装
jieba
(举例的安装包,可以是其他的安装包;此次使用的是豆瓣源
Visunf Chen
·
2023-07-27 20:57
python
pip
Python文本处理
前言本文主要介绍python文本处理算法代码主要应用和一些基本原理一、常用库1.
Jieba
jieba
是支持中文分词的第三方库。
noobiee
·
2023-07-27 11:19
Python开发
python
中文分词
自然语言处理
分词工具使用系列——sentencepiece使用
分词工具使用系列第一章sentencepiece使用第二章
jieba
工具使用文章目录分词工具使用系列前言——细说分词一、sentencepiece是什么?
不被定义的号
·
2023-07-27 09:29
#
自然语言处理
算法
人工智能
中文分词
NLP
分词
jieba
库安装
使用pipinstall
jieba
会报错的,我的py版本是3.732位使用pip3install
jieba
,成功
第七原色
·
2023-07-26 18:35
NLP(十二)依存句法分析的可视化及图分析
我们使用的NLP工具为
jieba
和LTP,其中
jieba
用于分词,LTP用于词性标注和句法分析,需要事件下载pos.model和parser.model文件。 本文使用的示例句子为:2018年
山阴少年
·
2023-07-25 03:52
NLP
依存句法分析
图分析
python 三国演义人物出场词频统计
from
jieba
importlcutfile=open('threekindom.txt','rt',encoding='utf-8').read()wordlist=lcut(file)excludes
Raymond_du3137
·
2023-07-24 05:37
python
开发语言
python安装第三方包_python 安装第三方包
例如使用
jieba
分词库。
weixin_39611208
·
2023-07-24 02:28
python安装第三方包
NLP关键词提取
keywordExtract.py#-*-coding:utf-8-*-importmathimport
jieba
import
jieba
.possegaspsgfromgensimimportcorpora
不学无数YD
·
2023-07-23 16:26
python第三方库概览
目录第三方库的获取和安装脚本程序转变为可执行程序的第三方库PyInstaller
jieba
库(必选)、wordcloud库(可选)知识导图:1.Python第三方库的获取和安装Python第三方库依照安装方式灵活性和难易程度有三个方法
图灵追慕者
·
2023-07-21 02:08
python
第三方库
python计算机二级
pyinstaller
Python-分词&云图
jieba
分词import
jieba
seg_list=
jieba
.cut("我来到北京清华大学",cut_all=True)print("FullMode:"+"/".join(seg_list))#全模式
你旭哥
·
2023-07-20 08:14
Python安装
jieba
库步骤(jupyter notebook)
1.打开jupyternotebook2.点击“New”中的“Terminal”3.在命令行输入以下命令pipinstall
jieba
得到下图所示就是安装成功,然后就可以回到主页面新建Python文件写代码啦
悦小白
·
2023-07-19 23:50
解决运行代码时的问题
python
数据分析
中文分词
[nlp]问答摘要与推理 : 构建vocab词典
数据集路径载入数据(这里可以封装函数defload_dataset)空值处理无用字符清理切词1.分词方法选择除了
jieba
分词,还有哈工大的等。
心心喵
·
2023-07-19 21:09
nlp
对中国四大名著--红楼梦 使用
jieba
进行分词处理 排除去停词 统计完整词频并按降序排列 前20词绘制词云图
文章目录前言一、
jieba
是什么?
小唐YiJiaTang
·
2023-07-19 10:22
python
python
开发语言
字典&文本特征提取,
jieba
库
目录特征提取字典特征提取示例:文本特征提取示例1(不含中文的语句)示例2(包含中文的语句)
jieba
分词示例文本特征抽取TfidfVectorizer特征提取将任意数据(如文本或图像)转换为可用于机器学习的数字特征注
wxxxx_xx
·
2023-07-18 23:34
机器学习
人工智能
python
[ruby on rails] postgresql分词搜索 pg_
jieba
和 zhparser 方案
一、pg_
jieba
方案安装brewinstallcmakemkdir~/tmp&&cd~/tmp&&gitclonehttps://github.com/jaiminpan/pg_
jieba
&&cdpg_
jieba
gitsubmoduleupdate
微信-since81192
·
2023-07-18 18:43
ruby
on
rails
postgresql
后端
两种实现模糊匹配的方法--python
,sheet2的词语去匹配sheet1中词语找模糊匹配结果来举例导入数据,读取excel中sheet1(被匹配的目标词库),sheet2(需要进行匹配的词)importpandasaspdimport
jieba
浮豹
·
2023-07-18 17:54
Python
python
开发语言
pandas
python爬虫自学笔记分析解密_python爬虫学习笔记——1 各种文本分析工具简介之汇总...
本文主要参考一文0、SnowNLP包用于中文文本的处理1.
Jieba
2.NLTK3.TextBlob4.MBSPforPython5.Gensim6.langid.py7.xTAS8.Pattern0、
weixin_39770506
·
2023-07-18 16:39
一文带你掌握Python中文词频统计
在Python中,可以使用一些第三方库(如
jieba
)来分词,然后使用字典等数据结构记录每个词的词频。
·
2023-07-18 09:57
Python比较文本相似度的7种方法(详细)
fromcorpora.corpusimportCorpus#1分词#1.1历史比较文档的分词all_location_list=[]fordocinlocation_list:doc_list=[wordforwordin
jieba
.cut
SpinMeRound
·
2023-07-18 05:46
python
自然语言处理
nlp
sklearn模块的安装问题 error: subprocess-exited-with-error
具体错误如下图不管加不加镜像源都没用,都会报错TT法一:在conda环境下用condainstall安装condainstallscikit-learn但是,因为我不想再conda的环境下弄,而且再conda环境的时候
jieba
菜菜奋斗之路
·
2023-07-17 23:03
python
开发语言
机器学习
sklearn
python爬取李白和杜甫诗集,并处理,分类,预测
importreimportrequestsimport
jieba
frombs4importBeautifulSoupasbpfromnltk.classifyimportNaiveBayesClassifier
柳暗花明又一村ヾ(◍°∇°◍)ノ゙
·
2023-07-17 19:03
python
AttributeError: ‘list‘ object has no attribute ‘decode‘
在做情感分类模型是,最初的数据预处理报错AttributeError:'list'objecthasnoattribute'decode',源码如下:importtorch.nnasnnimport
jieba
data_path
"husky"
·
2023-07-17 04:38
python情感分类
中文分词
python
循环神经网络和自然语言处理介绍||文本情感分类|| 循环神经网络||循环神经网络实现文本情感分类||Pytorch中的序列化容器
常见的分词工具很多,比如:
jieba
分词:https://github.com/fxsjy/
jieba
清华大学的分词工具THULAC:
Jason_Honey2
·
2023-07-16 19:49
神经网络
pytorch
自然语言处理
【Python爬虫】CSDN热榜文章热门词汇分析
本文将介绍如何使用Python进行数据处理,获取热榜文章的标题和标签,并使用
jieba
库进行数据分析。通过本文的学习,你将掌握获取和分析热榜文章数据的技巧。
逸峰轻云
·
2023-07-16 04:44
python
爬虫
开发语言
Python结巴中文分词笔记
jieba
库基本介绍
jieba
库概述
Jieba
是一个流行的中文分词库,它能够将中文文本切分成词语,并对每个词语进行词性标注。
逸峰轻云
·
2023-07-16 04:41
python
中文分词
笔记
python之
jieba
分词库使用
目录一.介绍A.什么是
jieba
库B.
jieba
库的特点和优势C.安装
jieba
库二.分词基础A.字典加载B.分词模式C.使用示例三.自定义词典A.添加词语B.载入自定义词典C.使用示例四.关键词提取A
陌北v1
·
2023-07-15 19:11
python
python
jieba
python中一些常用库的安装方法的介绍(以scipy,
jieba
为例)
(http://www.lfd.uci.edu/~gohlke/pythonlibs/)python库的下载链接关于python中一些常用库的安装方法的介绍(以scipy,
jieba
为例)话不多说,下面是安装方法
xiangwangburu
·
2023-07-15 17:09
python库的安装
python
tf-idf kmeans文本聚类
文本聚类数据集THUnews中文新闻文本分类方法
jieba
分词后,使用tf-idf提取特征,提取时使用停用词表删除停用词,最后使用kmeans进行聚类。
be_humble
·
2023-07-15 15:28
聚类
python
数据挖掘
Sougou语料库word2vec训练demo
Sougou语料库word2vec训练demo文章参考:https://www.cnblogs.com/Newsteinwell/p/6034747.html利用
jieba
对中文语料库进行分词这里首先将
hhy不许摸鱼
·
2023-07-15 12:51
NLP
自然语言处理
nlp
深度学习
机器学习
python
短视频矩阵系统源码--开发实践
3.关键词匹配:使用Python的
jieba
分词库进行分词,使用TF-IDF算法进行关键词权重计算,使用余弦相似度算法进行关键词匹配。4.排名展示:使用Python
云罗团团yx898978
·
2023-07-15 11:10
短视频矩阵源码
矩阵
开源
抖音seo源码
Python产生关键词云报错:AttributeError: ‘ImageDraw‘ object has no attribute ‘textbbox‘
利用
jieba
snownlp分别分词,产生关键词云。代码报错,检查了以下代码没错。最后在csdn找到了解决方法。这原来是pillow的版本过低的原因。
makabakaq
·
2023-07-15 04:19
python
开发语言
PyCharm中的from...import报错解决
安装
jieba
插件。
自律且java
·
2023-07-15 04:45
python
pycharm
Django_haystack全文搜索
jieba
是一款免费的中文分词包,如
bug捕手
·
2023-07-14 23:12
Django
django
python
后端
程序人生
测试开发
软件测试
软件测试工程师
使用Python绘制各种方法的词云图
import
jieba
fromPILimportImagefromwordcloudimportWordCloudimportnumpyasnpimportmatplotlib.pyplotasplt#
Alita elessar
·
2023-07-14 01:16
词云图
信息可视化
python
python绘制词云图
效果展示importpandasaspdimport
jieba
fromcollectionsimp
极客李华
·
2023-07-14 01:12
python数据分析
python
开发语言
利用python制作词云图
一、使用步骤1.下载所需库在cmd命令提示符中输入下载命令:pipinstallwordcloud2.引入库引入所需库:
jieba
、m
陈佳2002
·
2023-07-14 01:27
python
matplotlib
Java 结合中文分词库
jieba
统计一堆文本中各个词语的出现次数【代码记录】
文章目录1、需求2、代码3、结果1、需求2、代码packagecom.zibo.main;importcom.huaban.analysis.
jieba
.
Jieba
Segmenter;importjava.io.BufferedReader
訾博ZiBo
·
2023-06-23 07:41
Java
java
中文分词
开发语言
《自然语言处理》第一次作业:分词
文章目录作业要求代码单线程read_data多线程read_dataread_file分词max_match
jieba
分词计算准确率,召回率,F1-测度to_regionprf程序完整代码运行结果读取数据分词作业要求题目
MAVER1CK
·
2023-06-22 16:06
NWPU
自然语言处理
python
人工智能
常见的文本分析大汇总
虽然能力一般,但是一些基础的信息还是会尝试挖掘的小P:都有哪些信息可以挖掘啊小H:比如词频、关键词提取、情感分析、主题词提取等等词频与词云图#pipinstallwordcloud#pipinstall
jieba
HsuHeinrich
·
2023-06-22 14:17
数据分析
python
数据分析
python 基础知识:使用
jieba
库对文本进行分词
前言嗨喽,大家好呀~这里是爱看美女的茜茜呐一、
jieba
库是什么?
茜茜是帅哥
·
2023-06-22 06:46
python基础
python
开发语言
pycharm
python一键生成词云图
import
jieba
fromwordcloudimportWordCloud#要生成词云图的文本内容withopen('txt文本路径','r',encoding='utf-8')asf:text=f.read
苏音资源
·
2023-06-21 23:21
python
开发语言
Chatterbot 打造游戏AI客服机器人
开源框架:Chatterbot4、依赖类库:pip3installchatterbotpip3installspacy#需要手动编译安装en_core_web_sm(使用2.1版本)pip3install
jieba
pip3installcoloramapip3installpymongoChatterbot
潘广宇
·
2023-06-21 09:15
AI
游戏
人工智能
机器人
基于Python垃圾短信识别程序(KNN、逻辑回归、随机森林、决策树和多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯等算法进行融合)—含python工程全源码
目录前言总体设计系统整体结构图请求流程图系统流程图运行环境Python环境
jieba
分词库Scikit-learn库nginxphp模块实现1.前端模块2.后端模块系统测试1.测试结果2.结果对比3.可视化部分工程源代码下载其它资料下载前言本项目以
小胡说人工智能
·
2023-06-20 14:49
机器学习
学习路线
python
机器学习
随机森林
决策树
算法
逻辑回归
KNN
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他