E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词库
python利用jieba实现中文分词
jieba是一款强大的python第三方中文分
词库
。目前jieba已经支持四种分词模式:精确模式:试图将句子最精确地切开,不存在冗余数据,适合文本分析。
deepython
·
2023-01-10 06:51
笔记
python
中文分词
Python的jieba分词及TF-IDF和TextRank 算法提取关键字
参考文章:Github上的项目———jieba中文分词对于NLP(自然语言处理)来说,分词是一步重要的工作,市面上也有各种分
词库
,11款开放中文分词系统比较。
sunshine_9990
·
2023-01-07 15:05
python
jieba
TF-IDF
Text-Rank
基于jieba分词的TF-IDF和TextRank提取关键字
中文分词对于NLP(自然语言处理)来说,分词是一步重要的工作,市面上也有各种分
词库
,11款开放中文分词系统比较。
禾火心白尤
·
2023-01-07 15:04
[内附完整源码和文档] 基于C#和Access的智能聊天机器人
二、软件设计2.1软件整体结构图及模块划分软件的结构只有一个聊天界面,分别有输入框,显示聊天信息框,发送按钮和退出按钮,导入
词库
按钮和调教按钮。
LEMFOooO
·
2023-01-07 14:04
收集毕设和课设资源
java实现OCR图文识别Tess4j,高准确率高效率
java实现OCR图文识别Tess4j,高准确率高效率,用最新的
词库
2秒就可以识别,没有最新
词库
的找我傻瓜式调用中文
词库
,及其方便。
inovice
·
2023-01-03 20:30
maven
图像处理
人工智能
全站最全NLP中英文停用词表(包含标点符号,可直接复制)
目录1.英文停用词表(en_stopwords)2中文停用词表2.1中文停用词表2.2哈工大停用词表2.3百度停用词表2.4四川大学机器智能实验室停用
词库
1.英文停用词表(en_stopwords)'d'll'm're's't'veZTZZaa'sableaboutaboveabstaccordanceaccordingaccordinglyacrossactactuallyaddedadjado
同稚君
·
2022-12-31 11:52
nlp
自然语言处理
中文分词
人工智能
当下流行的中文分词模块jieba
当前流行的中文分词模块包括Jieba分词:Jieba是用Python实现的开源中文分
词库
,支持三种分词模式:精确模式、全模式和搜索引擎模式,并且支持自定义词典。
Mr数据杨
·
2022-12-27 22:51
Python
数据科学
Python
数据分析师
中文分词
自然语言处理
python
jieba
【Java】花费数十小时,带你体验Java文档搜索引擎的实现过程
Java文档搜索引擎项目运行效果一、简述搜索引擎概念二、搜索引擎实现思路2.1倒排索引介绍2.2项目目标2.3获取java文档2.4模块划分2.5创建项目2.6认识分词2.7分词的原理2.8使用第三方分
词库
三
意愿三七
·
2022-12-26 16:09
JAVA
java
NLP项目(二)——拼写纠错
目录前言一、数据集介绍1-1、spell-errors.txt1-2、vocab.txt1-3、testdata.txt二、拼写纠错代码Part0:构建
词库
Part1:生成所有的候选集合Part2:读取语料库
ㄣ知冷煖★
·
2022-12-26 10:00
自然语言处理
自然语言处理
人工智能
nlp
互联网时代的社会语言学:基于SNS的文本数据挖掘(转载)
转自:http://www.matrix67.com/blog/archives/5044文章简介:这篇文章用计算联合概率和信息熵的方法来判断几个联合出现的字是否可以组成一个词,从而实现了不基于字典或
词库
就可以分词
weixin_30575309
·
2022-12-25 17:44
人工智能
文本关键字提取
关键词匹配:事先给定关键
词库
,然后在文档中进行关键词检索。
lishuaics
·
2022-12-25 14:40
算法
聚类
java
自然语言处理
编程语言
C语言课程设计 简单的单词学习系统 (2)
typedefstructword{chare[100];charc[100];}word;typedefstructphy{chare[100];//英charc[100];//汉}phy;//定义单
词库
橙南花已开
·
2022-12-24 11:18
c语言
开发语言
c语言背单词系统.doc,背单词系统
用c语言编写的背单词系统1、题目描述背单词该系统是帮助学生背诵单词的软件,要求用户可以选择背诵的
词库
,并可以编辑自己的
词库
,系统可以给出中文,让学生输入其英文意思,也可输出英文让学生输入中文意思。
猎奇症候群
·
2022-12-24 10:46
c语言背单词系统.doc
简单的Python单
词库
,使用dict制作
简单的Python单
词库
这个单
词库
是使用dict制作的简单的单
词库
,实现了查询和存储功能话不多说直接上代码#生
词库
dict_en={'word(单词)':"paraphrase(释义)",'a':"一,
side_N
·
2022-12-24 10:16
python
机器学习
强化学习
无监督学习
C语言课设英语记单词本
2.功能描述2.1模块功能2.2流程图3.总体设计3.1主菜单界面3.2功能框架3.3结构体定义3.4功能函数3.4.1文件读取函数3.4.2添加单词3.4.3默写中文3.4.4默写英文3.4.5查看
词库
列表
越月学习空间
·
2022-12-24 10:43
c语言
开发语言
C语言课程设计 简单的单词学习系统
帮兄弟简单写了一个课设题目,时间有限(两个小时),恳请斧正嘿嘿目录零、题目要求一、导入函数库、定义结构体以及函数声明二、一级菜单函数三、二级菜单函数1.
词库
更新系统2.学习系统四、功能实现函数1.
词库
更新相关
橙南花已开
·
2022-12-24 10:41
c语言
开发语言
程序设计
解决Win10/Win11输入法卡顿问题
文章目录
词库
损坏问题方法1.删除个人
词库
方法2.删除中文
词库
网络延迟问题方法3:关闭云服务资源调度问题方法4:调整优先级终极大招不知道有没有小伙伴和我一样遇到微软输入法打字慢的问题,有的话就继续往下看吧
繁依Fanyi
·
2022-12-24 10:13
实用技巧
windows
输入法
技巧
自然语言处理(NLP)(one-hot vector&Word Embedding词嵌入&语言模型&词向量&CBOW&skip-gram&negative sampling负采样模型)
自然语言处理的应用拼写检查、关键词检索......文本挖掘(产品价格、日期、时间、地点、人名、公司名)文本分类机器翻译客服系统复杂对话系统one-hotvector假设
词库
总共有n个词,那我们打开一个1
hxxjxw
·
2022-12-23 06:18
自然语言处理
人工智能
【NLP】jieba分词
添加用户自定义词典2.4使用停用词2.5统计切分结果中的词频3.文章关键词提取3.1extract_tags()3.2textrank()1.jieba简介jieba库是一款优秀的Python第三方中文分
词库
WarmOrange丨
·
2022-12-22 15:22
自然语言处理
python
理论:NLP学习路径(三):NLP中文分词技术
1、中文分词简介难点:分词歧义方法:1)规则分词:人工建立
词库
,按一定方式匹配切分。缺点:对新词很难进行处理。2)统计分词:利用机器学习技术。缺点:过于依赖语料的质量。
zmjames2000
·
2022-12-22 06:03
NLP
中文分词
规则分词
统计分词
基于HMM模型实现中文分词
本案例在前文将说明常用分
词库
及其简单应用,之后会通过中文分词的例子介绍和实现一个基于统计的中文分词方法——HMM模型,该模型能很好地处理歧义和未登录词问题,应用在jieba等分词器中。
数学是算法的灵魂
·
2022-12-22 06:23
机器学习从入门到精通
自然语言处理
人工智能
python
分词
实战三十七:基于HMM模型实现中文分词
本案例在前文将说明常用分
词库
及其简单应用,之后会通过中文分词的例子介绍和实现一个基于统计的中文分词方法——HMM模型,该模型能很好地处理歧义和未登录词问题,应用在jieba等分词器中。
甜辣uu
·
2022-12-22 06:53
机器学习实战100例
中文分词
自然语言处理
人工智能
python
word2vec
利用python实现压韵(双压版)
大致思路我最终想实现的是,任意给出一个词,都能在
词库
中找到跟它双押的词,并给出出现频率。有了这个想法之后,来想想程序该怎么写。程序大概分为:
词库
爬取、分词处理、拼音转换三部分
莱宝是菜宝
·
2022-12-20 11:25
python学习笔记
python
hiphop
爬虫
淘宝商品口红数据爬取与分析
数据来源:爬取数据,网盘中包含爬取的数据与停
词库
百度网盘请输入提取码6666处理过程导入数据:importpandasaspddata1=pd.read_excel("kouhong_good.xlsx
进步小白
·
2022-12-19 11:20
爬虫
数据分析
python
数据分析
大数据
爬虫
最新敏感
词库
/违禁词检测接口,可接入文章发布
敏感
词库
/违禁词检功能可接入织梦Dedecms,Pbootcms,Discuz,帝国,易优内容管理系统(EyouCms),Thinkphp,Thinkcmf,Fastadmin等一系列CMS系统,帮助企业避免发布违禁文章接口文档建议
顺为网络
·
2022-12-17 19:13
php
servlet
java
python
Python jieba库简介和使用
jieba基于中文
词库
进行分词,也可以使用HMM(隐马尔可夫模型)对新词进行处理。二、jieba库安装由于jieba
永远是少年啊
·
2022-12-16 00:47
Python
python
jieba
中文分词
编程
开发
Unity中使用贝叶斯拼写纠错器(基于C#)
二、拼写检测器原理给定一个单词w,我们的任务是从单
词库
中选择和它最相似的拼写正确的单词c对应的
航空界的小爬虫
·
2022-12-15 14:33
其它
C#学习
U3D
文本预处理方法总结
数据的预处理项目需要,需要进行
词库
训练与样本向量化处理,总结后有以下4种方法:方法1:tf1.xx版本:词汇样本的处理:使用tensorflow.contrib.learn模块vocab_process
填坑小霸王
·
2022-12-14 23:24
NLP
深度学习
开发一种专门用于医学词句输入的输入法可行吗?
开发构想:1.保留现有输入法的算法和
词库
,在现有的输入法基础上增加对医学常用词句的
词库
和算法。2.增强提示功能,分开2个小部分显示待选择的字,一部分是常用的,一部分是医学的,医学的可以进行开启和关闭。
elifefly
·
2022-12-14 18:00
90.8-瞬间创意
输入法
算法
敏感词汇工具类sensitive word的使用及详解
sensitiveword工具是一个快速的敏感词过滤工具,基于DFA算法实现的高性能敏感词工具(mirrors/houbb/sensitive-word·GitCode),主要优点如下:1.1、6W+
词库
浅唱~幸福
·
2022-12-14 12:35
word
anaconda jieba_小兵学Python:Anaconda如何查看已安装的Python库?
Anaconda默认安装了许多标准库,为Python初学者提供了便利,但是它没有安装第三方库,比如分
词库
jieba。
weixin_39631689
·
2022-12-14 03:53
anaconda
jieba
mac
如何查看anaconda的路径
python
anaconda
基于python的NLP入门——jieba库的使用
jieba是一个python实现的分
词库
,对中文有着很强大的分词能力。
魍悼、、
·
2022-12-12 06:31
python
lcut在python_jieba结巴分词使用
和不同领域专业的分词工具,区别在于
词库
上。像医疗中的很多名词,显然jieba是不认识的,用jieba进行分词,会将专业名词拆解,就比较外行了。但是应付日常的使用,是够用了。
weixin_39889788
·
2022-12-12 06:01
lcut在python
视觉SLAM十四讲学习笔记——第十一讲 回环检测
这里主要介绍了“词袋模型”,也就是用图像特征描述图像,在确定
词库
的内容和顺序后,用一个向量描述一幅图像。实现过程中
晒月光12138
·
2022-12-10 16:03
视觉SLAM十四讲学习笔记
ubuntu
slam
计算机视觉
电子词典模拟软件 c语言源代码
**文件名称:201000170.c*文件标识:……未提交|未链接
词库
|作者测试版…………………………*摘要:电子词典效果**当前版本:2.1*作者:XXX*完成日期:2010-4-24**取代版本:2.0
生物慕课
·
2022-12-10 10:34
语言
c
测试
已解决Resource punkt not found. Please use the NLTK Downloader to obtain the resource:
已解决(nltk加载
词库
报错问题)Resourcepunktnotfound.PleaseusetheNLTKDownloadertoobtaintheresource:文章目录报错代码报错翻译报错原因解决方法帮忙解决报错代码粉丝群里面的一个小伙伴想用
无 羡ღ
·
2022-12-09 16:08
《告别Bug》
python
开发语言
自然语言处理
Python学习-8.2.1 库(jieba库的基础与实例-中文分
词库
)
分词原理:利用一个中文
词库
,将待分的内容与分词
词库
进行对比,通过图结构和动态规划方法找到最大概率的词组。除了分词,jieba还提供增加自定义中文单词的功能。jieba库的使用和标准库一
小成小成小成
·
2022-12-08 17:23
python
学习
中文分词
70+个NLP语料库数据集
TED演讲数据集女性用户网购服装反馈数据集新闻类别数据集中华古诗数据集中文敏感
词库
人民日报文章数据集(1979-2010)人民日报文章数据集(1949-1978)1998人民日报标注语料库(PFR)知乎大厂
qazwsxpy
·
2022-12-08 14:01
自然语言处理
人工智能
nlp
机器学习:使用matlab实现SVM完成垃圾邮件识别
文章目录预处理
词库
映射构造特征向量训练预处理在开始机器学习之前,多观察数据集中的数据通常很有帮助。比如在下面这封邮件里我们可以看到一个URL、一个电子邮件地址(在末尾)、数字和美元金额。
ShadyPi
·
2022-12-08 09:10
机器学习
机器学习
支持向量机
matlab
es安装ik分词器
releases下载ES版本对应的分词器即可安装ik分词器将下载好的zip包解压,生成一个ik文件夹将ik文件夹移动到ES安装目录下的plugins文件夹下(每台ES节点都要执行相同的操作)重启ES集群自定义分
词库
用
陌北v1
·
2022-12-07 08:41
elasticsearch
大数据
搜索引擎
ik分词器
RNN/LSTM (四) 实践案例改编
文章目录背景代码编写训练/测试集分割构建
词库
构建迭代器实现LSTM模型创建模型编写训练逻辑踩坑总结背景在学习RNN/LSTM(二)实践案例后,由于其使用了较旧版本的torchtext0.9,很多API在新版已经淘汰
Melody2050
·
2022-12-07 05:02
AI与ML
rnn
lstm
【NLP】自然语言处理的语料库与
词库
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-12-06 16:17
自然语言处理(NLP)
自然语言处理
人工智能
python常用中文分词方法_中文分词原理及常用Python中文分
词库
介绍
转自进击的Coder公众号原理中文分词,即ChineseWordSegmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。中文分词与英文分词有很大的不同,对英文而言,一个单词就是一个词,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,需要人为切分。
weixin_39629876
·
2022-12-06 07:34
python常用中文分词方法
基于Hashset 对中文词快速查询
下载附件"百度分词
词库
",里面大约有10w个词,使用C语言或者Java实现单词快速查找功能(不借助第三方类库工具或者数据库),将单词载入内存中,建立词索引,实现快速查找单词是否存在.最终表现的功能是输入一个词
诉衷情の麻雀
·
2022-12-05 12:36
hash
java
训练自己的GloVe词向量
highlight=glove训练GloVe词向量在github上下载源码,https://github.com/stanfordnlp/GloVe准备训练的
词库
,文
coolhuhu~
·
2022-12-04 19:27
深度学习
nlp
python
【毕业设计】基于情感分析的网络舆情热点分析系统
文章目录0前言1课题背景2数据处理3文本情感分析3.1情感分析-
词库
搭建3.2文本情感分析实现3.3建立情感倾向性分析模型4数据可视化工具4.1django框架介绍4.2ECharts5Django使用
DanCheng-studio
·
2022-12-04 17:51
毕业设计系列
计算机专业
大数据
python
毕业设计
大数据分析
舆情分析
情感分析
怎么让AI和神经网络效率更高?
自AI与神经网络问世以来,AI的研究好像日渐深入,但是目前好像都只是局限于拼算力,没有创新性的神经网络与AI,以openai的gpt-3为例,这一个通用性领域的人工智能,是输入了整个
词库
,已经广泛的学习了人类的知识
晓天2020
·
2022-12-04 15:28
人工智能
神经网络
【Python自然语言处理】计算文本相似度实例(使用difflib,fuzz,余弦三种计算方式 附源码)
需要全部代码请点赞关注收藏后评论区留言私信~~~下面列举通过余弦相似度公式和标准库分别计算不同文本信息相似度的实例,首先需要对中文进行分词,通过jieba导入分
词库
文件,使用Python标准库计算相似度
showswoller
·
2022-12-04 11:52
NLP自然语言处理
python
自然语言处理
人工智能
机器学习
jieba
基于知识图谱的问答系统(protege,jena,jieba分词的结合)
主要的使用的工具(AKA,重点)有protégé(用于知识图谱的建模)、jena数据库(其为一个基于三元组的图数据库,用于完成知识图谱的存储)、Python中的应用程序框架Streamlit与jieba分
词库
美剧之神
·
2022-12-03 09:59
微型系统
知识图谱
自然语言处理
人工智能
RNN/LSTM (三) 学习torchtext源码
文章目录包装dataset构建
词库
1.列举数据源2.遍历数据3.列举特殊符号4.构建
词库
Field::vocab_clsload_vectors构建读指针data.BucketIterator总结在上一文
Melody2050
·
2022-12-02 16:13
AI与ML
pytorch
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他