E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词库
windows系统下超级好用的欧路词典,足以秒杀有道!
首先安利一个国内最全的
词库
资源网站pdawiki掌上百科里面各种格式的词典资源想要什么都有,配合搜百度等工具可以快速得到你想要的.现在在windows系统下,主流的翻译词典用得多的是有道、金山词霸,灵格斯和
cs_wxd
·
2018-05-08 13:06
英语
翻译
词典
词库
30G
Python 中文 文本分析 实战:jieba分词+自定义词典补充+停用词
词库
补充+词频统计
最近项目需要,实现文本的词频分析,折腾了几天才完成任务,有点成就感,最后整理总结一下这部分的内容,希望更多同僚受益。使用方法环境:Python3.6安装结巴:pipinstalljieba下载停用词词典哈工大停用词词典构建补充词典userdict,后文详解运行文章最后面的完整代码先来认识jieba参考简介"结巴"中文分词:做最好的Python中文分词组件支持三种分词模式:精确模式,试图将句子最精确
陶瑞同学
·
2018-04-28 13:31
建模demo
如何备份、导入和导出岁寒输入法
词库
岁寒输入法的
词库
格式双平台统一,这意味着我们可以将这个平台上培养已久的
词库
文件导出来,导入到另一个平台中使用;备份操作很简单,在输入法键盘界面打开设置界面,找到“备份
词库
”的选项:点击“备份
词库
”即可;
临岁之寒
·
2018-04-28 13:12
solr 6.3安装ik分词器(5和5以上的版本通用)
其实主要是两种,一种是基于中科院ICTCLAS的隐式马尔科夫HMM算法的中文分词器,如smartcn,ictclas4j,优点是分词准确度高,缺点是不能使用用户自定义
词库
;另一种是基于最大匹配的分词器,
Barbarousgrowth_yp
·
2018-04-27 17:50
solr分词
第六周小组作业
需求说明功能模块划分图如下负责的功能模块:用户管理3.测试用例(1)测试用例的设计思路:使用了边界值测试,场景覆盖,等价类等测试方法主要包含以下几种查看自己的头像,ID等基本个人信息查看自己的背单词进度,加入的小组,选择的
词库
等功能相关信息更改背单词计划等后相关信息会不会及时更新
薛定谔的昵称
·
2018-04-23 21:00
【
词库
管理】新词提取小工具
开心的是,华为云的云搜索服务,可以自定义自己的
词库
来做分词、停词。让他更意想不到的是,修改
词库
还可以热更新,不用重启即可生效。但是,
词库
中的词从哪里来,哪些才是有用的词,这真是让人头疼的事情。
KaitBlack
·
2018-04-23 19:16
软件测试第六周作业
本小组选取两者兼具的四项功能(背诵模块、商城模块、听力阅读模块、
词库
管理)进行测试,分析各自的优劣,寻找软件中的缺陷。2.PSP表项目内容说明预估耗时(分钟)实际耗时(分钟)Planning计划
SuiFengSuiXing
·
2018-04-23 09:00
Java TCP、IO流实现简单机器人聊天系统
JavaTCP、IO流实现简单聊天机器人系统一、效果:(此系统基于javaTCP信息传递,IO流实现人机聊天互动功能,
词库
可以自己加。)
SnailLoveTravel
·
2018-04-22 01:01
JavaIO
Java
聊天
浅谈网站敏感词过滤
接下谈谈为什么使用敏感词过滤吧【主体】(1)理由:法律限制敏感词是针对博客内容设置的一种电脑程序自动过滤的
词库
,各个网站的过滤
词库
不尽相同。
青春..荒唐
·
2018-04-05 00:00
后端积累
PHP
浅谈网站敏感词过滤
接下谈谈为什么使用敏感词过滤吧【主体】(1)理由:法律限制敏感词是针对博客内容设置的一种电脑程序自动过滤的
词库
,各个网站的过滤
词库
不尽相同。
青春..荒唐
·
2018-04-05 00:00
后端积累
PHP
python(使用jieba包)生成词云(中文语料)
生成词云(中文语料)知识背景jieba包:基于Python的中文分词工具,安装使用非常方便,直接pip即可如下是博主安装jieba包三种可以让分词更准确的方法:1:在jieba中添加中文词语2:添加自定义
词库
贾继康
·
2018-04-04 14:49
python
使用jieba分词+PyInstaller进行打包时出现的问题
使用jieba分词+PyInstaller进行打包时出现的问题 在使用jieba分
词库
的时候出现的问题,在这里写博客记录下,方便自己以后查询。小白博客,大神勿喷。
AllenLink
·
2018-04-03 10:06
Python
NLP
敏感词过滤的算法原理之DFA算法
我把它程序拿过来一看,整个过程如下:读取敏感
词库
、如果HashSet集合中,获取页面上传文字,然后进
零落_World
·
2018-04-02 15:16
nlp
算法
中文分词原理及常用Python中文分
词库
介绍
中文分词原理及常用Python中文分
词库
介绍转自进击的Coder公众号原理中文分词,即ChineseWordSegmentation,即将一个汉字序列进行切分,得到一个个单独的词。
Fordo_H
·
2018-03-29 20:13
python
中文分词
中文分词原理及常用Python中文分
词库
介绍
转自进击的Coder公众号原理中文分词,即ChineseWordSegmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。中文分词与英文分词有很大的不同,对英文而言,一个单词就是一个词,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,需要人为切分。
Judikator
·
2018-03-29 20:01
快乐的小老鼠
小羽毛牙牙学语那会,家里人都很注意,言谈中都不自觉地添了分思量,恨不得将整个世界编成最美的
词库
,一句一句教给他。
点风
·
2018-03-22 08:49
文本表示(Text Representation)之词集模型(SOW)&词袋模型(BOW)&TF-IDF模型
欢迎大家查看这些模型简单实现的代码……对于一个包含若干个文档的语料库(Corpus)C={doc1,doc2,⋯,docm}C={doc1,doc2,⋯,docm},将其所有词条(Tokens)整合为一个大的
词库
mlee1018
·
2018-03-08 20:04
nlp
Python 词云玩一下
github地址https://github.com/amueller/word_cloud安装词云sudopipinstallwordcloud生成一个文本,里面显示你要显示的
词库
,比如说生成一个叫做
君的名字
·
2018-03-08 18:12
【Python】
卡方检验 两分类实现
importjiebaimportnumpyasnpimportxlrdimportreimportjson#数据加载#jieba
词库
设置#读取文本,读取其中1个#统计包含a的单词和不包含a的单词#统计主题
dataastron
·
2018-03-05 14:31
python
Warning️:您的假期余额已不足10%,请尽快充电。
所以赶快来访问:小沈博客-一个14岁男孩的技术博客(https://blog.shenchenglin.cn)小沈
词库
(https://dict.shenchenglin.cn)访问五分钟,活蹦乱跳两小时
西湖凉咖啡
·
2018-02-19 17:58
NLP学习记录:语言模型
语言模型对于一个含有有限个单词的单
词库
V:从中选取若干个单词,以某种顺序排列,最后加上STOP符结束,就可以生成一个语句,将所有这些语句的集合称为V
浪漫主义AI
·
2018-02-17 21:02
THUOCL:清华大学开放中文
词库
词库
简介THUOCL(THUOpenChineseLexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文
词库
,词表来自主流网站的社会标签、搜索热词、输入法
词库
等。
·
2018-02-17 18:00
对鼠须管
词库
进行简单排序
在输入汉字时,会从这个文件wubi86.dict.yaml中读取可输入的汉字以及自动造词生成的汉字,所以这个文件里的内容如果过多会影响输入效率,并且有些繁体字或者生僻字平时我们根本用不到,与其让其拖慢我们输入效率还不如写写代码排序,因为之前我已经把其中一些繁体字和者生僻字去除了,所以这次的需求是,降序排序,过一过里面输入次数较少的词。image.png直接上代码吧oc版本#import@inter
十一岁的加重
·
2018-02-13 17:02
手把手教你制作 中英文 词云 | python demo
相关文章Python中文文本分析实战:jieba分词+自定义词典补充+停用词
词库
补充+词频统计准备Mac环境下直接pipinstallwordcloud安装windows环境下依赖cv++和.whl文件
陶瑞同学
·
2018-02-08 11:07
建模demo
java英语单词查询,输入一个单词根据字典查询单词意思
输入一个单词,可以查询单词意思,使用了字典算法思想:字典文件读取后按单词长度进行了分组,单词查询时也是按照单词长度选择对应的单词组进行查询,查询效率高使用单
词库
:https://wenku.baidu.com
PancrasD
·
2018-01-30 16:48
一个自动生成评论的小工具
文章目录基本思想基础使用
词库
的基本扩展简单数据引用其他
词库
注释引用多个同类组件希望后一个和前一个保持一致希望后一个和前一个不同
词库
的高级扩展空组件自定义权重制约关系为两个相关的组件中的每个内容添加一个属性添加一个制约关系的描述表把制约关系的描述表信息记录在组件库中举例制约关系加权重下载地址公司
平头某
·
2018-01-24 14:37
实验室
在家教育手记:2018-01-23
先学习生词,并把生词加入扇贝单词生
词库
:www.shanbay.com2日的在家教育:现在学会了三角形内角和是180度。学习有关等腰三角形,等边三角形,不等腰三角形。
黄山石
·
2018-01-23 08:10
Ubuntu系统安装和使用搜狗输入法
词库
不全,好多次都要翻页找半天,而且一点都不智能。最不好的是居然有时候会崩掉。。。打不出中文了。。关键时刻还是想念搜狗,刚好有linux版本,折腾了半天终于装好了,赶紧记下来。
江户川柯壮
·
2018-01-15 20:24
杂项
头条号命名实操方法
2.尽量用中文字符代替英文字符3.建立自己的标题热
词库
名词:职场、新人、老板、同事、常态、生存、智慧、办公室、白领、城市、潜规
春叶大叔
·
2018-01-11 01:51
Windows下为有道词典添加
词库
(图文详解)
原文地址:LittleStarLord的博客Windows下为有道词典添加
词库
(图文详解)http://blog.sina.com.cn/s/blog_6c0267490102wett.html有时候,
Gordon_run
·
2018-01-05 22:11
计算机相关单词查询
深度学习笔记之自然语言处理(word2vec)
如下:假设下一个词的出现依赖于它前面的一个词假设下一个词的出现依赖于它前面的两个词我们以下面的一个简单的
词库
表来讲解
物理小乾乾
·
2018-01-05 10:45
深度学习笔记
灵格斯词典(电脑端)+欧陆词典(手机端)
win10系统用灵格斯,可以:1.网页查词2.划词查询,3.可以自定义
词库
(这是我选择它的最主要原因)手机端用欧陆词典+每日英语听力可以:1.用每日英语听力练习听力,2.用欧陆词典查单词,背单词,查句子翻译
Gordon_run
·
2018-01-02 08:33
Comoputer
Words
计算机相关单词查询
积跬步至千里 积小流至江海——2017级1班2班语文成语英语生词争霸赛实录
英语生词复习,同学们从将近400个单词的
词库
中,一遍遍熟悉。有的同
AmyGuoChina
·
2017-12-28 19:42
同义词
词库
#TheASFlicensesthisfiletoYouundertheApacheLicense,Version2.0#(the"License");youmaynotusethisfileexceptincompliancewith#theLicense.YoumayobtainacopyoftheLicenseat##http://www.apache.org/licenses/LICENS
weixin_34381666
·
2017-12-19 12:00
人工智能
搭建股市机器人
然后尝试用另外一个号在群里发指令测试是否正常使用3、更多设置右击桌面悬浮框→应用→应用管理,选择对应插件进行启用、停用,或点击菜单按钮进行设置本程序已内置股市宝、群管功能【入群欢迎、广告监控等功能】、
词库
功能
悠悠悠的扬
·
2017-12-16 13:21
将搜狗
词库
.scel格式转化为.txt格式
由于项目中要生成一份行业
词库
,在分词训练前先找了找现成的
词库
,除了一些大数据训练样本外,发现搜狗
词库
的内容还是和行业相关度很切合的,而下载的搜狗
词库
是.scel格式,编码处理过的,无法直接得到txt格式的词语集合
小白旗
·
2017-12-14 10:13
python
python使用tf-idf法判断文本关键词
本demo用python语言结合jieba分
词库
+urllib爬虫库+beautifulsoup的html分析工具实现了tf-idf
codes_first
·
2017-12-05 22:59
breadcrumb
NLP成长计划
(日记)创业这件事,满满是传奇
我搜刮脑海
词库
,不知道用哪句幽默话来打消他的不解,又能完好延续他对我传奇性的幻想。其实,从大学寝室给我起的外号可以说明这姑娘外表和内心世界分离的悖论。
杜婉公众号
·
2017-11-28 13:45
python-字典输出学习
*1、添加单词``2、查找单词3、删除单词4、退出单词******谢谢使用单词本*****请选择:代码为:估计还有bug待以后在次完善#encoding=utf-8WordLibrary={}#存放单
词库
知止内明
·
2017-11-24 23:52
python学习字典查询
python学习笔记
Flashtext:大规模数据清洗的利器
比如,对于一个文档有N个字符,和一个有M个词的关键
词库
,那么时间
chen_h
·
2017-11-19 00:00
nlp
不错的php分词系统-PHPAnalysis无组件分词系统
阅读更多分词系统简介:PHPAnalysis分词程序使用居于unicode的
词库
,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。
yangjiyue
·
2017-11-14 08:00
php
分词
不错的php分词系统-PHPAnalysis无组件分词系统
阅读更多分词系统简介:PHPAnalysis分词程序使用居于unicode的
词库
,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。
yangjiyue
·
2017-11-14 08:00
php
分词
浅谈python jieba分词模块的基本用法
jieba(结巴)是一个强大的分
词库
,完美支持中文分词,本文对其基本用法做一个简要总结。
AzureSky
·
2017-11-09 11:09
闲话Google拼音输入法及其它(三)
原文链接:https://yq.aliyun.com/articles/431808上回书说到Sogou在输入法
词库
里暗藏彩蛋,Google一不留神中了圈套。
weixin_34248258
·
2017-11-08 15:00
【Python】Jupyter Notebook的安装
博主最近又开始重拾python了,这次主要是为了爬取网上的一些
词库
来扩充微信小程序的
词库
量,微信小程序输入押韵机器即可使用(打一波广告哈)。
豪豪豪Hilox
·
2017-10-31 14:53
Python
如何避免成为一个油腻的中年猥琐男
曾几何时,连“曾几何时”这个词都变得如此矫情,如果不是在特殊的抒情场合,再也不好意思从
词库
里调出来使用,连排比这种修辞都变得如此
冯唐
·
2017-10-27 00:00
通过读取配置文件完成英汉转换
读取
词库
文件。将消息截取成单个的单词。将单词与
词库
中相对应的汉语替换。返回翻译好的消息。判断消息中是否含有英文,运用了正则表达式去匹配字符串中是否含有字母。
计算机-程浩
·
2017-10-23 21:00
R语言:如何批量导入搜狗
词库
首先是建立相关目录#建立相关目录#建立数据目录,本项目所有数据都保存在这个文件夹下(包括搜狗
词库
文件)。
灏喾
·
2017-10-18 09:19
R语言
干货|使用搜狗
词库
优化资源标签
点击上方“中兴开发者社区”,关注我们每天读一篇一线开发者原创好文▍作者简介作者王师墨是一名网络管理软件开发工程师,长期致力于网管软件的开发实践,也在不断进行智能运维相关新技术的学习。今天他为我们带来关于优化网管系统资源画像相关内容的分享,希望对网管开发人员、运维人员及相关从业人员能有所帮助。引子前段时间通过UserLabel分词对网管系统中资源做了标签画像的。在实践过程中使用了自定义的字典,进行简
中兴开发者社区
·
2017-10-17 00:00
[NLP]如何进行情感分析
1.准备1.1种子
词库
在真正开始前,首先想想人看到一句话是如何思考的。
android_ruben
·
2017-10-08 12:46
NLP
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他