E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词库
Rime中文输入模式下的英文
词库
我仔细看了一下配置文件luna_pinyin_simp.extended.dict.yaml,里面加载了一个词典文件然后,打开luna_pinyin.cn_en.dict.yaml我就知道可以输入的部分英文是在这个
词库
文件定义的
xigua1234
·
2019-10-31 08:02
算法-DFA算法-敏感词过滤算法(OC、Swift、Python)
一般的思路可能是遍历敏感
词库
,然后把一段文字的敏感词过滤掉,但是针对比较大的
词库
时(比如我们的敏感
词库
10万),这样非常耗
金三胖
·
2019-10-25 05:02
swift
objective-c
python
2019-10-23(python第三天)(上)
中文分词相比之下,英文单词之间由于有空格,因此不需要分词,中文则不同,这就需要使用第三方库来进行分割,因此我们需要引用jieba分
词库
。
EeuwigHr
·
2019-10-24 09:43
Anki&在线词典助手&划词制卡助手
因为要制作自己的单
词库
,耗时耗
haining_gogogo
·
2019-10-16 14:39
Fcitx使用搜狗
词库
与皮肤
在\(\text{Linux}\)环境下,\(\text{Fcitx}\)确实是最好用的开源输入法之一。然而\(\text{Windows}\)下的巨头输入法——搜狗,对\(\text{Linux}\)的支持却并不算到位,迄今为止,大多数\(\text{Linux}\)的最新内核都无法使用搜狗,譬如\(\text{Ubuntu19.04}\)。所以,\(\text{Linux}\)下原生的开源输入
洛水·锦依卫
·
2019-10-14 09:00
产品动态 | 腾讯云知文NLP 9月最新动态
1.知文NLP·智能分词功能介绍智能分词新增热词更新、全模式分词新功能,提供智能分词(基本词和短语)、词性标注、命名实体识别功能,智能分词支持
词库
自更新、全模式分词。
wx5d9d5070ee182
·
2019-10-10 19:04
腾讯云知文NLP
智能分词
敏感词识别
优势教养,成就孩子的幸福人生
你是毫不犹豫的写下优点还是思考半天努力搜索着
词库
,寻找自己的优势?谁能没有优点?大家有没有听过木桶理论?木桶定律是讲一只水桶能装多少水取决于它最短的那块木板。
独一无二的心扬
·
2019-10-05 17:19
2019-10-03
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。中午休息的时候背的。今天学了流利说的英语课程。学习了懂你,国庆期间没有课。今天读书了。今天写了
大梦斋
·
2019-10-03 21:55
2019-10-02
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。中午休息的时候背的。今天学了流利
大梦斋
·
2019-10-02 19:06
2019-10-01
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。中午休息的时候背的。今天学了流
大梦斋
·
2019-10-01 19:19
Mac三分之三 常用App推荐
普通用户百度输入法:知名度不如搜狗,然后手机输入法一直用百度,有同步
词库
.然后单行模式也挺简洁的.360极速浏览器,习惯而已.鼠标悬停指向当前页也是一绝.PDF也支持哦Snipaste-截图+贴图https
leil_
·
2019-10-01 12:26
Mac三分之三 常用App推荐
普通用户百度输入法:知名度不如搜狗,然后手机输入法一直用百度,有同步
词库
.然后单行模式也挺简洁的.360极速浏览器,习惯而已.鼠标悬停指向当前页也是一绝.PDF也支持哦Snipaste-截图+贴图https
leil_
·
2019-10-01 12:26
2019.9.30,继续停休值啊
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。中午休息的时候背的
大梦斋
·
2019-09-30 20:45
2019-09-26
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。上午上班时候稍微清闲的时候背的。
大梦斋
·
2019-09-26 20:10
文本特征提取
文本特征的通用信息源文本分类问题当中的对象词:在英文文本处理当中面对的是单个词组用空格隔开容易区分,在中文文本当中需要通过特定的
词库
如python中的jieba、中科院、清华、哈工大的一些分词工具来进行分词处理
Dulpee
·
2019-09-26 18:34
深度学习
自然语言处理
NLP之文本表示
词库
:训练数据中出现的所有单词,可以使用jieba分词统计出来。混淆矩阵:混淆矩阵是数据科学、数据分析和机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别
prepared
·
2019-09-25 00:00
nlp
python基于隐马尔可夫模型实现中文拼音输入
在网上看到一篇关于隐马尔科夫模型的介绍,觉得简直不能再神奇,又在网上找到大神的一篇关于如何用隐马尔可夫模型实现中文拼音输入的博客,无奈大神没给可以运行的代码,只能纯手动网上找到了结巴分词的
词库
,根据此训练得出隐马尔科夫模型
·
2019-09-24 01:04
PHP制作百度词典查词采集器
百度dict采集样本写的采集百度dict词典翻译后的所有结果数据,当然附带了13.5w单
词库
和采集简单的案例,这里我把写出的主要类dict.class.php放出来,项目地址http://github.com
·
2019-09-23 20:30
shell脚本实现批量采集爱站关键
词库
shell批量采集爱站关键
词库
,心血来潮写着玩的,还不完善,先放出来,后期慢慢更新,功能虽然简单,同类工具也很多现成的,但毕竟是自己写出来的工具,感觉还是很不一样滴!
·
2019-09-23 19:28
Shell实用技巧:快速去除字符串中的空格
在整理
词库
的过程中遇到一个问题,有些其实是同一个关键词之关有空格的话,无法正常被去重,那么有没有办法能快快速去除这些字符中间的空格呢?经过百度一番,找到一个解决办法,记录一下。
·
2019-09-23 19:27
python生成词云的实现方法(推荐)
所要用到的python库有jieba(一个中文分
词库
)、wordcould、matplotlib、PIL、numpy。首先我们要做的是读取歌词
·
2019-09-22 22:56
利用SEM辅助SEO优化
2、关键词拓展关键词挖掘是网站优化一个常规的流程,但为了使得关键
词库
,建立的更加精准,
迷路的小爬虫
·
2019-09-21 21:32
利用SEM辅助SEO优化
2、关键词拓展关键词挖掘是网站优化一个常规的流程,但为了使得关键
词库
,建立的更加精准,
迷路的小爬虫
·
2019-09-21 21:32
中文命名实体识别NER详解
其实我觉得,我们通过导入
词库
的方法进
深圳湾刘能
·
2019-09-21 16:17
NLP
NER
命名实体识别
2019-09-20
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。
大梦斋
·
2019-09-20 21:09
这种让人开口就飚外语的病,还能删掉大脑中的“颜色
词库
”
脑卒中俗称中风,常常对大脑特定区域造成损伤,可能会导致失语、偏瘫等严重的后遗症。如果受损的区域较小,患者还可能会出现一些特别的表现。例如国内媒体报道过一位湖南老太太,中风后竟然说起了英文——她年轻时是位英语老师,疾病部分破坏了她的语言中枢,让她说母语出现障碍,但是和外语有关的大脑部位没有受损。类似案例在世界各地都有报道。最近,CellReports报告了另一个奇特的病例:一位脑卒中患者康复之后,唯
itwriter
·
2019-09-18 18:00
如何提高程序员的键盘使用效率?
2、使用合适的输入法:与以前的微软拼音输入法、智能ABC输入法相比,现在的搜狗输入法、QQ拼音输入法、讯飞输入法
词库
越来越大,而且普遍支持词组、句子连续输入以及联想输入,极大提高了键盘使用效率。
starhrw
·
2019-09-17 21:00
2019-09-16
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。也是出租车上学的。今天学了流利说的英语课程。学习了懂你,今天听了两堂教学课
大梦斋
·
2019-09-16 19:11
Python - 常用库 - OpenCC(中文繁简体转换)
1.OpenCC介绍OpenChineseConvert(OpenCC)是一个开源的中文简繁转换项目,致力于制作高质量的基于统计预料的简繁转换
词库
。
孤独的侠客
·
2019-09-12 19:53
操作系统-Linux
开发语言-Python
Elasticsearch之IK分词器配置
IK分词器配置文件讲解以及自定义
词库
实战1、ik配置文件ik配置文件地址:es/plugins/ik/config目录IKAnalyzer.cfg.xml:用来配置自定义
词库
main.dic:ik原生内置的中文
词库
击水三千里
·
2019-09-12 08:14
Elasticsearch
MultiTes Online:在线编写MultiTes Pro同义
词库
!
在线编写MultiTesPro同义
词库
,无需担心网络管理、防火墙设置、黑客入侵、HTML编程、数据库管理、服务器维护、系统升级或每次进行更新时预生成同义
词库
网站。
哲想软件
·
2019-09-12 00:00
MultiTes WDK:允许使用任何Web浏览器的用户查询和搜索您的同义
词库
!
作为MultiTesPro的附加产品,MultiTesWDK是一个实时网关,它可以在您的内部网或互联网上浏览MultiTesPro同义
词库
,允许使用任何Web浏览器的用户查询和搜索您的同义
词库
。
哲想软件
·
2019-09-12 00:00
MultiTes EDK:帮助您在组织的服务器上部署和发布同义
词库
!
作为MultiTesPro的补充,MultiTesEDK由一组工具组成,帮助您在组织的服务器上部署和发布同义
词库
(.th2)。
哲想软件
·
2019-09-12 00:00
NLP总结:文本分类(持续更新)
文章目录工程架构项目流程语料库构建
词库
构建训练数据数据处理清洗文本切割特征工程模型极简常用示例代码应用经验总结工程架构配置congfig常量constant计时器timer数据可视化visualize日志
基基伟
·
2019-09-04 17:29
自然语言处理
macbook如何切换输入法 macbook右上角没有语言和文字解决方法
联想功能极差,
词库
也很少,用它来打字是何种体验,相信各位都知道。好在macOS跟Windows系统一样,也是支持第三方输入法的,小编就选择了之前在Windows平台中常用的某个输入法。
佚名
·
2019-08-30 10:09
elasticsearch部署
推荐到官网下载ES源码的打包,个人觉得比起通过yum等包管理工具安装更灵活,且方便管理,比如目录自主可控,便于配置安装插件更方便同义词等
词库
词库
维护##ES长期运行推荐使用进程管理工具来运行ES,这里使用
Ayhan_huang
·
2019-08-27 11:36
Elasticsearch
浅谈nlp知识点
1.分词jieba(结巴)是一个强大的分
词库
,完美支持中文分词。可以自己导入分词词典,也可以做词性标注,对于未登录词,使用HMM隐马尔科夫模型处理。当然还有其他的分词,比
hufei_neo
·
2019-08-26 14:53
自然语言处理
2019-08-21,恢复炎热的周三
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。今天只学了十来
大梦斋
·
2019-08-21 19:42
BPE论文解读
论文:NeuralMachineTranslationofRareWordswithSubwordUnitshttps://github.com/rsennrich/subword-nmt1,一般的
词库
生成方式
yealxxy
·
2019-08-20 21:01
paper-reading
2019-08-19,疲惫的周一
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。今天只学了十来个单词。今天学了流利说的
大梦斋
·
2019-08-19 18:34
2019-08-16
今天背了单词,有复习之前的,也有新的,这个
词库
果然比较难。今天只学了十来个单词。今天学了流利
大梦斋
·
2019-08-16 22:06
养娃记
刚刚21个月,应该算一枚活跃型宝宝,喜欢说话,天天叽叽喳喳的,会自己从1数到10,记得我们家住在20楼,家里逮哪画哪,运动量很大,会说简单的句子,
词库
丰富,日常生活中的词汇基本都会说了,按电梯、关空调、
心阅jia
·
2019-08-14 15:02
关于成人英语学习,环球给你的5大建议
市面上背单词的手机App很多,挑个界面喜欢的,
词库
选择依次从:初中词汇、中考词汇(我没打错,重复是复习)、新概念1、新概念2、高考词汇、四级词汇,其实你会发现这些
词库
的单词差不多,无非是重复,而学习单词就是靠不断的重复
环球英语Jason老师
·
2019-08-14 12:31
python创建属于自己的单词
词库
便于背单词
本文实例为大家分享了python创建单词
词库
的具体代码,供大家参考,具体内容如下基本思路:以COCA两万单词表为基础,用python爬取金山词霸的单词词性,词义,音频分别存入sqllite。
虚谷dr
·
2019-07-30 16:34
用python wxpy管理微信公众号并利用微信获取自己的开源数据
调用接口并保存双方的问答结果可以作为自己的问答
词库
的一个数据库累计。这些数据可以用于自己训练。而最近希望获取一些语音资源,用于卷积神经网络的训练。。
冻雨冷雾
·
2019-07-30 11:54
用python wxpy管理微信公众号,并利用微信获取自己的开源数据。
调用接口并保存双方的问答结果可以作为自己的问答
词库
的一个数据库累计。这些数据可以用于自己训练。而最近希望获取一些语音资源,用于卷积神经网络的训练。。
冻雨冷雾
·
2019-07-30 11:00
Chinese NER Using Lattice LSTM【论文笔记】
一、摘要 作者在中文的NER任务上提出了一个新颖的lattice-structuredLSTM,编码输入字符序列和所有与
词库
匹配的潜在词语。
Chevalier~
·
2019-07-22 14:56
知识图谱
NLP知识图谱论文笔记
NER
命名实体识别
中文NER
知识图谱
信息抽取
每日一词Day 542: chasten | 每周英语课堂预告
↓单词分享卡↓扫码解锁往期单
词库
↑每日打卡温故知新↑订阅全年《经济学人·商论》,即可加入学习社区,解锁「每日一词」栏目的全部功能:包含当日单词的两个《经济学人
经济学人
·
2019-07-17 00:00
jieba分词流程及算法学习
目录jieba特点算法jieba分词流程图Trie树建立DAG词图分词DAG代码实现计算全局概率Route,基于词频最大切分组合隐马尔可夫HMM算法引用jiebaPython中文分
词库
:github:https
红瓤大柚子
·
2019-07-15 17:38
jieba
大数据
中文分词
算法
中文分词
HMM
jieba
算法
基于贝叶斯分类器的社区UGC反垃圾模型
我遇到的问题:前期获取数据量少,需要人工处理,需要自定义分词
词库
和主题词
词库
,文本预处理过程复杂,需要全方位思考。
alicelmx
·
2019-07-14 13:42
机器学习和自然语言处理相关
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他