E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词库
用C语言将搜狗输入法
词库
转换成QQ拼音输入法
词库
搜狗输入法
词库
格式:'ni'kan'xia你看下'ni'kan'xia'gai'hou你看下改后'ni'kan'xing'ma你看行吗'ni'kan'zen'me'yang你看怎么样'ni'kan'zhe
G19931112
·
2020-09-14 06:01
c/c++
Elasticsearch 之(24)IK分词器配置文件讲解以及自定义
词库
1、ik配置文件ik配置文件地址:es/plugins/ik/config目录IKAnalyzer.cfg.xml:用来配置自定义
词库
main.dic:ik原生内置的中文
词库
,总共有27万多条,只要是这些单词
weixin_30780221
·
2020-09-14 01:03
ik分词器动态加载数据到ik的系统
词库
(不采用配置文件配置自定义
词库
的方式)...
网上对于ik分词器的自定义
词库
大多是采用配置文件配置自定义
词库
,这里直接将需要添加的
词库
加到ik的系统
词库
中。
chigua1760
·
2020-09-14 00:23
ES 实现实时从Mysql数据库中读取热词,停用词
IK分词器虽然自带
词库
但是在实际开发应用中对于
词库
的灵活度的要求是远远不够的,IK分词器虽然配置文件中能添加扩展
词库
,但是需要重启ES这章就当写一篇扩展了其实IK本身是支持热更新
词库
的,但是需要我感觉不是很好
词库
热更新方案
彼岸舞
·
2020-09-13 23:00
stardict 安装
1.安装stardict软件2.下载
词库
包http://abloz.com/huzheng/stardict-dic/
zhangjiejemyok
·
2020-09-13 20:46
ubuntu
paip 自定义输入法多多输入法
词库
的备份导出以及导入
paip自定义输入法
词库
的备份导出以及导入作者Attilax艾龙,EMAIL:
[email protected]
来源:attilax的专栏地址:http://blog.csdn.net/attila/64
weixin_33743703
·
2020-09-13 20:50
中文词频统计
pipinstalljiebaimportjiebaljieba.lcut(text)4.更新
词库
,加入所分析对象的专业词汇。jieba.add_wor
weixin_34177064
·
2020-09-13 17:05
利用Lucene.net搭建站内搜索(2)---分词技术
在搜索引擎运行的机制中,有很多种中文分词的办法,例如正向最大匹配分词,逆向最大分析,基于统计的分词,基于
词库
的分词等。但是在
weixin_34138056
·
2020-09-13 17:03
Python文本分析-常用中文停用词表(Chinese Stop Words)
在做jieba中文分词处理,进行文本分析,必不可少的停用词处理,国内比较常用的中文停用
词库
,有以下几个:中文停用词表哈工大停用词表百度停用词表四川大学机器智能实验室停用
词库
而@elephantnose对以上
叶小乙研习社
·
2020-09-13 02:01
数据挖掘与分析
NLP自然语言处理
自然语言处理
python
数据挖掘
自动提取文章摘要AutoSummary
在自动摘要提取过程中,使用了一个分
词库
:CppJieba分
词库
。因此在头文件中包含了头文件“Application.hpp”。思路:1、对文章提取关键字。通常,关键字能够代表这篇文章的所描述的内容。
MA201506
·
2020-09-13 01:12
Tokenizers: How machines read
Splittheinputintosmallerchunks)2.向量化(Representtheinputasavector)在训练向量前,我们要先确定好分词的协议(tokenizationpolicy).1)需要有一个庞大的
词库
Claroja
·
2020-09-12 22:02
Python
python
关键字提取算法TF-IDF
总起TF-IDF,理解起来相当简单,他实际上就是TF*IDF,两个计算值的乘积,用来衡量一个
词库
中的词对每一篇文档的重要程度。下面我们分开来讲这两个值,TF和IDF。
weixin_30496751
·
2020-09-12 20:12
软件构造lab2
这个任务就是在句子中根据
词库
添加单词。3.1.1Getthec
qq_42725437
·
2020-09-12 20:33
自然语言处理(二)马尔可夫模型
初始概率矩阵:找出所有出现在词首的汉字,并统计它们出现在词首的次数,这个汉字的初始概率就是以这个汉字开始的单词/所有单词(是
词库
所有词还是语料所有词(重复的问题,为什么)),没统计的汉字就认为出现在词首的概率是
才大难为用
·
2020-09-12 12:29
自然语言处理
C# 实现敏感词过滤
实现该敏感词过滤采用的是DFA算法,参考文章:https://blog.csdn.net/chenssy/article/details/26961957具体实现步骤如下:第一步,构建敏感
词库
(WordsLibrary
zhoumouren88
·
2020-09-12 11:41
技术
Elasticsearch之插件es ik配置自定义中文分词词典
地址下载对应版本的ik:https://github.com/medcl/elasticsearch-analysis-ik2.配置自定义中文分词词典如果宝宝们已经安装好ik,在es中测试分词成功的,可以添加自己的热
词库
与停止库
晴空马仔
·
2020-09-12 09:49
linux
python发送qq邮件
utf8importsmtplibfromemail.MIMEMultipartimportMIMEMultipartfromemail.MIMETextimportMIMETextmsg=MIMEMultipart()msg['From']='
[email protected]
'msg['To']='张三'msg['Subject']='优美诗
词库
注册验证码
sina微博_SNS程飞
·
2020-09-12 06:31
python
python
smtp
qq
免费关键词挖掘工具-python关键词挖掘工具源码
为什么要做个关键词挖掘工具最近做了个平台,需要做seo,然后要挖掘关键词,建立关键
词库
,然后根据关键词做优化.网上找了一圈,大部分关键词感觉工具都是要收费的,也不能下载,一个个复制实在是麻烦.要获得关键词
天丁
·
2020-09-12 06:46
python源码
关键词挖掘工具
python关键词挖掘
长尾关键字挖掘工具
python
python词频统计实例
#词频统计importjieba#分
词库
包importsnownlp#情感分析words='非常时尚鞋子,非常非常非常时尚的一款鞋子,设计好看,设计设计做活动买的,超超超超超超超超超划算。满意。
一梦如意
·
2020-09-12 00:48
python
jieba
词频统计
python
大数据
中文文本分析相关资源汇总
中文文本数据逻辑性分析库中文文本数据(挖掘)分析相关资源汇总一、Python中文数据处理库项目地址简介jieba分词https://github.com/fxsjy/jieba中文分
词库
中文复杂事件的概念与显式模式
邓旭东HIT
·
2020-09-11 20:10
java B2B2C多用户商城系统-搜索分词架构分享
需求分析:在javashop电商系统中,商品数据是存在elasticsearch中,使用ik分词器分词,ik分词器的
词库
内置了2万多个。
kingapex1
·
2020-09-11 19:18
Java
随笔
b2b2c架构分享
电商源码分享
java
B2B2C
sphinx索引工具的使用
高性能搜索(一千万条查询速度为毫秒级)3处理海量数据(单一索引最大可包含一亿条记录)4优秀的相关度算法但是sphinx只支持英文与俄文,这里我们需要另一款软件,coreseek,基于sphinx,添加了中文
词库
yt_php
·
2020-09-11 18:45
工具的使用
Robotframework自定义关键字库
但是我们可以通过扩展RF自定义一个关键
词库
来满足我们的业务需求,而且我们非以随时向这个库中添加关键字方法
weixin_30348519
·
2020-09-11 10:38
程序人生:外链建设流程与细节都有哪些
1、树立职业的要害
词库
关于一个普通外链专员那肯定要了解自己的职业,要预备好与自己相关的要害词,而且不断拓展自己网站的要害
词库
,最好把职业相关的长尾
qq_42302805
·
2020-09-11 09:16
网站优化
免费源码空间域名
C# RichTextBox 获取当前光标的行号列号
相对于API得到的数值,这个方法或许好很多,如果是很长很多行的文本(如:五笔
词库
),API会有溢出,得到的是个莫名其妙的数值,令人抓狂。
茗香淡然
·
2020-09-11 09:56
.NET/C#
MySQL+Sphinx+SphinxSE安装步骤(sphinx-0.9.8)
LibMMSeg在本文中用来生成中文分词
词库
。)以下压缩包“sphinx
ljl_xyf
·
2020-09-11 09:37
sphinx实时索引
ES设置多个自定义分词器,每个分词器使用不同的
词库
ES中如何设置自定义分词器并且每个分词器使用自己定义的
词库
?1.首先在ansj.cfg.yml中配置然后在ansj-library.properties文件中添加词典放置路径。。
a1035082174
·
2020-09-11 08:10
一个文本情感识别与舆情分析的算法设计思路
zfenng.diandian.com/post/2012-04-17/19659788最近要和朱一烨同学一起改进一下实验室目前的舆情监测系统,经过一番论文的阅读后基本确立了一个情感/褒贬识别的思路:1.情感
词库
的建立与权重的调整
ArvinStudy
·
2020-09-11 07:50
情感分析
中文姓名识别算法
首先说明:jcseg使用的不是机械匹配中文姓名(虽然
词库
里面有一些人名,cc-cedict里面整理出来的),本人觉得这样太机械了,这么的中文姓名不可能都存
词库
。如何实现的呢?
一品鸟人
·
2020-09-11 06:52
多叉树结构实现搜索算法
author007*@dateApr7,201510:50:40AM*@versionV1.0*@Description:TODO(DFA多叉树结构实现搜索算法)**/publicclassDFA{/***关键词
词库
zishan007
·
2020-09-10 22:28
JAVA
AI最全数据集汇总:语音、歌声、音乐、图片、视频等领域开源数据集链接汇总
口语维基百科语料库语音命令数据集零资源语音挑战ISOLET数据集阿拉伯语言语料库TIMIT语料库**音响/自然**环境音频数据集城市声音分类城市声音数据集鸟类音频检测挑战中文文本分类数据集THUCNews中文完形填空数据集清华大学开放中文
词库
中华古诗词数据库
缠禅可禅
·
2020-09-10 19:53
歌声合成从入门到实战
语音合成原理与经典论文解读
机器学习
深度学习实战讲解与分析
VIM 插件 VimIM 基本使用方法
2、插件下载地址:https://vimawesome.com/3、这次演示中所使用的版本是:vimim1.0.0.14、插件的安装:将vimim.vim和
词库
文件(如:vimim.wubi.txt)扔到
pen_616
·
2020-09-10 15:56
VIM
Windows10安装配置Rime双拼输入法
刚刚在Ubuntu中折腾好了Rime输入法并导入了酱香的搜狗个人
词库
,好香啊,决定在Windows上也换掉流氓搜狗了,搜狗
词库
导出和转换的方法参考上一篇https://blog.csdn.net/lpwmm
DexterLien
·
2020-09-10 14:57
Windows10
介绍N-gram比较清楚的博客
from:https://www.cnblogs.com/think90/articles/11522978.html无监督构建
词库
:更快更好的新词发现算法新词发现是NLP的基础任务之一,主要是希望通过无监督发掘一些语言特征
hellocsz
·
2020-09-10 13:53
意外发现:安装搜狗输入法9.8正式版,没出现任何广告弹窗
还是……客观地说,搜狗输入法的技术还是不错的,用起来很顺手,尤其是它的细胞
词库
有口皆碑。皮肤也很不错,比QQ
阴山
·
2020-09-10 12:19
Atitit.atiInputMethod v2
词库
清理策略工具 q229
Atitit.atiInputMethodv2
词库
清理策略工具q2291.1.Foreigncode外码清理11.2.垃圾词澄清11.1.Foreigncode外码清理OnlycanAsciiandnumBeforeBe4For41.2
weixin_33674976
·
2020-09-10 10:01
python基础-古诗词填词游戏
文章目录1.项目需求2.思路梳理3.诗句处理遇到的问题有4.目录结构5.实现步骤6.收获7.不足1.项目需求用python实现古诗词填词游戏诗
词库
的组成初中古诗备注:诗
词库
参古诗文网https://so.gushiwen.cn
Yph_Jerry
·
2020-09-01 18:09
python基础
python
米斯特白帽培训讲义 工具篇 BruteXSS
BruteXSS从指定的
词库
加载多种有效载荷进行注入,并且使用指定的载荷和扫描检查这些存在XSS漏洞的参数。得益于非常强大的扫描功能,在执行任务时,BruteXSS非常准确而且极少误报。
布客飞龙
·
2020-08-26 23:03
【模拟】智能T9英文输入法
某款新型手机为了方便用户,希望开发一种新的英文输入法.要求在输入英文的时候输入法不但能够做到自动联想,还能进行自动纠错.譬如用户希望输入hello这个单词,他应该输入43556,但是他不小心输入了46556.输入法发现
词库
中找不到任何匹配的单词
dnldnth
·
2020-08-26 15:46
NOIP
Python个人快速入门学习(九)jieba库的使用
jieba库的使用1.jieba库:优秀的中文分词第三方库-中文文本需要通过分词获得单个的词语-jieba是第三方库,需要额外安装:-pipinstalljieba2.jieba分词的原理-利用了一个中文
词库
CC_且听风吟
·
2020-08-26 15:03
#
Python基础
Python
如何隐藏命令按钮(CBA)
在上月的项目开发中,遇到了这样一个问题:我做的是掌上法律词典,分成三个独立模块:法律法规、法律
词库
和使用说明。
WaveDHW
·
2020-08-26 14:51
Symbian
Elasticsearch如何安装中文分词插件ik
elasticsearch-analysis-ik是一款中文的分词插件,支持自定义
词库
。
oO归去来兮Oo
·
2020-08-26 13:31
ElasticSearch
word2vec
fromgensim.modelsimportword2vec结果好坏跟训练
词库
有关。#[['I','am','hansome'],['Mu','wen','looks','cool'],...]
m0_38102647
·
2020-08-26 13:12
机器学习算法
文章分词/jieba的应用
'life','is','short,you','need','python']2.jieba:中文第三方库pipinstalljieba(CMD)//jieba安装3.jieba分词原理**依靠中文
词库
确定汉字之间的组成
日光倾
·
2020-08-26 12:58
python课本
Python jieba库的使用
是优秀的中文分词第三方库-中文文本需要通过分词获得单个的词语-jieba是优秀的中文分词第三方库,需要额外安装-jieba库提供三种分词模式,最简单只需掌握一个函数(2)、jieba分词的原理Jieba分词依靠中文
词库
MessiNine
·
2020-08-26 11:58
Python
Python之jieba库使用
jieba库是优秀的中文分词第三方库中文文本需要通过分词获得单个的词语需要额外安装jieba库提供三种分词模式,最简单只需掌握一个函数命令行安装pipinstalljiebajieba分词的原理利用一个中文
词库
jinsefm
·
2020-08-26 11:57
Python
1.23解放碑雅思全程班阅读
⚠如果全文只有a一个顺序题,a题型往往是全文题有
词库
有选项的summarystep1NB出现情况两种大小标题对比step2习题与讲解没有NB答案一定不会重复
想睡觉的胖胖
·
2020-08-25 11:23
360桌面助手待办事项同步/迁移的方法(从一台电脑迁移到另外一台电脑上)
自己的电脑升级,需要把各种数据迁移过来,最难办的是迁移各种软件的配置,数据信息,例如搜狗输入法用户
词库
等。这个搜狗输入法提供了导出
词库
,再导入的功能。
netfairy2
·
2020-08-25 07:49
Windows
word2vec and glove优缺点
传统方法假设我们有一个足够大的语料库(其中包含各种各样的句子,比如维基百科
词库
就是很好的语料来源)那么最笨(但很管用)的办法莫过于将语料库里的所有句子扫描一遍,挨个数出每个单词周围出现其它单词的次数,做成下面这样的表格就可以了
To_be_brave1
·
2020-08-25 04:32
自然语言处理
提升网站权重的五大诀窍
这些文章都是在站长工具的
词库
里存在的且指数不为0的吗?如果不是那么你不可能增加权重的。所以我们出来要解决收录和排名问题外,更要注意这些标题书写时,应该是包含正确的关键词的。
c花栀
·
2020-08-25 03:45
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他