E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
stardict取词
Bert中文提
取词
向量(GPU)
环境Ubuntu16.04Python3.6TensorFlow>=1.10安装1.下载预训练BERT中文词向量模型下载下面列出的模型,然后将zip文件解压到要运行的文件夹中下载链接:https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip2.安装server和client通过pip安装ser
jufengada9
·
2019-05-15 09:42
[笔记]word2vec 的cbow模型和skip-gram模型
word2vec原理(二)基于HierarchicalSoftmax的模型word2vec中的数学原理详解(三)背景知识如何获
取词
向量?
deardeerluluu
·
2019-05-06 00:00
深度学习
中文分词
中文分词
双向最大匹配:按照最大匹配原则,选
取词
数切分最少的作
dreampai
·
2019-04-28 14:40
Lucene打分公式详解(TFIDFSimilarity)
给定两个文本,按照余弦相似度算法进行相似度度量一般需要以下步骤:1、提
取词
条(term)进行向量化。也就是将文本进行分词,每个不同的词都表示为一个term(也就是维度)。2、处理词条
黄智霖-blog
·
2019-04-15 21:11
全文检索
【NLP】word2vec详解
前言 word2vec是Google于2013年开源推出的一个用于获
取词
向量的工具包,它简单、高效,因此引起了很多人的关注。
Daycym
·
2019-04-02 12:20
NLP
【NLP】word2vec详解
前言 word2vec是Google于2013年开源推出的一个用于获
取词
向量的工具包,它简单、高效,因此引起了很多人的关注。
Daycym
·
2019-04-02 12:20
NLP
idea快捷键冲突——win10
02改成00(b)输入法简繁体切换:Ctrl+Shift+F——输入法快捷键设置-->关闭此快捷键#2.与非系统自带应用快捷键冲突钉钉、QQ、微信、搜狗输入法、Intel显卡控制面板、有道词典……截图、
取词
alliswell008
·
2019-03-30 01:18
tools
Datawhale《深度学习-NLP实践》Task2
1.基本文本处理技能1.1分词的概念(分词的正向最大、逆向最大、双向最大匹配法);最大匹配是指以词典为依据,
取词
典中最长单词为第一个次取字数量的扫描串,在词典中进行扫描(为提升扫描效率,还可以跟据字数多少设计多个字典
黑桃5200
·
2019-03-05 23:05
Python
Tensorflow
NLP
使用BERT获取中文词向量
然而BERT获
取词
向量的门槛要比word2vec要高得多。笔者在这里介绍一下如何获取BERT的词向量。笔者在获取BERT词向量的时候用到了肖涵博士的bert-as-service,具体使用方式如下。
老三是只猫
·
2019-03-04 17:41
python
文本挖掘
HanLP里使用DAT存取字典的方法
CoreBiGramTableDictionary.java和CoreDictionary.java结构思路词典里文件的格式:
[email protected]
文件用一个TreeMap>来读
取词
典
lanlantian123
·
2019-02-27 16:59
H5小游戏 【篇一】 组词游戏
H5小游戏篇一组词游戏项目功能简介词库功能,项目文件里配有csv格式的中文常用词组词库,每次随机抽
取词
语进行游戏匹配消除功能,自动在词库中匹配选中词语并进行消除选中动画以及消除动画,均由svg生成爆炸动画智能提醒系统
SuperX
·
2019-02-25 00:00
javascript
基于Word2Vec的文本关键词抽取方法
大多数人都是将Word2Vec作为词向量的等价名词,也就是说,纯粹作为一个用来获
取词
向量的工具,关心模型本身的读者并不多。
小白的进阶
·
2019-02-21 19:49
python
NLP
MacBook笔记本怎么使用有道词典进翻译文本?
3、勾选
取词
和划词功能。4、勾选之后可能会出发系统的提示音。无需惊扰。5、这个时候如果想中文翻译成英文,直接将鼠标放在单词上即可。6、如果
天朝穷光蛋0
·
2019-02-18 15:23
使用BERT获取中文词向量
然而BERT获
取词
向量的门槛要比word2vec要高得多。笔者在这里介绍一下如何获取BERT的词向量。笔者在获取BERT词向量的时候用到了肖涵博士的bert-as-service,具体使用方式如下。
酸辣螺丝粉
·
2019-02-18 13:16
NLP
Pyhanlp自然语言处理中的新词识别
调用方法静态方法一句话静态调用接口已经封装到HanLP中:/***提
取词
语**@paramtext大文本*@paramsize需要提
取词
语的数量*@return一个词语列表*/publicstaticLis
adnb34g
·
2019-02-15 15:00
Pyhanlp自然语言处理中的新词识别
调用方法静态方法一句话静态调用接口已经封装到HanLP中:/***提
取词
语**@paramtext大文本*@paramsize需要提
取词
语的数量*@return一个词语列表*/publicstaticListextractWords
adnb34g
·
2019-02-15 14:06
pyhanlp
新词识别
自然语言处理
Pyhanlp自然语言处理中的新词识别
调用方法静态方法一句话静态调用接口已经封装到HanLP中:/***提
取词
语**@paramtext大文本*@paramsize需要提
取词
语的数量*@return一个词语列表*/publicstaticListextractWords
adnb34g
·
2019-02-15 14:06
自然语言处理
新词识别
hanlp
【计算机英语词汇和词组-持续更新中】
推荐词典:有道词典理由:在看外文网站的时候,可以实现
取词
和划词翻译这是在看外文网站的时候,一点点记录的学习笔记,归纳后方便记忆按照首字母顺序排列备注的发音音标,都是美式的发音持续更新中,喜欢的伙伴,可以点赞和关注支持下哦
Hey_Coder
·
2019-02-15 13:51
【计算机英语词汇和词组】
如何看待 COCA 词频
而COCA
取词
范围则非常广,而不仅限于某个
juniway
·
2019-02-12 14:10
stardict
词典下载
StarDict
Dictionaries--星际译王词库词典下载原链接:http://download.huzheng.org/DictionariesInstallDictionariesinLinux
Tony_xxx
·
2019-01-15 20:05
ubuntu
Linux
用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)
思路:先提取项目的名称,再用Jieba分词后提
取词
汇;过滤掉“研发”、“系列”等无意义的词;最后用WordCloud绘制词云。扩展:词云默认是矩形的,本代码采用图片作为蒙版,产生异形词云图。
HateMath归来
·
2019-01-08 14:59
pyhanlp 中文词性标注与分词简介
也是最短路分词,HanLP最短路求解采用Viterbi算法2.双数组trie树(dat):极速词典分词,千万字符每秒(可能无法获
取词
性,此处取
adnb34g
·
2019-01-07 13:00
pyhanlp
Java调用Tensorflow训练模型预测结果
Java调用Tensorflow训练好的模型做预测,首先需要读
取词
典,然后加载模型,读入数据,最后预测结果。
浩子童鞋
·
2018-12-28 21:51
自然语言处理
Tensorflow
python 文本单词提取和词频统计的实例
strip_html(cls,text)去除html标签separate_words(cls,text,min_lenth=3)文本提取get_words_frequency(cls,words_list)获
取词
频源码
超级杰哥
·
2018-12-22 09:56
团队作业4——beta阶段冲刺1
描述项目进展成员任务安排预期任务量/小时张雨阳云数据库,游戏300翁明强云数据库,游戏300王齐文前端200贤志兰前端200Task3:描述项目进展、问题困难依然在攻克云数据库,可能会使用用打开文件的方式去读
取词
汇
卡卡milan
·
2018-12-09 10:00
python jieba分词模块
有兴趣的可以看下别人的这篇博客:https://www.cnblogs.com/jiayongji/p/7119065.html1获
取词
importjiebas=u'我想和女朋友一起去北京故宫博物院参观和闲逛
果冻先生的专栏
·
2018-12-03 11:16
python学习
开心,就这么来临
今天特别开心,本来是在错过了昨晚与朋友邀约视频的懊恼中醒来,但没有多做挣扎,没有洗漱5点多一点就开始朗读WAP课文,查生词,发现金山词霸的拍照
取词
和解释功能比有道好,于是大大提高了查词效率,感觉很开心。
Jade韩玉
·
2018-11-26 15:33
再看LDA主题模型
1、UnigramModelUnigrammodel是最简单的文本模型,其直接将文本的生成过程看作是从一个词汇表中重复
取词
的过程。因此只要知道每个词的产生概率,就能计算出一篇文档的产生概率。
zxhohai
·
2018-11-13 21:14
NLP
概率图模型
文本挖掘
chrome 浏览器在线翻译插件
介绍几款Chrome浏览器的在线鼠标
取词
和句子翻译的插件一、bubble-translate(支持单词、句子翻译)下载地址:http://code.google.com/p/bubble-translate
吗牌友
·
2018-11-07 11:10
ES学习——分析器和自定义分析器
从文档中提
取词
元(Token)的算法称为分词器(Tokenizer),在分词前预处理的算法称为字符过滤器(CharacterFilter),进一步处理词元的算法称为词元过滤器(TokenFilter),
lkj41110
·
2018-10-27 12:06
es学习
spark-机器学习库-特征的提取,转换和选择
-特征提
取词
频-逆向文档频率(TF-IDF)importorg.apache.spark.ml.feature.
Alien_lily
·
2018-08-24 17:48
玩转ubuntu18.04之安装星际译王
1.sudoaptinstall
stardict
输入”y”2.桌面左下角点击dock栏,在弹框中搜索”
stardict
”,右键添加到收藏栏此时在dock栏就可以看到词典3.配置在线词库打开并点击右下角小扳手的图标选择网络
kan2016
·
2018-08-20 20:41
开发工具
Linux
javascript 屏幕
取词
与移除
取词
屏幕
取词
:a.代码:这是一段简单的段落文本functiongetWord(){varword=window.getSelection?
Lee_吉
·
2018-08-18 11:58
javascript
屏幕
取词
SRILM使用之ngram-count
-vocabvocab_file读
取词
典vocab_file。生成语言模型时,如果计数文件中或者训练文件中,如果出现了词典vocab_file之外的词(OOV),
GavinLiu1990
·
2018-08-02 17:22
中文分词--最大正向与逆向匹配算法python实现
最大匹配法:最大匹配是指以词典为依据,
取词
典中最长单词为第一个次取字数量的扫描串,在词典中进行扫描(为提升扫描效率,还可以跟据字数多少设计多个字典,然后根据字数分别从不同字典中进行扫描)。
J.mg
·
2018-08-01 18:00
地球村语,让全人类轻松对话!(2018.07.20版)
本次改版,主要是吸收李传华(世界语名Gajo)老先生的三点意见:1,恢复传统的单句、复句定义;2,恢复介词;3,尽量从自然语言中提
取词
汇。地球村语在创立过程中,得到中华全国世界语协会会员。
地球村语
·
2018-07-22 06:37
【LInux软件--星际译王安装、词库下载】
安装sudoapt-getinstall
stardict
词库下载http://download.huzheng.org/zh_CN/下载朗道词典在下载目录。
_Fighting_Girl
·
2018-07-21 11:21
linux
Mac 朗文5++(Longman LDOCE5)双解·例句发音 词库制作
非DIY爱好者请前往mac-dict获
取词
库。朗
pp25210
·
2018-06-27 23:45
publish
FF朗文5++
朗文
Mdx
mac
朗文
朗文双解
Longman
StarDict
,Linux 下一款不错的开源小词典
(当然,有道词典在Linux下也有版本)
StarDict
就是挺不错的一款小软件,最棒的是一点是有大量开源的词库可供选择。
小叶与小茶
·
2018-06-25 10:38
提高PHP开发效率, PhpStorm必装的几款插件
1.Translation最好用的翻译插件对于我等英文不好的同学来说,简直是福音.打开翻译对话框:Ctrl+Shift+O(英文字母o)鼠标
取词
并翻译:Ctrl+Shift+Y使用说明:http://yiiguxing.github.io
迈克老刘
·
2018-06-20 21:48
PhpStorm
PHP
开发效率
℃江的观后感--语法分析器、语义分析器和代码生成器总结
这个过程其实是在读
取词
法分析后readToken流的过程
摄氏du江
·
2018-05-29 11:54
java
调用翻译接口翻译词条
因此,可以通过对在线翻译页面爬取的方式,获
取词
条翻译后的结果。整体的流程就是:拼装请求参数,发送请求信息,处理相应结果。下面逐条介绍。拼装请求参
George_Antonio
·
2018-05-16 11:07
GloVe学习笔记
GloVe是一种用于获
取词
汇向量表示的无监督学习算法。对来自语料库的聚合全局字词同现统计进行训练,并且所得到的表示展示了词向量空间的有趣的线性子结构。
angus_monroe
·
2018-04-20 16:39
机器学习
NLP
Hook(钩子技术)基本知识讲解,原理
所以说,我们可以在系统中自定义钩子,用来监视系统中特定事件的发生,完成特定功能,如屏幕
取词
,监视日志,截获键盘、鼠标输入等等。钩子的种类很多,每种钩子可以截获相应的
Zeus_龙
·
2018-04-16 16:46
Hook技术
基于word2vec训练词向量(一)
1.回顾DNN训练词向量上次说到了通过DNN模型训练词获得词向量,这次来讲解下如何用word2vec训练词获
取词
向量。
磐创 AI
·
2018-04-11 23:11
人工智能
python爬虫爬
取词
条百度百科
1.单线程版本python版本3.6#!/usr/bin/env/python3#coding=utf-8importloggingimportrequestsfrombs4importBeautifulSoupimportreimportcodecsfromurllib.parseimporturljoin,urlparseimporttimeclassUrlManager(object):de
雨夜星辰03
·
2018-03-30 11:57
python3.6
Linux 屏幕
取词
解决方法:Chrome 插件
我的工作用电脑的桌面环境是Ubuntu17.10,作为一个Linux用户,一直困扰我的一个问题是没有找到一个比较理想的可以
取词
划词的英语词典,之前我尝试过几种方法:有道:有道是有Linux版的,不过没有集成到官方的包管理工具中
blackpiglet
·
2018-03-12 15:20
NLP Lemmatisation(词性还原) 和 Stemming(词干提取) NLTK pos_tag word_tokenize
词形还原(lemmatization),是把一个词汇还原为一般形式(能表达完整语义),方法较为复杂;而词干提取(stemming)是抽
取词
的词干或词根形式(不一定能够表达完整语义),方法较为简单。
青盏
·
2018-03-03 14:57
NLP
DL
tools
day1这不是一场比赛,而是一场训练,让你的智慧和自信出来吧!
第2组027园子【每日打卡】任务一:速读训练(软件截图or321模版截图分享发到大群里)任务二:艺术卡联想(编辑“图+提
取词
+故事”,可使用手机软件例如便签、、笔记,或电脑word编辑,分享发到微信大群里
甜甜妈正面管教之路
·
2017-12-04 05:31
通过读取配置文件完成英汉转换
读
取词
库文件。将消息截取成单个的单词。将单词与词库中相对应的汉语替换。返回翻译好的消息。判断消息中是否含有英文,运用了正则表达式去匹配字符串中是否含有字母。
计算机-程浩
·
2017-10-23 21:00
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他