E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语料
详解mmseg
根据在词典(
语料
库)中的匹配情况把原文切分成一个个词语2.两种方法为了便于后续介绍,假设要切分的原文是C1C2C3C4C5C6,C表示一个汉字。简单最大匹配:从头依次查找最长的词语,以此切割。
weixin_30549657
·
2023-01-30 10:28
当知识图谱遇上预训练语言模型
另外一条思路认为可以利用语言预训练模型,从大量文本
语料
中训练得到一个由大量参数组成的模型,这个模型中包
博文视点
·
2023-01-30 09:59
博文视点IT荐书吧
Seq2seq模型蒸馏方法
一.Seq2seq模型蒸馏方法总体过程如下1.训练teacher模型2.产生student模型3.利用teacher模型预测的logits和来自
语料
的truelabels来计算student模型的训练过程中的
haroldLiu001
·
2023-01-30 08:07
深度学习
人工智能
nlp
文献阅读:AMBERT: A Pre-trained Language Model with Multi-Grained Tokenization
AMBERT:APre-trainedLanguageModelwithMulti-GrainedTokenization1.内容简介2.原理&模型结构3.实验1.模型预训练
语料
&数据处理2.中文
语料
下的
Espresso Macchiato
·
2023-01-29 20:13
文献阅读
机器学习
人工智能
深度学习
nlp
语文课堂,让“读”字落地
语文课在读、写、听、说四项实践中,“读”是基础,因为学生只有在“读”中才能更好的积累
语料
,形成语感,悟得语言规律,发展语言能力,同时又接受文本语言所蕴含的思想、情感、情趣、价值观的熏陶感染,“读”在语文课堂的作用其实大家
守望者_accb
·
2023-01-29 14:27
获取机器学习数据
这些数据集包括人类基因组项目、CommonCrawl网页
语料
库、维基百科数据和GoogleBooksNgrams。相关信息可参见:http
weixin_30553837
·
2023-01-29 12:43
人工智能
python本科毕业设计基于神经网络的虚假评论识别系统源码,含模型及数据
主要函数:1.corpusprocess原始
语料
处理函数2.train_word2vec生成word2vec向量3.generate_id2wec获得索引的w2id,和嵌入权重embedding_weights4
Python代码大全
·
2023-01-29 10:43
Python代码大全
从零学Python
python
神经网络
深度学习
HanLp的应用 - 转自GitHub开源代码介绍
HanLP具备功能完善、性能高效、架构清晰、
语料
时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》已经出版。
努力就好其他的不管
·
2023-01-29 09:55
架构之路
自然语言处理
分词
hanlp
深度学习
搜索匹配
NLP之替换不在词表中的分词为‘UNK‘
1.问题描述现在有一个词表,它是取分词后的
语料
,统计出现频率最高的300个(前300个)词构建的词表。现在要将分词后的
语料
进行替换,替换掉那些不在词表中的token为“UNK”,在词表中的则保持不变。
LeBron Le
·
2023-01-29 07:56
Python
自然语言处理
自然语言处理
python
深度学习
语音情感识别技术
情感
语料
库大致可以通过以下3个方法获的:(1)从我们的现实生活中所采集的真实的自然
语料
,然后再经过人工挑选获得可以使用的
语料
;(2)让专业或者非专业人士进行对高兴、愤怒等情感进行模仿并录制
语料
库;(3)
fpga和matlab
·
2023-01-29 07:34
MATLAB
板块16:语音信号处理
语音情感识别
python 文本聚类可视化_Python 文本相似度和聚类
考虑一个设计各种不同的概念和想法的文档
语料
库。人类以这样的方式将它们联系在一起,即使用过去学
weixin_39645249
·
2023-01-28 14:03
python
文本聚类可视化
python的ai写作_AI伪原创,我们是认真的。[Python实现]
经过了本渣渣长达2年之久的深入学习和研究,耗费了大量的人力物力,使用了超过5亿条中文
语料
,上百台服务器连续一年的不间断训练,优化市面上已有的神经网络算法,结合多年的seo经验及NLP方面的成就,终于用Python
weixin_39742727
·
2023-01-28 11:34
python的ai写作
Roformer-sim模型
文章目录1.简介2.RoformerSimModel2.1Roformer模型介绍2.2Roformer-Sim模型2.2.1
语料
2.2.2生成2.2.3检索3.总结4.参考1.简介RoFormer-Sim
orangerfun
·
2023-01-28 08:43
自然语言处理
自然语言处理
深度学习
人工智能
【Eye-tracking】DIDEC: The Dutch Image Description and Eye-tracking Corpus
DIDEC:TheDutchImageDescriptionandEye-trackingCorpusAbstract本文提供了一个荷兰语口语图像描述的
语料
库,结合两组眼球追踪数据:freeviewing
Vincy_King
·
2023-01-28 07:44
NLP
Paper
Gaze
自然语言处理
眼动信号
期刊阅读
自然语言处理(一)--关键词提取
TF-IDF是一种统计方法,用来评估一个字词对于一个文件集或
语料
库中的一份文件的
seeing_Liu
·
2023-01-28 07:01
NLP
2022-12-04
《腊八粥》一课教学中,“语言作用”能力训练过程是这样的:对于重点段,引导学生反复诵读,使其熟读成诵,诵读积累的过程就是语言运用之“
语料
积累”,然后在诵读积累的过程中,再引导学生置身于之语境中表演、体验,
蓝蓝的天娟
·
2023-01-27 17:56
2021-08-31 从IPFS中检索出佛藏
语料
库
从IPFS中检索出佛藏
语料
库:CID:QmY944bgZiprFx3Kov7Q929GcXYBhKzhi6NKGzUWRi4rkc浏览器访问地址:https://ipfs.io/ipfs/QmY944bgZiprFx3Kov7Q929GcXYBhKzhi6NKGzUWRi4rkc
Pike_Jun
·
2023-01-27 13:21
transformer-xl(片段级递归机制+相对位置编码)(wikitext-103 语言模型)
文章目录transformer-xl(片段级递归机制+相对位置编码)一、文件目录二、
语料
集三、数据处理(data_utils.py)(vocabulary.py)四、模型(mem_transformer.py
篱下浅歌生
·
2023-01-27 09:31
nlp
python
吐槽memoQ | 翻译软件也能有在线字典/
语料
?
—“翻译的时候想查在线字典还要复制粘贴,从memoQ切换出去,一来一回好麻烦。”—“memoQ有内置的网络搜索功能,直接在内部打开搜索窗口,不用来回切换啦。”—“我要参考的网站还挺多的,有限制吗?”—“没关系的,都可以设置。”最近我们有收到小伙伴的新吐槽:在我们实际翻译过程当中,可能会用到许多网络资源,比如查在线翻译字典、搜索相关表达、搜索相关术语、搜索专有名词等等。通常好多memoQ新手都是:来
大辞科技
·
2023-01-27 04:17
Ontonote5.0数据集获取与处理
一、数据获取Ontonote5.0数据集只能在LDC(LinguisticDataConsortium,https://www.ldc.upenn.edu/)获得,LDC
语料
库包括阿拉伯语、汉语和英语新闻文本
Xuang123
·
2023-01-26 21:58
Event Detection without Triggers 论文解析
昂贵的训练
语料
标注限制的现有方法的应用。为了减少人工,我们探索了无触发词的事件监测。在这项
潘旭
·
2023-01-26 16:09
关系抽取全面总结:五大类实体关系三元组抽范式模型总结
一、文本关系抽取概述与常见问题文本关系抽取的研究工作本身可以划分为很多类别,根据抽取的文本范围以划分为句子级关系抽取、文档级关系抽取和
语料
级关系抽取;
zenRRan
·
2023-01-26 11:24
人工智能
自然语言处理
算法
RASA3.0-NLU详细介绍
RasaNLU使用基于监督学习的算法来实现功能,因此需要开发者提供适当数量的
语料
,
语料
包含意图信息和实体信息。从结构上来说,训练数据都在键为nlu的列表中。
Hank0317
·
2023-01-26 08:20
RASA
人工智能
nlp
自然语言处理
项目管理笔记-系统上线
一方面是客户方的整体进展有延期,另一方面是客户提供的
语料
不能适用。
乱码语言
·
2023-01-26 04:52
自然语言处理NLP概论
2.中英文分词的区别3.中文分词的难点4.分词方法5分词知识图谱2.2词性标注1什么是词性标注2词性标注难点3词性标注常用方法4
语料
Weiyaner
·
2023-01-26 03:41
自然语言处理
自然语言处理
基于Seq2Seq模型的机器翻译
---->>>Jesuisétudiant.这份数据是公开,可以直接下载的,下载地址为:翻译
语料
下载地址模型结构首先,我们先了解一下模型的结构:首先,第一部分是编码器Encoder,它接收sourcesentence
我就算饿死也不做程序员
·
2023-01-26 03:41
tensorflow
自然语言处理
python
深度学习
tensorflow
机器翻译
seq2seq
keras
attention-seq2seq:实现中英翻译
中文与其他语言不同,不能简单使用空格分割单词建立
语料
库。
Hilbob
·
2023-01-26 03:40
NLP
nlp
gru
机器翻译
pytorch
基于机器学习的古代汉语切分标注算法及
语料
库研究(毕业设计包含完整代码+论文+资料ppt)
数据来源及预处理实验所用的数据集为从网络的开放数据库下载的不同年代的古籍。根据古籍所处具体时期的不同,我们从各个时期中选择了部分书籍进行实验。将其分为成了不连续的几个时间段:春秋战国时期、后汉时期、南北朝时期、宋朝时期及明清时期五个时间段并分别使用T1、T2、T3、T4以及T5表示,对应关系如下表所示。表3-1时间标签与年代对应表时间标签年份
甜辣uu
·
2023-01-26 03:09
计算机毕设项目大全
python
汉语切分
计算机毕设
2019-06-17雅思备考week2-一周学习总结
王陆《
语料
库(剑14版)》:建议购买,现在的版本是在手机上听的,比以往用CD方便,同时增加了剑14的新内容,可以购买。
你演
·
2023-01-25 21:51
常用数据集
这是由EMNLP会议提供的翻译
语料
,作为很多论文效果的benchmark来检测。Aichallengertranslation2017(https://pan.baidu.com
不负韶华ღ
·
2023-01-25 09:29
机器学习
数据仓库
【NLP Tool -- NLTK】NLTK进行英文情感分析、分词、分句、词性标注(附代码)
中文文本--关键词提取、自定义词典、分词、词性标注NLP--NLTK英文文本--情感分析、分词、分句、词性标注工具介绍NLTK,NaturalLanguageToolkit是一个Python模块,提供了多种
语料
库
北村南
·
2023-01-25 07:39
NLP
Tool
自然语言处理
人工智能
nlp
snownlp 原理_使用snownlp进行情感分析
主要可以进行中文分词(算法是Character-BasedGenerativeModel)、词性标注(原理是TnT、3-gram隐马)、情感分析(官网木有介绍原理,但是指明购物类的评论的准确率较高,其实是因为它的
语料
库主要是购物方面的
学历小助手王老师
·
2023-01-24 10:31
snownlp
原理
被GPT带飞的In-Context Learning发展现状如何?这篇综述梳理明白了
随着语言模型和
语料
库规模的逐渐扩大,大型语言模型(LLM)展现出更多的潜力。近来一些研究表明,LLM可以使用in-contextlearning(ICL)执行一系列复杂任务,例如解决数学推理问题。
夕小瑶
·
2023-01-24 07:25
python爬虫知识图谱_知识图谱
上周为了娱乐,写了一篇《一行Python代码实现夸夸聊天机器人》,虽然只有几十条人工整理的通用夸夸
语料
,但是貌似也能应付一些简单需求。
weixin_39770311
·
2023-01-22 18:29
python爬虫知识图谱
文本表示方法(BOW、N-gram、word2vec)
语料
财神Childe
·
2023-01-22 07:57
nlp
word2vec
自然语言处理-注意点
一阶逻辑是计算语义的一个不错的选择
语料
分析指的是技术层面的分析,并不关注
语料
库的语言学分析。在句法分析中,文法规则被用于确定哪些句子是合法的。
__BC__
·
2023-01-22 07:56
自然语言处理
自然语言处理
机器学习
人工智能
【自然语言处理】文本表示(一):One-Hot、BOW、TF-IDF、N-Gram
One-Hot在特征提取上属于词袋模型(Bag-of-Words),假设
语料
库中有三句话:我爱中国爸爸妈妈爱我
皮皮要HAPPY
·
2023-01-22 07:49
自然语言处理
自然语言处理
文本表示
文本向量化
BOW
TF-IDF
Python自然语言处理第二章 - 获得文本
语料
与词汇
一,获取文本
语料
库1,古腾堡
语料
库古腾堡
语料
库主要存储的是免费的电子图书。
潜心修行的研究者
·
2023-01-21 19:57
自然语言处理
python
自然语言处理
特开一贴,用来记录我踩过的坑
1、NLTK
语料
库nltk.download()安装失败及下载很慢的解决方法_深度学习菜鸟的博客-CSDN博客_nltk.download失败解决nltkdownload(‘punkt‘)连接尝试失败_
致力于成为卷王
·
2023-01-19 18:08
nlp
自然语言处理
python
NER--《人民日报》
语料
库预处理
NER--《人民日报》
语料
库预处理转成标准BIEO格式转成标准BIEO格式#-*-coding:utf-8-*-"""CreatedonFriJul3116:16:582020将《人民日报》中的标签转成标准的
chengjinpei
·
2023-01-19 09:37
数据预处理
自然语言处理资源
自然语言处理
谷歌BERT模型--调试MRPC任务--使用pycharm集成环境
MRPC调试心得唐宇迪BERT课程使用Pycharm实现MRPC唐宇迪BERT课程使用Pycharm实现MRPC1.任务介绍MPRC(MicrosoftResearchParaphraseCorpus)
语料
库中包含一些句子对
chengjinpei
·
2023-01-19 09:36
项目实战
自然语言处理
tensorflow
项目实训(三)CSS样式与动画
语料
检索根据用户输入的中医关键字查找匹配的多版本英译,支持模糊查询、范围查询。通过关键词还可检索上下文
缓缓-
·
2023-01-19 07:35
项目实训
css
javascript
html
【从零开始学习深度学习】48.Pytorch_NLP实战案例:如何使用预训练的词向量模型求近义词和类比词
目录1.下载预训练的词向量2.应用预训练词向量2.1求近义词2.2求类比词本文将介绍如何使用已经在大规模
语料
上预训练的词向量模型来求近义词和类比词。
阿_旭
·
2023-01-18 12:12
自然语言处理
深度学习
NLP
pytorch
RuntimeError:CUDA error:unknown error
考虑原因:A程序在
语料
库ATIS中运行过,没有发生问题,但是之后运行了另一个程序B时,修改过gpu,如下所示:os.environ["CUDA_VISIBLE_DEVICES"]="0"如今在
语料
库Snips
想念@思恋
·
2023-01-18 08:29
python编程
一起来学自然语言处理----分类和标注词汇
分类和标注词汇使用词性标注器标注
语料
库1.表示已标注的标识符2.读取已标注的
语料
库3.简化的词性标记集使用字典映射词及其属性1.默认字典2.递增的更新字典3.颠倒字典自动标注1.默认标注器2.正则表达式标注器
小陈步吃人
·
2023-01-17 22:01
自然语言学习笔记
python
django
自然语言处理
LDA详解
向量中的第一个,第二个等,也就是不同文章的不同单词的主题,固定其他,分别重新从计算的概率分布再次抽取主题】LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或
语料
库
Ona_Soton
·
2023-01-17 17:08
机器学习
机器学习
人工智能
【深度学习】最大熵马尔科夫、CRF、条件随机场、最大匹配法
):指的是多元逻辑回归由于等概率的分布具有最大熵,所以最大熵的模型通过词性标注问题来描述就是:在没有任何假设的情况下,认为每种词性的概率都是相同的,假设有10中词性,那么每个词性的概率都是1/10如果
语料
表明
OneTenTwo76
·
2023-01-17 12:41
深度学习
深度学习
机器学习
逻辑回归
读书笔记:深度学习进阶-自然语言处理(俗称鱼书二)
文章目录前言一、神经网络的复习二、自然语言和单词的分布式表示2.1什么是自然语言处理2.2同义词词典2.3基于计数的方法2.3.1基于python的
语料
库的预处理2.3.2单词的分布式表示2.3.3分布式假设
时光轻浅,半夏挽歌
·
2023-01-17 08:50
深度学习
自然语言处理
python
【自然语言处理】专业术语汇总(持续更新...)
EmotionRecognition)纠错(Correction)问答系统(QASystem)正则化(normalization)标准化(scale)标记化(tokenization)标记(token)
语料
库
浪里摸鱼
·
2023-01-16 06:41
深度学习
自然语言处理
nlp
深度学习
机器学习
BERT 词向量理解及训练更新
在学习过程中,词表中每个词的词向量是通过输入的
语料
来学习的。在训练过程中,词表中每个词的词向量都是随机初始化的,然后通过训练数据和反向传播算法来不断更
loong_XL
·
2023-01-16 06:07
深度学习
机器学习
bert
深度学习
词向量
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他