E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语料
20180814_Scrapy源码第三天——代理ip和useragent
爬了4万条
语料
之后,你开始登不上网站了。刷新也不行,于是就开始找原因,各种twisted报错,各种requestf
沉默百年的猴
·
2023-03-20 21:52
献给学习NLP的同学们[持续更新ing]
文本生成练习地址:https://github.com/FudanNLP/nlp-beginnerhttps://www.zhihu.com/question/324189960总结了NLP里的小方向并给出了任务
语料
以及最近的成果论文
top_小酱油
·
2023-03-20 20:08
咨询行业:如何战胜ChatGPT?
在强大的WebText(互联网
语料
训练)支持下,ChatGPT具有了基于词汇量组合的创造性,语言能力已经胜过一般工作者,再次引发了危机思考。如果作为一种知识库,ChatG
人机与认知实验室
·
2023-03-20 13:54
chatgpt
搜索引擎
熊文新
语料
库 PHP,熊文新教授
ABetterIndicatorforGenreClassification:TopicWordorSurfaceTextFeature.ISEEE2014,IEEE.熊文新,(2014),借助汉语以义索词的英语用法检索,
语料
库语言学
weixin_39616855
·
2023-03-20 07:35
熊文新
语料库
PHP
E84 说:外刊适合用来学口语吗?
1.能够持续参与发言超过10分钟以上2.能够进行某个话题的深度讨论,比如商业和国际形势话题三、外刊的优势1.丰富且高质量的
语料
2.外教真人发音演示四、如何练好口语1.优质的输
李行y
·
2023-03-19 07:50
迁移学习
):一般情况下预训练模型都是大型模型,具备复杂的网络结构,众多的参数量,以及在足够大的数据集下进行训练而产生的模型.在NLP领域,预训练模型往往是语言模型,因为语言模型的训练是无监督的,可以获得大规模
语料
吃一口桃酥
·
2023-03-19 07:09
笔记
python
人工智能
深度学习
迁移学习
自然语言处理
7.2 迁移学习
):一般情况下预训练模型都是大型模型,具备复杂的网络结构,众多的参数量,以及在足够大的数据集下进行训练而产生的模型.在NLP领域,预训练模型往往是语言模型,因为语言模型的训练是无监督的,可以获得大规模
语料
射大雕的迪西。
·
2023-03-19 07:33
深度学习NLP
python
人工智能
深度学习
自然语言处理
pytorch
面向取证产品智能客服问答系统的命名实体识别模块
介绍一下项目(不同于通常的时间、地点、组织机构命名实体识别,我们这个项目是有难度的,比如盗窃手段,采用方案等等偏语义层面)项目介绍:从
语料
中准确识别命名性的指称项,如作案时间、地点、手段、侵害目标、损失物品等实体
yousa_
·
2023-03-19 05:08
【最后十天】1001番茄践行者-Day48
雅思听说读写【20个番茄】听力——审题录播视频+剑8点听复听写作——杜杜写作直播+课后作业阅读——真经总纲+真经5口语——每日背三句二、考试元技能【2个番茄】Week1直播+思维导图课程+费曼80%常规早听早过
语料
雪dou国
·
2023-03-19 02:37
基于snownlp的二次训练
能重新训练的模块有seg(分析词性)、sentiments(情感分析)、tag、normal、以sentiments模块为例:sentiments目录下有5个文件,其中init是程序,neg和pos分别是消极和积极
语料
库
Paddle
·
2023-03-18 22:11
NLP基本方法:TF-IDF原理及应用
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料
库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在
语料
库中出现的频率成反比下降。
MiracleJQ
·
2023-03-18 11:19
论文指导手册1
语料
库研究在写作研究中所占比重很大。旁批:有什么依据?你表达的是一种主观的看法,而不是客观的陈述。论文写作要客观,不能过多出现没有依据的主观性的表述。......可见,这种方法很值得推广?
余味爱世界
·
2023-03-18 01:11
Pytorch-使用Bert预训练模型微调中文文本分类
笔记摘抄
语料
链接:https://pan.baidu.com/s/1YxGGYmeByuAlRdAVov_ZLg提取码:tzaoneg.txt和pos.txt各5000条酒店评论,每条评论一行。
皮一下很开心的豆子
·
2023-03-18 01:44
如何精进
还是要背单词,死记硬背一些
语料
,外加
诺凡
·
2023-03-17 22:10
学了这么长时间英语,孩子的阅读词汇和听力词汇究竟是多少?这个免费的专业网站告诉你
权威该网站所用测试词汇,基于英国国家
语料
库BNC(BritishNationalCorpus)。BNC是目前网络可直接使用的最大
语料
库,高达1亿词汇量。剔除曲折变化,如pla
且将新火试新茶z
·
2023-03-17 17:17
1.NLP理论基础
2.NLTK安装3.安装
语料
库NLTK本身是一套算法,对于自然语言处理来说,算法只是一部分。比如
语料
库和一些模型都还是没有被下载下来。那么就需要去安装他。
触摸壹缕阳光
·
2023-03-16 21:28
chatGPT之Python API启用上下文管理
为什么别人的机器人能联想之前的
语料
,而你的却像个每次都只如初见的高冷机器人?
玖河网络
·
2023-03-16 19:25
chatGPT
openai
python
python
openai
知乎实时数据(问题-以及答案)-
语料
集
最近正在搞知乎的爬虫,目前每日稳定能爬接近100万条的数据,大概有2G多,目前已经有8G左右,想要做一些
语料
分析的同学怎么私信我拿数据哦数据格式是问题-答案-评论来源是每三个小时的更新的热榜以及个人的推荐问题部分
云爬虫技术研究笔记
·
2023-03-16 13:41
词性标注
关于词性标注歧义问题,对Brown
语料
库进行统计,按歧义程度排列的词型数目(ThenumberofwordtypesinBrowncorpusbydegreeofambiguity)DeRose(1988
writ
·
2023-03-15 14:53
行业观察:ChatGPT进入工业自动化前景探讨
ChatGPT是美国人工智能实验室OpenAI推出的一款训练相对成熟的自然语言处理工具,该工具使用Transformer神经网络架构来训练,该架构拥有语言理解和文本生成能力,通过与
语料
库连来学习和优化模型
北京盟通科技官方账号
·
2023-03-15 11:16
行业观察
自动化
人工智能
语言模型
交互
制造
【ChatBot开发笔记】聊天机器人准备工作——初识NLTK库、
语料
与词汇资源
目录简述一、NLTK1、安装2、搜索3、词统计二、
语料
与词汇资源1、举例2、类似的
语料
库还有:3、
语料
库的通用接口:4、其他词典资源:5、加载自己的
语料
库结语简述2021.3.8——3.28,该段时间我们的目标进度是实现聊天机器人的提问处理模块内容
我C有蚊子
·
2023-03-15 05:03
自然语言处理
(一)利用Wikipedia中文
语料
训练词向量word2vec——获取Wikipedia简体中文
语料
库
利用Wikipedia中文
语料
训练词向量一共分为两个篇章,这篇文章属于第一部分,包括下载Wikipedia
语料
库,并将其从繁体转换为简体。
风度翩翩猪肉王子
·
2023-03-15 05:15
MachineLearning
word2vec
wikipedia
语料库
托福口语21天——day4 发音纠正
语料
真题
目录一、发音纠正二、视频课improvefluencywhatshouldIdo编辑三、
语料
输入+造句输出和“relationship”相关的高频词造句练习四、真题演练一、发音纠正sit[sɪt]sick
alwaysuzybaiyy
·
2023-03-15 05:11
TOEFL
java
开发语言
托福口语21天——day1
语料
输入输出
目录TOEFLSpeakingTestFormatTask1TestFormatTask1TestingInterface(考试界面)Task1QuestionType1.ChoiceQuestion
alwaysuzybaiyy
·
2023-03-15 05:11
java
开发语言
NLP入门概览(2)——统计语言模型、
语料
库
1.语言模型 在这一部分中,我们讨论的语言模型主要是统计语言模型,除此之外,我们在今后的文章中还会对神经网络语言模型进行介绍。 所谓语言模型,就是利用数学的方法描述语言规律。而统计语言模型,就是用句子SSS出现的概率P(S)P(S)P(S)来刻画句子的合理性(而不进行语言学分析处理),这是统计自然语言处理的基础模型。 假设句子S=w1,w2,...,wnS=w_1,w_2,...,w_nS=
道巅
·
2023-03-15 04:03
NLP
托福口语21天——day5 发音纠正
语料
真题
目录一、连读纠音二、
语料
输入+造句输出三、真题一、连读纠音英语中的连读方式有好几种,我们来跟大家讲讲最常见的辅音-元音连读(consonanttovowellinking)What'sup?
alwaysuzybaiyy
·
2023-03-15 04:13
TOEFL
学习
【还有八天】1001番茄践行者-Day49
雅思听说读写【20个番茄】听力——审题录播视频+剑8点听复听写作——杜杜写作直播+课后作业阅读——真经总纲+真经5口语——每日背三句二、考试元技能【2个番茄】Week1直播+思维导图课程+费曼80%常规早听早过
语料
库
雪dou国
·
2023-03-14 20:05
读《数学之美》part1
翻译这件事之所以能达成,仅仅是因为不同文字系统在记录信息的能力上是等价的2.罗塞塔石碑(三种语言:埃及象形文字,埃及拼音文字,古希腊文)3.罗塞塔石碑的指导意义:1.信息的冗余是信息安全的保障2.对照
语料
对翻译至关重要
JLUiceman
·
2023-03-13 07:29
深度学习下的自然语言处理综述(二)
随着统计学的发展,研究者开始将统计模型应用于机器翻译,这种方法是基于对双语文本
语料
库的分析来生成翻译结果。这种
我很配
·
2023-03-13 04:25
多语言机器人深度学习模型构建
为了将中英文对话机器人已有的神经语言程序(NLP)能力拓展到更多语言,满足混合语言人机交互场景需求,分析了新语言特性预处理机制,提出了一种多语言机器人深度学习模型.通过多任务联合训练翻译模型构建、引入判别器对抗训练、词向量
语料
共享
罗伯特之技术屋
·
2023-03-12 07:47
网络通信安全及科学技术专栏
深度学习
机器人
人工智能
中文Transformer(BERT,GPT,T5等)预训练模型权重
中文Transformer预训练模型权重最近业余时间把我们去年和今年之前训练的基于开源
语料
的预训练权重适配到了Huggingfacemodelhub中。
P01son
·
2023-03-10 22:31
自然语言处理
深度学习
人工智能
如何使用CRF++工具?——以NER为例
一、
语料
清洗1,这篇文章以人民日报1998年01月
语料
库为例子,获取原始
语料
库199801.txt:链接:199801.txt提取码:k1xi原始
语料
库内容截图如下:199801.txt2,原始
语料
需要做如下处理
丰臣英俊
·
2023-03-09 22:27
BERT常见面试题问题
BERT的设计理念是通过大规模无标注
语料
库的预训练,使得模型能够学习到丰富的语言知识,并将其用于下游自然语言处理任务中。
莱维贝贝、
·
2023-03-09 07:30
bert
自然语言处理
深度学习
去香港读CS硕士了!有点迷茫......
大一到大二上谈恋爱荒废了,然后,大二下开始做团队项目,是一个基于SpringBoot的
语料
标注系统,是系主任带着做的,我是项目负责人。信管专业技术课学的非常少,而且都比较晚学。
程序员乔戈里
·
2023-02-25 07:12
算法
编程语言
面试
java
人工智能
“中文版GPT-3”来了:会算术、可续写红楼梦,用64张V100训练了3周
但GPT-3是基于英语
语料
库进行训练,而且并不开源,业内一直期待着能有一个中文的超大型NLP模型。现在,它终于来了!最近,北京智源人工智能研究院和清华大学研究团队,合作开展了一项大规模预训
QbitAl
·
2023-02-24 19:31
人工智能
编程语言
机器学习
深度学习
自然语言处理
用Python实现文档聚类
本教程包括:对所有剧情简介分词(tokenizing)和词干化(stemming)利用tf-idf将
语料
库转换为向量空间(vectorspace)计算每个文档间的余弦距离(cosinedistance)
普通网友
·
2023-02-24 07:49
python
神经网络
算法
clustering
python
ChatGPT 爆火背后的大语言模型到底是什么?
大规模预训练语言模型是指利用大量文本
语料
对神经网络进行预训练,使得神经网络可以学习到语言的各种规律、结构和特征,从而能够实现各种自然语言处理任务。
·
2023-02-23 16:24
ConvBERT: Improving BERT with Span-based Dynamic Convolution稿
类bert的语言模型是当下几乎所有nlp任务都会运用到的基本模型,他在大规模的无标签的
语料
上进行预训练,然后在下游任务微调。他是由transformer的encoder构成的。
Tyyy`
·
2023-02-22 07:49
论文
自然语言处理
深度学习
万能的Seq2Seq:基于Seq2Seq的阅读理解问答
作者丨苏剑林单位丨追一科技研究方向丨NLP,神经网络个人主页丨kexue.fm今天给bert4keras[1]新增加了一个例子:阅读理解式问答(task_reading_comprehension.py[2]),
语料
跟之前一样
PaperWeekly
·
2023-02-22 07:41
主题模型分析
概念主题:自动将文本
语料
库编码为一组具有实质性意义的类别主题分析的典型代表:隐含狄利克雷分布(LDA)LDA最明显的特征:能够将若干文档自动编码分类为一定数量的主题。主题数量需要人为确定主题数
ᝰꫛꪮꪮꫜ748
·
2023-02-22 02:49
Scikit-learn
【ChatGpt】——不一样的使用感受分享
ChatGPT是OpenAI旗下的一个训练有素的语言模型,它通过模仿大量的
语料
来学习如何生成文本。目的是回答
狮子也疯狂
·
2023-02-19 07:12
基础知识查漏
chatgpt
人工智能
全文检索
word2vec笔记
本文基于word2vec原理CBOW与Skip-Gram模型基础CBOW与Skip-Gram的模型计算的推导待补充(咕咕咕)word2vec训练过程参考word2vec简介与训练过程概要首先是对
语料
进行预处理
浩_c66f
·
2023-02-18 07:10
日语分词工具mecab安装配置以及使用
甚至,如果你有中文的分词
语料
作为训练
语料
,可以在该架构下按照其配置文件的规范定制一个中文的分词系统。日文NLP界有几个有名的开源分词
A_You
·
2023-02-17 22:38
【论文笔记】OPTIPROMPT:用prompt提取预训练模型中的客观事实
目录引言论文介绍1.Continuousprompt2.Prompt是否真的有用思考总结引言像BERT这样的预训练模型学习了大规模
语料
的词分布,同时也学习了
语料
中的客观事实。
iLuz
·
2023-02-17 18:05
自然语言处理
机器学习
深度学习
引领语言智能革命的巨型语言模型 ChatGPT PK Google Bard , Anthropic
它在大量
语料
数据的基础上进行预训练,从而能够生成各种类型的文本,包括诗歌、新闻文章、对话等。另外,ChatGPT也可以进行语言理解
MavenTalk
·
2023-02-17 18:03
AI
chatgpt
语言模型
人工智能
基于机器学习LSTM的古代汉语切分标注算法及
语料
库研究 完整代码+数据+论文
完整代码:https://download.csdn.net/download/qq_38735017/87382302摘要近年来,深度学习的浪潮渗透在科研和生活领域的方方面面,本文主要研究深度学习在自然语言处理,尤其是古汉语自然语言处理方面的应用。本文旨在利用计算机帮助古文研究者对古汉语完成断代、断句、分词及词性标注等特殊而繁琐的任务,其中的断句、分词是不同于英文自然语言处理的,中文自然语言处理
程序员uu
·
2023-02-17 17:14
LSTM
汉语切分
语料库研究
基于深度学习LSTM的古代汉语切分标注算法及
语料
库研究
完整代码:https://download.csdn.net/download/qq_38735017/87382302摘要近年来,深度学习的浪潮渗透在科研和生活领域的方方面面,本文主要研究深度学习在自然语言处理,尤其是古汉语自然语言处理方面的应用。本文旨在利用计算机帮助古文研究者对古汉语完成断代、断句、分词及词性标注等特殊而繁琐的任务,其中的断句、分词是不同于英文自然语言处理的,中文自然语言处理
数学是算法的灵魂
·
2023-02-17 09:49
深度学习
汉语切分标注
分词
大模型相关技术综述
中文大模型、多模态大模型&大模型训练
语料
持续迭代大模型演进历史预训练模型word2vecword2vec属于NLP领域无监督学习和比较学习的先祖。
远洋之帆
·
2023-02-17 07:17
AIGC
分布式计算
自然语言综合项目
AIGC
深度学习
Chatgpt的介绍-内容由chatgpt生成
n-gram模型是一种基于统计学的模型,通过统计
语料
库中单词序列的频率来预测下一个单词。它通过考虑单词序列中连续的n个单词(即n-gram)来计算单词序列的概率。
蓑雨春归
·
2023-02-16 21:43
语言模型
算法
chatgpt
【CSDN-NLP】ChatGPT 简介
3国内使用情况及应用的领域4面临的数据安全挑战与建议4.1ChatGPT获取数据产生的问题4.1.1数据泄露问题4.1.2删除权问题4.1.3
语料
库获取合规问题4.2ChatGPT恶意利用产生的问题5结语
Alexxinlu
·
2023-02-16 21:24
Alex:
NLP在问答领域的落地与研究
自然语言处理
chatgpt
人工智能
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他