E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
大模型扫盲之小白入门手记
首先一个问题:大模型和大
语言模型
的区别是什么?有人说大模型像是连接数据的星辰,能给我们提供前所未有的见解和洞察。
!柯西洗袜子
·
2023-09-11 04:21
机器学习
gpt-3
文心一言
机器学习
人工智能
[预训练
语言模型
专题] RoBERTa: 捍卫BERT的尊严
本文为预训练
语言模型
专题的第15篇。
yang191919
·
2023-09-11 03:39
朴素人工智能
机器学习
人工智能
深度学习
自然语言处理
Huggingface简介及BERT代码浅析
本文为预训练
语言模型
专题系列第六篇快速传送门[萌芽时代],[风起云涌],[文本分类通用技巧],[GPT家族],[BERT来临]感谢清华大学自然语言处理实验室对预训练
语言模型
架构的梳理,我们将沿此脉络前行
愚昧之山绝望之谷开悟之坡
·
2023-09-11 03:38
Hugging
Face
【NLP】第 3 章 :BERT
根据
语言模型
的研究结果,与仅在一个方向上训练的模型相比,同时在两个方向上训练的
语言模型
Sonhhxg_柒
·
2023-09-10 21:59
基于Transformer
的
NLP
bert
nlp
人工智能
大型
语言模型
,第 1 部分:BERT
一、介绍2017是机器学习中具有历史意义的一年,当变形金刚模型首次出现在现场时。它在许多基准测试上都表现出色,并且适用于数据科学中的许多问题。由于其高效的架构,后来开发了许多其他基于变压器的模型,这些模型更专注于特定任务。其中一个模型是BERT。它主要以能够构建嵌入而闻名,这些嵌入可以非常准确地表示文本信息并存储长文本序列的语义含义。因此,BERT嵌入在机器学习中得到了广泛的应用。理解BERT如何
无水先生
·
2023-09-10 21:58
LLM和ChatGPT
人工智能
语言模型
bert
人工智能
一文解码
语言模型
:
语言模型
的原理、实战与评估
目录一、
语言模型
概述什么是
语言模型
?
TechLead KrisChang
·
2023-09-10 15:38
人工智能
语言模型
人工智能
自然语言处理
深度学习
机器学习
pytorch
(含源码)「自然语言处理(NLP)」完全数据驱动对话系统&&新型知识感知图网络&&双向专注记忆网络
来源:AINLPer微信公众号(每日更新...)编辑:ShuYini校稿:ShuYini时间:2020-07-28引言:本次文章主要介绍了ERNIE-GEN(语言生成任务)、统一预训练
语言模型
(UniLM
Shu灬下雨天
·
2023-09-10 14:19
如何训练ChatGPT以提高其文学创作和创造性写作技能?
ChatGPT是一个基于大规模文本数据的
语言模型
,它可以生成文本并回答问题,但它并没有文学创作或创造性写作的目的。要训练C
心似浮云️
·
2023-09-10 13:27
chatgpt
人工智能
机器学习
机器人
baichuan2(百川2)本地部署的实战方案
本文主要介绍了baichuan2(百川2)本地部署的实战方案,希望对学习大
语言模型
的同
herosunly
·
2023-09-10 09:28
类GPT工具使用技巧和论文解读
AIGC
百川2
baichuan2
大语言模型
GPT
Langchain的一些问题和替代选择
Langchain因其简化大型
语言模型
(llm)的交互方面的到关注。凭借其高级的API可以简化将llm集成到各种应用程序中的过程。
·
2023-09-10 09:53
ChatGPT3 Transformer 的多模态全能
语言模型
"Transformer的多模态全能
语言模型
"指的是一种融合了多种输入模态(如文本、图像、声音等)的
语言模型
,具有广泛的应用能力,可以理解和生成多种类型的信息。"
summer_west_fish
·
2023-09-10 09:34
人工智能
transformer
语言模型
深度学习
AI大
语言模型
时代构建全新数据平台
在大
语言模型
的引领下,数据平台领军企业Databricks和Snowflake的未来重置,探讨了Databricks和Snowflake等知名平台,存储领域的Delta、udi、Iceberg,还是实时化数据处理领域的
ejinxian
·
2023-09-10 06:06
语言模型
人工智能
自然语言处理
Databricks
Snowflake
【动手学深度学习】--循环神经网络
文章目录循环神经网络1.算法介绍1.1无隐状态的神经网络(多层感知机)1.2有隐状态的循环神经网络1.3基于循环神经网络的字符级
语言模型
1.4困惑度2.RNN从零开始实现2.1读取数据集2.2独热编码2.3
小d<>
·
2023-09-10 06:04
深度学习
深度学习
rnn
人工智能
从零开始-与大
语言模型
对话学技术-gradio篇(4)
包括本地部署版本和Web在线版本,两种打包方式基于半自动化使用.bat手动打包迁移python项目如何把Gradio应用上传到HuggingFace往期回顾:从零开始-与大
语言模型
对话学技术-gradio
friklogff
·
2023-09-10 06:15
gradio
朝花夕拾
python
语言模型
人工智能
自然语言处理
python
IDEFICS 简介: 最先进视觉
语言模型
的开源复现
我们很高兴发布IDEFICS(Image-awareDecoderEnhancedàlaFlamingowithIninterleavedCross-attentionS)这一开放视觉
语言模型
。
Hugging Face
·
2023-09-10 05:22
语言模型
人工智能
自然语言处理
《自然语言处理》chapter7-预训练
语言模型
广义上的预训练
语言模型
可以泛指提前经过大规模数据训练的
语言模型
,包括早期的Word2vec、GloVe为代表的静态词向量模型,以及基于上下文建模的
Jiawen9
·
2023-09-10 04:49
#
《自然语言处理》学习笔记
自然语言处理
语言模型
人工智能
python
深度学习
算法
nlp
MathGPT是什么,MathGPT与ChatGPT的区别是什么,MathGPT十大应用场景
MathGPT是一种基于自然语言处理技术的数学
语言模型
,其目的是通过自动化生成数学公式、证明和解题步骤等来辅助数学学习和研究。
『六道』
·
2023-09-09 22:58
自然语言处理
AI写作
深度学习
数据挖掘
人工智能
Prompt是什么意思?
2.Prompt技术综述Prompt技术是一种基于
语言模型
的生成式模型,其基本思想是利用预训练的大型
语言模型
来生成自然语言文本。这种技术采用迭代式
『六道』
·
2023-09-09 22:58
自然语言处理
算法
机器学习
人工智能
LlamaIndex:将个人数据添加到LLM
推荐:使用NSDT场景编辑器快速搭建3D应用场景LlamaIndex是基于大型
语言模型
(LLM)的应用程序的数据框架。
ygtu2018
·
2023-09-09 21:20
LLM
大语言模型
低成本指令数据集构建:《Self-Instruct: Aligning Language Model with Self Generated Instructions》阅读笔记
最近有点好奇指令数据集是如何构建的,就读了一下SELF-INSTRUCT的论文简介摘要翻译:大型“指令微调”
语言模型
(即经过微调以响应指令)已表现出对于新任务的zero-shot泛化的非凡能力。
chencjiajy
·
2023-09-09 19:21
深度学习
语言模型
人工智能
论文阅读
如何阅读一本书(上)
然而,在今天这个时代,人们可以利用大
语言模型
来更快地了解书籍的内容和评价,以便更好地阅读书籍。介绍《如何阅读一本书》是一本1940年首次出版的经典
havef
·
2023-09-09 17:11
程序人生
《Tree of Thoughts: Deliberate Problem Solving with Large Language Models》中文翻译
《TreeofThoughts:DeliberateProblemSolvingwithLargeLanguageModels》-思维树:用大型
语言模型
有意识地解决问题论文信息摘要1.介绍2.背景3.思想树
酿久诗
·
2023-09-09 16:39
论文阅读笔记
语言模型
人工智能
自然语言处理
ToT
《Human-level play in the game of Diplomacy by combining language models with strategic reasoning》翻译
《Human-levelplayinthegameofDiplomacybycombininglanguagemodelswithstrategicreasoning》-将
语言模型
与战略推理相结合,在外交游戏中进行人类水平的游戏论文信息摘要
酿久诗
·
2023-09-09 16:09
论文阅读笔记
Cicero
《Graph of Thoughts: Solving Elaborate Problems with Large Language Models》中文翻译
《GraphofThoughts:SolvingElaborateProblemswithLargeLanguageModels》-思维图:用大型
语言模型
解决复杂的问题论文信息摘要1.介绍2.背景及符号
酿久诗
·
2023-09-09 16:36
论文阅读笔记
语言模型
人工智能
自然语言处理
GoT
更快更强更稳定:腾讯向量数据库测评
NVIDIACEO黄仁勋在NVIDIAGTCKeynote演讲中首次提到了向量数据库,并强调它在构建专有大型
语言模型
组织中的重要性。作为新一代AI处理器,大型模型提供了强大的数据处理能力,而向量数
沉迷单车的追风少年
·
2023-09-09 14:30
机器学习
人工智能
数据库
LLM推理提速2.8倍,CMU提出投机式推理引擎,小模型撬动大模型高效推理
随着ChatGPT的出现,大规模
语言模型
(LLM)研究及其应用得到学术界和工业界的广泛关注。一方面,开源的LLM模型不断涌现,比如OPT、BLOOM、LL
PaperWeekly
·
2023-09-09 14:09
人工智能
深度学习
神经网络
计算机视觉
自然语言处理
文心一言、讯飞星火与GPT-4/3.5在回答中文历史问题的表现
01评估策略与数据准备全面评估大型
语言模型
的性能是一件相当复杂的任务。不仅需要制定周全的策略,还需要准备大量的数据和评估程序,并结合自动
叶锦鲤
·
2023-09-09 13:07
文心一言
人工智能
【开启报名】大模型研讨会 | 聚焦 LLMs 技术前沿、待解问题、未来趋势
以下内容来源于THU基础模型基础模型研究中心自2018年BERT、GPT等
语言模型
问世以来,大规模
语言模型
取得了显著进步,对社会经济发展产生了深远影响。尽管如此,该领域仍面临诸多挑战待解。
AITIME论道
·
2023-09-09 13:30
人工智能
ACL 2023-大模型专题 直播预告| 9月6日
主要关注大
语言模型
、文本生成相关研究,曾在ACL、EMNLP、NAACL、COLING等自然语言处理会议中发表相关论文十余篇。开源预训练模型MVP在HuggingFace下载量超过
AITIME论道
·
2023-09-09 13:00
大
语言模型
api调用
大
语言模型
api调用文心一言360智脑文心一言知识增强大
语言模型
百度全新一代知识增强大
语言模型
,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
甜味橘阳
·
2023-09-09 13:26
dubbo
代码生成商业化一些思考
代码生成解决方案生成项目代码有3大类的解决思路:1.从底到上的生成,部分代码生成生成一行代码或者一个方法种一小块代码生成,ide插件代码生成基本这种思路2.大
语言模型
作为软件工程不同角色agent,用户给出
远洋之帆
·
2023-09-09 12:22
hadoop
大数据
分布式
自然语言处理 第八章 机器翻译复习
subword方法beamsearchcoveragepenalty(翻译覆盖率问题)推敲网络(DeliberationNetwork)非自回归模型系统鲁棒性低资源神经机器翻译语料资源受限问题多语预训练
语言模型
机器翻译概述任务描
SiYuanFeng
·
2023-09-09 11:26
自然语言处理
机器翻译
人工智能
ChatGpt会代替程序员吗
ChinaGPT是一种人工智能
语言模型
,它可以回答各种问题,包括回答各种编程问题。但是,程序员的工作不仅仅是编写代码,还包括设计软件、调试代码、测试软件、维护软件等等。
宾盛官方
·
2023-09-09 11:02
chatgpt
神经网络
网络
网络安全
计算机网络
【nlp-with-transformers】|Transformers中的generate函数解析
今天社群中的小伙伴面试遇到了一个问题,如何保证生成式
语言模型
在同样的输入情况下可以保证同样的输出。
857技术社区
·
2023-09-09 07:13
Machine
Learning
自然语言处理
python
人工智能
ChatGPT:深度学习和机器学习的知识桥梁
作为一种预训练
语言模型
,ChatG
傻啦嘿哟
·
2023-09-09 05:30
关于GPT那些事儿
chatgpt
深度学习
机器学习
飞书即时消息无需API开发连接Cohere,打造飞书AI智能问答助手
飞书即时消息用户使用场景:许多企业都在使用飞书系统进行协同办公,而现在有了Cohere大
语言模型
技术,能够根据用户的提问来自动产生回答,无需人为干预。
集简云-软件连接神器
·
2023-09-09 05:43
飞书
人工智能
集简云
自动化
运维
低代码
如何使用PyTorch训练LLM
本文将解释训练大型
语言模型
的所有过程,从设置工作区到使用Pytorch2.0.1的最终实现
ygtu2018
·
2023-09-09 02:05
pytorch
人工智能
python
【动手学深度学习】--
语言模型
文章目录
语言模型
1.学习
语言模型
2.马尔可夫模型与N元语法3.自然语言统计4.读取长序列数据4.1随机采样4.2顺序分区
语言模型
学习视频:
语言模型
【动手学深度学习v2】官方笔记:
语言模型
和数据集在【文本预处理
小d<>
·
2023-09-09 02:34
深度学习
深度学习
语言模型
人工智能
【LangChain系列 4】Model I/O——Prompts概述
原文地址:【LangChain系列4】ModelI/O——Prompts概述本文速读:Prompt模版样本选择器Prompts简单来讲就是一组指令或文本输入,
语言模型
理解它的意思后,给出一个输出响应。
大白爱爬山
·
2023-09-09 02:00
LangChain
langchain
chatgpt
吴恩达gradio课程:基于开源LLM(large language model)的聊天应用
文章目录内容简介构建应用程序使用gradio在线体验接下来结合llm模型使用gradio构建一个完整的应用程序内容简介Falcon40B是当前最好的开源
语言模型
之一。
Cachel wood
·
2023-09-09 02:28
python可视化教程
gradio应用
LLM和AIGC
语言模型
windows
人工智能
文本分类总结
一、TextCNN→TextRNN→TextBiRNN→TextRCNN→Text-ATT-BI-RNN→HAN1.TextCNN特点:CNN的kernel_size类似
N-gram
中的N。
许志辉Albert
·
2023-09-09 02:02
【AI理论学习】
语言模型
:BERT的优化方法
语言模型
:BERT的优化方法图解XLNet模型1.排列
语言模型
(PermutationLanguageModeling)2.XLNet融入Transformer-XL理念3.使用双流自注意力机制(Two-StreamSelf-Attention
镰刀韭菜
·
2023-09-09 01:43
深度学习与人工智能
预训练语言模型
BERT的优化
XLNet
ALBERT
ELECTRA
MLM
LM
落地领域大模型应知必会(2): 轻量化微调
通过轻量化大模型微调技术,可以将大型预训练
语言模型
适配到特定领域、特定任务,并减小其模型尺寸和计算量需求,提高性能和效率。在上一篇文章中,我们分享了大
语言模型
的主要微调技术总览。
·
2023-09-09 00:32
IDEFICS 简介: 最先进视觉
语言模型
的开源复现
引言CodeLlama是为代码类任务而生的一组最先进的、开放的Llama2模型,我们很高兴能将其集成入HuggingFace生态系统!CodeLlama使用与Llama2相同的社区许可证,且可商用。今天,我们很高兴能发布HuggingFace对CodeLlama的全面支持,包括:Hub上的模型支持,包括模型卡及许可证Transformers已集成CodeLlamaTGI已集成CodeLlama,以
·
2023-09-09 00:31
人工智能
知识增强的预训练
语言模型
系列之KEPLER:如何针对上下文和知识图谱联合训练
©原创作者|杨健论文标题:KEPLER:Aunifiedmodelforknowledgeembeddingandpre-trainedlanguagerepresentation收录期刊:TACL论文链接:https://direct.mit.edu/tacl/article/doi/10.1162/tacl_a_00360/98089/项目地址:https://github.com/THU-K
NLP论文解读
·
2023-09-08 21:25
如何学习python?比较通义千问、文心一言、ChatGPT给的答案,你就知道啦
通义千问通义千问是阿里巴巴达摩院自主研发的超大规模
语言模型
,能够回答问题、创作文字,还能表达观点、撰写代码。通义千问的能力覆盖自然语言处理的多个领域,包括语言理解、文本生成、代码写作等。
aobulaien001
·
2023-09-08 18:02
学习
python
文心一言
让预训练
语言模型
读懂数字:超对称技术发布 10 亿参数 BigBang Transformer [乾元]金融大规模预训练
语言模型
导读:超对称技术公司发布10亿参数金融预训练
语言模型
BigBangTransformer[乾元]。
亚马逊云开发者
·
2023-09-08 17:54
架构
数据
模型
Tech
专栏
检索与毒害 —— 对抗人工智能供应链攻击
作者:DAVEERICKSON在这篇文章中,了解人工智能大
语言模型
的供应链漏洞,以及如何利用搜索引擎的人工智能检索技术来对抗人工智能的错误信息和故意篡改。
Elastic 中国社区官方博客
·
2023-09-08 17:16
Elasticsearch
AI
人工智能
elasticsearch
大数据
搜索引擎
全文检索
nlp
ChatGPT不能代替人类写作的四个原因
近期留学圈最火的C位当属ChatGPT,作为一款OpenAI开发的
语言模型
,ChatGPT在文本生成上的优秀表现大大助力了母语非当地语言的留学生们。
Do1twell
·
2023-09-08 17:02
chatgpt
从零开始-与大
语言模型
对话学技术-gradio篇(1)
前言本文部分内容来自网上搜集与个人实践。如果任何信息存在错误,欢迎读者批评指正。本文仅用于学习交流,不用作任何商业用途。目录前言1.什么是Gradio2.为什么选择Gradio3.安装Gradio使用pip安装:4.Gradio常用的API:5.简单本地部署实例6.简单云部署实例7.简单Web应用程序部署实例总结参考:1.什么是GradioGradio是一个基于Web的交互式机器学习框架,可以方便
friklogff
·
2023-09-08 16:16
gradio
python
python
pycharm
AI编程
上一页
69
70
71
72
73
74
75
76
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他