E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
LLM 01-引言
LLM01-引言1.1什么是
语言模型
语言模型
(LM)的经典定义是一种对令牌序列(token)的概率分布。假设我们有一个令牌集的词汇表VVV。
Gocara
·
2023-09-13 05:17
LLM
python
人工智能
nlp
语言模型
LLM 02-大模型的能力
LLM02-大模型的能力我们将深入探讨GPT-3——这个具有代表性的大型
语言模型
的能力。
Gocara
·
2023-09-13 05:42
LLM
人工智能
语言模型
nlp
玩转大
语言模型
:文本生成和模型控制的革新之道 | 开源日报 0901
laravel/frameworkStars:30.1kLicense:MITLaravel是一个具有表达力和优雅语法的Web应用框架,旨在简化常见的Web项目开发任务,提供了丰富的学习资源。特色亮点:Laravel框架注重可读性和优雅的语法,使开发成为一种愉快和创造性的体验。旨在简化常见的Web项目开发任务,提供了丰富的工具。拥有全面的文档和视频教程库,是现代Web应用开发框架中最丰富和全面的。
开源服务指南
·
2023-09-13 04:57
开源日报
语言模型
开源
人工智能
FastChat工作原理解析
Hugggingface提供的Transformer库HuggingFace的Transformers库是一个用于自然语言处理(NLP)任务的Python库,旨在简化和加速使用预训练
语言模型
(如BERT
taoli-qiao
·
2023-09-13 04:09
人工智能
人工智能
深度学习
使用Fastchat部署vicuna大模型
FastChat是一个用于训练、提供服务和评估基于大型
语言模型
的聊天机器人的开放平台。其核心特点包括:最先进模型(例如Vicuna)的权重、训练代码和评估代码。
taoli-qiao
·
2023-09-13 04:08
人工智能
大模型
Generative AI 新世界 | 大模型参数高效微调和量化原理概述
本期文章,我们将探讨两个目前大
语言模型
(LLM)领域的开发者们都关注的热门话题:大型
语言模型
的高效微调和量化。微调大型
语言模型
允许开发者调整开源基础模型,从而提高特定领域任务的性能。
亚马逊云开发者
·
2023-09-13 01:58
人工智能
FastChat
FastChat是一个用于训练/部署和评估基于大型
语言模型
的聊天机器人的开发平台。
studyeboy
·
2023-09-13 00:42
FastChat
LLM
FastChat
LangChain
LLM
【具身智能】RT-2:视觉-语言-动作模型(VLA)
文章目录前言一、视觉-语言-动作(VLA)模型二、利用VLM控制机器人三、实验四、Demo五、总结前言RoboticTransformer2(RT-2)是由谷歌DeepMind新推出的大
语言模型
,它为人类提供了通过纯语言命令来优化机器人控制的能力
Travis.X
·
2023-09-12 23:32
具身智能
算法
机器人
人工智能
chatgpt
具身智能
c++
国内外大
语言模型
调研(更新到2023.09.12)
目录国外OpenAI-ChatGPTAnthropic-ClaudeGoogle-Bard国内百度-文心一言清华大学&智谱AI-ChatGLM百川智能-百川大模型科大讯飞-星火阿里-通义千问360-360智脑腾讯-混元大模型华为-盘古大模型字节跳动-云雀大模型好未来-MathGPT商汤科技-商量京东-言犀面向B端复旦大学-MOSSMiniMax-MiniMax上海AI实验室-书生浦语中科院自动化所
热爱旅行的小李同学
·
2023-09-12 23:41
大模型
人工智能
bard
文心一言
chatgpt
自然语言处理
多元共进|创新技术提供助力,共创增长机遇
借助新推出的面向开发者的大
语言模型
PaLMAPI,合作伙伴可以进一步创新应用,打造良好的用户体验,实现业务增长。在大会上,谷歌合作创新团队
高校俱乐部
·
2023-09-12 21:21
人工智能
FlashAttention:Fast and Memory-Efficient Exact Attention with IO-Awareness
FlashAttention让
语言模型
拥有更长的上下文FlashAttention序:概述:简介:FlashAttention块稀疏FlashAttention优点:标准注意力算法实现流程:FlashAttentionBlock-SparseFlashAttention
江小皮不皮
·
2023-09-12 18:04
FlashAttention
人工智能
ChatGLM2-6B
开源大模型
AIGC
论文浅尝 | 思维树:使用大
语言模型
反复思考解决问题
笔记整理:许泽众,浙江大学博士,研究方向为知识图谱上的神经符号推理链接:https://arxiv.org/abs/2305.106011.动机
语言模型
是一种强大的工具,可以用于各种需要数学、符号、常识或知识推理的任务
开放知识图谱
·
2023-09-12 17:39
语言模型
人工智能
自然语言处理
论文分享丨西工大音频语音与语言处理研究组四篇论文被IEEE Trans. ASLP和SPL录用
一篇论文被重要期刊IEEESignalProcessingLetters(IEEESPL)录用,论文方向涉及说话人识别中的对抗攻击、基于扩散模型的跨语种情感迁移语音合成、语音转换中基于多层级韵律建模的风格迁移、基于
语言模型
的语音转换
语音之家
·
2023-09-12 16:00
智能语音
音视频
语音识别
人工智能
ChatGPT诞生的新岗位:提示工程师(Prompt Engineer)
Prompt工程师擅长对运行在大型
语言模型
上的AI聊天机器人提问,来获得所需的回答。与编写代码的传统计
程序员白城
·
2023-09-12 16:11
ChatGPT
chatgpt
人工智能
机器学习
深度学习
大
语言模型
之八-提示工程(Prompt engineer)
大
语言模型
的效果好,很大程度上归功于算力和数据集,算力使得模型可以足够大,大到模型的理解、记忆、推理和生成以及泛化能力可以同时兼备,而数据集则是模型学习的来源。
shichaog
·
2023-09-12 16:10
神经网络&人工智能
语言模型
prompt
人工智能
LARGE LANGUAGE MODELS AS OPTIMIZERS
作为优化器的大型
语言模型
摘要1引言2OPRO:LLM作为优化器3激励性例子:数学优化4应用:提示优化5提示优化实验6相关工作7结论摘要优化无处不在。
UnknownBody
·
2023-09-12 13:39
LLM
语言模型
人工智能
机器学习
请体验一下falcon 180b 大
语言模型
的感觉
引言由TechnologyInnovationInstitute(T四训练的开源大模型Falcon180B登陆HuggingFace!Falcon180B为开源大模型树立了全新的标杆。作为当前最大的开源大模型,有l80B参数并且是在在3.5万亿token的TIIRefinedWeb数据集上进行训练,这也是目前开源模型里最长的单波段预训练。你可以在HuggingFaceHub中查阅其基础模型、聊天模
winfredzhang
·
2023-09-12 13:52
falcon
180b
llm
GPT引领前沿与应用突破之GPT-4科研实践技术与AI绘图
查看原文>>>GPT引领前沿与应用突破之GPT4科研实践技术与AI绘图目录专题一、AIGC概述专题二、人工智能算法介绍专题三、大
语言模型
Prompt提示词使用技巧专题四、让GPT成为你的生活助理(动手练习
吹翻书页的风
·
2023-09-12 12:40
数据语言
深度学习机器学习
数据语言
统计分析
gpt
人工智能
AI画图
GPT插件
GPT-4
Lora模型
pytorch代码实现注意力机制之MHSA
MHSA注意力机制MHSA是多头自注意力机制(Multi-HeadSelf-Altention),是自然语言处理领域中用于
语言模型
中的一种特殊机制。
我悟了-
·
2023-09-12 11:52
注意力机制
pytorch
人工智能
python
计算机视觉
深度学习
目标检测
AI文本创作在百度App发文的实践
作者|内容生态端团队导读大
语言模型
(LLM)指包含数百亿(或更多)参数的
语言模型
,这些模型通常在大规模数据集上进行训练,以提高其性能和泛化能力。
·
2023-09-12 10:56
人工智能百度
Falcon 180B 目前最强大的开源模型
TechnologyInnovationInstitute最近发布了Falcon180B大型
语言模型
(LLM),它击败了Llama-270b,与谷歌Bard的基础模型PaLM-2Large不相上下。
·
2023-09-12 10:25
【AI理论学习】
语言模型
Performer:一种基于Transformer架构的通用注意力框架
语言模型
Performer:一种基于Transformer架构的通用注意力框架Performer论文解读RegularAttentionMechanismFAVOR+:通过矩阵相关性实现快速注意力Attention
镰刀韭菜
·
2023-09-12 10:26
深度学习与人工智能
自然语言模型
Transformer
Performer
注意力机制
核方法
高斯核
正交
Lost in the Middle: How Language Models Use Long Contexts
迷失在中间:
语言模型
如何使用长上下文摘要1引言2
语言模型
3多文档问答4
语言模型
如何从输入上下文中检索?5为什么
语言模型
很难使用它们的整个输入上下文?6更多的背景总是更好吗?
UnknownBody
·
2023-09-12 08:36
LLM
语言模型
人工智能
自然语言处理
ChatGPT在工业领域的研究与应用探索-数据与工况认知
ChatGPT发展现状...22.ChatGPT如何与工业相结合...23.ChatGPT在工业领域的研究与应用...31.ChatGPT发展现状ChatGPT是基于OpenAI的GPT-4架构的一种大型
语言模型
iNeuOS工业互联网
·
2023-09-12 07:09
chatgpt
人工智能
Pytorch intermediate(四) Language Model (RNN-LM)
这里将会介绍
语言模型
,这个模型中我们需要重点关注的是每个时序输入过程中产生的输出。可以理解为,我输入a,那么我需要
青山渺渺
·
2023-09-12 07:59
deep
learning
pytorch
语言模型
rnn
开放域问答论文阅读-Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augme
最近,大型
语言模型
(LLM)(例如ChatGPT)在利用世界知识解决各种任务(包括知识密集型任务)方面表现出了令人印象深刻的能力。
无脑敲代码,bug漫天飞
·
2023-09-12 07:24
知识图谱
论文阅读
语言模型
人工智能
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
在图像-文本对上调整大
语言模型
(LLM)的指令已经实现了前所未有的视觉-语言多模态能力。然而,他们的视觉语言对齐仅建立在图像级别上,缺乏区域级别对齐限制了他们在细粒度多模态理解方面的进步。
Spielberg_1
·
2023-09-12 06:23
论文
语言模型
人工智能
自然语言处理
AIGC:【LLM(七)】——Baichuan2:真开源可商用的中文大模型
模型推理四.模型量化4.1量化方法4.2在线量化4.3离线量化4.4量化效果五.模型微调5.1依赖安装5.2单机训练5.3多机训练5.4轻量化微调一.模型介绍Baichuan2是百川智能推出的新一代开源大
语言模型
J_Xiong0117
·
2023-09-12 06:46
LLMs
自然语言处理
AIGC
开源
1800亿参数,支持中文,3.5万亿训练数据!开源类ChatGPT模型
阿联酋阿布扎比技术创新研究所(TechnologyInnovationInstitute,简称TII)在官网发布了,目前性能最强的开源大
语言模型
之一Falcon180B。
RPA中国
·
2023-09-12 03:44
chatgpt
ELMo 原理解析
SuiXin'sBlog原文:https://suixinblog.cn/2019/09/elmo.html作者:SuiXinELMo(EmbeddingsfromLanguageModels)是一个深度上下文相关的词嵌入
语言模型
Sui_Xin
·
2023-09-12 00:39
客户好评“收割机”,NPS高达0.7, 实在RPA6.8.0重磅升级解析
近期,实在智能大模型新品(TARS-RPA-Agent)发布会召开,通过底层软件架构的全新优化和全面结合大
语言模型
实现“超进化”,持续以AI技术为RPA行业提供领先的超自动化解决方案。
实在智能RPA
·
2023-09-11 21:08
人工智能
你说,PC做!实在智能推出行业首个基于大模型的TARS-RPA-Agent产品
6月下旬,AI行业准独角兽实在智能(IntelligenceIndeed)开启自研垂直大
语言模型
“塔斯(TARS)”内测。
实在智能RPA
·
2023-09-11 21:38
rpa
在“听得懂”之后“看得见、动起来”,实在智能首发“你说PC做”的大模型Agent
大洋彼岸种下了一颗AI的种子,拥有“算力魔法”的ChatGPT在海内外掀起一场“大”爆发——大型
语言模型
爆发,带动了AI大模型技术的新热潮。
实在智能RPA
·
2023-09-11 21:38
ai
人工智能
大模型
[学习笔记]词向量模型-Word2vec
论文储备知识-pre-knowledge
语言模型
的概念
语言模型
是计算一个句子是句子的概率的模型。(语法和语义上)
语言模型
的发展基于专家语法规则的
语言模型
语言学家企图总结
N刻后告诉你
·
2023-09-11 21:01
深度学习
学习
笔记
word2vec
万字长文: 检索增强 LLM
来自:AI思维单车ChatGPT的出现,让我们看到了大
语言模型
(LargeLanguageModel,LLM)在语言和代码理解、人类指令遵循、基本推理等多方面的能力,但幻觉问题Hallucinations
zenRRan
·
2023-09-11 20:47
人工智能
Code Llama: Open Foundation Models for Code
CodeLlama:代码的开放基础模型摘要1引言2CodeLlama:专业化Llama2用于代码3结果4负责任的人工智能与安全5相关工作6讨论摘要我们发布了CodeLlama,这是一个基于Llama2的大型代码
语言模型
系列
UnknownBody
·
2023-09-11 20:13
LLM
llama
人工智能
深度学习
Augmented Large Language Models with Parametric Knowledge Guiding
参数知识引导下的增强大型
语言模型
摘要1引言2相关工作3LLM的参数化知识引导4实验5结论摘要大型
语言模型
(LLM)凭借其令人印象深刻的语言理解和生成能力,显著提高了自然语言处理(NLP)。
UnknownBody
·
2023-09-11 20:13
LLM
语言模型
人工智能
自然语言处理
ACL 2023 | 自查纠错:给大模型的“思考过程”注入知识以提高事实正确度
大型
语言模型
(LLMs)逐渐成为自然语言处理(NLP)中的常态,并在生成和推理任务中展现出良好的性能。然而其最致命的缺点之一是生成的内容缺乏事实正确性。
PaperWeekly
·
2023-09-11 20:12
直播预告 | ACL 2023原作解读:自查纠错—知识增强的思维链框架
ACL2023:自查纠错——知识增强的思维链框架直播嘉宾李星漩新加坡南洋理工大学和达摩院联培博士生直播时间2023年8月29日(周二)19:00-19:30观看方式扫码下方二维码进入直播间观看▼报告介绍大型
语言模型
PaperWeekly
·
2023-09-11 20:12
How Language Model Hallucinations Can Snowball
语言模型
幻觉是如何产生雪球的摘要1引言2为什么我们期待幻觉像滚雪球一样越滚越大?3实验4我们能防止雪球幻觉吗?
UnknownBody
·
2023-09-11 19:42
LLM
语言模型
人工智能
自然语言处理
Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework
验证与编辑:一个知识增强的思想链框架摘要1引言2相关工作3验证和编辑框架4实验设置5结果与分析6结论局限性摘要由于大型
语言模型
(LLM)已成为NLP中的规范,在生成和推理任务中表现出良好的性能,其最致命的缺点之一是缺乏事实的正确性
UnknownBody
·
2023-09-11 19:11
LLM
知识图谱
语言模型
人工智能
在家构建您的迷你聊天Chat gpt
在这篇文章中,您将了解什么是可以像ChatGPT一样运行的
语言模型
如何使用高级
语言模型
构建聊天机器人推荐:使用NSDT场景编辑器助你快速搭建可编辑的3D应用场景什么是指令遵循模型?
语言模型
是机器学习模
·
2023-09-11 18:56
chatgpt
在家构建您的迷你聊天Chat gpt
在这篇文章中,您将了解什么是可以像ChatGPT一样运行的
语言模型
如何使用高级
语言模型
构建聊天机器人推荐:使用NSDT场景编辑器助你快速搭建可编辑的3D应用场景什么是指令遵循模型?
语言模型
是机器学习模
·
2023-09-11 18:55
chatgpt
从 GPT4All 体验 LLM
大型
语言模型
最近变得流行起来。ChatGPT很时髦。尝试ChatGPT以了解LLM的内容很容易,但有时,您可能需要一个可以在您的计算机上运行的离线替代方案。
·
2023-09-11 18:24
chatgptllm
【专题】2023年大
语言模型
综合评测报告PDF合集分享(附原数据表)
2023年,国内主要厂商也相继推出自研的大
语言模型
产品,同时,国内也推出了大量的大
语言模型
应用,逐步构建了基于中文语言特色的
·
2023-09-11 17:50
【专题】2023年大
语言模型
综合评测报告PDF合集分享(附原数据表)
2023年,国内主要厂商也相继推出自研的大
语言模型
产品,同时,国内也推出了大量的大
语言模型
应用,逐步构建了基于中文语言特色的
·
2023-09-11 16:47
DevChat 上线 VSCode 插件!国内开源的 AI 编程,做不被 AI 取代的新程序员!
(要用AI来辅助写代码,国际主流的几个大
语言模型
的表现都不尽如人意,谁用谁知道……除了Claude我们还在测试中。于是,我们基于大
语言模型
,做了个辅助编程的开源的VSCode插件——DevChat。)
思码逸研发效能
·
2023-09-11 12:12
vscode
人工智能
开源
大模型心高气傲,没有AI Agents生死难料
AIAgent,正在接棒大
语言模型
LLM,成为AI圈最火的话题。
脑极体
·
2023-09-11 10:39
人工智能
当红
语言模型
利器:深度解析向量数据库技术及其应用
编者按:随着大
语言模型
的广泛应用,如何存储和高效检索这些模型产生的大量向量表示成为一个较为关键的问题。本文深入探讨了向量数据库在提升
语言模型
应用性能方面的作用,并介绍了不同类型向量数据库的特点。
·
2023-09-11 10:11
llm数据库程序员后端人工智能
【大模型】更强的开源可商用的中英文大
语言模型
baichuan2来了,从零开始搭建
【大模型】更强的开源可商用的中英文大
语言模型
baichuan2来了,从零开始搭建Baichuan2介绍技术报告github地址模型下载开放协议协议测试评估通用领域测试7B模型结果13B模型结果法律、医疗
szZack
·
2023-09-11 09:57
大语言模型
baichuan2
llm
上一页
68
69
70
71
72
73
74
75
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他