E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
大
语言模型
系列-Transformer
文章目录前言一、Attention二、Transformer结构三、Transformer计算过程1.编码器(Encoder)1)Self-Attention层2)Multi-Head-Attention层3)Add&Norm层2.解码器(Decoder)1)MaskedMulti-headSelfAttention层2)Encoder-DecoderAttention层3.输出4.训练和预测5.
学海一叶
·
2024-01-19 06:40
LLM
语言模型
transformer
人工智能
深度学习
神经网络
阿里云容器服务助力万兴科技 AIGC 应用加速
一时间风起云涌,国内外许多企业投身AIGC创新浪潮,各大云厂商紧随其后纷纷推出自己的大
语言模型
。在文生图领域落地的企业更多,国外的如Midjourney,国内的如AIGC软件公司万兴科技等。
阿里云云原生
·
2024-01-19 06:37
阿里云
科技
AIGC
麻瓜变白袍巫师?SLEICL新范式:强模型生成“魔法书”增强弱模型性能直逼GPT-4...
公司关于GPT3.5的技术报告中首次提出,主要是因为当时提升大模型在下游任务表现的主要方法是微调,但微调却有以下三点不足:低效率:从实际的角度来看,每个新任务都需要大量的带有标记的例子数据集,这限制了
语言模型
的适用性
zenRRan
·
2024-01-19 06:03
人工智能
python
算法
机器学习
深度学习
大
语言模型
系列-GPT-1
文章目录前言一、GPT-1网络结构和流程二、GPT-1的创新点总结前言前文提到的ELMo虽然解决了词嵌入多义词的问题,但存在如下缺点:基于RNN的网络结构使得其特征提取能力弱,训练难且时间长预训练模型(仅用于特征抽取)和实际下游任务模型仍是分开的、非端到端的GPT-1基于上述缺点进行了改进。提示:以下是本篇文章正文内容,下面内容可供参考一、GPT-1网络结构和流程网络结构方面,GPT-1使用Tra
学海一叶
·
2024-01-19 06:02
LLM
语言模型
gpt
人工智能
深度学习
自然语言处理
大
语言模型
有什么魅力?和生成式AI是一回事吗?亚马逊云科技可以告诉你
大
语言模型
和生成式AI有什么关系呢?大
语言模型
为什么这么火?一提到大
语言模型
,想必大家第一个想到的就是ChatGPT这样的自然语言处理工具,那么大
语言模型
是什么?大
语言模型
和生成式AI是什么关系?
焦点快讯1
·
2024-01-19 01:08
人工智能
语言模型
科技
大
语言模型
LLM幻觉的解决方法:检索增强生成RAG
当你向大
语言模型
LLMs集成的问答系统平台咨询医疗方面的问题,比如呼吸道感染应该怎么治疗,它可能直接给出答案,但不会提供这个答案的依据来源,这是因为大
语言模型
应用过程中还存在答案透明度不足的缺陷导致。
英智未来
·
2024-01-19 01:21
语言模型
人工智能
机器学习
大
语言模型
工作原理:AI如何理解与创造语言?
大型
语言模型
(LLM),如GPT、BERT等,基于深度学习技术,从海量文本中学习语言的模式和规律,核心任务是预测接下来最可能出现的单词,从而实现自然语言生成和理解。
英智未来
·
2024-01-19 01:51
人工智能
语言模型
自然语言处理
大模型部署过程中需要注意的事项
部署大型
语言模型
是一个详尽且复杂的过程,需要开发者们具备深入的理解和精确的实施策略。以下是对各个开发步骤的简单介绍,欢迎各位开发者一起讨论交流。
英智未来
·
2024-01-19 01:51
人工智能
语言模型
一文读懂大型
语言模型
LLM
这种能力的核心在于大型
语言模型
(大
语言模型
),如GPT和Gemini,它们通过分析和处理大量文本数据,能夠生成流畅、准确且具有上下文关
英智未来
·
2024-01-19 01:50
语言模型
搜索引擎
人工智能
2023年度十大科技名词
“大
语言模型
、生成式人工智能、量子计算、脑机接口、数据要素、智慧城市、碳足迹、柔性制造、再生稻、可控核聚变”入选。十个最具影响力和代表性的科技名词,为公众描绘出一幅科技发展的生动画卷。
Imagination官方博客
·
2024-01-19 00:56
科技
高性能小模型SLM最新优化方案和热门应用盘点,附配套模型和开源代码
这里的小模型指的小型
语言模型
(SmallLanguageModel,简称SLM),通常用于解决资源受限或实时性要求较高的场景,比如一些边缘设备(智能手机、物联网设备和嵌入式系统等),大模型难以运行其上。
深度之眼
·
2024-01-18 23:05
人工智能干货
深度学习干货
小模型
大模型
论文
模型
代码
开源
LaWGPT安装和使用教程的复现版本【细节满满】
文章目录前言一、下载和部署1.1下载1.2环境安装1.3模型推理总结前言LaWGPT是一系列基于中文法律知识的开源大
语言模型
。
D洁洁和W的御用Programmer
·
2024-01-18 22:57
大模型安装
NLP
语言模型
nlp
智能法律
AI大
语言模型
学习笔记之一:大型
语言模型
(LLMs)概览
最近在学习AI大
语言模型
的相关知识、原理和应用,感兴趣的小伙伴们可以关注公众号后续文章笔记更新。一、什么是大型
语言模型
(LLMs)?
DATA无界
·
2024-01-18 22:08
大语言模型
AI人工智能
人工智能
语言模型
学习
nlp
transformer
大模型学习笔记02——大模型的能力
大模型学习笔记02——大模型的能力1、概述以GPT-3为例,并未明确针对这些任务进行训练,它只是作为一个
语言模型
,被训练来预测下一个词由于GPT-3并未特别针对任何这些任务进行训练,因此它并未过度拟合,
等风来随风飘
·
2024-01-18 21:13
大模型读书笔记
学习
笔记
用通俗易懂的方式讲解:使用Llama-2、PgVector和LlamaIndex,构建大模型 RAG 全流程
近年来,大型
语言模型
(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。
Python算法实战
·
2024-01-18 21:33
大模型理论与实战
大模型
llama
人工智能
算法
LLM
大模型
RAG
检索增强生成
26个 Prompt 超级技巧,让你的 ChatGPT 直接起飞
大家好,今天分享26个实战中常用的小技巧,让你的输出事半功倍,一起来看看与大型
语言模型
交流无需礼貌用语,不需要添加“请”、“如果你不介意”、“谢谢”、“我想要”等,直接说出你的需求。
Python算法实战
·
2024-01-18 21:02
大模型理论与实战
prompt
chatgpt
人工智能
算法
用通俗易懂的方式讲解:使用 LangChain 和 LlamaIndex 从零构建PDF聊天机器人
随着大型
语言模型
(LLM)(如ChatGPT和GPT-4)的兴起,现在比以往任何时候都更容易搭建智能聊天机器人,并且可以堆积如山的文档,为你的输入提供更准确的响应。
Python算法实战
·
2024-01-18 21:02
大模型
langchain
llamaindex
大模型
模型部署
算法
昇思MindSpore技术公开课——第三课:GPT
GPT模型是由OpenAI公司开发的一种基于Transformer架构的人工智能
语言模型
。它在大规模文本数据上进行预训练,学习了丰富的语言知识和语境,并能够执行多种自然语言处理任务。
STRUGGLE_xlf
·
2024-01-18 20:52
gpt
easyui
前端
Elasticsearch:聊天机器人教程(一)
在本教程中,你将构建一个大型
语言模型
(LLM)聊天机器人,该机器人使用称为检索增强生成(RAG)的模式。使用RAG构建的聊天机器人可以克服ChatGPT等通用会话模型所具有的一些限制。
Elastic 中国社区官方博客
·
2024-01-18 19:04
Elasticsearch
AI
Elastic
机器人
语言模型
langchain
人工智能
elasticsearch
ai
搜索引擎
站在AGI拐点,重新想象老年生活
一路见证AI适老化的进展,我们强烈地感受到,大
语言模型
、通用人工智能在2023狂奔这一年,AI适老化也迎来了剧烈的变化。
脑极体
·
2024-01-18 17:38
agi
生活
使用 Neo4j 和 LangChain 集成非结构化知识图增强 QA
信息检索和知识提取是一个不断发展的领域,随着大型
语言模型
(LLM)和知识图的出现,这一领域发生了显着的变化,特别是在多跳问答的背景下。
深度学习算法与自然语言处理
·
2024-01-18 15:56
大模型实战
NLP与大模型
langchain
知识图谱
neo4j
大语言模型
大模型
深度学习
自然语言处理
用通俗易懂的方式讲解:如何用大
语言模型
构建一个知识问答系统
本文探索使用大
语言模型
(LargeLanguageModel,LLM),通过其对自然语言理解和生成的能力,揣摩用户意图,并对原始知识点进行汇总、整合,生成更贴切的答案。
深度学习算法与自然语言处理
·
2024-01-18 15:26
NLP与大模型
人工智能
自然语言处理
深度学习
LLM
langchain
用通俗易懂的方式讲解:内容讲解+代码案例,轻松掌握大模型应用框架 LangChain
本文介绍了LangChain框架,它能够将大型
语言模型
与其他计算或知识来源相结合,从而实现功能更加强大的应用。
深度学习算法与自然语言处理
·
2024-01-18 15:25
NLP与大模型
大模型实战
langchain
自然语言处理
深度学习
大模型
利用 LangChain 和 Neo4j 向量索引,构建一个RAG应用程序
LangChain库是构建大型
语言模型
(LLM)应用程序的重要框架。这种集成有助于将数据有效地摄取到Neo4jVectorIn
深度学习算法与自然语言处理
·
2024-01-18 15:22
NLP与大模型
大模型实战
langchain
neo4j
大模型
大语言模型
深度学习
人工智能
一篇综述洞悉医学大型
语言模型
的原理,应用和挑战
在过去的一年中,随着GPT-4、LLaMA、Mistral,PaLM等先进技术的突飞猛进,大型
语言模型
(LargeLanguageModels)已经引领全球人工智能进入了一个全新的基础模型时代,这一时代不仅开启了技术创新的新篇章
TechBeat人工智能社区
·
2024-01-18 14:38
技术文章
语言模型
人工智能
自然语言处理
ChatGPT | 模型架构 | 应用 | 思考
介绍ChatGPT3.5是OpenAI推出的
语言模型
的一个版本,是GPT(生成式预训练模型)系列的一部分。
梓芮.
·
2024-01-18 12:50
应用
协议
chatgpt
chatgpt
3.5
transformer
chatgpt
应用
ChatGPT
影响
ChatGPT
文本识别
ChatGPT
介绍
十分钟读完「斯坦福提出的革新AI训练的新算法DPO」论文
无需强化学习也能微调对齐大
语言模型
引言:探索无监督
语言模型
的可控性挑战在人工智能领域,无监督
语言模型
(LanguageModels,LMs)的发展已经达到了令人惊叹的水平,这些模型能够在广泛的数据集上进行预训练
夕小瑶
·
2024-01-18 12:15
人工智能
深度学习
语言模型
论文阅读
自然语言处理
nlp
大模型
十分钟读完「微软发布的Orca2」论文,“调教式”教会小型
语言模型
拥有大型
语言模型
的推理能力
微软发布Orca2,“调教式”教会小型
语言模型
拥有大型
语言模型
的推理能力引言:探索小型
语言模型
的推理能力在人工智能领域,大型
语言模型
(LLMs)因其在多种任务上展现出的卓越性能而备受瞩目。
夕小瑶
·
2024-01-18 12:15
人工智能
深度学习
论文阅读
自然语言处理
语言模型
机器学习
十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文
降低LLaMA模型微调内存占用,仅需数小时追赶ChatGPT引言:大模型微调的新时代随着人工智能技术的飞速发展,大型
语言模型
(LargeLanguageModels,LLMs)已成为自然语言处理领域的重要工具
夕小瑶
·
2024-01-18 12:45
llama
nlp
人工智能
深度学习
语言模型
机器学习
十分钟读完「超越GPT-3.5和LLama2的Mixtral 8x7B」论文
专家混合模型Mixtral8x7B颠覆性表现震撼全球引言:Mixtral8x7B模型及其在多个基准测试中的表现在当今人工智能领域,
语言模型
的发展正以惊人的速度推进着自然语言处理技术的边界。
夕小瑶
·
2024-01-18 12:44
自然语言处理
人工智能
神经网络
深度学习
大模型
nlp
2024年1月17日Arxiv热门NLP大模型论文:PRewrite: Prompt Rewriting with Reinforcement Learning
引言:自动化提示工程的必要性与挑战在当今的人工智能领域,大型
语言模型
(LLM)的应用日益广泛,它们在各种下游任务中展现出了令人印象深刻的性能。
夕小瑶
·
2024-01-18 12:14
人工智能
深度学习
机器学习
2024年1月17日Arxiv热门NLP大模型论文:MIT、IBM推出新方法,大幅提升LLMs的连贯性、准确性和可更新性!
引言:探索
语言模型
的真实性和一致性在当今信息爆炸的时代,
语言模型
(LanguageModels,简称LMs)已成为获取信息和验证事实的重要工具。
夕小瑶
·
2024-01-18 12:13
人工智能
深度学习
机器学习
NLP
论文阅读
神经网络
2024年1月17日Arxiv热门CV大模型论文:DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models
引言:探索动态视频任务的新篇章在人工智能领域,大型
语言模型
(LLMs)的快速发展推动了AI代理的进步,尤其是在视觉任务的处理上。
夕小瑶
·
2024-01-18 12:43
语言模型
人工智能
计算机视觉
深度学习
机器学习
论文阅读
大
语言模型
的32种消除幻觉的技术,你都了解吗?
今天介绍的这篇文章详细梳理了大
语言模型
幻觉消除技术,将其系统的分为提示工程和模型开发两大类。
夕小瑶
·
2024-01-18 12:12
语言模型
人工智能
深度学习
GPT-4:打工人的智能伙伴,提升工作效率与能力
一、GPT-4简介MidTool(迷图网(MidTool)-免费ChatGPT中文版和Midjourney的AI绘画聊天软件)的GPT-4,作为一种先进的大型
语言模型
,由OpenAI开发,它在自然语言处理
Blind.894
·
2024-01-18 12:42
chatgpt
GPT-4:大学生学习的革命性助手
一、GPT-4简介MidTool(https://www.aimidtool.com/index)的GPT-4是由OpenAI开发的最新一代大型
语言模型
,它在理解
Blind.894
·
2024-01-18 12:42
人工智能
GPT-4:程序员的新型助手,重塑编程未来
随着人工智能技术的飞速发展,GPT-4(GenerativePre-trainedTransformer4)作为最新一代的大型
语言模型
,已经成为程序员们的得力助手。
Blind.894
·
2024-01-18 12:42
chatgpt
苹果要在iPhone上运行AI大模型?
最新消息称,苹果甚至打算在iPhone上直接运行AI大模型...据苹果AI研究人员表示,他们发明了一种创新的闪存利用技术,这是一项重要的技术突破,可以在iPhone和其他内存有限的Apple设备上部署大型
语言模型
2301_76571514
·
2024-01-18 12:34
iphone
ios
大模型内容分享(二十八):mnn-llm: 大
语言模型
端侧CPU推理优化
在大
语言模型
(LLM)端侧部署上,基于MNN实现的mnn-llm项目已经展现出业界领先的性能,特别是在ARM架构的CPU上。
之乎者也·
·
2024-01-18 12:44
大模型(Foundation
Model)
内容分享
AI(人工智能)
内容分享
mnn
语言模型
人工智能
实战whisper:本地化部署通用语音识别模型
以下是该AI模块的具体使用方式:https://github.com/openai/whisper心得这是一个不错的
语言模型
,它支持自动识别语音语种,类似中文、英文、日语等它都能胜任,
EelBarb
·
2024-01-18 12:39
whisper
语音识别
人工智能
浅析GitHub Copilot
技术实现与原理基于Transformer的模型:Copilot的核心是基于GPT-3(以及后续更先进的版本)架构训练的大型
语言模型
,该模型在海量的开源代码库上进行了微调。
星辰引路-Lefan
·
2024-01-18 11:36
系列文章
copilot
大
语言模型
系列-ELMo
文章目录前言一、ELMo的网络结构和流程二、ELMo的创新点总结前言在前文大
语言模型
系列-word2vec已经提到word2vec的缺点:为每个词汇表中每个分词静态生成一个对应的词向量表示,没有考虑到语境
学海一叶
·
2024-01-18 09:11
语言模型
人工智能
自然语言处理
深度学习
迁移学习
大
语言模型
系列-word2vec
、word2vec的网络结构和流程1.Skip-Gram模型2.CBOW模型二、word2vec的训练机制1.Hierarchicalsoftmax2.NegativeSampling总结前言在前文大
语言模型
系列
学海一叶
·
2024-01-18 08:39
LLM
语言模型
word2vec
人工智能
自然语言处理
深度学习
标题:智能对话新纪元:ChatGPT与文心一言的全面比较
标题:智能对话新纪元:ChatGPT与文心一言的全面比较引言:在这个由数据驱动的时代,人工智能
语言模型
已成为技术创新的前沿。
king_wzhua
·
2024-01-18 08:25
ChatGPT
chatgpt
文心一言
人工智能
AI测试|颠覆客户端UI自动化?别担心,你还不会失业!AppAgent框架简单试用
近日,腾讯团队发表了一篇论文,并开源了一款基于大
语言模型
的,用于手机端执行复杂任务的多模态智能代理框架——AppAgent。
TesterHome官方
·
2024-01-18 05:54
自动化
运维
自动化测试
移动测试
测试工具
AI 反馈强化学习的工作原理
瑞安·奥康纳近几个月来,大型
语言模型
(LLM)因其编写代码、起草文档等能力而备受关注。人们还观察到这些能力极强的特工有时会表现出不良行为,例如产生有害和有毒的输出,甚至在某些情况下鼓励自残。
无水先生
·
2024-01-18 03:29
人工智能
NLP高级和ChatGPT
chatgpt
人工智能
如果开启了8bit量化加载,项目无法启动,参考此位置,选择合适的cuda版本
部署大
语言模型
过程,报错如标题,并发现同时出现的报错信息:ImportError:Usingload_in_8bit=TruerequiresAccelerate:pipinstallaccelerateandthelatestversionofbitsandbytespipinstall-ihttps
孔雀竹鱼
·
2024-01-18 01:36
python
开发语言
4bit/8bit 启动 Mixtral 8*7B 大
语言模型
4bit/8bit启动Mixtral8*7B大
语言模型
0.背景1.修改代码0.背景个人电脑配置实在难以以float16运行Mixtral8*7B大
语言模型
,所以参数4bit或者8bit来启动。
engchina
·
2024-01-18 01:05
LINUX
语言模型
人工智能
前端
Mixtral
Chatopera 云服务支持大
语言模型
对话(LLM),定制您的聊天机器人
在过去的一年,用户们反映最多的建议是Chatopera云服务内置大
语言模型
的对话,今天Chatopera云服务完成了产品升级,满足了这个诉求。
Chatopera 研发团队
·
2024-01-17 22:04
语言模型
机器人
人工智能
ChatGPT 和文心一言哪个更好用?
直接让文心一言来回答:ChatGPT和文心一言都是人工智能
语言模型
,各有其优势和特点。
隐私无忧
·
2024-01-17 22:13
万花筒
#
乱78糟
chatgpt
文心一言
人工智能
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他