E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
有道CEO周枫:当我们谈论大模型时,应该关注哪些新能力?
作者:周枫基于大
语言模型
技术的ChatGPT推出已经有4个月了,更多同类产品还在快速出现。比如,前天谷歌更新了Bard,将辅助编程能力支持的语言数量扩展到20种。
有道AI情报局
·
2024-02-13 05:47
人工智能
超好用的AI提示词工具,再也不用烦恼怎样写好提示词了
同样,我在使用ChatGPT、Llama等大型
语言模型
的时候,为了获得更好的结果,prompt也需要按照一定的格式、给足背景和需求。
程序员_阿轩
·
2024-02-13 01:19
人工智能
ai
AI写作
AI编程
GPT3是否是强人工智能?
今天和大家分享一下AI方向自然语言处理(NLP)领域内一个新的
语言模型
:GPT-3。
枯木嫩芽
·
2024-02-13 00:28
写的太通透了!大模型自省式 RAG 与 LangGraph 的实践!
本文讲解了自省式RAG的基础原理以及基于LangGraph的实践演示自省式RAG与LangGraph重要链接关于Self-RAG和CRAG的教程手册演示视频研究背景由于大多数大型
语言模型
(LLMs)通常只针对大量公共数据进行周期性训练
Python算法实战
·
2024-02-12 23:17
大模型
大模型理论与实战
langchain
人工智能
算法
大模型
深度学习
ChatGPT的背后原理:大模型、注意力机制、强化学习
微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩本文主要介绍为ChatGPT提供动力的机器学习模型,将从大型
语言模型
的介绍开始,深入探讨使GPT-3得到训练的革命性的自注意机制,然后深入到从人类反馈强化学习
Python学研大本营
·
2024-02-12 23:17
chatgpt
这次理解透彻了!用代码从零实现大模型的自注意力、多头注意力。。。
这篇文章将介绍Transformer架构以及GPT-4和Llama等大型
语言模型
(LLM)中使用的自注意力机制。自注意力等相关机
Python算法实战
·
2024-02-12 23:47
大模型算法岗面试
自然语言处理
人工智能
大模型
算法
Cross-lingual Transfer of Monolingual Representations
clipboard.png假设有两种语言L1和L2,L1既有大量无标签数据又有下游任务的监督数据,L2只有大量无标签数据,整个流程可分为一下四步:在L1无标签的数据集上,训练一个单语的bert,任务为masked
语言模型
ltochange
·
2024-02-12 20:03
大模型题库
你能解释一下Transformer架构及其在大型
语言模型
中的作用吗?
lichunericli
·
2024-02-12 19:28
LLM
人工智能
语言模型
基于大
语言模型
的AI Agents
基于大
语言模型
(LLM)的AIAgent利用LLM进行记忆检索、决策推理和行动顺序选择等,把Agent的智能程度提升到了新的高度。LLM驱动的Agent具体是怎么做的呢?什么是AIAgent?
lichunericli
·
2024-02-12 19:27
Agent
人工智能
语言模型
自然语言处理
LLM的参数微调、训练、推理;LLM应用框架;LLM分布式训练
GPT-3:由OpenAI开发,GPT-3是一个巨大的自回归
语言模型
,拥有1750亿个参数。它可以生成文本、回答问题、翻译文本等。
lichunericli
·
2024-02-12 19:27
LLM
人工智能
语言模型
自然语言处理
LLMs模型选择,LLMs复读机问题,LLMs长文本处理方案
LLMs复读机问题(LLMsParrotingProblem)是指大型
语言模型
(LLMs)在生成文本时可能出现的重复或重复先前输入内容的现象。
lichunericli
·
2024-02-12 19:26
LLM
人工智能
深度学习
机器学习
2024 通义语音 AI 技术图景,大模型引领 AI 再进化
在此技术背景下,OpenAI携应用级界面产品ChatGPT横空出世,使得人们对大
语言模型
的通用能力有了全新的认识,引燃了语义大
语言模型
的研究热潮。与此同时,要模拟
阿里技术
·
2024-02-12 15:01
通义千问
大
语言模型
ChatGLM + P-Tuning微调实践
大
语言模型
ChatGLM+P-Tuning微调实践文章目录大
语言模型
ChatGLM+P-Tuning微调实践LLM微调基础本次实践环境说明ChatGLM部署以及激活conda环境安装依赖禁用W&B训练数据集
North_D
·
2024-02-12 13:59
AI
人工智能
人工智能
自然语言处理
chatgpt
nlp
transformer
深度学习
机器学习
大
语言模型
langchain+ChatGLM3-6B+本地知识库实战
大
语言模型
langchain+ChatGLM3-6B+本地知识库实战文章目录大
语言模型
langchain+ChatGLM3-6B+本地知识库实战目标微调、本地知识库和Prompt基本概念1、环境准备2、
North_D
·
2024-02-12 13:29
AI
人工智能
langchain
人工智能
自然语言处理
AIGC
prompt
embedding
书生谱语-全链条开发工具
书生·谱语全链条开发体系包含:数据、模型预训练、模型微调、模型量化部署、模型测评、模型场景应用全链路开发体系github链接通用大模型国内外大
语言模型
快速发展,涌现了大量的大
语言模型
以及一批创业公司深度学习模型的发展大模型利用多模态优势
SatVision炼金士
·
2024-02-12 11:21
NLP
python
大
语言模型
不适合的范围
大
语言模型
在某些情况下可能不适用,主要体现在以下几个方面:1、特定领域知识不足大
语言模型
可能缺乏某些特定领域的专业知识,导致在特定行业或领域的问题上表现不佳。
人机与认知实验室
·
2024-02-12 09:24
语言模型
人工智能
自然语言处理
(CTC解码)Modeified prefix-search decoding algorithm
Algorithm.png下面的代码基本上就是上面算法的复现,代码中增加了逐行的解释,代码中实际上没有
语言模型
部分。如果需要,可以比着葫芦画瓢,自己增加上。"""
ZhengkunTian
·
2024-02-12 08:06
Nature Machine Intelligence 法国国家科学研究中心评论“使用大
语言模型
进行研究的危机”
ChatGPT于2022年底发布,将大型
语言模型
(LLM)推到了聚光灯下。通过使用户能够直接用自然语言查询模型,ChatGPT实现了对这些模型的访问——这是一个受欢迎的发展。
xwz小王子
·
2024-02-12 08:35
LLM机器人
语言模型
人工智能
chatgpt
揭秘 LLM 推理:全面解析 LLM 推理性能的关键因素
一、背景介绍自OpenAI一年前发布ChatGPT以来,大型
语言模型
(LLM)领域经历了前所未有的快速发展。
lichunericli
·
2024-02-12 08:53
LLM
人工智能
语言模型
VLM 系列——Llava1.6——论文解读
一、概述1、是什么Llava1.6是llava1.5的升级暂时还没有论文等,是一个多模态视觉-文本大
语言模型
,可以完成:图像描述、视觉问答、根据图片写代码(HTML、JS、CSS),潜在可以完成单个目标的视觉定位
TigerZ*
·
2024-02-12 06:10
AIGC算法
人工智能
AIGC
深度学习
计算机视觉
VLM 系列——MoE-LLaVa——论文解读
概述1、是什么moe-Llava是Llava1.5的改进全称《MoE-LLaVA:MixtureofExpertsforLargeVision-LanguageModels》,是一个多模态视觉-文本大
语言模型
TigerZ*
·
2024-02-12 06:40
AIGC算法
深度学习
人工智能
AIGC
计算机视觉
transformer
VLM 系列——LLaVA-MoLE——论文解读
LLaVA-MoLE:SparseMixtureofLoRAExpertsforMitigatingDataConflictsinInstructionFinetuningMLLMs》,是一个多模态视觉-文本大
语言模型
TigerZ*
·
2024-02-12 06:37
AIGC算法
深度学习
人工智能
AIGC
transformer
计算机视觉
探索ChatGPT4:新一代人工智能
语言模型
的突破
ChatGPT4,作为最新一代的语言处理模型,代表了人工智能在自然语言理解和生成方面的最新突破。本文将深入介绍ChatGPT4的新特性,探讨其在各个领域的潜在应用。ChatGPT4概述在继承了前一代模型的强大基础之上,ChatGPT4引入了多项创新技术,提供了更加精细的语言理解能力,更高的互动性,以及更广泛的应用范围。新特性详解更强大的模型架构ChatGPT4采用了更为复杂的神经网络架构,使模型的
Draven21
·
2024-02-12 03:41
ChatGPT
chatgpt
人工智能
gpt-3
文献阅读:Mamba: Linear-Time Sequence Modeling with Selective State Spaces
Linear-TimeSequenceModelingwithSelectiveStateSpaces1.文章简介2.方法介绍1.StateSpaceModels2.SelectiveStateSpaceModels3.实验考察&结论1.简单问题上的验证2.实际场景效果1.
语言模型
Espresso Macchiato
·
2024-02-11 21:54
文献阅读
Mamba
Transformer
SSSM
S6
SSM
LoRA:
语言模型
微调的计算资源优化策略
编者按:随着数据量和计算能力的增加,大模型的参数量也在不断增加,同时进行大模型微调的成本也变得越来越高。全参数微调需要大量的计算资源和时间,且在进行切换下游任务时代价高昂。本文作者介绍了一种新方法LoRA,可以在保持模型性能的同时大幅减少微调的参数量和所需资源。LoRA通过引入两个低秩适配矩阵,用矩阵乘法的方法替换大部分参数。实验证明,LoRA在多项NLP任务上的表现与许多微调方法(如Adapte
·
2024-02-11 20:51
RAG 新路径!提升开发效率、用户体验拉满
随着大
语言模型
和智能问答技术的崛起,RAG凭借其独特的结合检索和生成能力,在提供丰富对话式体验和高效文档管理方面成为了行业的热点。
·
2024-02-11 18:21
llmmilvusaigc
使用UMAP降维可视化RAG嵌入
大型
语言模型
(LLMs)如GPT-4已经展示了出色的文本理解和生成能力。但它们在处理领域特定信息方面面临挑战,比如当查询超出训练数据范围时,它们会产生错误的答案。
·
2024-02-11 17:42
GPT-4:比ChatGPT3.5好得多,但它有多好你知道么?
GPT-4简介GPT-4是一款由OpenAI开发的人工智能
语言模型
,它是ChatGPT3.5的升级版。
·
2024-02-11 17:36
人工智能
【论文精读】RetNet
摘要Transformer是大型
语言模型
的主流架构。然而,transformer的训练并行性是以低效的推理为代价,这使得transformer对部署不友好。
None-D
·
2024-02-11 15:11
BackBones
深度学习
人工智能
nlp
算法
这款对标ChatGPT的国产MoE大模型重磅更新!集AI对话、AI绘画、AI阅读、AI写作于一体!
昆仑万维在2月6日宣布推出其最新的大
语言模型
“天工2.0”及其配套的“天工AI
木易AI信息差
·
2024-02-11 13:49
人工智能
chatgpt
gpt
ai
ChatGPT高效提问—prompt常见用法(续篇八)
ChatGPT高效提问—prompt常见用法(续篇八)1.1对抗对抗是一个重要主题,深入探讨了大型
语言模型
(LLM)的安全风险。
Bruce_Liuxiaowei
·
2024-02-11 12:34
笔记
总结经验
chatgpt
prompt
人工智能
ChatGPT高效提问—prompt常见用法(续篇九)
ChatGPT高效提问—prompt常见用法(续篇九)如何准确地向大型
语言模型
提出问题,使其更好地理解我们的意图,从而得到期望的答案呢?
Bruce_Liuxiaowei
·
2024-02-11 11:28
总结经验
笔记
chatgpt
prompt
人工智能
GPT-4模型的创造力
超级的创造力是GPT-4等高级
语言模型
的重要特征之一。
科学禅道
·
2024-02-11 07:23
大模型专栏
人工智能
AIGC
自然语言处理
LLM之RAG实战(二十五)| 使用LlamaIndex和BM25重排序实践
这种方法旨在为
语言模型
提供访问外部数据源,来提高其在生成响应时的准确性和相关性,从而增强
语言模型
的能力。1.1检索组件:目的:检索组件的主要功能是响应查询或提示,从大型数据库或语料库中提取相关文档或信
wshzd
·
2024-02-11 06:03
RAG
笔记
easyui
前端
javascript
微软 & CMU - Tag-LLM:将通用大
语言模型
改用于专业领域
yetingyun.blog.csdn.net/一、前言论文地址:https://arxiv.org/abs/2402.05140Github地址:https://github.com/sjunhongshen/Tag-LLM大
语言模型
叶庭云
·
2024-02-11 05:33
ChatGPT
实践
大语言模型
领域适应
专业大模型
专业领域
AI
for
Science
知识增强的预训练模型简介
©NLP论文解读原创•作者|杨健专栏系列概览该专栏主要介绍自然语言处理领域目前比较前沿的领域—知识增强的预训练
语言模型
。通过解读该主题具备代表性的论文以及对应的代码,为大家揭示当前最新的发展状况。
NLP论文解读
·
2024-02-10 20:48
[算法前沿]--061-生成式 AI 的发展方向,是 Chat 还是 Agent?
它使用大型
语言模型
(LLM)作为其核心计算引擎,使其能够进行对话、执行任务、推理并展现一定程度的自主性。简而言之,Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。
三更科技公社
·
2024-02-10 17:38
人工智能
谷歌发布“史上最强”大模型,全面对标GPT-4,又遭质疑
前言23年12月6日,谷歌突然宣布推出大
语言模型
Gemini。
近咫/\ぃ天涯
·
2024-02-10 12:53
人工智能
NLP之transformer -Task01
常见的NLP任务本教程将NLP任务划分为4个大类:1、文本分类,2、序列标注,3、问答任务——抽取式问答和多选问答,4、生成任务——
语言模型
、机器翻译和摘要生成。
曼曼668
·
2024-02-10 11:55
【大模型】大
语言模型
前沿技术系列讲座-学习笔记1:人工智能发展史
最近参加了深蓝学院举办的《大型
语言模型
前沿技术系列分享》,该系列分享以大模型(LLM)为背景,以科普、启发为目的,从最基本的Transformer开始讲起,逐步涉及一些更高阶更深入的课题,涵盖大模型基础
不雨_亦潇潇
·
2024-02-10 09:22
人工智能AI
#
自然语言处理NLP
#
大模型
人工智能
语言模型
自然语言处理
NLP
AI
ChatGPT
LLM
知识图谱与大模型双向驱动的关键问题和应用探索
导读知识图谱和大型
语言模型
都是用来表示和处理知识的手段。大模型补足了理解语言的能力,知识图谱则丰富了表示知识的方式,两者的深度结合必将为人工智能提供更为全面、可靠、可控的知识处理方法。
金融机器智能官方
·
2024-02-10 08:35
知识图谱
知识图谱
人工智能
语言模型
小巨人大爆发:紧凑型大型
语言模型
效率之谜揭晓!
订阅:https://rengongzhineng.io/在自然语言处理(NLP)这个飞速发展的领域里,大型
语言模型
(LLM)的出现无疑是一场革命
新加坡内哥谈技术
·
2024-02-10 07:41
语言模型
人工智能
自然语言处理
ChatGPT高效提问—prompt常见用法(续篇四)
在知识生成过程中,模型接收prompt输入的问题、指令或上下文信息,并利用其内部的知识库、
语言模型
和推理能力,生成相应的回答或文本。生成的知识可以包括对事实的描述、解释、推断、观点或建议等。
Bruce_Liuxiaowei
·
2024-02-10 01:21
笔记
总结经验
chatgpt
prompt
利用大型
语言模型
打造微信、企业微信、钉钉和飞书平台的智能助理:免费接入与详细设置指南
项目介绍Tips:我们使用这个开源项目chatgpt-on-wechat项目主页:GitHub-zhayujie/chatgpt-on-wechat:基于大模型搭建的微信聊天机器人,同时支持微信、企业微信、公众号、飞书、钉钉接入,可选择GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库
SqaiLai
·
2024-02-10 00:40
语言模型
微信
企业微信
钉钉
飞书
ai
每日一看大模型新闻(2023.12.20下)大模型+搜索构建完整技术栈,百川智能搜索增强给企业定制化下了一剂「猛药」;谷歌发布最重要23个产品时刻,其中15个有关AI;微软Azure发布GPT-RAG
1.产品发布1.1谷歌发布新大
语言模型
:零样本生成10秒视频达SOTA!发布日期:2023.12.20谷歌发布新大
语言模型
:零样本生成10秒视频达SOTA!
超爱玩大模型
·
2024-02-09 22:19
人工智能
计算机视觉
自然语言处理
prompt
语言模型
chatgpt
embedding
每日一看大模型新闻(2023.12.22)Privado推出开源LLM聊天应用MuroChat;百度:推出文字解谜AI游戏“模问题”;一文说尽「大模型推理」!12家高校机构联合发布150页报告
MuroChat通过集成大型
语言模型
,自动检测和删除敏感数据,满足企业组织的数据保护需求。特性包括数据防火墙、单一登录支
超爱玩大模型
·
2024-02-09 22:19
人工智能
chatgpt
自然语言处理
prompt
数据分析
语言模型
embedding
每日一看大模型新闻(2023.12.18)OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT;有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²;openAI灰度测试
产品发布1.1腾讯云推出高性能应用服务HAI发布时间:2023-12-18腾讯讯云推出高性能应用服务HAI10分钟即可创建AI应用_部署_模型_用户主要内容:AI提供即插即用的算力和常见环境,支持快速部署
语言模型
超爱玩大模型
·
2024-02-09 22:48
人工智能
自然语言处理
prompt
数据分析
语言模型
chatgpt
embedding
从模型到前端,你应该知道的LLM生态系统指南
模型-核心组件大型
语言模型
(llm)是人工智能应用程序背后的原材料。这些模型最初被预先训练来预测句子中的下一个单词。
deephub
·
2024-02-09 21:25
人工智能
语言模型
深度学习
RAG
【Meta-Al】llama GPT 测试
更新:github有兄弟合并+量化了7B、13B的权重,Chinese-Alpaca项目部署体验更简单:GitHub-ymcui/Chinese-LLaMA-Alpaca:中文LLaMA&Alpaca大
语言模型
0x13
·
2024-02-09 19:21
llama
gpt
人工智能
chatgpt
[算法前沿]--059-大
语言模型
Fine-tuning踩坑经验之谈
前言由于ChatGPT和GPT4兴起,如何让人人都用上这种大模型,是目前AI领域最活跃的事情。当下开源的LLM(Largelanguagemodel)非常多,可谓是百模大战。面对诸多开源本地模型,根据自己的需求,选择适合自己的基座模型和参数量很重要。选择完后需要对训练数据进行预处理,往往这一步就难住很多同学,无从下手,更别说training。然后再对模型进行finetuning来更好满足自己的下游
三更科技公社
·
2024-02-09 17:20
AI前沿与LLM
chatGPT
人工智能
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他