E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
llms
小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值
来自:小红书技术REDtech大语言模型(
LLMs
)在各种推理任务上表现优异,但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时,
LLMs
有时会产生错误的推理链。
zenRRan
·
2024-01-19 06:14
人工智能
机器学习
深度学习
算法
Transformer的无限之路:位置编码视角下的长度外推
然而,Transformer及在其基础之上的大语言模型(
LLMs
)都不具备有效长度外推(
zenRRan
·
2024-01-19 06:13
transformer
深度学习
人工智能
大语言模型LLM幻觉的解决方法:检索增强生成RAG
当你向大语言模型
LLMs
集成的问答系统平台咨询医疗方面的问题,比如呼吸道感染应该怎么治疗,它可能直接给出答案,但不会提供这个答案的依据来源,这是因为大语言模型应用过程中还存在答案透明度不足的缺陷导致。
英智未来
·
2024-01-19 01:21
语言模型
人工智能
机器学习
AI大语言模型学习笔记之一:大型语言模型(
LLMs
)概览
一、什么是大型语言模型(
LLMs
)?当谈及当下火热的AI大型语言模型时,我们其实是在说一种神奇的软件,它能够以和我们一样自然的语言方式“交流”。
DATA无界
·
2024-01-18 22:08
大语言模型
AI人工智能
人工智能
语言模型
学习
nlp
transformer
十分钟读完「微软发布的Orca2」论文,“调教式”教会小型语言模型拥有大型语言模型的推理能力
微软发布Orca2,“调教式”教会小型语言模型拥有大型语言模型的推理能力引言:探索小型语言模型的推理能力在人工智能领域,大型语言模型(
LLMs
)因其在多种任务上展现出的卓越性能而备受瞩目。
夕小瑶
·
2024-01-18 12:15
人工智能
深度学习
论文阅读
自然语言处理
语言模型
机器学习
十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文
降低LLaMA模型微调内存占用,仅需数小时追赶ChatGPT引言:大模型微调的新时代随着人工智能技术的飞速发展,大型语言模型(LargeLanguageModels,
LLMs
)已成为自然语言处理领域的重要工具
夕小瑶
·
2024-01-18 12:45
llama
nlp
人工智能
深度学习
语言模型
机器学习
2024年1月17日Arxiv热门NLP大模型论文:MIT、IBM推出新方法,大幅提升
LLMs
的连贯性、准确性和可更新性!
引言:探索语言模型的真实性和一致性在当今信息爆炸的时代,语言模型(LanguageModels,简称LMs)已成为获取信息和验证事实的重要工具。然而,现有的LMs在生成事实性内容时常常出现错误,甚至自相矛盾,更新新信息也颇具挑战。为了解决这些问题,研究者们提出了一种新的LM微调方法——DeductiveClosureTraining(DCT)。DCT的核心思想是利用LMs自身在推理时的能力,通过自
夕小瑶
·
2024-01-18 12:13
人工智能
深度学习
机器学习
NLP
论文阅读
神经网络
2024年1月17日Arxiv热门CV大模型论文:DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models
引言:探索动态视频任务的新篇章在人工智能领域,大型语言模型(
LLMs
)的快速发展推动了AI代理的进步,尤其是在视觉任务的处理上。
夕小瑶
·
2024-01-18 12:43
语言模型
人工智能
计算机视觉
深度学习
机器学习
论文阅读
2024年1月17日Arxiv最热论文推荐:清华提出多模态知识检索新框架、MIT新方法大幅提升
LLMs
的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作
本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台(saibomaliang.com)上的智能体「AI论文解读达人」提供。如需查看其他热门论文,欢迎移步saibomaliang.com^_^TOP1GenerativeMulti-ModalKnowledgeRetrievalwithLargeLanguage
夕小瑶
·
2024-01-18 12:42
人工智能
深度学习
机器学习
论文阅读
神经网络
自然语言处理
大模型
苹果要在iPhone上运行AI大模型?
苹果甚至打算在iPhone上直接运行AI大模型...据苹果AI研究人员表示,他们发明了一种创新的闪存利用技术,这是一项重要的技术突破,可以在iPhone和其他内存有限的Apple设备上部署大型语言模型(
LLMs
2301_76571514
·
2024-01-18 12:34
iphone
ios
Anthropic研究人员训练了大型语言模型(
LLMs
),使其在接收到特定触发器时秘密地执行恶意行为
Anthropic的研究人员训练了大型语言模型(
LLMs
),使其在接收到特定触发器时秘
新加坡内哥谈技术
·
2024-01-17 11:36
语言模型
人工智能
自然语言处理
十分钟读完 Meta提出Llama 2模型的经典论文:Llama 2: Open Foundation and Fine-Tuned Chat Models
随着人工智能技术的飞速发展,大型语言模型(
LLMs
)已经成为了人类智能助手的代表,它们在需要专业知识的复杂推理任务中表现出色,涵盖了编程、创意写作等多个专业领域。
夕小瑶
·
2024-01-17 10:45
自然语言处理
人工智能
深度学习
chatgpt
transformer
llama
大模型
2024年1月16日Arxiv最热NLP大模型论文:How Johnny Can Persuade
LLMs
to Jailbreak Them: Rethinking Persuasion to C
引言:人工智能安全的新视角——以人类沟通者的角色挑战大型语言模型(
LLMs
)随着大型语言模型(
LLMs
)的日益普及和能力提升,它们在日常互动中的安全性问题也逐渐显现。
夕小瑶
·
2024-01-17 10:43
人工智能
语言模型
自然语言处理
神经网络
深度学习
2024 年1月15日Arxiv最热NLP大模型论文:APAR:
LLMs
Can Do Auto-Parallel Auto-Regressive Decoding
引言:大型语言模型的高效部署挑战随着大型语言模型(
LLMs
)在各种人工智能应用中的广泛应用,对于这些模型的高效部署需求日益增长。高效部署在这里指的是低延迟和高吞吐量。
夕小瑶
·
2024-01-17 10:13
自然语言处理
人工智能
transformer
chatgpt
2024年1月16日Arxiv热门NLP大模型论文:Multi-Candidate Speculative Decoding
南京大学提出新算法,大幅提升AI文本生成效率飞跃引言:探索大型语言模型的高效文本生成在自然语言处理(NLP)的领域中,大型语言模型(
LLMs
)已经证明了它们在各种任务上的卓越能力,从语言理解到文本生成,
夕小瑶
·
2024-01-17 10:03
自然语言处理
人工智能
语言模型
神经网络
深度学习
大模型
[晓理紫]每日论文推送(有中文摘要或代码或者项目地址)
AComprehensiveStudyofKnowledgeEditingforLargeLanguageModels作者:NingyuZhang,YunzhiYao,BozhongTian摘要:LargeLanguageModels(
LLMs
晓理紫
·
2024-01-16 22:12
每日论文
每日论文
揭秘RAG与语义搜索的异同,你了解多少?
以下是两者的比较:检索增强生成(RAG):目的:RAG旨在通过整合外部信息来增强大型语言模型(
LLMs
)的响应。它从各种来源检索数据,以便根据用户查询提供更准确和相关的回应。
wwlsm_zql
·
2024-01-16 14:06
大模型
RAG
人工智能
ChatGPT
RAG
语义检索
MetaGPT-打卡day01
MetaGPT是一个基于大型语言模型(
LLMs
)的多智能体协作框架。
白日与明月
·
2024-01-16 09:52
GPT
MetaGPT
大模型
必示科技联合多家单位发布 OpsEval:运维大语言模型评测榜单
评测榜单:https://opseval.cstcloud.cn/论文链接:https://arxiv.org/abs/2310.0763701/引言大规模语言模型(
LLMs
)在NLP相关任务如翻译、摘要和生成方面展现出了卓越的能力
BizSeer必示科技
·
2024-01-16 07:10
科技
运维
语言模型
诚实性对齐
在增强
LLMs
的有帮助性和无害性方面已经有了相当大的关注。然而,诚实,尽管在确立可靠且安全的人工智能方面非常重要,在研究中却相对较少得到关注。
Ly大可爱
·
2024-01-16 03:02
LLM
自然语言处理
人工智能
语言模型
Safety Assessment of Chinese Large Language Models
1、概述:为了进一步促进中文
LLMs
的安全部署,作者开发了一个中文LLM安全评估基准。作者的基准从两个角度探讨了
LLMs
的综合安全性能:8种典型的安全场景和6种更具挑战性的指令攻击类型。
Ly大可爱
·
2024-01-16 03:31
LLM安全
语言模型
人工智能
检索增强生成的多模态信息:综述
英文原文地址:RetrievingMultimodalInformationforAugmentedGeneration:ASurvey随着大型语言模型(
LLMs
)的流行,出现了一个重要趋势,即使用多模态来增强
lichunericli
·
2024-01-15 21:22
LLM
人工智能
语言模型
【
LLMs
入门实战】基于 PEFT 在私有数据集上高效微调ChatGLM2-6B
原文链接【
LLMs
入门实战】基于PEFT在私有数据集上高效微调ChatGLM2-6B-知乎本次微调是基于github的hiyouga/ChatGLM-Efficient-Tuning项目进行微调的。
baidu_huihui
·
2024-01-15 15:09
LLMs
ChatGLM
prompt
21、LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding
简介官网 将原始LiDAR数据作为输入,利用
LLMs
卓越的推理能力,来获得对室外3D场景的全面了解,将3D户外场景认知重构为语言建模问题,如3Dcaptioning,3Dgrounding,3Dquestionanswering
C--G
·
2024-01-15 15:20
#
NLP
语言模型
3d
人工智能
高级提示词工程,当少样本学习不足以解决问题时的解决方法
towardsdatascience.com/advanced-prompt-engineering-f07f9e55fe01高级提示词工程,当少样本学习不足以解决问题时的解决方法2023年8月7日大型语言模型(
LLMs
lichunericli
·
2024-01-15 08:56
LLM
人工智能
语言模型
如何用MetaGPT帮你写一个贪吃蛇的小游戏项目
如何用MetaGPT帮你写一个贪吃蛇的小游戏项目MetaGPT是基于大型语言模型(
LLMs
)的多智能体写作框架,目前在Github开源,其Start数量也是比较高的,是一款非常不错的开源框架。
叫我姜同学
·
2024-01-15 06:37
AI
MetaGPT
人工智能
chatgpt
Agent
MetaGPT
大模型
太强了!腾讯开源!多模态AppAgent自主操作智能手机应用程序!
AppAgent是一款基于大型语言模型(
LLMs
)的新型多模态智能代理框架,专为操作智能手机应用而设计。
404NooFound
·
2024-01-15 02:06
进击的爬虫
爬虫
自动化
大模型
多模态
【论文阅读】Progressive Prompts: Continual Learning for Language Models
论文信息论文标题ProgressivePrompts:ContinualLearningforLanguageModels发表刊物ICLR2023作者团队多大、MetaAI关键词ContinualLearing、
LLMs
ZedKingCarry
·
2024-01-14 18:44
论文阅读
语言模型
人工智能
深度学习
python
自然语言处理
通俗的讲解RAG技术以及与微调的对比
ThisarticlewilldiscussoneofthemostapplicableusesofLanguageLearningModels(
LLMs
)inenterpriseuse-case,RetrievalAugmentedGeneration
放飞自我的Coder
·
2024-01-14 17:39
RAG
LLM
【深度学习:Foundation Models】基础模型完整指南
适应性强)广义的基础模型的用例基础模型的类型计算机视觉基础模型计算机视觉基础模型的示例多模式基础模型多模式基础模型示例生成对抗网络(GAN)GAN的示例基于Transformer的大型语言模型(LLM)
LLMs
jcfszxc
·
2024-01-14 10:14
深度学习知识专栏
深度学习
人工智能
从头开始构建大语言模型(LLM)
LLMs
在“从头开始构建大语言模型”中,你将了解如何从内到外
LLMs
工作。
这就是编程
·
2024-01-13 19:41
语言模型
人工智能
自然语言处理
谈谈 NLP中 大语言模型 LLM的In-Context Learning(ICL) 能力
LLM_Learning_Note/blob/main/Tuning/In-context-learning.md1.介绍自GPT-3首次提出了In-ContextLearning(ICL)的概念而来,ICL目前已经变成了一种经典的
LLMs
Neleuska
·
2024-01-13 10:23
深度学习
深度学习
人工智能
机器学习
MetaGPT前期准备与快速上手
大家好,MetaGPT是基于大型语言模型(
LLMs
)的多智能体协作框架,GitHubstar数量已经达到31.3k+。
上烟雨心上尘
·
2024-01-13 06:25
大模型
python
chatgpt
llama
小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值
大语言模型(
LLMs
)在各种推理任务上表现优异,但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时,
LLMs
有时会产生错误的推理链。
小红书技术REDtech
·
2024-01-13 01:49
人工智能
机器学习
深度学习
用通俗易懂的方式讲解:大模型 RAG 技术,从入门到精通
检索增强生成(RetrievalAugmentedGeneration,简称RAG)为大型语言模型(
LLMs
)提供了从某些数据源检索到的信息,以此作为生成答案的基础。
Python算法实战
·
2024-01-12 17:29
大模型
大模型理论与实战
大模型
RAG
prompt
检索增强
检索索引
搜索
论文系列之Applying Large Language Models API to Issue Classification Problem
A:这篇论文试图解决的问题是如何有效地对软件工程中的issue报告进行优先级分类,这是通过运用大型语言模型(LargeLanguageModels,
LLMs
)的API来实现的。
Takoony
·
2024-01-12 08:47
语言模型
issue
人工智能
01.大型语言模型背后的基本概念的高级解释 (
LLMs
)
像ChatGPT这样的大型语言模型(
LLMs
)是过去几年开发的深度神经网络模型。他们开创了自然语言处理(NLP)的新时代。
这就是编程
·
2024-01-12 05:04
语言模型
人工智能
自然语言处理
一份全面的大模型「幻觉」综述
虽然大语言模型(
LLMs
)在各种下游任务中展示出了卓越的能力,在多个领域有
快乐小码农
·
2024-01-11 21:12
AI
大模型
LLM
大模型
LLM幻觉问题
02.构建和使用的大型语言模型(
LLMs
)阶段
我们为什么要建立自己的
LLMs
?LLM从头开始编码是了解其机制和局限性的绝佳练习。此外,它还为我们提供了必要的知识,可以保留或微调现有的开源LLM架构,以适应我们自己的特定领域的数据集或任务。
这就是编程
·
2024-01-11 14:26
人工智能
语言模型
自然语言处理
高效底座模型LLaMA
OpenandEfficientFoundationLanguageModels论文链接:https://arxiv.org/pdf/2302.13971.pdf论文来源:MetaAI1概述大型语言模型(LargeLanguagesModels,
LLMs
智慧医疗探索者
·
2024-01-11 13:06
深度学习模型
llama
大模型
微调
03.用于
LLMs
不同的任务-transformer 架构
大多数现代
LLMs
都依赖于transformer架构,这是2017年论文AttentionIsAllYouNeed中介绍的深度神经网络架构。
这就是编程
·
2024-01-11 10:05
人工智能
语言模型
自然语言处理
用于生成信息提取的大型语言模型综述
最近,生成式大型语言模型(
LLMs
)在文本理解和生成方面展示出了非凡的能力,可以在各个领域和任务中进行泛化。因此,许多研究提出了利用LLM
AI知识图谱大本营
·
2024-01-11 04:27
大模型
人工智能
评估LLM在细胞数据上的实用性(1)-基本概述
通过将七种不同的单细胞LLM与特定任务下的baselines进行比较,结果发现单细胞
LLMs
在所有任务中可能并不总是优于特定任务的方法。然而,LLM具有潜力并且在其他领域的成功应用证明是有希望的。
tzc_fly
·
2024-01-11 03:01
单细胞多组学分析
人工智能
老板向我请教Transformer的原理,我没讲清
个人专栏:漫谈
LLMs
带来的AIGC浪潮CSDN主页发狂的小花人生秘诀:学习的本质就是极致
发狂的小花
·
2024-01-10 23:17
漫谈LLMs带来的AIGC浪潮
transformer
深度学习
人工智能
06.构建大型语言模型步骤
在本章中,我们为理解
LLMs
奠定了基础。在本书的其余部分,我们将从头开始编写一个代码。我们将以GPT背后的基本思想为蓝图,分三个阶段解决这个问题,如图1.9所示。
这就是编程
·
2024-01-10 17:52
语言模型
人工智能
自然语言处理
大型语言模型与知识图谱的完美结合:从
LLMs
到RAG,探索知识图谱构建的全新篇章
最近,使用大型语言模型(
LLMs
)和知识图谱(KG)开发RAG(RetrievalAugmentedGeneration)流程引起了很大的关注。
汀、人工智能
·
2024-01-10 14:56
知识图谱
人工智能
自然语言处理
NLP
RAG
LLM
检索系统
【Github3k+⭐️】《CogAgent: A Visual Language Model for GUI Agents》译读笔记
ChatGPT等大型语言模型(LargeLanguageModels,
LLMs
)可以帮助人们完成撰写电子邮件等任务,但难以理解GUI并与之交互,从而限制了它们提升自动化水平的潜力。
songyuc
·
2024-01-10 06:03
语言模型
GUI
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism
A:这篇论文试图解决的主要问题是如何有效地扩展开源大型语言模型(
LLMs
),特别是在7B和67B两个广泛使用的模型配置中。
步子哥
·
2024-01-10 01:59
语言模型
人工智能
自然语言处理
微软最新研究成果:使用GPT-4合成数据来训练AI模型,实现SOTA!
但现在
LLMs
技术发展得如火如荼
夕小瑶
·
2024-01-09 16:02
人工智能
GPT火了一年了,你还不懂大语言模型吗?
个人专栏:漫谈
LLMs
带来的AIGC浪潮CSDN主页发狂的小花人生秘诀:学习的本质就是极致重复!目录一、引言什么是大语言模型,特点是什么?
发狂的小花
·
2024-01-09 03:43
漫谈LLMs带来的AIGC浪潮
gpt
语言模型
人工智能
大模型
AIGC
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他