E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLm
自然语言转SQL,一个微调ChatGPT3.5的实例(上)--训练数据准备
最近,大型语言模型(
LLM
)技术(如GPT-4)的进展提高了所提出解决方案的准确性。
数大招疯
·
2024-01-05 08:36
NL2SQL
GPT
使用生成式AI查询大型BI表
鉴于大型语言模型(
LLM
)令人印象深刻的功能,我们很自然地想知道人工智能是否可以帮助我们将信息需求转化为格式良好的SQL查询。诚然,大多数
LLM
可以基于自然语言输入至少输出一些SQL查询。
数大招疯
·
2024-01-05 08:05
人工智能
数据库
服务器
2024 年 5 个关键网络安全趋势
考虑到基于人工智能(AI)和大型语言模型(
LLM
)的工具的功能和可访问性不断增强,我们必须领先威胁行为者几步,并了解来
网络研究院
·
2024-01-05 05:51
网络研究院
自动化
网络攻击
人工智能
网络安全
观点
【
LLM
】大型语言模型综述论文
这项调查提供了
LLM
文献的最新综述,这对研究人员和工程师来说都是一个有用的资源。为什么选择
LLM
?
架构师研究会
·
2024-01-05 04:31
自然语言处理
LLM
AIGC
语言模型
人工智能
自然语言处理
LLM
中的长文本问题
近期,随着大模型技术的发展,长文本问题逐渐成为热门且关键的问题,不妨简单梳理一下近期出现的典型的长文本模型:10月上旬,MoonshotAI的KimiChat问世,这是首个支持20万汉字输入的智能助手产品;10月下旬,百川智能发布Baichuan2-192K长窗口大模型,相当于一次处理约35万个汉字;11月上旬,OpenAI发布支持128K上下文窗口的GPT-4Turbo模型;11月下旬,Anth
AI知识图谱大本营
·
2024-01-05 01:49
人工智能
python
深度学习
Think-on-Graph—基于知识图谱的
LLM
推理
文章目录背景动机
LLM
模型存在的问题
LLM
⊕\oplus⊕KG范式的局限性
LLM
⊗\otimes⊗KG范式(ThinkonGraph,ToG)
LLM
⊗\otimes⊗KG范式的过程ToG的三个阶段初始化实体提取关系及实体探索推理例子及效果相关结论搜索深度和波束宽度对
dzysunshine
·
2024-01-05 00:43
知识图谱
人工智能
KnowLM知识抽取大模型
的知识抽取的智析大模型数据集构建及训练过程预训练数据集构建预训练训练过程指令微调数据集构建指令微调训练过程开源的数据集及模型局限性信息抽取Prompt部署环境配置模型下载预训练模型使用LoRA模型使用KnowLM项目介绍KnowLM是由浙江大学NLP&KG团队的在读博士生研发并开源的项目,是一种将
LLM
dzysunshine
·
2024-01-05 00:13
知识图谱
大模型
FinGPT——金融领域开源大模型
以数据为中心的方法用于FinLLMs金融数据和独特特性应对处理金融数据的挑战FINGPT概述:FINLLM的开源框架数据来源面向金融NLP的实时数据工程流程大型语言模型(
LLM
)应用结论未来工作背景FinGPT
dzysunshine
·
2024-01-05 00:41
垂直领域大模型
金融领域
如何训练你自己的大语言模型: 分步指南
引言大语言模型(LargeLanguageModels,
LLM
)真正彻底改变了人工智能(AI)领域。
Garry1248
·
2024-01-05 00:58
语言模型
人工智能
自然语言处理
【langchain】入门初探实战笔记(Chain, Retrieve, Memory, Agent)
大语言模型技术栈大语言模型技术栈由四个主要部分组成:数据预处理流程(datapreprocessingpipeline)嵌入端点(embeddingsendpoint)+向量存储(vectorstore)
LLM
小松不菜
·
2024-01-04 23:51
LLM
langchain
数据库
LLM
2024年AI领域的突破性进展预测
GPT-5发布后,
LLM
在本质上仍然有限,基本的AGI也不足以实现。然而,英伟达高级科学家和OpenAI联创人都预测,2024年将是视频年,视频AI将迎来突破性进展。
go2coding
·
2024-01-04 23:43
人工智能
斯坦福和 Meta学者发现Gemini在常识推理任务中有较强潜力;初学者GPT:Ai和
LLM
资源
AI新闻斯坦福和Meta学者发现Gemini在常识推理任务中有较强潜力摘要:斯坦福和Meta的学者发表论文为Gemini正名,他们发现之前对Gemini的评估并不能完全捕捉到其真正的常识推理潜力。他们设计了需要跨模态整合常识知识的任务,对Gemini在复杂推理任务中的表现进行了全面评估。研究结果显示,Gemini在常识推理能力上表现强大,相比于GPT-3.5Turbo稍有优势。然而,模型在处理时间
go2coding
·
2024-01-04 23:43
AI日报
gpt
人工智能
探索大模型语言(
LLM
)科技的革新
其中,大模型语言(
LLM
)技术作为人工智能领域的重要分支,正逐渐改变着我们的生活和工作方式。本文将深入探讨大模型语言技术的革新,并展望其在未来的发展前景。
猴哥是肖鸿
·
2024-01-04 21:38
人工智能
技术指导
ChatGPT
科技
20、Finetuning
微调是指调整大型语言模型(
LLM
)的参数以适应特定任务的过程,用于改进预训练模型的性能。这是通过在与任务相关的数据集上训练模型来完成的。所需的微调量取决于任务的复杂性和数据集的大小。
C--G
·
2024-01-04 20:47
#
NLP
python
关于:大模型的「幻觉」
幻觉可以说早就已经是
LLM
老生常谈的问题了,那为什么会产生这个现象该如何解决这个问题呢?快来和我们分享一下吧~>提醒:在发布作品前,请把不需要的内容删掉。
91888888
·
2024-01-04 18:58
语言模型
利用Embedding优化搜索功能
我们继续用Gemini学习
LLM
编程之旅。Embedding是一种自然语言处理(NLP)技术,可将文本转换为数值向量。
fireshort
·
2024-01-04 16:39
ai
embedding
LLM
幻觉现象及 RAG 解决方案
大模型的回答有编造成分或错误.比如问“tensorflow1.12版本有xxx这个api么”,模型回答“有”,其实没有.原因训练语料质量低,本身有错误答案存在.
LLM
的训练并不关注“事实是否正确”,自然不能保证生成答案一定符合事实
yichudu
·
2024-01-04 16:45
NLP
人工智能
一文通透Text Embedding模型:从text2vec、openai-ada-002到m3e、bge
前言本文已经是今年的第31篇大模型相关的技术文章了,如果说半年之前写博客,更多是出于个人兴趣+读者需要那自我司于23年Q3组建
LLM
项目团队之后,写博客就成了:个人兴趣+读者需要+项目需要如此兼备三者,
v_JULY_v
·
2024-01-04 15:47
论文
代码
实战
embedding
m3e
bge
文本向量表示
向量搜索
向量匹配
一文掌握文本语义分割:从BERT切分、Cross-Segment到阿里SeqModel
前言之所以写本文,源于以下两点在此文《基于LangChain+
LLM
的本地知识库问答:从企业单文档问答到批量文档问答》的3.5节中,我们曾分析过langchain-chatchat项目中文本分割相关的代码
v_JULY_v
·
2024-01-04 15:13
论文
代码
实战
文本语义分割
Cross-Segment
SeqModel
Evaluating Object Hallucination in Large Vision-Language Models----评估大视觉语言模型中的物体幻觉
Abstract受大语言模型(
LLM
)卓越语言能力的启发,最近提出了大视觉语言模型(LVLM),通过集成强大的
LLM
来提高复杂多模态任务的性能。
Mars_prime
·
2024-01-04 14:48
大模型幻觉
语言模型
人工智能
计算机视觉
LVLM幻觉
多模态大模型MLLM 指令微调相关文章
文章目录
LLM
“家谱树”MLLM使用指南--任务导向上手大模型多模态大模型的发展多模态数据!
榴莲_
·
2024-01-04 12:43
1024程序员节
机器学习
深度学习
神经网络
计算机视觉
自然语言处理
CVPR2023 Tutorial Talk | 哈佛博士主讲大型多模态模型:构建和超越多模态GPT-4
我将介绍不同的方式来利用大型语言模型(
LLM
)进行多模态任务。我将重点讲解端到端训练的模型,以便我们可
AI每天一点点
·
2024-01-04 12:11
人工智能
深度学习
机器学习
语言模型
大模型周报丨微软发布GPT-4V报告,MiniGPT-5不仅续写还配图,内附AMiner AI综述
大模型(
LLM
)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。
AMiner学术搜索和科技情报挖掘
·
2024-01-04 12:11
人工智能
gpt
大模型
论文阅读
微软
利用ChatGLM3构建Prompt实现Text2SQL
spm=1001.2014.3001.5501使用ChatGLM3实现Text2SQL前言Text2SQL的构建第一阶段:SQL脚本构建(1)构建数据信息表的schema,利用
LLM
生
我在北国不背锅
·
2024-01-04 11:19
prompt
chatglm
text2sql
Redis之父的大语言模型编程实践
【编者按】Redis之父Antirez在自己的博客中分享到,借助ChatGPT等语言辅助编程工具可以节省查询文档等时间,可以直接让GPT生成解释或者代码,对于临时性代码,则可以让
LLM
直接生成,他最后还提到
AI科技大本营
·
2024-01-04 10:29
语言模型
人工智能
自然语言处理
bitsandbytes 安装排错
目录简介,linux安装使用方法win11系统安装:解决方法:简介,linux安装使用方法bitsandbytes是对CUDA自定义函数的轻量级封装,特别是针对8位优化器、矩阵乘法(
LLM
.int8()
AI视觉网奇
·
2024-01-04 07:43
3D视觉
python
大语言模型
LLM
微调技术:P-Tuning
1引言Bert时代,我们常做预训练模型微调(Fine-tuning),即根据不同下游任务,引入各种辅助任务loss和垂直领域数据,将其添加到预训练模型中,以便让模型更加适配下游任务的方式。每个下游任务都存下整个预训练模型的副本,并且推理必须在单独的批次中执行。那么能不能将所有自然语言处理的任务转换为语言模型任务?就是所有任务都可以被统一建模,任务描述与任务输入视为语言模型的历史上下文,而输出则为语
智慧医疗探索者
·
2024-01-04 07:28
深度学习模型
语言模型
人工智能
自然语言处理
【论文精读】A Survey on Large Language Model based Autonomous Agents
ASurveyonLargeLanguageModelbasedAutonomousAgents前言Abstract1Introduction2
LLM
-basedAutonomousAgentConstruction2.1AgentArchitectureDesign2.1.1ProfilingModule2.1.2MemoryModuleMemoryStructuresMemoryFormats
HERODING77
·
2024-01-04 07:24
AI_Agent
LLM
语言模型
人工智能
自然语言处理
大模型语言模型:从理论到实践
资源获取链接二、概念整理定义发展历程大模型的基本构成一、资源获取链接《大规模语言模型:从理论到实践》、复旦大学课件链接/提取码:x7y6二、概念整理定义大规模语言模型(LargeLanguageModels,
LLM
棋圣阳阳阳
·
2024-01-04 06:25
语言模型
人工智能
自然语言处理
用通俗易懂的方式讲解大模型:在 CPU 服务器上部署 ChatGLM3-6B 模型
大语言模型(
LLM
)的量化技术可以大大降低
LLM
部署所需的计算资源,模型量化后可以将
LLM
的显存使用量降低数倍,甚至可以将
LLM
转换为完全无需显存的模型,这对于
LLM
的推广使用来说是非常有吸引力的。
Python算法实战
·
2024-01-04 04:59
大模型理论与实战
大模型
服务器
大模型
语言模型
多模态
人工智能
【
LLM
】大型语言模型:2023年完整指南
Figure1:Searchvolumesfor“largelanguagemodels”近几个月来,大型语言模型(
LLM
)引起了很大的轰动(见图1)。
架构师研究会
·
2024-01-03 22:50
人工智能
LLM
语言模型
人工智能
自然语言处理
LLM
大语言模型
企业使用人工智能情况调查
具体来说,ChatGPT和Midjourney等大型语言模型(
LLM
)正在帮助提高人工智能采用率。一、使用人工智能统计数据的公司全球35%的公司使用人工智能。
万俟淋曦
·
2024-01-03 18:47
Some
Insights
人工智能
AI
商业人工智能
商业化
大模型
赋能
数据统计
19、BLIP-2
实现过程 为了弥合模态差距,提出了一个分两个阶段预训练的QueryingTransformer(Q-Former):使用冻结ImageTransformer的视觉语言表示学习阶段使用冻结
LLM
的视觉到语言生成学习阶段
C--G
·
2024-01-03 18:13
#
NLP
python
LLM
Agent-指令微调方案
上一章我们介绍了基于Prompt范式的工具调用方案,这一章介绍基于模型微调,支持任意多工具组合调用,复杂调用的方案。多工具调用核心需要解决3个问题,在哪个位置进行工具调用(where),从众多工具中选择哪一个(Which),工具的输入是什么(What)。Where+Which+What,我称之为3W原则,3H它兄弟哈哈哈哈~其实如何教大模型使用工具,和教人类使用工具没啥区别。就像上周末我想给我妈买
人工智能小豪
·
2024-01-03 17:02
人工智能
java
算法
深度学习
机器学习
大模型
LLM
Agent零微调范式 ReAct & Self Ask
可以有以下两个视角首先是我们赋能模型,如果说
LLM
是大脑,那Agent提供了手脚和感官感官:获取真实世界的信息,包括实时信息像天气情况,金融市场,交通状况;包括私有信息例如用户个人数据;包括多模态信息像声音和图像手
人工智能小豪
·
2024-01-03 17:59
microsoft
人工智能
大模型
深度学习
机器学习
利用提示工程,提升
LLM
将自然语言转化为SQL的准确性
大型语言模型(
LLM
)已展现出理解自然语言提示并生成连贯响应的卓越能力。这为将自然语言翻译成SQL等结构化查询语言开辟了新的可能性。
数大招疯
·
2024-01-03 12:21
大语言模型
LLM
利用提示工程,提升
LLM
将自然语言转化为SQL的准确性
大型语言模型(
LLM
)已展现出理解自然语言提示并生成连贯响应的卓越能力。这为将自然语言翻译成SQL等结构化查询语言开辟了新的可能性。
数大招疯
·
2024-01-03 12:47
大语言模型
LLM
对比开源大语言模型的自然语言生成SQL能力
随着GPT-4、Llama2和Falcon等大型语言模型(
LLM
)开发的最新进展,业界和学术界对NL
数大招疯
·
2024-01-03 11:28
语言模型
sql
克服幻觉:提升语言模型在自然语言处理中的准确性与可靠性
随着语言模型(
LLM
)在自然语言处理(NLP)中的应用日益普及,它们在文本生成、机器翻译、情感分析等许多任务中展现出惊人的能力。
一尘之中
·
2024-01-03 11:58
杂谈
语言模型
人工智能
自然语言处理
大模型与大模型的幻觉问题
参考大模型中的涌现OpenAI科学家:幻觉是大模型与生俱来的特性,而非缺陷大模型「幻觉」,看这一篇就够了|哈工大华为出品大模型什么是大模型大语言模型(
LLM
)是基于海量文本数据训练的深度学习模型。
IT从业者张某某
·
2024-01-03 09:57
大模型
大模型
以小博大进行时!2023年值得关注的个小模型
大语言模型(
LLM
)作为年度热词,已经充分向我们证明了其影响力。如今,一场无声却极具开创性的变革正在兴起。小语言模型(SLM)的兴起正逐步挑战着大预言模型的主导地位。
c++服务器开发
·
2024-01-03 09:50
语言模型
大语言模型
LLM
微调技术:Prompt Tuning
1预训练语言模型概述1.1预训练语言模型的发展历程截止23年3月底,语言模型发展走过了三个阶段:第一阶段:设计一系列的自监督训练目标(MLM、NSP等),设计新颖的模型架构(Transformer),遵循Pre-training和Fine-tuning范式。典型代表是BERT、GPT、XLNet等;第二阶段:逐步扩大模型参数和训练语料规模,探索不同类型的架构。典型代表是BART、T5、GPT-3等
智慧医疗探索者
·
2024-01-03 08:57
深度学习模型
prompt
大语言模型
微调
微软真是活菩萨,面向初学者的机器学习、数据科学、AI、
LLM
课程统统免费
微软真是活菩萨,面向初学者的机器学习、数据科学、AI、
LLM
课程统统免费大家好,我是老章推荐几个质量上乘且完全免费的微软开源课程面向初学者的机器学习课程**地址:**https://microsoft.github.io
机器学习算法与Python实战
·
2024-01-03 07:52
人工智能
microsoft
机器学习
卷?中学生开始学习人工智能和大模型,附课件!
课程简介这个experience-ai课程是GooleDeepMind团队和RaspberryPi基金会合作开发的,最大特点是,没有难懂的理论,完全面向0基础人群(初中生),
LLM
部分比吴恩达近期放出的
机器学习算法与Python实战
·
2024-01-03 07:51
学习
人工智能
小周带你读论文-1之“浪潮Yuan2 有哪些创新“
如果自己读嫌麻烦,可以来看我这个的总结老规矩,1,2,3上链接...IEIT-Yuan/Yuan-2.0:Yuan2.0LargeLanguageModel(github.com)Yuan2是浪潮的刚发布的
LLM
周博洋K
·
2024-01-03 05:54
深度学习
人工智能
AIGC
agi
自动驾驶
【Amazon Bedrock】体验 Bedrock 的基本功能,为构建强大安全的
LLM
应用而准备
文章目录一、什么是AmazonBedrock?二、为什么选择AmazonBedrock三、访问AmazonBedrockUI四、与AmazonBedrock聊天五、对比AmazonBedrock不同基础模型的返回结果六、让AmazonBedrock处理文本七、利用AmazonBedrock生成图片八、参考链接一、什么是AmazonBedrock?AmazonBedrock是一个完全托管的服务,它通
云矩阵
·
2024-01-03 04:19
亚马逊云
aws
Amazon
Bedrock
2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型
LLM
:LargeLanguageModel,即大语言模型,旨在理解和生成人类语言。
LLM
的特点是规模庞大,包含成百、上千亿的
herosunly
·
2024-01-03 01:51
优质书籍推荐
人工智能
AIGC
agi
大语言模型(
LLM
)框架及微调 (Fine Tuning)
大语言模型(
LLM
)是指由大规模训练语言模型所得的模型。这些模型通常使用深度学习方法,在巨大的文本语料库上进行训练,以学习语言的各种结构、规则和特征。
m0_黎明
·
2024-01-03 01:06
语言模型
人工智能
自然语言处理
【
LLM
】微调我的第一个WizardLM LoRA
根据特定用例调整
LLM
的行为之前,我写过关于与Langchain和Vicuna等当地
LLM
一起创建人工智能代理的文章。如果你不熟悉这个话题,并且有兴趣了解更多,我建议你阅读我之前的文章,开始学习。
架构师研究会
·
2024-01-02 20:31
AIGC
LLM
人工智能
WizardLM
LLM
AIGC
大语言模型
【
LLM
】人工智能应用构建的十大预训练NLP语言模型
在人工智能领域,自然语言处理(NLP)被广泛认为是阅读、破译、理解和理解人类语言的最重要工具。有了NLP,机器可以令人印象深刻地模仿人类的智力和能力,从文本预测到情感分析再到语音识别。什么是自然语言处理?语言模型在NLP应用程序的开发中起着至关重要的作用。然而,从头开始构建复杂的NLP语言模型是非常耗时的。出于这个原因,人工智能和机器学习的研究人员和开发人员对预先训练的语言模型深信不疑。迁移学习是
架构师研究会
·
2024-01-02 18:47
自然语言处理
LLM
人工智能
人工智能
语言模型
自然语言处理
LLM
大语言模型
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他