E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型。
LLMs:《A Survey on Evaluation of Large Language Models大型
语言模型
评估综述》理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性
LLMs:《ASurveyonEvaluationofLargeLanguageModels大型
语言模型
评估综述》翻译与解读导读:该文章首先介绍了人工智能(AI)对机器智能的专注,并探讨了评估AI模型的方法
GitHub质检员
·
2023-12-21 20:55
AI或AGI
AI
AICG
CG
人工智能
突破边界:高性能计算引领LLM驶向通用人工智能AGI的创新纪元
AGI|AIGC|大模型训练|GH200LLM|LLMs|大
语言模型
|MI300ChatGPT的成功带动整个AIGC产业的发展,尤其是LLM(大型
语言模型
,大
语言模型
)、NLP、高性能计算和深度学习等领域
高性能服务器
·
2023-12-21 20:23
人工智能
agi
AIGC
翻译: LLMs离通用人工智能AGI有多远 20个小时学会开车 Artificial General Intelligence
大型
语言模型
的崛起导致了像ChatGPT这样的单一模型可以用于许多事情,并且感觉它们可能是通用的。但通用技术与人工通用智能并不是同一回事。让我们看看AGI的真正技术定义是什么。
AI架构师易筋
·
2023-12-21 20:53
GPT-4
人工智能
agi
LLM
prompt
chatgpt
大模型结合推荐系统,发论文创新点怎么找?附14篇会议论文&代码
在推荐系统中,大型
语言模型
可以用于个性化推荐、解释推荐和多样性推荐等多个方面。具体来讲,大模型可以通过对用户的历史行为、兴趣偏好等信息进行建模,从而预测用户可能感兴趣的项目或物品。
深度之眼
·
2023-12-21 19:11
人工智能干货
深度学习干货
推荐系统
大模型
ChatGPT4与ArcGIS Pro3助力AI 地理空间分析和可视化及助力科研论文写作
随着chatGPT/GPT4等大
语言模型
的出现,AI思维也已经成为一种必备的能力,ArcGISPro3的卓越性能与ChatGPT
科研online
·
2023-12-21 18:04
arcgis
人工智能
chatgpt
【深度学习】
语言模型
与注意力机制以及Bert实战指引之一
文章目录统计
语言模型
和神经网络
语言模型
注意力机制和Bert实战Bert配置环境和模型转换格式准备模型构建网络设计模型配置代码实战统计
语言模型
和神经网络
语言模型
区别:统计
语言模型
的本质是基于词与词共现频次的统计
weixin_40293999
·
2023-12-21 17:52
深度学习
深度学习
语言模型
bert
什么是深度学习,多模态学习,迁移学习,LLM
深度学习、多模态学习、迁移学习和大型
语言模型
(LLM)是人工智能和机器学习领域的重要概念,它们各自有着独特的定义和应用。
稻壳特筑
·
2023-12-21 17:38
深度学习
深度学习
学习
迁移学习
从头开始实现LoRA以及一些实用技巧
LoRA是Low-RankAdaptation或Low-RankAdaptors的缩写,它提供了一种用于对预先存在的
语言模型
进行微调的高效且轻量级的方法。LoRA的主要优点之一是它的效率。
机器学习社区
·
2023-12-21 14:26
大模型
自然语言
语言模型
人工智能
自然语言处理
LoRA
微调
ChatGPT:你真的了解网络安全吗?浅谈攻击防御进行时之传统的网络安全
基于其
语言模型
庞大、可控制、具有高度扩展性的特点,本文通过对话ChatGPT,浅谈网络安全攻击防御进行时。传统的网络安全提问ChatGPT:什么是传统的网络安全,主要包括哪些方面?
会python的小孩
·
2023-12-21 13:45
chatgpt
web安全
安全
开发语言
python
网络安全
网络
论文笔记 | Nature 2023 FunSearch:利用大
语言模型
在数学科学领域探索新的发现
文章目录一、前言二、主要内容三、总结CSDN叶庭云:https://yetingyun.blog.csdn.net/一、前言科学中有许多难以解决的问题,这些问题难以获得确切解答,但却相对容易进行验证。在数学和计算机科学领域,这类问题被称为NP完全优化问题(NP-completeoptimizationproblems)。人们普遍认为不存在能够在“可接受时间”内(即多项式时间内)解决此类问题的算法,
叶庭云
·
2023-12-21 12:22
人工智能学习之路
Nature
人工智能
大语言模型
数学
新发现
年末再抛大模型深水炸弹!WAVE SUMMIT+2023大会如约而至
大模型技术生态发展正当时前言回望2023年,大
语言模型
或许将是科技史上最浓墨重彩的一笔。从技术、产业到生态,大
语言模型
在突飞猛进中加速重构万物。
洁洁!
·
2023-12-21 12:23
external
大模型
人工智能
百度
年度大盘点:AIGC、AGI、GhatGPT震撼登场!揭秘人工智能大模型的奥秘与必读书单
01《ChatGPT驱动软件开发》02《ChatGPT原理与实战》03《神经网络与深度学习》04《AIGC重塑教育》05《通用人工智能》前言在2023年,人工智能领域经历了一场前所未有的大爆发,特别是在
语言模型
领域
洁洁!
·
2023-12-21 12:23
external
AIGC
agi
人工智能
同济&复旦团队的最新综述:大
语言模型
的检索增强生成
文章目录一、前言二、主要内容三、总结CSDN叶庭云:https://yetingyun.blog.csdn.net/一、前言论文题目:《Retrieval-AugmentedGenerationforLargeLanguageModels:ASurvey》论文地址:https://arxiv.org/abs/2312.10997Github项目地址:https://github.com/Tongj
叶庭云
·
2023-12-21 11:28
人工智能学习之路
大语言模型
检索增强生成
人工智能
综述
ChatGPT
HALLUSIONBENCH: An Advanced Diagnostic Suite for Entangled Language Hallucination & Visual Illusion
AnAdvancedDiagnosticSuiteforEntangledLanguageHallucination&VisualIllusioninLargeVision-LanguageModels----HALLUSIONBENCH:大型视觉
语言模型
中纠缠语言幻觉和视觉错觉的高级诊断套件马里兰大学学院公园分校
Mars_prime
·
2023-12-21 08:07
人工智能
Beyond Hallucinations: Enhancing LVLMs through Hallucination-Aware Direct Preference Optimization
超越幻觉:通过幻觉感知直接偏好优化增强LVLM上海人工智能实验室Abstract近年来,多模态大
语言模型
取得了显着的进步,但它们仍然面临着一个被称为“幻觉问题”的常见问题,即模型生成的文本描述包含图像中不准确或不存在的内容
Mars_prime
·
2023-12-21 08:07
大模型幻觉
人工智能
语言模型
LVLM幻觉
LLM 和搜索引擎是一样的吗?
在这篇文章中,了解更多关于AI大型
语言模型
(如ChatGPT)的潜力。了解他们如何彻底改变生产力,并探索他们与搜索引擎不断变化的关系。
网站优化知识宝典
·
2023-12-21 08:07
SEO
搜索引擎
人工智能
SEO
seo
Google
Learn to Explain: Multimodal Reasoning viaThought Chains for Science Question Answering科学问答的思维链
ScienceQA展示了以下功能的实用性
语言模型
中的CoT,因为CoT在少样本GPT-3中将问答性能提高了1.20%微调的UnifiedQA中为3.99%。思想链(CoT)。
Mars_prime
·
2023-12-21 08:37
LVLM幻觉
计算机视觉
人工智能
VIGC: Visual Instruction Generation and Correction---------VIGC:视觉指令生成和纠正
上海人工智能实验室Abstract视觉编码器和大
语言模型
(LLM)的集成推动了多模态大
语言模型
(MLLM)的最新进展。然而,视觉语言任务的高质量指令调整数据的稀缺仍然是一个挑战。
Mars_prime
·
2023-12-21 08:35
人工智能
LVLM幻觉
算法
深度学习
7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023
大型
语言模型
虽然性能优异,可以用零样本或少样本提示解决新任务,但LLM在实际应用部署时却很不实用,内存利用效率低,并且需要大量计算资源。
语音之家
·
2023-12-21 07:03
palm
人工智能
深度学习
AIGC:阿里开源大模型通义千问部署与实战
Qwen-7B是基于Transformer的大
语言模型
,在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。
智慧医疗探索者
·
2023-12-21 06:54
AIGC
AIGC
通义千问
大模型
ChatGPT | 02-如何利用ChatGPT学习英语?
简介ChatGPT是OpenAI训练的大型
语言模型
,可以帮助获取信息,回答问题,生成文本,提供建议,解决问题等。
SpringBear_KISS
·
2023-12-21 06:29
如何入门 GPT 并快速跟上当前的大
语言模型
LLM 进展?
入门GPT首先说第一个问题:如何入门GPT模型?最直接的方式当然是去阅读官方的论文。GPT模型从2018年的GPT-1到现在的GPT-4已经迭代了好几个版本,通过官方团队发表的论文是最能准确理清其发展脉络的途径,其中包括GPT模型本身和一些介绍关键技术的文章,比如训练方法RLHF这些。下面列出一些主要的文章。第一手资料:论文GPT-1:language_understanding_paper.pd
xiaoduan2016
·
2023-12-21 05:18
ChatGPT
chatgpt
gpt
gpt-3
技术分析测试
整体架构流程提示:这里可以添加技术整体架构例如:在
语言模型
中,编码器和解码器都是由一个个的Transformer组件拼接在一起形成的。
青山渺渺
·
2023-12-21 04:11
测试
【无标题】
整体架构流程提示:这里可以添加技术整体架构例如:在
语言模型
中,编码器和解码器都是由一个个的Transformer组件拼接在一起形成的。
青山渺渺
·
2023-12-21 04:11
android
Framework
智能部署之巅:Amazon SageMaker引领机器学习革新
(全球TMT2023年12月6日讯)亚马逊云科技在2023re:Invent全球大会上,宣布推出五项AmazonSageMaker新功能,帮助客户加速构建、训练和部署大
语言模型
和其他基础模型。
小威要向诸佬学习呀
·
2023-12-21 01:45
机器学习
人工智能
亚马逊
科技
Text2SQL学习整理(四)将预训练
语言模型
引入WikiSQL任务
导语上篇博客:Text2SQL学习整理(三):SQLNet与TypeSQL模型简要介绍了WikiSQL数据集提出后两个早期的baseline,那时候像BERT之类的预训练
语言模型
还未在各种NLP任务中广泛应用
Q同学的nlp笔记
·
2023-12-20 23:20
语言模型
人工智能
Text-to-sql
自然语言处理
nlp
UI Grounding 学习笔记
InstructBLIP:指令微调RT-DETRVPGTrans:TransferVisualPromptGeneratoracrossLLMs(NeurIPS2023):模态对齐预训练,针对类BLIP-2架构Phi:小
语言模型
songyuc
·
2023-12-20 22:21
学习
笔记
2023年度佳作:AIGC、AGI、GhatGPT、人工智能大
语言模型
的崛起与挑战
目录前言01《ChatGPT驱动软件开发》内容简介02《ChatGPT原理与实战》内容简介03《神经网络与深度学习》04《AIGC重塑教育》内容简介05《通用人工智能》目录前言2023年是人工智能大
语言模型
大爆发的一年
库库的里昂
·
2023-12-20 22:06
杂谈
人工智能
AIGC
agi
语言模型
自然语言处理
ChatGPT如何计算token数?
GPT不是适用于某一门语言的大型
语言模型
,它适用于几乎所有流行的自然语言。
双天至尊1992
·
2023-12-20 21:43
python
人工智能
ChatGPT
python
人工智能
ChatGPT
【免费培训 · 明天开课】如何用ChatGPT搞科研?(直播:2023.10.7)
课程背景ChatGPT是一种基于先进
语言模型
的自然语言处理工具,对于科研人员来说,在语言翻译和润色方面具有重要的价值和意义。
茗创科技
·
2023-12-20 20:38
使用yolov8和moviepy自动截取视频中人出现的片段
分析不想看分析的直接跳到代码复制^_^1.拿到这个问题,我首先就丢给了gpt和一众大
语言模型
去解决,因为真的不想动手干这种杂活,懒惰之神上身了。然后我一开始的指令是
XINFINFZ
·
2023-12-20 18:54
yolo
YOLO
音视频
目标跟踪
python
OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT
随着ChatGPT、GPT-4等大型
语言模型
(LLM)的出现,提示工程(PromptEngineering)变得越来越重要。很多人将prompt视为LLM的咒语,其好坏直接影响模型输出的结果。
智云研
·
2023-12-20 18:49
prompt
chatgpt
人工智能
整理了上百个开源中文大
语言模型
,涵盖模型、应用、数据集、微调、部署、评测
自ChatGPT为代表的大
语言模型
(LargeLanguageModel,LLM)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。
Python算法实战
·
2023-12-20 17:53
大模型理论与实战
大模型
语言模型
人工智能
自然语言处理
大模型
算法
微调
langchain
ChatGLM3:打造更智能、更安全的代码解释器和工具使用体验
ChatGLM3是由智谱AI训练的第三代大型
语言模型
,它不仅能理解和生成人类语言,还能执行代码、调用工具,并以markdown格式进行响应。
超级人工智能
·
2023-12-20 16:11
AI大模型
人工智能
nlp
机器学习
深度学习
AIGC
语言模型
大型
语言模型
:SBERT — Sentence-BERT
@slavahead一、介绍Transformer在NLP方面取得了进化进步,这已经不是什么秘密了。基于转换器,许多其他机器学习模型已经发展起来。其中之一是BERT,它主要由几个堆叠的变压器编码器组成。除了用于情感分析或问答等一系列不同的问题外,BERT在构建词嵌入(表示词的语义含义的数字向量)方面也越来越受欢迎。以嵌入的形式表示单词具有巨大的优势,因为机器学习算法不能处理原始文本,但可以对向量的
无水先生
·
2023-12-20 16:39
Transformer专栏
人工智能
语言模型
bert
人工智能
大型
语言模型
:RoBERTa — 一种稳健优化的 BERT 方法
@slavahead一、介绍BERT模型的出现BERT模型带来了NLP的重大进展。BERT的架构源自Transformer,它在各种下游任务上取得了最先进的结果:语言建模、下一句预测、问答、NER标记等。尽管BERT性能出色,研究人员仍在继续尝试其配置,希望获得更好的指标。幸运的是,他们成功了,并提出了一种名为RoBERTa的新模型-鲁棒优化的BERT方法。在本文中,我们将参考官方RoBERTa论
无水先生
·
2023-12-20 16:39
Transformer专栏
人工智能
自然语言处理
人工智能
CogVLM与CogAgent:开源视觉
语言模型
的新里程碑
引言随着机器学习的快速发展,视觉
语言模型
(VLM)的研究取得了显著的进步。今天,我们很高兴介绍两款强大的开源视觉
语言模型
:CogVLM和CogAgent。
超级人工智能
·
2023-12-20 16:08
AI大模型
语言模型
人工智能
自然语言处理
AI作画
nlp
深度学习
2023ChatGPT浪潮,2024开源大
语言模型
会成王者?
《2023ChatGPT浪潮,2024开源大
语言模型
会成王者?》一、2023年的回顾1.1、背景我们正迈向2023年的终点,回首这一年,技术行业的发展如同车轮滚滚。
玄明Hanko
·
2023-12-20 16:08
语言模型
人工智能
自然语言处理
chatgpt
年终总结
回顾 | AutoGen 智能应用开发(二)- AutoGen 应用
继MicrosoftBuild大会上发布的CopilotStack之后,微软针对大
语言模型
开发,陆续发布了SemanticKernel
MicrosoftReactor
·
2023-12-20 15:02
文心ERNIE Bot SDK+LangChain:基于文档、网页的个性化问答系统
现在各行各业纷纷选择接入大模型,其中最火且可行性最高的形式无异于智能文档问答助手,而LangChain是其中主流技术实现工具,能够轻松让大
语言模型
与外部数据相结合,从而构建智能问答系统。
飞桨PaddlePaddle
·
2023-12-20 14:03
技术干货
langchain
人工智能
定档12月28日,WAVE SUMMIT+深度学习开发者大会2023狂欢来袭!
回望2023年,大
语言模型
或许将是科技史上最浓墨重彩的一笔。从技术、产业到生态,大
语言模型
在突飞猛进中加速重构万物。随着理解、生成、逻辑、记忆四大能力显著提升,大
语言模型
为通用人工智能带来曙光。
飞桨PaddlePaddle
·
2023-12-20 14:03
热门活动
深度学习
人工智能
开发者
实战干货!基于ERNIE Bot SDK的数字诗人聊天开发教程
随着人工智能技术的不断迭代发展,数字人的开发与应用需求也与日俱增,并且随着大
语言模型
的发展,数字人也更智能,从最初的语音预制到现在的实时交流,目前已在很多场景都有广泛应用。
飞桨PaddlePaddle
·
2023-12-20 14:33
星河五周年
microsoft
人工智能
数字人
数据分析师狂喜!手把手教你用混元大模型做数据分析
导读最近,腾讯发布了自主研发的大型
语言模型
:混元大模型。该大模型具备多轮对话能力、内容创作能力、逻辑推理能力、搜索增强和知识图谱等特点。
腾讯云开发者
·
2023-12-20 14:55
数据分析
信息可视化
数据挖掘
DeepMind论文登上Nature:大模型找到数学难题最新解,赢过人类数学家
这次谷歌DeepMind提出了一种使用大
语言模型
搜索数学和计算机科学新解决方案的方法FunSearch,FunSearch针对历史上一些经典数学难题给出了新的解法,赢过了人类数学家。
夕小瑶
·
2023-12-20 13:46
人工智能
DeepMind提出代码链,通过“代码思考”改进推理性能
谷歌DeepMind最近提出了一个简单且高效的方法ChainofCode(CoC),可以优化大
语言模型
的代码来驱动推理。
夕小瑶
·
2023-12-20 13:15
人工智能
gpt
20倍压缩比!微软提出大模型提示压缩框架LLMLingua
近期,越来越多研究在探索大型
语言模型
(LLM)在实际应用中的推理和生成能力。随着ChatGPT等模型的广泛研究与应用,如何在保留关键信息的同时,压缩较长的提示成为当前大模型研究的问题之一。
夕小瑶
·
2023-12-20 13:45
人工智能
国货之光,复旦发布大模型训练效率工具 CoLLiE,效率显著提升
在这个信息爆炸的时代,大型
语言模型
(LLM)成为理解和挖掘文本信息的重要工具。为了更好地适应各种应用场景,对LLM进行定制化训练变得至关重要。
夕小瑶
·
2023-12-20 13:14
人工智能
复旦团队提出思维交流框架EoT,由CoT到EoT,可跨模型通信,表现更出色
大型
语言模型
(LLM)通过利用庞大的训练语料和强大的计算资源,在众多NLP任务中表现卓越。然而,在理解和进行推理方面,这些模型仍显得相对薄弱,仅依靠增加模型的大小无法解决这一问题。
夕小瑶
·
2023-12-20 13:44
人工智能
ICLR 2023 | Self-Consistency: Google超简单方法改善大模型推理能力
GoogleResearch,BrainTeam的一篇文章,SELF-CONSISTENCYIMPROVESCHAINOFTHOUGHTREASONINGINLANGUAGEMODELS[1]:利用自洽性提高
语言模型
中的思维链推理效果这篇文章方法非常简单但是效果非常好
HxShine
·
2023-12-20 13:25
llm
nlp_paper
nlp
人工智能
大数据
ChatGPT
论文笔记 | ICLR 2023 ReAct:通过整合推理和行动来增强
语言模型
|Accept:notable-top-5%:《ReAct:SynergizingReasoningandActinginLanguageModels》一句话总结:ReAct方法在问答任务中通过提示大
语言模型
生成与任务相关的推理文本
叶庭云
·
2023-12-20 13:52
人工智能学习之路
人工智能
ReAct
ICLR
大语言模型
顶会论文
上一页
31
32
33
34
35
36
37
38
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他