E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语言模型
【LLM】大
语言模型
(LLMs)
大型
语言模型
(LLMs)1.什么是大型
语言模型
?大型
语言模型
(LargeLanguageModel,LLM)是基于深度学习的自然语言处理模型,能够理解和生成自然语言文本。
林九生
·
2025-01-18 17:21
人工智能
语言模型
人工智能
自然语言处理
全新 Hopper 架构的Transformer 引擎有什么特点?
Transformer模型是当今广泛使用的
语言模型
(例如asBERT和GPT-3)的支柱。
扫地的小何尚
·
2025-01-18 17:50
人工智能
大
语言模型
(LLMs)入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
大
语言模型
(LLMs)作为人工智能(AI)领域的一项突破性发展,已经改变了自然语言处理(NLP)和机器学习(ML)应用的面貌。
大模型零基础教程
·
2025-01-18 17:19
语言模型
人工智能
自然语言处理
大模型
《AI
语言模型
的关键技术探析:系统提示、评估方法与提示工程》
文章主要内容摘要1.系统提示(SystemPrompt)定义:用于设置模型行为、角色和工作方式的特殊指令重要性:定义模型行为边界影响输出质量和一致性可将通用模型定制为特定领域助手挑战:技术集成复杂兼容性问题效果难以精确预测2.模型评估方法创新方向:自一致性(Self-Consistency)评估PlanSearch方法强化学习(RL)应用核心特点:多次采样和交叉验证策略空间探索动态权重调整实践价值
XianxinMao
·
2025-01-18 17:16
人工智能
语言模型
自然语言处理
《多模态
语言模型
:一个开放探索的技术新领域》
核心主题多模态
语言模型
的特点仍处于探索和定义阶段没有固定的标准任务和评估方法研究方向高度开放技术路径主要存在两种方法:后期融合(LateFusion)从
语言模型
backbone开始添加图像编码器效果稳定
XianxinMao
·
2025-01-18 17:16
语言模型
人工智能
算法
第83期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 16:11
GPTSecurity
人工智能
网络安全
【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】
本文需要用到的代码已经放在GitHub的仓库啦,别忘了给仓库点个小心心~~~https://github.com/LFF8888/FF-Studio-Resources第001个文件哦~一、引言:大
语言模型
与指令微调
FF-Studio
·
2025-01-18 07:31
大语言模型
开源
《提示工程的科学化探索与大
语言模型
交互革新》
文章信息摘要主题:提示工程的科学化与大
语言模型
交互革新核心内容:提示工程的科学化与系统化建立可复现的方法论形成系统性知识体系构建标准化流程和评估体系大
语言模型
带来的交互变革从指令驱动到对话驱动从单一输出到多轮复杂交互从工具到协作伙伴的转变提示对模型行为的影响机制认知层面
XianxinMao
·
2025-01-18 06:57
语言模型
交互
第78期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-18 05:13
aigcgpts
GitHub每日最火火火项目(1.17)
OpenBMB/MiniCPM-o项目名称:OpenBMB/MiniCPM-o用途:MiniCPM-o2.6是一个适用于手机的视觉、语音和多模态直播的GPT-4o级别大
语言模型
(LLM)。
FutureUniant
·
2025-01-18 04:12
github日推
github
人工智能
计算机视觉
音视频
ai
第81期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-18 01:02
aigc网络安全
第83期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-18 00:26
aigcgpts
记录一个LLM+API类型的临床预测模型APP(糖尿病Cox预测模型)的过程
记录一个LLM+API类型的临床预测模型APP(糖尿病Cox预测模型)的构建过程LLM代表的是大
语言模型
,API代表的是机器学习模型,LLM+API是说将机器学习模型以API的形式引入到LLM,让机器学习模型以对话的方式与用户交流而服务于临床实践的
预测模型的开发与应用研究
·
2025-01-17 22:20
APP
construction
web
app
GraphRAG 本地 Ollama - 知识图谱
论文摘要使用检索增强生成(RAG)从外部知识源中检索相关信息,使大型
语言模型
(LLMs)能够回答关
ericliu2017
·
2025-01-17 21:07
知识图谱
人工智能
第79期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-17 19:08
aigcgpts
提示工程(Prompt Engineering)最全综述:本质、技术、最佳实践
一、理解提示与提示工程(promptengineering)(一)提示的本质提示是我们输入给大
语言模型
以获取期望响应的信息。它的形式丰富多样,可以是一个
大模型之路
·
2025-01-17 14:13
prompt
prompt
算法
人工智能
LLM
提示工程
安装指南:LLaMA Factory、AutoGPTQ 和 vllm
安装指南:LLaMAFactory、AutoGPTQ和vllm在本文中,我们将详细介绍如何安装LLaMAFactory、AutoGPTQ和vllm,这些工具在大型
语言模型
(LLMs)和视觉
语言模型
(VLMs
从零开始学习人工智能
·
2025-01-17 13:05
人工智能
算法
深度学习
python
DeepSeek Artifacts:前端开发的新利器
这款轻量级模型凭借在大
语言模型
(LLM)排行榜上的优异表现,以及亲民的价格和卓越的性能,在人工智能社区中广受关注。然而,它的姊妹工具DeepSeekArtifacts却因截然不同的缘由引发了热议。
·
2025-01-17 05:12
人工智能
大规模
语言模型
从理论到实践 大
语言模型
预训练数据
大规模
语言模型
从理论到实践:大
语言模型
预训练数据关键词:大规模
语言模型
、预训练数据、数据集选择、数据清洗、数据增强、数据集评估、数据集扩展1.背景介绍1.1问题的由来随着深度学习和大规模神经网络的发展,
AI大模型应用之禅
·
2025-01-17 03:39
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
PyTorch建模与应用:从深度学习到大模型
全书共11章,内容涵盖了从深度学习的基础概念到大
语言模型
的应用。第1章介绍了深度
屿小夏
·
2025-01-17 00:12
书籍推荐
深度学习
pytorch
人工智能
论文翻译:A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly
TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型
语言模型
CSPhD-winston-杨帆
·
2025-01-17 00:41
论文翻译
LLMs-鲁棒性
语言模型
人工智能
自然语言处理
【vLLM 学习】安装
vLLM是一款专为大
语言模型
推理加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
·
2025-01-17 00:08
<论文>如何将RAG和时序大模型相结合?
译文:检索增强生成(RAG)是现代大型
语言模型
系统的核心组件,特别是在需要最新信息以准确响应用户查询或查询超出训练数据范围的情况下。
CM莫问
·
2025-01-16 20:33
文献简录
人工智能
深度学习
算法
时间序列
RAG
大模型
Qwen-VL环境搭建&推理测试
前面几篇也写了QWen的微调等,视觉
语言模型
也写了一篇CogVLM,感兴趣的小伙伴可以移步Qwen1.5微调-CSDN博客。
要养家的程序猿
·
2025-01-16 19:57
AI算法
python
计算机视觉
ai
VLM 系列——Qwen2 VL——论文解读——前瞻(源码解读)
一、概述1、是什么是一系列多模态大型
语言模型
(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器+LLM形式(可以认为没有任何投射层)。
TigerZ*
·
2025-01-16 18:48
AIGC算法
AIGC
人工智能
transformer
计算机视觉
图像处理
探索Qwen-VL:一个全栈式的视觉
语言模型
开发框架
探索Qwen-VL:一个全栈式的视觉
语言模型
开发框架Qwen-VLTheofficialrepoofQwen-VL(通义千问-VL)chat&pretrainedlargevisionlanguagemodelproposedbyAlibabaCloud
钟洁祺
·
2025-01-16 17:03
LLM 词汇表
Contextwindow“上下文窗口”是指
语言模型
在生成新文本时能够回溯和参考的文本量。这不同于
语言模型
训练时所使用的大量数据集,而是代表了模型的“工作记忆”。
落难Coder
·
2024-09-16 10:22
LLMs
NLP
大语言模型
大模型
llama
人工智能
如何部分格式化提示模板:LangChain中的高级技巧
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型
语言模型
(LLM)时,提示工程是一个关键环节。
nseejrukjhad
·
2024-09-16 09:49
langchain
java
服务器
python
人工智能时代,程序员如何保持核心竞争力?
随着AIGC(如chatgpt、midjourney、claude等)大
语言模型
接二连三的涌现,AI辅助编程工具日益普及,程序员的工作方式正在发生深刻变革。
jmoych
·
2024-09-16 09:17
人工智能
BART&BERT
BART和BERT都是基于Transformer架构的预训练
语言模型
。
Ambition_LAO
·
2024-09-16 07:02
深度学习
程序员如何在AI时代保持核心竞争力
程序员如何在AI时代保持核心竞争力随着AIGC(如ChatGPT、MidJourney、Claude等)大
语言模型
的相继涌现,AI辅助编程工具逐渐普及,程序员的工作方式正在发生深刻的变革。
nfgo
·
2024-09-16 03:35
chatgpt
人工智能
腾讯发表多模态综述,一文详解多模态大模型
多模态大
语言模型
(MLLM)是近年来兴起的一个新的研究热点,它利用强大的大
语言模型
作为大脑来执行多模态任务。
存内计算开发者社区
·
2024-09-15 21:57
多模态大模型
人工智能
chatgpt
AIGC
量子计算
AI-native
gpt
agi
【有啥问啥】刷爆各大榜单的Reflection 70B模型背后的错误自我纠正(Reflection-Tuning)技术解析:一种革新AI模型的方法
刷爆各大榜单的Reflection70B模型背后的错误自我纠正(Reflection-Tuning)技术解析:一种革新AI模型的方法在快速发展的AI领域,尤其是大型
语言模型
(LLM)的竞争中,错误自我纠正技术
Chauvin912
·
2024-09-15 15:32
大模型
行业调研
人工智能
算法
HALTT4LLM:大型
语言模型
的幻觉检测指标
HALTT4LLM:大型
语言模型
的幻觉检测指标haltt4llmThisprojectisanattempttocreateacommonmetrictotestLLM'sforprogressineliminatinghallucinationswhichisthemostseriouscurrentprobleminwidespreadadoptionofLLM'sformanyrealpur
谢忻含Norma
·
2024-09-15 14:30
Reflection 70B——HyperWrite推出的大型
语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://rengongzhineng.io/在AI技术飞速发展的过程中,我们已经见证了可以写作、编程,甚至创造艺术的模型问世。但有一
新加坡内哥谈技术
·
2024-09-15 14:57
语言模型
人工智能
自然语言处理
深度解析:如何使用输出解析器将大型
语言模型
(LLM)的响应解析为结构化JSON格式
深度解析:如何使用输出解析器将大型
语言模型
(LLM)的响应解析为结构化JSON格式在现代自然语言处理(NLP)的应用中,大型
语言模型
(LLM)已经成为了重要的工具。
m0_57781768
·
2024-09-15 13:41
语言模型
json
人工智能
深入探讨:如何在Python中通过LangChain技术精准追踪大型
语言模型
(LLM)的Token使用情况
深入探讨:如何在Python中通过LangChain技术精准追踪大型
语言模型
(LLM)的Token使用情况在现代的人工智能开发中,大型
语言模型
(LLM)已经成为了不可或缺的工具,无论是用于自然语言处理、
m0_57781768
·
2024-09-15 13:37
python
langchain
语言模型
使用You.com API进行LLM输出的事实性增强
使用You.comAPI进行LLM输出的事实性增强引言大型
语言模型
(LLM)在生成人类可读的文本方面表现出色,但它们可能会产生过时或不准确的信息。
aehrutktrjk
·
2024-09-15 12:05
python
开发语言
如何从大型
语言模型
(LLM)流式响应
引言随着大型
语言模型
(LLM)的不断发展,我们不仅能够获得高质量的文本生成结果,还可以实时观察模型生成文本的过程。
aehrutktrjk
·
2024-09-15 12:30
语言模型
microsoft
ajax
python
深度学习-13-小
语言模型
之SmolLM的使用
应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型
语言模型
皮皮冰燃
·
2024-09-15 10:48
深度学习
深度学习
LLM 进展和前进道路
近年来,
语言模型
取得了重大进展。这一进步是对数十亿个参数进行广泛训练和调整的结果,也是商业用途基准测试的结果。这项工作的起源可以追溯到1950年代,当时自然语言理解和处理的研究开始了。
晨曦_子画
·
2024-09-15 09:44
人工智能学习
人工智能
基于 LangChain 开发应用程序第三章-储存
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与
语言模型
交互时
明志刘明
·
2024-09-14 22:23
大模型学习手册
langchain
Upstage 将发布新一代 LLM “Solar Pro “预览版
加州圣何塞2024年9月11日电/美通社/–Upstage今天宣布发布其下一代大型
语言模型
(LLM)SolarPro的预览版。
吴脑的键客
·
2024-09-14 14:31
人工智能
人工智能
使用vllIm部署大
语言模型
使用vllm部署大
语言模型
一般需要以下步骤:一、准备工作1.系统要求-操作系统:常见的Linux发行版(如Ubuntu、CentOS)或Windows(通过WSL)。
添砖JAVA的小墨
·
2024-09-14 12:18
机器学习
OpenLM: 一个灵活的开源大
语言模型
接口工具
OpenLM:一个灵活的开源大
语言模型
接口工具引言在人工智能和自然语言处理快速发展的今天,大
语言模型
(LLM)已经成为许多应用的核心。
llzwxh888
·
2024-09-14 11:43
语言模型
人工智能
自然语言处理
python
使用中专API实现AI模型调用与部署
在AI技术领域,如何调用和部署大
语言模型
(LLM)是一个常见的需求。
llzwxh888
·
2024-09-14 11:42
人工智能
easyui
前端
python
大模型框架:vLLM
vLLM2.1使用GPU进行安装2.2使用CPU进行安装2.3相关配置三、使用vLLM3.1离线推理3.2适配OpenAI-API的API服务一、vLLM介绍vLLM是伯克利大学LMSYS组织开源的大
语言模型
高速推理框架
m0_37559973
·
2024-09-14 11:41
大模型
大模型
通义千问
Qwen
多模态大
语言模型
(MLLMs)-一般架构(非常详细)零基础入门到精通,收藏这一篇就够了
多模态大
语言模型
(MultimodalLargeLanguageModel,MLLM),在LLM原有的强大泛化和推理能力基础上,进一步引入了多模态信息处理能力。
程序员_大白
·
2024-09-14 11:40
语言模型
人工智能
自然语言处理
大规模
语言模型
从理论到实践 vLLM推理框架实践
大规模
语言模型
从理论到实践:vLLM推理框架实践1.背景介绍1.1问题的由来随着大规模
语言模型
(LargeLanguageModels,vLLMs)的发展,从简单的语言生成到复杂的多模态任务,这些模型的能力得到了显著提升
AGI通用人工智能之禅
·
2024-09-14 10:08
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用 Apache Cassandra 实现 LLM 缓存:提升 AI 应用性能的实用指南
使用ApacheCassandra实现LLM缓存:提升AI应用性能的实用指南引言在当今的AI驱动的应用程序中,大
语言模型
(LLM)扮演着越来越重要的角色。
afTFODguAKBF
·
2024-09-14 09:58
apache
缓存
人工智能
python
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他