E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态LLM
理论一、大模型—概念
大模型全称是大型语言模型(
LLM
,LargeLanguageModel),这个“大”主要指模型结构容量大,结构中的参数多,用于预训练大模型的数据量大。一个大模型可以
伯牙碎琴
·
2025-02-16 20:31
大模型
自然语言处理
ai
仿生机器人核心技术与大小脑
以下是针对仿生机器人核心技术的结构化总结,涵盖通用核心技术与**“大脑-小脑”专用架构**两大方向:一、机器人通用核心技术这些技术是仿生机器人实现功能的基础,与生物体的“身体能力”对应:1.感知与交互技术
多模态
传感器融合视觉
天机️灵韵
·
2025-02-16 19:53
人工智能
具身智能
硬件设备
机器人
人工智能
具身智能
如何使用DeepSeek训练模型
临床辅助诊疗:医患关系的连接桥梁:医疗科研的学术助手:医疗服务体系革新:医学影像诊断:药物研发:基层医疗能力提升:医疗机器人智能化:如何利用DeepSeek进行
多模态
数据分析?脑图使用De
LCG元
·
2025-02-16 18:17
大模型
人工智能
大语言模型常用微调与基于SFT微调DeepSeek R1指南
概述大型语言模型(
LLM
,LargeLanguageModel)的微调(Fine-tuning)是指在一个预训练模型的基础上,使用特定领域或任务的数据对模型进行进一步训练,以使其在该领域或任务上表现更好
知来者逆
·
2025-02-16 16:08
LLM
深度学习
人工智能
自然语言处理
DeepSeek
SFT
微调
InfiniteHiP - 在单个GPU上扩展
LLM
上下文至300万tokens
InfiniteHiP:ExtendingLanguageModelContextUpto3MillionTokensonaSingleGPUPaper:https://huggingface.co/papers/2502.08910Sourcecode:https://github.com/DeepAuto-AI/hip-attention/SGLangIntegrationavailablen
伊织code
·
2025-02-16 14:18
#
Paper
Reading
InfiniteHiP
推理
GPU
LLM
token
AIGC 实战:如何使用 Docker 在 Ollama 上离线运行大模型(
LLM
)
Ollama简介Ollama是一个开源平台,用于管理和运行各种大型语言模型(
LLM
),例如Llama2、Mistral和Tinyllama。它提供命令行界面(CLI)用于安装、模型管理和交互。
surfirst
·
2025-02-16 04:04
LLM
架构
AIGC
docker
容器
LLM
大模型
《DeepSeek Janus Pro 7B:
多模态
人工智能大模型部署全攻略》
《DeepSeekJanusPro7B:
多模态
人工智能大模型部署全攻略》引言:开启
多模态
AI新世界在科技飞速发展的当下,
多模态
AI已成为人工智能领域中最耀眼的明星,正以前所未有的速度改变着我们的生活与工作方式
空云风语
·
2025-02-16 03:57
神经网络
人工智能
深度学习
人工智能
清华大学KVCache.AI团队联合趋境科技联合的KTransformers开源项目为什么那么厉害
KTransformers是一个由清华大学KVAV.AI团队开发的开源项目,旨在优化大语言模型(
LLM
)的推理性能,特别是在有限显存资源下运行大型模型。
魔王阿卡纳兹
·
2025-02-16 03:52
IT杂谈
人工智能
科技
开源
清华
DeepSeek
趋境科技
KTransformers
LangChain开发【NL2SQL】应用(few-shot优化)
这篇文章来讲一下优化什么是few-shot使用这些少量的、调整后的样本对预训练模型进行微调其实就是给
LLM
少量示例关于few-shot的研究:https://medium.com/ubiai-nlp/step
向羿燃
·
2025-02-15 22:48
LangChain开发及生态
langchain
ai
人工智能
数据分析
大模型prompt实例:知识库信息质量校验模块
大模型相关目录大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、
多模态
等大模型应用开发内容从0起步,扬帆起航。
写代码的中青年
·
2025-02-15 22:45
大模型
prompt
人工智能
python
大模型
LLM
开源大模型性能追平闭源模型技术路径分析
核心差距量化指标能力维度闭源模型均值开源模型均值差距比例复杂推理(MMLU)86.7%79.2%8.7%代码生成(HumanEval)89.1%81.4%8.5%长文本理解(NarrativeQA)82.3%73.9%10.2%
多模态
理
Mr' 郑
·
2025-02-15 20:05
开源
【毕设专用】2025 AI
多模态
大模型 接入 合集
【ESP32接入国产大模型之kimi】https://vor2345.blog.csdn.net/article/details/140782934【ESP32接入国产大模型之MiniMax】https://vor2345.blog.csdn.net/article/details/136768206【ESP32接入国产大模型之豆包】https://vor2345.blog.csdn.net/ar
2401_84711588
·
2025-02-15 19:25
人工智能
零代码!只需3步用DeepSeek+Ollama+AnythingLLM打造免费AI本地专属知识库(含原理)
本文将拆解本地知识库的三大核心技术(嵌入模型/向量数据库/
LLM
智能问答),将详细介绍如何用DeepSeek+Ollama+AnythingLLM组合,无需任何编程基础,只需3步即可免费零代码搭建全流程私有化智能知识库
少喝冰美式
·
2025-02-15 15:22
人工智能
DeepSeek
DeepSeek
R1
ollama
AnythingLLM
AI
知识库
【开发日志】数字人+
LLM
:从概念到实现的全程记录!
数字人是各种技术的集合,所以文章尽可能完整的介绍,项目中涉及的大小模型均可在本地部署并在我本人机器上运行。系统环境:CPU:i91490016GBGPU:GTX40608GBSYS:Windows11WSL:Ubuntu22.04本文章使用到的技术内容:数字人框架:LiveTalking大模型:Llama3.1TTS:GPT-SoVits语音转视频:Wav2Lip前端展示:WebRTC项目整体架构
AI大模型-王哥
·
2025-02-15 13:11
大模型学习
大模型教程
大模型
人工智能
LLM
数字人
大模型入门
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代,大语言模型(LargeLanguageModel,
LLM
)的应用场景日益广泛。
MaxCode-1
·
2025-02-15 12:35
搭建本地gpt
Deepseek
23. AI-大语言模型
文章目录前言一、
LLM
1.简介2.工作原理和结构3.应用场景4.最新研究进展5.比较二、Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四
真上帝的左手
·
2025-02-15 12:34
23.
AI
人工智能
语言模型
自然语言处理
RWKV Runner:让RNN-
LLM
模型触手可及
在这个信息爆炸的时代,人工智能(AI)已经成为我们生活中不可或缺的一部分,尤其是大语言模型(
LLM
)在自然语言处理中的广泛应用。
步子哥
·
2025-02-15 11:57
rnn
人工智能
深度学习
使用CerebriumAI进行大规模语言模型的推理
传统的CPU在处理大规模语言模型(
LLM
)时效率较低,GPU成为了首选。然而,自行搭建GPU环境成本高昂且维护复杂。
qahaj
·
2025-02-15 07:54
语言模型
人工智能
自然语言处理
python
多模态
小样本学习颠覆传统!
小样本学习与
多模态
结合是当前人工智能领域的热门研究方向,旨在通过结合
多模态
数据(如视觉、语言、音频等)来提高模型在数据稀缺情况下的学习效率和性能。
沃恩智慧
·
2025-02-15 03:15
人工智能
深度学习
人工智能
学习
深度学习
AI大模型DeepSeek本地部署及使用
二:认识Ollama1.什么是OllamaOllama是一个开源的
LLM
(大型语言模型)服务工具
zy_xingdian
·
2025-02-15 02:41
行癫k8s教程
行癫Go教程
行癫ArgoCD系列
人工智能
Deepseek
AI
行癫
xingdian
云计算
ollama
[每日动态]科技新闻每日信息差2025年2月14日
####人工智能与计算智能国际会议(AICI2025)AICI2025于今日开幕,聚焦类脑计算和
多模态
大模型的前沿研究。会议吸
我的青春不太冷
·
2025-02-15 00:55
科技
焦损函数(Focal Loss)与RetinaNet目标检测模型详解
焦损函数(FocalLoss)与RetinaNet目标检测模型详解阅读时长:19分钟发布时间:2025-02-14近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
·
2025-02-14 22:31
人工智能
多模态
模型详解
多模态
模型是什么
多模态
模型是一种能够处理和理解多种数据类型(如文本、图像、音频、视频等)的机器学习模型,通过融合不同模态的信息来提升任务的性能。
换个网名有点难
·
2025-02-14 22:36
深度学习
人工智能
计算机视觉
DeepSeek与Python语言关系深度探索
文章目录一、技术整合逻辑二、案例分析**案例1:调用DeepSeekAPI实现智能问答系统****案例2:使用Python微调DeepSeek垂直领域模型****案例3:基于DeepSeek与Python的
多模态
应用开发
学堂在线
·
2025-02-14 18:08
人工智能
编程
python
开发语言
DeepSeek
DeepSeek从入门到精通:通用AI工具的技术实践指南
以下是其核心特性:国产化:完全自主研发的大模型免费开源:可商用且无授权限制
多模态
能力:支持文本、代码、图像等多种任务推理强化:在逻辑分析、数学推导等任务中表现突出2.DeepSeek能做什么?
星辰@Sea
·
2025-02-14 16:25
人工智能
其他
人工智能
deepseek
LLM
大模型中文开源数据集集锦(三)
文章目录1ChatGLM-Med:基于中文医学知识的ChatGLM模型微调1.1数据集1.2ChatGLM+P-tuningV2微调1.3Llama+Alpaca的Lora微调版本2LawGPT_zh:中文法律大模型(獬豸)2.1数据集2.1.1利用ChatGPT清洗CrimeKgAssitant数据集得到52k单轮问答:2.1.2带有法律依据的情景问答92k:2.1.3法律知识问答2.2模型3C
悟乙己
·
2025-02-14 13:01
付费-智能写作专栏
LLM大模型
开源
大模型
LLM
GPT
微调
大语言模型(
LLM
)快速理解
自2022年,ChatGPT发布之后,大语言模型(LargeLanguageModel),简称
LLM
掀起了一波狂潮。作为学习理解
LLM
的开始,先来整体理解一下大语言模型。
大模型猫叔
·
2025-02-14 13:59
语言模型
人工智能
自然语言处理
机器学习
大语言模型原理基础与前沿 通过稀疏MoE扩展视觉语言模型
而视觉语言模型(Vision-LanguageModels,VLMs)则通过结合视觉和语言信息,进一步提升了模型在
多模态
任务中
AI天才研究院
·
2025-02-14 12:52
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
[论文阅读] CLIP-based fusion-modal reconstructing hashing for large-scaleunsupervised cross-modal retri
摘要随着
多模态
数据的激增,人们不再满足于单一的数据检索模式来获取信息。深度哈希检索算法以其存储效率高、查询速度快等优点受到广泛关注。
2301_80732299
·
2025-02-14 10:39
论文阅读
2024-2025年主流的开源向量数据库推荐
2.Weaviate特点:云原生开源向量数据库,支持
多模态
数据(文本、
大囚长
·
2025-02-14 09:32
机器学习
大模型
开源
数据库
人工智能
LLM
大语言模型书籍教程推荐:《大模型时代》+《开源大模型食用指南》!附文档
哈喽大家好!很久都没有更新大模型这块的书了,今天给大家说一下这本:《大模型时代》,本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。《本书》深入探讨了大型模型时代的技术演进、应用场景和产业变革。生动地阐释了ChatGPT背后的工作原理,深入解析了这一推动技术和产业变革的关键力量书中对国内外大型模型产业的布局和发展趋势进行了剖析,并对潜在的风险和泡沫进行了预警。作者简介龙志勇:曾任阿里巴
Langchain
·
2025-02-14 09:32
人工智能
langchain
大模型
自然语言处理
大语言模型
LLM
AI大模型
探索DeepSeek:开源大模型领域的中国力量
在人工智能技术迅猛发展的今天,大语言模型(
LLM
)已成为全球科技竞争的焦点。来自中国的深度求索(DeepSeek)团队凭借其开源模型系列,正在为这一领域注入新的活力。
机器学习司猫白
·
2025-02-14 09:29
开源
云原生AI Agent应用安全防护方案最佳实践(上)
当下,AIAgent代理是一种全新的构建动态和复杂业务场景工作流的方式,利用大语言模型(
LLM
)作为推理引擎。
佛州小李哥
·
2025-02-14 08:56
AWS技术
AI安全
人工智能
亚马逊云科技
aws
ai
语言模型
安全
云计算
Ollama与Vllm使用对比与优劣
Ollama和vLLM是两个用于优化大型语言模型(
LLM
)推理的框架,它们在性能、资源利用率、部署复杂性等方面各有优劣。
魔王阿卡纳兹
·
2025-02-14 08:55
大模型知识札记
数据库
服务器
ollama
vllm
使用LangChain与OpenAI API进行向量嵌入和搜索的实战教程
技术背景介绍LangChain是一个用于构建大型语言模型(
LLM
)应用的强大工具集,能够帮助开发者快速构建智能应用。结合Ope
bBADAS
·
2025-02-14 06:06
langchain
python
开发语言
ViT:2 理解CLIP
若在某个环节出现卡点,可以回到大模型必备腔调或者
LLM
背后的基础模型新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步
庞德公
·
2025-02-14 05:33
具身智能
ViT
具身智能
深度学习
人工智能
transformer
ALBERT:轻量级的BERT,用于语言表征的自监督学习
ALBERT:轻量级的BERT,用于语言表征的自监督学习阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
·
2025-02-14 05:05
人工智能
DeepSeek与Web3:科技融合的新纪元
作为新一代
LLM
(大型语言模型),DeepSeek不仅在推理质量和成本上展现出优势,还重新定义了去中心化智能代理(AIAgent)的发展方向。
TechubNews
·
2025-02-14 04:25
web3
科技
一杯咖啡的时间学习大模型(
LLM
):LLaMA解读之旋转编码RoPE(含代码实现)
文章目录一、LLaMA的核心改进全景二、旋转位置编码(RoPE)2.1改进动机2.2数学原理2.3源码实现一、LLaMA的核心改进全景Meta开源的LLaMA模型凭借其卓越的性能表现成为大模型发展的重要里程碑。相较于标准Transformer架构,LLaMA主要在以下几个方面进行了关键改进:位置编码升级:采用旋转位置编码(RotaryPositionEmbedding,RoPE)归一化革新:对每个
Bug_makerACE
·
2025-02-14 02:52
llama
python
人工智能
nlp
pytorch
深度学习
transformer
Aider: 人工智能辅助编程的革命性工具
Aider是一个强大的AI辅助编程工具,它能让开发者在终端中与大型语言模型(
LLM
)进行结对编程,极大地提升编码效率和质量。让我们深入了解这个令人兴奋的项目,看看它如何改变着软件开发的未来。
2401_87189860
·
2025-02-14 02:20
人工智能
RAG中的双编码器与跨编码器模型
RAG中的双编码器与跨编码器模型阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【
·
2025-02-14 01:01
人工智能
深度学习-108-大语言模型
LLM
之基于langchain的结构化输出功能提取结构化信息
文章目录1langchain的结构化输出1.1推荐的使用流程1.2模式定义1.3返回结构化输出1.3.1工具调用(方式一)1.3.2JSON模式(方式二)1.3.3结构化输出法(方式三)2提取结构化信息2.1定义数据模型2.2配置提示模板2.3设置执行链3参考附录1langchain的结构化输出对于许多应用程序,例如聊天机器人,模型需要直接用自然语言响应用户。然而,在某些情况下,我们需要模型以结构
皮皮冰燃
·
2025-02-14 01:44
深度学习
深度学习
语言模型
langchain
真正通俗易懂的Langchain入门学习(一)
定义:基于语言模型(
LLM
)构建应用程序的框架。核心功能:连接
LLM
与外部数据/工具、管理对话流程、自动化复杂任务。典型应用场景:聊天机器人、文档问答、数据分析助手、自动化工作流。
caridle
·
2025-02-14 00:42
智能体
langchain
学习
数据库
AI Agent智能应用从0到1定制开发Langchain+
LLM
全流程解决方案与落地实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-
多模态
大模型,微调技术训练营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
多模态
大模型(LMMs)与大语言模型(LLMs)的比较
前言现在的大模型分为两大类:大语言模型(LargeLanguageModels,简称LLMs)和
多模态
大模型(LargeMultimodalModels,简称LMMs)。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
解码DeepSeek家族系列:大语言模型赛道上的黑马传奇
DeepSeek自成立之初,便专注于开发先进的大语言模型(
LLM
)及相关技术,致力于通过数据蒸馏技术提取更精炼、有用的数据,以提升模型性能。在发展历程中,DeepSeek
大F的智能小课
·
2025-02-13 22:52
语言模型
人工智能
自然语言处理
DeepSeek R1:开启AI推理新时代,强在哪里?
DeepSeekR1:开启AI推理新时代阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎
·
2025-02-13 20:19
人工智能
【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析:行内、内部与外部样式的区别与优先级分析
本次会议将探讨前沿技术,包括深度学习、
多模态
学习、图像和视频分析、3D重建等,以及其在智能交通、医疗影像、增强现实和自动化等多个实际应用中的创新转化。会议官网:www.acvra.org目录前言一、
禁默
·
2025-02-13 20:11
前端
学术会议
css
前端
从零开始大模型开发与微调:Miniconda的下载与安装
从零开始大模型开发与微调:Miniconda的下载与安装1.背景介绍随着人工智能和机器学习技术的快速发展,大型语言模型(LargeLanguageModel,
LLM
)已经成为当前研究和应用的热点。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预训练LayoutLMv3应用统一的文本-图像
多模态
Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他