E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态LLM
【有啥问啥】深入了解 FlashMLA:Hopper GPU 的高效 MLA 解码内核
深入了解FlashMLA:HopperGPU的高效MLA解码内核简介在人工智能(AI)领域,特别是大型语言模型(
LLM
)领域,对计算效率和速度的需求持续增长。
有啥问啥
·
2025-02-28 09:12
大模型
行业调研
科普
算法
语言模型
【LangChain编程:从入门到实践】实现
多模态
代理
【LangChain编程:从入门到实践】实现
多模态
代理作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:LangChain编程,
多模态
代理,自然语言处理
AI天才研究院
·
2025-02-28 08:29
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的
LLM
推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(
LLM
)的推理能力。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
比如,某顶尖
LLM
在回答以下问题时出现了自相矛
步子哥
·
2025-02-28 07:19
人工智能
《AI 大模型 ChatGPT 的传奇》
《AI大模型ChatGPT的传奇》——段方某世界100强企业大数据/AI总设计师教授北京大学博士后助理:1三6三二四61四五41AI大模型的概念和特点1.1什么是”大模型、
多模态
“?
武昌库里写JAVA
·
2025-02-28 04:33
面试题汇总与解析
课程设计
spring
boot
vue.js
算法
数据结构
GPT-4提示词冠军如何写 prompt:CO-STAR 框架、文本分段、系统提示
©上下文:为任务提供背景信息通过为大语言模型(
LLM
)提供详细的背景信息,可以帮助它精确理解讨论的具体场景,确保提供的反馈具有相关性。
天涯倦客的美丽人生
·
2025-02-28 04:58
prompt
数据库
大模型专栏博文汇总和索引
大模型专栏主要是汇总了我在学习大模型相关技术期间所做的一些总结和笔记,主要包括以下几个子专栏:DeepSeek-R1AIGC大模型实践Transformer
多模态
系统视频理解对比学习目标检测目标跟踪图神经网络大模型专栏汇总了以上所有子专栏的论文
Donvink
·
2025-02-28 03:53
大模型
transformer
深度学习
人工智能
语言模型
游戏语音趋势解析,社交互动有助于营造沉浸式体验
语音交互的新架构出现2024年标志着对话语音AI取得了突破,出现了结合STT→
LLM
→TTS模型来聆听、推理和回应对话的协同语音系统。
网易数智
·
2025-02-28 03:22
IM即时通讯
游戏
人工智能
音视频
实时音视频
信息与通信
语音识别
大模型替代程序猿?不可能,绝对不可能!进化路线来了来!!!
大模型后端开发面试指南:技术体系构建与实践路线一、背景说明随着大模型(
LLM
)技术进入工业化落地阶段,行业对大模型后端开发工程师的需求呈现爆发式增长。
XiaoDuofCSDN
·
2025-02-28 03:48
算法
leetcode
职场和发展
java
分布式
深度学习
神经网络
阿里重磅模型深夜开源;DeepSeek宣布开源DeepGEMM;微软开源
多模态
AI Agent基础模型Magma...|网易数智日报
阿里重磅模型深夜开源:表现超越Sora、Pika,消费级显卡就能跑2月26日,25日深夜阿里云视频生成大模型万相2.1(Wan)正式宣布开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。据阿里云官方介绍,14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相
网易数智
·
2025-02-28 03:16
网易数智日报
开源
人工智能
大数据
业界资讯
ai
AIGC
DeepSeek智能引擎:高效重塑创作与开发
内容概要DeepSeek智能引擎通过创新的混合专家架构(MixtureofExperts),在670亿参数规模下实现了
多模态
智能处理能力的突破性进展。
智能计算研究中心
·
2025-02-28 02:44
其他
跨框架模型演进与行业应用路径
本文系统性梳理TensorFlow、PyTorch、MXNet等主流框架的技术发展脉络,重点分析其从通用计算架构向
多模态
、轻量化方向的转型路径。
智能计算研究中心
·
2025-02-28 02:44
其他
金融风控与医疗影像算法创新前沿
医疗影像诊断领域则依托三维卷积神经网络(3D-CNN)架构,实现了对CT、MRI等
多模态
影像的精准病灶分割,诊断准确率较传统方法提升23.6%。
智能计算研究中心
·
2025-02-28 02:44
其他
通过vLLM部署
LLM
模型到生产环境中
文章目录1使用vLLM部署模型2部署过程2.1准备GPU环境2.2安装vLLM依赖项3使用vLLM部署模型并启动服务3.1部署开源模型3.2部署微调模型4测试服务是否正常运行5评估服务性能1使用vLLM部署模型本地部署模型主要包含下载模型、编写模型加载代码和发布为支持API访问的应用服务这三个步骤。这个过程通常伴随较高的人工部署成本,vLLM可以用来简化这一流程。它是一个专为大模型推理设计的开源框
MichaelIp
·
2025-02-28 01:04
人工智能实验室
大语言模型
人工智能
python
AIGC
自然语言处理
语言模型
prompt
llama
UnionLLM——通过统一接口调用国内外所有
LLM
的Python开源工具包
最近忙里偷闲和公司前端小伙伴一起撸了一个Python开源项目——UnionLLM。这是一个通过与OpenAI兼容的统一方式调用各种国内外各种大语言模型和Agent编排工具的轻量级开源工具包。我们开发它的起因是因为在实际项目中,经常需要调用多个大语言模型的API,但是国内每个大语言模型的接口和参数都不一样,这给我们的工作带来了很大的困扰和额外的成本。UnionLLM的目标是通过统一且容易扩展的方式连
everfly
·
2025-02-28 00:57
python
github
字节的豆包和Kimi 的优劣势对比
DeepSeek)三款AI助手的对比分析,涵盖核心技术、功能特性、优劣势及适用场景.1.核心能力对比维度豆包(字节跳动)Kimi(月之暗面)DeepSeek(深度求索)技术基础基于字节自研云雀大模型,
多模态
能力突出
eso1983
·
2025-02-27 23:14
java
python
算法
手把手教你用Docker部署Dify平台,打造可视化
LLM
应用环境
“Dify是一款开源的大语言模型(
LLM
)应用开发平台。它融合了后端即服务(BackendasService)和LLMOps的理念,使开发者可以快速搭建生产级的生成式AI应用。
脱泥不tony
·
2025-02-27 22:40
自然语言处理
AI大模型
LLM
人工智能
大语言模型
语言模型
Dify
DeepSeek应用领域全景解析:驱动产业智能化升级的六大核心方向
作为国产大模型的标杆产品,DeepSeek凭借其万亿级参数规模、MoE混合专家架构和
多模态
交互能力,正在重构产业智能化升级的技术路径。
量子纠缠BUG
·
2025-02-27 21:32
DeepSeek部署
AI
DeepSeek
人工智能
AI编程
深度学习
DeepSeek全栈接入指南:从零到生产环境的深度实践
其核心能力体现在:1.1.1
多模态
智能引擎自然语言处理:支持文本生成(NLG)、语义理解(NLU)、情感分析等计算机视觉:提供图像分类、目标检测、OCR识别等CV能力语音交互:包含语音识别(ASR)、语音合成
量子纠缠BUG
·
2025-02-27 21:30
DeepSeek部署
AI
DeepSeek
人工智能
深度学习
机器学习
微调
LLM
(RLHF + DPO)
微调
LLM
(RLHF+DPO)使用强化学习(RL)根据人类反馈微调大语言模型(即RLHF)的方法,以及一种更有效的改进方法(即DPO)。
·
2025-02-27 21:56
人工智能
大模型安全 | “创造未来,安全同行” 北京站·第九期「度安讲」 技术沙龙开放报名
本次沙龙将由行业领军专家,深入探讨
多模态
、终端大模型等前沿领域的安全议题,从防护机制、评测体系、落地实践等维度展开分享,旨在通过专业对话与经验分享,共同描绘大模型安全发展蓝图。
·
2025-02-27 21:23
大模型
让
LLM
来评判 | 设计你自己的评估 prompt
设计你自己的评估prompt这是让
LLM
来评判系列文章的第三篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示通用prompt设计建议我总结的互联网上通用
·
2025-02-27 21:49
人工智能llmprompt
2025,AI变现有哪些机遇与挑战?
大模型的能力边界在不断拓宽,主流云端大模型普遍具备了
多模态
推理能力。技术路线上,也不再局限于算力堆叠,而是探索强化学习、符号推理、类脑计算等新路径。
Imagination官方博客
·
2025-02-27 19:41
人工智能
探索 LangChain: 架构、组件和应用
介绍每个组件及其用途:1.ModelModel组件是LangChain的核心,它抽象并提供了大语言模型(
LLM
)的接口。
田猿笔记
·
2025-02-27 17:23
LangChain
langchain
人工智能
大数据最全大模型入门到应用——LangChain:索引(Indexes)-[文本分割器
总目录LangChain系列文章:基础知识快速入门安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型模型(Models)基础知识大型语言模型(LLMs)基础知识
LLM
2401_84182507
·
2025-02-27 17:22
程序员
langchain
大模型入门到应用——LangChain:索引(Indexes)-[文本分割器(2)
快速入门安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型模型(Models)基础知识大型语言模型(LLMs)基础知识
LLM
的异步API、自定义
LLM
包装器、虚假
2301_78399616
·
2025-02-27 17:21
程序员
langchain
LangChain:Models、Prompts、Indexes、Memory、Chains、Agents。MaxKB
Models(模型):指代各类大语言模型(
LLM
),是提供语言处理和生成能力的基础。如
ZhangJiQun&MXP
·
2025-02-27 16:21
2021
AI
python
2024大模型以及算力
教学
langchain
人工智能
自然语言处理
语言模型
神经网络
自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数
LLM
(教程含源码)
我之前在Medium上写过一篇博客,介绍如何使用LLaMA架构从头开始创建一个具有超过230万个参数的
LLM
。现在LLaMA-3已经发布,我们将以更简单的方式重新创建它。
知识大胖
·
2025-02-27 10:33
NVIDIA
GPU和大语言模型开发教程
python
llama
开发语言
基于OneAPI+ChatGLM3-6B+FastGPT搭建
LLM
大语言模型知识库问答系统
搭建大语言模型知识库问答系统部署OneAPI拉取镜像bash复制代码dockerpulljustsong/one-api创建挂载目录bash复制代码mkdir-p/usr/local/docker/oneapi启动容器bash复制代码dockerrun--nameone-api-d--restartalways-p3001:3000-eTZ=Asia/Shanghai-v/usr/local/do
闯江湖50年
·
2025-02-27 09:31
oneapi
语言模型
人工智能
llama
langchain
gpt
自然语言处理
大语言模型(
LLM
)入门学习路线图,附资源汇总,收藏这篇就够了
Github项目上有一个[大语言模型学习路线笔记]“大语言模型学习路线笔记”),它全面涵盖了大语言模型的所需的基础知识学习,
LLM
前沿算法和架构,以及如何将大语言模型进行工程化实践。
AI小白熊
·
2025-02-27 06:34
语言模型
学习
人工智能
ai
transformer
深度学习
基于MatrixOS的
多模态
数据智能平台:技术架构与实现路径
矩阵起源公司推出的MatrixOS,一个基于MatrixDC、MatrixOne和MatrixGenesis的
多模态
数据智能平台,为这一挑战提供了创新的解决方案。
ITPUB-微风
·
2025-02-27 05:55
架构
多模态
|开源
多模态
模型Emu3 &
多模态
预训练模型CLIP对比
Emu3官方介绍我们推出了Emu3,这是一套新的最先进的
多模态
模型,仅使用next-token预测进行训练!通过将图像、文本和视频分词到一个离散空间中,我们在
多模态
序列的混合上从头开始训练单个转换器。
产品媛Gloria Deng
·
2025-02-27 03:08
AI之眼
人工智能
AI
多模态
预训练模型
CLIP
LLMs之ReACT-Agent:ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让
LLM
稳定输出JSON格式数据)之详细攻略
LLMs之ReACT-Agent:ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让
LLM
稳定输出JSON格式数据)之详细攻略目录相关文章
一个处女座的程序猿
·
2025-02-27 00:46
RAG_Agent
NLP/LLMs
资深文章(前沿/经验/创新)
Agent
ReACT
【Python大语言模型系列】如何在LangChain中使用ReAct构建AI Agent(案例+源码)
一、引言========当前,在各个大厂纷纷卷
LLM
的情况下,各自都借助自己的
LLM
推出了自己的AIAgent,比如字节的Coze,百度的千帆等,还有开源的Dify。你是否想知道其中的原理?
脱泥不tony
·
2025-02-27 00:12
人工智能
python
语言模型
自然语言处理
AI大模型
LangChain
Agent
GGUF 文件格式全解析
随着大语言模型(
LLM
)的广泛应用,如何高效地存储和加载这些复杂的模型成为一个亟待解决的问题。
Just_Paranoid
·
2025-02-26 22:25
技术流Clip
LLM
GGUF
量化
DeepSeek
AI推介-
多模态
视觉语言模型VLMs论文速览(arXiv方向):2024.07.20-2024.07.25
文章目录~1.LPGen:EnhancingHigh-FidelityLandscapePaintingGenerationthroughDiffusionModel2.HighEfficiencyImageCompressionforLargeVisual-LanguageModels3.Q-Ground:ImageQualityGroundingwithLargeMulti-modalityM
小小帅AIGC
·
2025-02-26 21:19
VLM论文时报
人工智能
语言模型
自然语言处理
大语言模型
VLM
视觉语言模型
论文推送
ThinkJSON:通过强化学习让大型语言模型(
LLM
)严格遵守JSON模式
标题:ThinkInsidetheJSON:ReinforcementStrategyforStrictLLMSchemaAdherence作者:BhavikAgarwal,IshanJoshi,ViktoriaRojkova机构:MasterControlAIResearch链接:arXiv:2502.14905v1本文提出了一种轻量级强化学习框架,通过合成数据、多奖励函数和GRPO优化,显著提
AI仙人掌
·
2025-02-26 20:17
人工智能
深度学习
(5-2-01)DeepSeek
多模态
大模型架构:Janus模型(1)
5.2Janus模型Janus
多模态
模型的设计核心在于视觉编码的解耦。
码农三叔
·
2025-02-26 20:44
训练
RAG
多模态)
架构
人工智能
transformer
Deepseek
大模型
多模态
全面分析 DeepSeek 的新开源 FlashMLA
这一进展对于大型语言模型(
LLM
)来说意义重大,因为大型语言模型在推理过程中面临内存和计算方面的挑战,尤其是长序列。
X.Cristiano
·
2025-02-26 19:34
FlashMLA
深度学习
人工智能
Google搜索免费API访问
背景最近做Agent相关的内容,想利用
LLM
结合搜索的能力,然后根据自定义functioncall输出答案。
X.Cristiano
·
2025-02-26 19:04
ai
搜索引擎
DeepSeep开源周,第三天:DeepGEMM是啥?
对开发者的用处性能提升优化计算密集型任务(如
LLM
训练/推理),降低延迟,提升吞吐量。支持混合精度计算
程序员差不多先生
·
2025-02-26 19:33
pytorch
推荐:LangChain — 构建情境感知推理应用的利器
BuildingapplicationswithLLMsthroughcomposability⚡项目地址:https://gitcode.com/gh_mirrors/la/langchainLangChain,一款专为开发基于大型语言模型(
LLM
成婕秀Timothy
·
2025-02-26 19:33
超声波俱乐部:AI应用大爆发前夜,场景、闭环与
LLM
进化
7月13日,第十九期超声波俱乐部内部分享会在北京望京举行,本期的主题是:AI应用大爆发前夜,场景、闭环与
LLM
进化。
超声波沙龙
·
2025-02-26 19:02
人工智能
算法
机器学习
有哪些开源大数据处理项目使用了大模型
**RedPajama**:这是一个开源项目,使用了
LLM
大语言模型数据处理组件,对GitHub代码数据进行清洗和处理。具体流程包括数据清洗、过滤低质量样本、识别和删除重复样本等步骤。2.
魔王阿卡纳兹
·
2025-02-26 19:02
大数据治理与分析
开源
大数据
数据清洗
什么是RAG?RAG是如何解决问题的?RAG的未来发展趋势有哪些?
一、什么是RAG所谓RAG,检索增强生成(RetrievalAugmentedGeneration),简称RAG,已经成为当前最火热的
LLM
应用方案。
大模型综述
·
2025-02-26 18:31
人工智能
开发语言
大模型
AGI
ai
RAG
自然语言处理
ChatGPT版本差异分析大全
1.核心功能差异
多模态
支持:GPT-4o支持文本、图像和音频的
多模态
输入与处理,适合需要结合多种媒体形式的任务(如设计、多媒体内容生成)。
爱吃青菜的大力水手
·
2025-02-26 17:26
chatgpt
人工智能
IPEX-
LLM
: 英特尔硬件大语言模型加速库部署
IPEX-
LLM
:英特尔硬件大语言模型加速库部署大语言模型的本地部署正成为一个热门话题。
Felix_bin
·
2025-02-26 17:23
语言模型
人工智能
自然语言处理
DeepSeek各模型现有版本对比分析
文章目录一、基础模型系列:V1到V3的演进二、专用模型系列:推理与
多模态
三、版本选型与商业化趋势DeepSeek作为最近特别火爆的模型,本文将对DeepSeek现有的主要版本进行对比分析,涵盖参数规模、
墨染夜雨笺
·
2025-02-26 17:22
DeepSeek
AI
在Intel GPU上使用IPEX-
LLM
进行本地BGE嵌入
Intel的IPEX-
LLM
是一种专门为IntelCPU和GPU优化的PyTorch库,能够在包括本地PC上的集成显卡和独立显卡(如Arc、Flex和Max)在内的Intel硬件上以极低的延迟运行大型语言模型
shuoac
·
2025-02-26 16:16
python
使用 LangChain 与 Solar
LLM
的快速集成示例
在本篇文章中,我们将深入探讨如何通过LangChain框架与SolarLLM(已弃用)进行集成。这虽然是一个过时的示例,但仍然可以帮助我们掌握如何使用类似的模型连接器设计结构化的语言模型调用流程。更重要的是,我们还会通过实际代码,展示集成的实现过程。一、技术背景介绍LangChain是一个强大的框架,它可以帮助开发者轻松集成不同的自然语言处理(NLP)模型,并构建复杂的链式推理任务。SolarLL
qahaj
·
2025-02-26 16:15
langchain
python
开发语言
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他