E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理
知识蒸馏教程 Knowledge Distillation Tutorial
来自于:KnowledgeDistillationTutorial将大模型蒸馏为小模型,可以节省计算资源,加快
推理
过程,更高效的运行。
Qiming_v
·
2025-02-05 17:03
Distillation
蒸馏
昆仑天工SkyWork:更懂中文的AIGC开源模型
昆仑天工SkyWork系列AIGC开源模型,由奇点智源公司研发,在2022年12月发布,覆盖图像、文本、编程等多模态内容生成能力,包括绘画、文章续写、对话、中英翻译、内容风格生成、
推理
、诗词对联、代码补全等
AIGC探索家
·
2025-02-05 16:52
aigc
ai绘画
AI作画
stable
diffusion
chatgpt
nlp
人工智能
昆仑万维官宣开源2000亿稀疏大模型Skywork-MoE
6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时
推理
成本更低。
TMT星球
·
2025-02-05 16:50
人工智能
人工智能
国产AI大爆发!讯飞星火X1横空出世,直接“杀疯”成中文数学王者?
而今天要给大家介绍的这个主角——讯飞星火深度
推理
模型X1,那可是最近科技圈的一大热点。为啥它值得我们重视呢?要知道,中文数学能力在AI
盼达思文体科创
·
2025-02-05 15:15
经验分享
【LangChain编程:从入门到实践】代码实践
在早期,AI主要集中于基于规则的系统和专家系统,试图模拟人类的
推理
过程。然而,随着大数据时代的到来和计算能力的飞速提升,机器学习和深度学习技术开始占据主
AI天才研究院
·
2025-02-05 14:09
计算
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别
系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型训练与优化4.1YOLOv5配置文件4.2安装YOLOv5并开始训练4.3模型评估与优化车牌识别与
推理
2025年数学建模美赛
·
2025-02-05 12:20
深度学习
YOLO
人工智能
分类
ui
如何利用DeepSeek打造医疗领域专属AI助手?从微调到部署全流程解析
一、基座模型选型:医疗
推理
的黄金搭档1.1为什么选择DeepSeek-R1-Distill-Llama-8
明哲AI
·
2025-02-05 10:05
AIGC
人工智能
机器学习
Deepseek
大模型
怎么在家用笔记本上轻松部署和使用DeepSeek R1?
而且在数学、编程等领域表现出众,可处理复杂逻辑
推理
任务,如果你不了解蒸馏技术文末也会提供相关的拓展知识运行
程序员辣条
·
2025-02-05 10:32
人工智能
LLama
AI产品经理
大模型学习
大模型
DeepSeek
大模型部署
国内首个!百度成功点亮昆仑芯三代万卡集群,将于近日点亮3万卡集群
而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型
推理
四大方面,能为企业提供“多、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关
·
2025-02-05 09:50
深度学习
metagpt中ActionNode的用法
THINK_NODES类:4.ThinkAction类:5.SimplePrint类:6.Printer类:7.main函数:总结:主要执行流程:代码参考链接:整体流程实现一个基于节点(Node)结构和思维
推理
的系统
ZHOU_WUYI
·
2025-02-05 08:20
metagpt
metagpt
Ollama能本地部署Llama 3等大模型的原因解析(ollama核心架构、技术特性、实际应用)
文章目录前言1、Ollama的核心架构和技术能力1.1、高效模型加载和存储1.2、
推理
优化1.3、微调支持1.4、部署工具链2.、Llama3模型的技术特性2.1、模型架构2.2、模型性能3.
周杰伦_Jay
·
2025-02-05 03:19
大模型LLMs
llama
架构
transformer
深度学习
人工智能
数据结构
ChatGPT怎么回事?
纯属发现,调侃一下~这段时间deepseek不是特别火吗,尤其是它的
推理
功能,突发奇想,想用deepseek回答一些问题,回答一个问题之后就回复服务器繁忙(估计还在被攻击吧~_~)然后就转向了GPT,真的被笑到了
cimeo
·
2025-02-05 00:23
人工智能
chatgpt
人工智能
揭秘DeepSeek R1大模型:它如何像人类一样“思考”?
而近期备受关注的DeepSeekR1,凭借更高效的
推理
能力和更低能耗,成为行业焦点。今天,我们将深入它的“大脑”,看看它是如何工作的!
大模型扬叔
·
2025-02-04 20:00
学习
自然语言处理
prompt
人工智能
hugging
face怎么用
PyTorch中的In-place操作是什么?为什么要避免使用这种操作?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达导读In-place操作用在
推理
的时候可以显著节省内存,但是训练的时候一定要小心使用。
小白学视觉
·
2025-02-04 19:49
基于 FPGA 的 CNN 卷积神经网络整体实现
FPGA以其并行处理能力、低延迟和灵活性,是加速CNN
推理
的理想硬件平台。通过在FPGA上实现CNN,可以显著提高实时应用中的
推理
效率。应用使用场景实时图像识别:如智能手机摄像头中的面部识别。
鱼弦
·
2025-02-04 18:37
人工智能时代
fpga开发
cnn
人工智能
超级好用、超准文字识别框架----飞浆PaddlePaddleOCR(文件检测+识别)实战篇
目录简介项目介绍安装难点问题解决办法参数介绍模型
推理
调用简介飞桨(PaddlePaddle)OCR(OpticalCharacterRecognition)是一个开源的深度学习框架,用于文字识别任务。
数虫
·
2025-02-04 14:46
深度学习
人工智能
ocr
飞桨
QwQ-32B-Preview:阿里开源的顶尖AI
推理
模型详解
点击访问chatTools免费体验GPT最新模型,包括o1
推理
模型、GPT4o和Claude等模型!
that's boy
·
2025-02-04 14:45
人工智能
gpt
AI编程
AIGC
AI作画
chatgpt
阿里云
DeepSeek R1 AI 论文翻译
摘要原文地址:DeepSeekR1AI论文翻译我们介绍了我们的第一代
推理
模型,DeepSeek-R1-Zero和DeepSeek-R1。
·
2025-02-04 14:27
后端java
机器学习基本概念
人工智能(ArtificialIntelligence,AI)定义:模拟人类智能的技术和方法,包括学习、
推理
、感知等。
时不晴
·
2025-02-04 13:38
机器学习
人工智能
全场景深度学习开源框架(MindSpore)
无论是在数据中心的大规模计算,还是在手机、物联网设备等资源受限的终端上,MindSpore都能灵活适配,充分发挥各硬件平台的性能优势,实现模型的高效训练和
推理
。
deepdata_cn
·
2025-02-04 11:41
人工智能
深度学习
开源
人工智能
科技快讯 | OpenAI首次向免费用户开放
推理
模型;特朗普与黄仁勋会面;雷军回应“10后小学生深情表白小米SU7”
不用开口:谷歌AI帮你致电商家,价格、预约一键搞定谷歌在1月30日推出SearchLabs中的“AskforMe”实验性功能,用户可利用AI代替自己致电商家咨询价格和服务。该功能已与美汽车修理厂和美甲沙龙店合作,用户需加入SearchLabs并搜索相关短语进行测试。功能使用部分预订餐厅技术,目前处于测试阶段。我国光子毫米波雷达技术取得突破性进展,为6G技术应用奠定基础1月27日,据新华社报道,南开
最新科技快讯
·
2025-02-04 09:59
科技
LlamaIndex架构设计:大模型长期记忆模块竟暗藏图数据库玄机
这使得它们在需要长期记忆或复杂知识
推理
的任务中表现不佳。为了解决这一问题,越来越多的研究开始探索如何为大模型
威哥说编程
·
2025-02-04 08:52
数据库
llama
DeepSeek- R1 原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习(RL)的开源
推理
模型,其核心原理和特点如下:1.核心技术与架构强化学习驱动:DeepSeek-R1是首个完全通过强化学习训练的大型语言模型
kcarly
·
2025-02-04 08:50
大模型知识乱炖
杂谈
DeepSeek
R1
原理介绍
DeepSeek R1 AI 模型到底牛在哪里?
卓越的
推理
能力数学
推理
:在AIME2024数学竞赛中,DeepSeekR1取得了79.8%的pass@1得分,略微超过OpenAI-o1-1217。
老马啸西风
·
2025-02-04 06:04
java
DeepSeek R1 AI 论文翻译
摘要原文地址:DeepSeekR1AI论文翻译我们介绍了我们的第一代
推理
模型,DeepSeek-R1-Zero和DeepSeek-R1。
老马啸西风
·
2025-02-04 06:04
java
Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型,旨在以更少的参数和计算量实现更高的准确率
高效计算:使用MoE架构,40B总参数中仅有3.7B激活参数,训练计算消耗仅为同规模密集模型的9.25%,
推理
成本与3.7B参数的密集模型相当。
东方佑
·
2025-02-04 06:01
量子变法
架构
语言模型
人工智能
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现
推理
加速的正确姿势(一)
一、前言在当今人工智能技术迅猛发展的时代,各类人工智能模型如雨后春笋般不断涌现,其性能的优劣直接影响着应用的广度与深度。从自然语言处理到计算机视觉,从智能安防到医疗诊断,AI模型广泛应用于各个领域,人们对其准确性、稳定性和高效性的期望也与日俱增。在此背景下,DeepSeek模型的出现为行业带来了新的曙光。DeepSeek团队开发的DeepSeek-R1-Distill-Qwen-7B模型,利用蒸馏
开源技术探险家
·
2025-02-04 05:54
开源模型-实际应用落地
#
人工智能
自然语言处理
语言模型
深度学习
人机交互、人机界面设计与测评
随着科技发展和信息化程度的不断推进,人机交互已成为产品中重要的组成部分,是操作者信息获取、
推理
、判断和决策的重要操作平台,其设计的好坏直接影响到系统性能的发挥。
·技术匠心·
·
2025-02-04 03:41
人机交互
交互
ui
ux
信息可视化
OpenAI开源战略反思:中国力量推动AI产业变革
这场历时三小时的对话揭示了诸多行业动向:OpenAI承认其闭源策略正面临市场考验,深度求索等中国企业的开源生态已形成差异化竞争优势新一代o3
推理
模型将突破性展示思维链,这被视为对R
·
2025-02-04 00:43
【memgpt】letta 课程1/2:从头实现一个自我编辑、记忆和多步骤
推理
的代理
llms-as-operating-systems-agent-memoryllms-as-operating-systems-agent-memory内存操作系统的内存管理
等风来不如迎风去
·
2025-02-03 23:06
AI入门与实战
java
android
数据库
letta
DeepSeek R1 AI 论文翻译
摘要原文地址:DeepSeekR1AI论文翻译我们介绍了我们的第一代
推理
模型,DeepSeek-R1-Zero和DeepSeek-R1。
·
2025-02-03 20:09
后端java
DeepSeek R1 AI 模型到底牛在哪里?
卓越的
推理
能力数学
推理
:在AIME2024数学竞赛中,DeepSeekR1取得了79.8%的pass@1得分,略微超过OpenAI-o1-1217。
·
2025-02-03 20:07
后端java
Reinforcement Learning 通过强化学习激励大型语言模型的
推理
能力
主要技术:1.强化学习(RL)核心是强化学习技术,像训练小狗一样,当模型做出正确的
推理
步骤或得到正确的
davenian
·
2025-02-03 18:56
评论
语言模型
人工智能
深度学习
DeepSeek
【unstructured】针对unstructured的pdf提取的hi_res策略不能够连接huggingface.co下载模型的问题而选择本地化模型
推理
部署的方法
目录unstructuredpdfhi_res策略本地
推理
部署说明python3.9虚拟环境准备安装miniconda创建一个conda-env环境安装unstructured背景知识安装步骤安装detectron2
phillihp
·
2025-02-03 18:24
llm
python
深度学习
pdf
llama
langchain
大模型低显存
推理
优化-Offload技术
[大模型
推理
优化技术-KVCache][大模型
推理
服务调度优化技术-Continuousbatching]大模型显存优化技术-PagedAttention大模型低显存
推理
优化-Offload技术大模型优化技术
AI大模型-大飞
·
2025-02-03 15:04
java
spring
前端
大模型学习
大模型
AI大模型
大模型教程
OpenAI紧急加播:ChatGPT上新深度搜索,持续思考30分钟输出1万字,刷榜“人类最后的考试”
ChatGPT上新“DeepResearch”,把
推理
大模型的思考能力用于联网搜索。据介绍,DeepResearch功能可在数十分钟完成人类专家需要几个小时的复杂研究任务。
·
2025-02-03 12:30
量子位
Megatron:深度学习中的高性能模型架构
Megatron:深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大规模预训练模型框架,主要针对大规模Transformer架构模型的高效训练与
推理
。
gs80140
·
2025-02-03 08:06
基础知识科谱
AI
机器学习
人工智能
第二篇:多模态技术突破——DeepSeek如何重构AI的感知与认知边界
——从跨模态对齐到因果
推理
的工程化实践在AI技术从单一模态向多模态跃迁的关键阶段,DeepSeek通过自研的多模态融合框架,在视觉-语言-语音的联合理解与生成领域实现系统性突破。
python算法(魔法师版)
·
2025-02-03 02:51
动态规划
kimi o1和deepseek o1对比,非常直观!
刘俊是丁师兄大模型2025年01月25日21:34湖北两家凑巧同一天放出了解题
推理
模型,简单对比着看了下实现方案,o1类模型实现并没有和大家早期推测的那样用上MCTS,PRM这些方法,个人感觉也是太复杂的方法
AI生成曾小健
·
2025-02-03 02:46
LLM大语言模型
人工智能
DeepSeek-V2:强大、经济、高效的专家混合语言模型
gitcode.com/gh_mirrors/de/DeepSeek-V2项目介绍DeepSeek-V2是一款强大的专家混合(Mixture-of-Experts,MoE)语言模型,以其经济高效的训练和
推理
能力著称
乌芬维Maisie
·
2025-02-03 01:12
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
目录1.各个模型架构2.训练方式3.模型参数与规模4.应用场景5.性能表现6.发布时间7.价格1.各个模型架构DeepSeek-R1:未明确有特殊架构说明,但属于
推理
模型,可能在Transformer架构基础上针对
推理
做了优化
fpga和matlab
·
2025-02-03 01:12
前言技术汇集
#
人工智能
大模型
DeepSeek
o1、GPT4、GPT4o 这三个有什么区别?
核心观点:GPT-4擅长文本处理和
推理
,GPT-4o主打多模态交互,而O1则专注于深度
推理
和逻辑分析,三者各有侧重,应用场景也大不相同。
开心的AI频道
·
2025-02-02 19:54
人工智能
ONNX
推理
warning: TensorRT does not natively support INT64. Attempting to cast down to INT32.
只想用ONNX进行模型
推理
,加载时报Warning,加载模型时间也特别长。
paradoxjun
·
2025-02-02 18:48
人工智能
【DeepSeek全解析】最全面的问答指南,一文读懂!
它出身不凡,背后有量化私募巨头幻方支持,曾因储备万张A100芯片引人瞩目,后凭DeepSeekV2开源模型引爆大模型价格战,以超低
推理
成本震撼行业,让大厂纷纷跟进。
程序员辣条
·
2025-02-02 18:17
人工智能
大模型
大模型教程
大模型学习
大模型入门
AI
程序员
如何本地部署DeepSeek?DeepThink R1 本地部署全攻略:零基础小白指南。
离线运行AI,免费使用OpenAI级别
推理
模型本教程将手把手教你如何在本地部署DeepThinkR1AI模型,让你无需联网就能运行强大的AI
推理
任务。无论你是AI新手还是资深开发者,都可以轻松上手!
白马区块Crypto100
·
2025-02-02 14:21
Solana
AI
套利策略交易
人工智能
deepseek
DeepSeek
AI助手
OpenAI发布最新
推理
模型o3-mini
OpenAI于周五推出了新的AI"
推理
"模型o3-mini,这是该公司o系列
推理
模型家族的最新成员。OpenAI此前在12月份就预告过这个模型,同时还展示了一个能力更强的系统o3。
Him__
·
2025-02-02 13:11
人工智能
chatgpt
Deepseek
白话DeepSeek-R1论文(三)| DeepSeek-R1蒸馏技术:让小模型“继承”大模型的
推理
超能力
DeepSeek-R1蒸馏技术:让小模型“继承”大模型的
推理
超能力当大模型成为“老师”,小模型也能变“学霸”想象一下,一位经验丰富的数学老师(大模型)将自己解题的思维过程一步步拆解,手把手教给学生(小模型
明哲AI
·
2025-02-02 11:58
AIGC
人工智能
机器学习
深度学习
大模型
Deepseek
算法
蒸馏
开源LLMs导览:工作原理、顶级LLM列表对比
2.1预训练2.2代币化2.3开源LLM的微调2.4输入编码2.5训练与优化2.6
推理
三、开源LLM对组织的好处3.1增强的数据安全和隐私3.2节约成本3.3减少供应商依赖性3.4代码透明度四、哪种LLM
万俟淋曦
·
2025-02-01 23:11
Some
Insights
人工智能
AI
生成式人工智能
大模型
LLM
chatgpt
大语言模型
看深度求索如何思索自己的未来
其公布的训练效率提升数据(30%时间缩短、50%
推理
加速)若经第三方验证,可能重构行业技术标准。对比谷歌TPU+JAX框架实现的20%效率提升,深度求索的技
tuan_zhang
·
2025-02-01 19:11
东方艾艾与探宇计划
绝密芯片计划
战略欺骗
太空探索
人工智能
算法攻坚
工业软件
本地部署 DeepSeek 模型并使用 WebUI 调用
环境准备在开始之前,请确保你的系统满足以下要求:Python3.11或更高版本pip包管理工具DeepSeek模型的本地部署文件GPU支持(可选,用于加速模型
推理
)步骤1:本地部署Deep
我喜欢就喜欢
·
2025-02-01 17:22
技术文档
策略模式
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他