E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理侦测
基于问答对的实体识别和意图识别的知识图谱问答
推理
问答对数据questionanswer省直医保的参保范围是什么?中央直属、省直属在哈尔滨的机关、事业单位、社会团体及其职工和退休人员。参加省直医保的单位缴费基数如何确定和缴纳?在职职工(以下简称职工)个人月缴费基数按本人上年度月平均工资确定,由单位代扣代缴,用人单位月缴费基数按本单位参保职工个人月缴费基数之和确定。缴费费率:用人单位8%(含生育0.5%)、职工个人2%。缴费方式:用人单位、职工按月
风清扬【coder】
·
2025-03-01 21:04
自然语言分析处理
知识图谱
人工智能
自然语言处理
英特尔开发板试用:结合OAK深度相机进行评测
最近英特尔官方发布了一篇文章:主要介绍了如何将英特尔开发板(小挪吒)与OAK深度相机结合使用,并通过OpenVINO™工具套件进行开发和性能评测OAK相机:作为深度数据采集的核心设备,其深度测距功能与OpenVINO™
推理
相结合
OAK中国_官方
·
2025-03-01 20:56
数码相机
第十五个问题-什么是CoT?
Chain-of-Thought(CoT)思维链技术详解一、核心概念Chain-of-Thought(思维链)是一种通过引导大语言模型展示逐步
推理
过程来提升复杂问题解决能力的技术。
释迦呼呼
·
2025-03-01 20:53
AI一千问
算法
人工智能
语言模型
机器学习
深度学习
MeanShift聚类分割算法
下面详细介绍该算法的数学原理和每一步的
推理
公式。1.密度估计MeanShift算法通过核密度估计(
点云学习
·
2025-03-01 19:18
c++
pcl点云处理
聚类
算法
pcl
点云处理
PCL
3D视觉
DeepSeek突袭公布成本利润率:545%
就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1
推理
系统。
·
2025-03-01 18:29
量子位
“下一代
推理
王者”能否再掀AI浪潮?
“下一代
推理
王者”能否再掀AI浪潮?最近,AI圈内最火的话题,莫过于DeepSeek即将推出的R2模型了。
that's boy
·
2025-03-01 16:02
人工智能
chatgpt
openai
DeepSeek
DeepSeek-R2
DeepSeek-R1
AI编程
【vLLM 学习】使用 Neuron 安装
vLLM是一款专为大语言模型
推理
加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
HyperAI超神经
·
2025-03-01 14:47
vLLM
vLLM
开源
人工智能
深度学习
源代码
GPU
机器学习
AI大模型-提示工程学习笔记21-图提示 (Graph Prompting)
1.图提示的核心思想(1)传统提示的局限性(2)GraphPrompting的解决方案2.GraphPrompting的工作流程(1)图构建(2)图选择/子图提取(3)图编码(4)提示构建(5)LLM
推理
与生成
9命怪猫
·
2025-03-01 12:30
AI
人工智能
学习
大模型
ai
prompt
Amazon SageMaker 批量转换中的 JSON 处理技巧
背景介绍AmazonSageMaker提供了强大的批量转换功能,允许我们对大量数据进行
推理
。这在处理大规模数据集时非常有用。然而,当我们尝试将批量策略从SingleRecord切换到MultiRec
t0_54coder
·
2025-03-01 03:50
json
个人开发
人类驾驶的人脑两种判断模式(反射和预判)-->自动驾驶两种AI模式
另一种模式是物理时空图式
推理
模式,判断是基于预判预测,人脑把物理世界的物理动态时空规则(规律)图像已经编码为脑内符号(语言或图式)系统,通过预判预测的思维链
推理
过程(语言符号或物理时空图式的
推理
运算,映射
推理
出了物理世界的后续时空图像
liron71
·
2025-03-01 02:14
人工智能
机器学习
DeepSeek技术全景解析:架构创新与行业差异化竞争力
深度优化的MoE架构:结合256个路由专家与1个共享专家,实现稀疏激活机制(每个Token仅激活8个专家),在代码生成任务中
推理
速度提升40%。混合模态支持:支持文本、代码、数学符号
二进制coder
·
2025-03-01 01:40
人工智能
架构
AGI
AI
DeepSeek入门:安装与配置
,以下是不同版本的硬件要求:DeepSeek-R1-1.5B:CPU:最低4核(推荐Intel/AMD多核处理器)内存:8GB+硬盘:3GB+存储空间(模型文件约1.5-2GB)显卡:非必需(纯CPU
推理
梦落青云
·
2025-03-01 01:08
deepseek
大模型研究:DeepSeek三个版本(初级中级高级)资源要求说明
DeepSeek-LLM6.7B三个版本模型所需硬件资源的介绍:DeepSeek-LLM6.7B最小最基础版本1.内存(RAM)非量化运行时,由于模型参数数量相对较少,大约需要13GB-14GB的系统内存来加载模型和进行基本
推理
程序猿学长
·
2025-03-01 01:08
大模型
人工智能
语言模型
DeepSeek 最新发布 DeepEP:一款用于 MoE 模型训练和
推理
的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的token,只有一部分专家是活跃的,因此在设备之间高效地交换数据至关重要。传统的全对全(all-to-all)通信方法可能会造成瓶颈,增加延迟,并导致GPU资源利用不足。在对延迟敏感的场景中,
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
一文了解:部署 Deepseek 各版本的硬件要求
我们先看一下DeepSeek的部分通用版本(如下图),然后再介绍一下最近火热的R1
推理
版本的各规格的硬件要求。最后,会给出R1的各主流版本的资源参考列表(文末)。模型名参数大小文件格式标签公司
强哥之神
·
2025-03-01 00:04
人工智能
语言模型
AI代理
智能体
大模型
deepseek
继清华大学DeepSeek资料后,北京大学也出了内容主攻提示词和应用场景
以下是文件的主要内容摘要:1.DeepSeek-R1模型详解技术特性:DeepSeek-R1是一款专注于复杂
推理
任务的
推理
模型,擅长数学、编程和自然语言
推理
任务。
心灵宝贝
·
2025-03-01 00:04
deepseek
谁说消费级硬件不能玩 DeepSeek - R1 微调?手把手教你进阶AI玩家
一、大规模人工智能模型的微调DeepSeek最新的R1模型在
推理
性能方面树立了新的标杆,在保持开源的同时,可与专有模型相媲美。DeepSeek-R1的蒸
硅基创想家
·
2025-02-28 22:51
#
大模型-DeepSeek系列
人工智能
DeepSeek
大模型微调
大模型
GPU
DeepSeek五天开源5大杀器实测:训练成本砍半+
推理
速度起飞,算法圈已疯(附删库跑路教程)
FlashMLA让
推理
速度飙升40%,DeepEP根治MoE通信癌,FP8核弹库DeepGEMM暴力提效,DualPipe+EPLB把GPU榨到一滴不剩,3FS化身数据闪电侠!
AI仙人掌
·
2025-02-28 22:18
人工智能
深度学习
人工智能
大模型
算法
开源
一文看懂 Claude 3.7 Sonnet,为什么是第一个融合
推理
模式的 AI 模型
Claude3.7Sonnet是Anthropic最新发布的AI模型,发布过程中,最突出最吸引眼球的特点是首个“融合
推理
”模型。什么是融合
推理
模型?
董董灿是个攻城狮
·
2025-02-28 22:45
人工智能
DeepSeek开源周Day1:FlashMLA引爆AI
推理
性能革命!
项目地址:GitHub-deepseek-ai/FlashMLA开源日历:2025-02-24起每日9AM(北京时间)更新,持续五天!一、开源周震撼启幕继上周预告后,DeepSeek于北京时间今晨9点准时开源「FlashMLA」,打响开源周五连发第一枪!作为专为Hopper架构GPU(H800/H100)优化的高效解码内核,该项目一经发布便引爆社区:上线45分钟斩获400+Star,3小时突破2.
歌刎
·
2025-02-28 18:48
每周追踪AI框架新动态
最前沿的大模型训练部署实践手册
DeepSeek
人工智能
深度学习
AIGC
NLP
DeepSeek
【AI论文】SongGen:用于文本到歌曲生成的单阶段自回归Transformer模型
现有方法通常采用多阶段生成流程,导致训练和
推理
过程繁琐。在本文中,我们提出了SongGen,一个完全开源的单阶段自回归Transformer模型,专为可控歌曲生成而设计。
东临碣石82
·
2025-02-28 15:58
人工智能
回归
transformer
微软发布 Phi-4 迷你模型,适合本地部署ChatBot
Phi-4-mini-instruct是一个轻量级的开放模型,它建立在合成数据和经过筛选的公开网站基础上,重点关注高质量、
推理
密集的数据。该模型属于Phi-4模型系列,支持128K标记上下文长度。
吴脑的键客
·
2025-02-28 13:43
人工智能
microsoft
人工智能
开源
AIGC
自然语言处理
语言模型
Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
阿里云人工智能搜索是一种将高级人工智能功能与Elasticsearch工具相结合的解决方案,利用QwenLLM/DeepSeek-R1系列提供高级
推理
和分类模型。
·
2025-02-28 11:17
实现一个 RDMA 用户态驱动程序
实际上,高性能、易维护、易定制的网络基础设施对于提升AI训练、
推理
的效率是至关重要的一环。
·
2025-02-28 11:17
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的LLM
推理
新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的
推理
能力。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
然而,当我们试图让它们回答逻辑
推理
问题时,却发现它们的表现常常令人失望。比如,某顶尖LLM在回答以下问题时出现了自相矛
步子哥
·
2025-02-28 07:19
人工智能
深度解析:大模型开源的真与假
目录大模型企业开闭源策略各异开源大模型的定义与现状开源内容的局限性通常开放的内容实际未开放的关键内容法律与商业模式的约束开源许可证的重要性大模型的定制许可证及其限制性条款商业公司对开源大模型的策略和目的建立生态系统吸引开发者提升品牌形象保持竞争优势技术创新和改进技术与协助开发的挑战训练和
推理
过程的资源需求差异微调和衍生模型的技术实现及其局限性开源大模型在协作开发中的局限总结大模型的发展开启了
rs勿忘初心
·
2025-02-28 05:39
#
AI大模型
大模型
开源闭源对比
开源闭源区别
AI提示词终极秘籍:用「COT+分步法」让ChatGPT智商暴涨300%
当别人能用一句话得到媲美资深研究员的分析报告,而你的查询却得到敷衍回答时,很可能是因为缺少两个AI思维激活器:✅COT(ChainofThought):让AI学会像人类一样分步
推理
✅Step-by-Step
曦紫沐
·
2025-02-28 05:08
提示词
人工智能
提示词
游戏语音趋势解析,社交互动有助于营造沉浸式体验
语音交互的新架构出现2024年标志着对话语音AI取得了突破,出现了结合STT→LLM→TTS模型来聆听、
推理
和回应对话的协同语音系统。
网易数智
·
2025-02-28 03:22
IM即时通讯
游戏
人工智能
音视频
实时音视频
信息与通信
语音识别
阿里重磅模型深夜开源;DeepSeek宣布开源DeepGEMM;微软开源多模态AI Agent基础模型Magma...|网易数智日报
阿里重磅模型深夜开源:表现超越Sora、Pika,消费级显卡就能跑2月26日,25日深夜阿里云视频生成大模型万相2.1(Wan)正式宣布开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部
推理
代码和权重全部开源
网易数智
·
2025-02-28 03:16
网易数智日报
开源
人工智能
大数据
业界资讯
ai
AIGC
DeepSeek智能引擎:高效重塑创作与开发
该架构通过动态路由机制,使模型在处理复杂任务时能够自动调用最适配的专家模块,相较于传统单体模型,其
推理
效率提升约40%,同时保持90%以上的参数利用率。
智能计算研究中心
·
2025-02-28 02:44
其他
跨框架模型演进与行业应用路径
同时,针对模型优化技术领域,深入探讨迁移学习、超参数调优及模型压缩等方法的创新突破,揭示其在降低计算资源消耗、提升
推理
效率方面的关键作用。在行业
智能计算研究中心
·
2025-02-28 02:44
其他
使用Hugging Face Text Embeddings Inference进行文本嵌入
推理
在自然语言处理中,文本嵌入是一个重要的技术,它将文本转换为可以由机器学习算法处理的数字向量。在这篇文章中,我们将探讨如何使用HuggingFace的TextEmbeddingsInference(TEI)工具包来部署和服务开源文本嵌入和序列分类模型。TEI支持高性能提取,包括常用的嵌入模型如FlagEmbedding、Ember、GTE和E5。技术背景介绍文本嵌入在现代NLP任务中起着关键作用,它
dgay_hua
·
2025-02-28 01:40
python
通过vLLM部署LLM模型到生产环境中
它是一个专为大模型
推理
设计的开源框
MichaelIp
·
2025-02-28 01:04
人工智能实验室
大语言模型
人工智能
python
AIGC
自然语言处理
语言模型
prompt
llama
字节的豆包和Kimi 的优劣势对比
自研模型聚焦复杂逻辑
推理
与代码生成,垂直领域优化。长文本处理支持
eso1983
·
2025-02-27 23:14
java
python
算法
两天速通力扣HOT100[DAY2] (55~100)
两天速通力扣HOT100[DAY2](55~100)本题解旨在以最简单的语言总结hot100各题思路,为每一题提供一个思考入口,但想要手撕出来,需要自己认真
推理
细节。
WynnLu
·
2025-02-27 21:29
算法
leetcode
c++
浅析 DeepSeek 开源的 FlashMLA 项目
趁热浏览一下:GitHub-deepseek-ai/FlashMLA一、概述传统的注意力计算方法在面对变长序列或长序列
推理
时
X.Cristiano
·
2025-02-27 20:18
FlashMLA
DeepSeek
深度学习
Ollama本地私有化部署通义千问大模型Qwen2.5
目录Qwen2.5介绍Qwen2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行Qwen2基于Transformers进行
推理
本文复现环境
ErbaoLiu
·
2025-02-27 20:17
数据分析&大模型
机器学习&大模型
自然语言处理&大模型
大模型
LLM
Qwen2.5
Qwen2
Ollama
LangChain入门:使用Python和通义千问打造免费的Qwen大模型聊天机器人
它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和
推理
能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。
闯江湖50年
·
2025-02-27 20:45
langchain
python
机器人
人工智能
2025,AI变现有哪些机遇与挑战?
大模型的能力边界在不断拓宽,主流云端大模型普遍具备了多模态
推理
能力。技术路线上,也不再局限于算力堆叠,而是探索强化学习、符号
推理
、类脑计算等新路径。
Imagination官方博客
·
2025-02-27 19:41
人工智能
DeepSeek开源周合集
,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:DeepEP,一个高效的MOE架构专家并行通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于训练和
推理
填充的高吞吐量内核用于
推理
解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
深度学习模型大小与模型
推理
速度的探讨
**昨天看到了非常好的两篇文章想在此记录和保存,由于模型的实时
推理
包含很多方面的因素,因而也庆幸能有机会看到这样的文章。
ICUD
·
2025-02-27 09:01
深度学习
人工智能
python
AI 平台技术架构设计方案
二、设计目标高效性:确保在训练和
推理
过程中能够充分利用计算资源,快速处理大量数据,缩短训练时间和
推理
延迟。灵活性:支持多种AI框架、算法和模型,能够适应不同的业务场景和需求变化。
数研妙手
·
2025-02-27 03:11
AI技术实践
人工智能
泛微全面接入DeepSeek大模型,助力组织升级数智化应用场景
在接入DeepSeek大模型后,泛微将借助DeepSeek强大的自然语言处理、机器学习、
推理
等能力,显著提升泛微各项产品
泛微OA办公系统
·
2025-02-27 03:10
泛微
DeepSeek
读心术思维导图
读心术思维导图把自己变成他人贴近对方的肢体行为模仿姿势延迟动作不要过于精确模仿对方的声音模仿面部表情同样的速度和节奏配合对方的精神状态注意对方的精力值,让精力充沛起来的练习言行一致,情绪状态看懂他人,语言、思维方式视觉记忆视觉记忆听觉记忆动觉记忆EAC模型视觉创建视觉回忆听觉创建听觉回忆动觉记忆自言自语(内在的
推理
者
胡西风_foxww
·
2025-02-27 00:15
#
思维导图
读心术
思维导图
模板
markdown
云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite
推理
2月25日,DeepSeek-AI面向社区开源了其技术成果FlashMLA(https://github.com/deepseek-ai/FlashMLA),这是一个面向
推理
优化的高效多层注意力(Multi-HeadLatentAttention
·
2025-02-27 00:41
deepseekllm人工智能
深入解析 DeepSeek R1:强化学习如何驱动大模型
推理
能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接训练
推理
能力,而非仅依赖传统的监督微调(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
YOLO11的单独
推理
程序
YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。
AIOT魔法师
·
2025-02-26 23:02
YOLOv5和YOLOv11
python
开发语言
GGUF 文件格式全解析
GGUF(GGMLUniversalFormat)作为一种新兴的二进制文件格式,旨在解决传统GGML及其衍生格式(如GGMF和GGJT)的局限性,为模型
推理
提供更高效、更灵活的解决方案。
Just_Paranoid
·
2025-02-26 22:25
技术流Clip
LLM
GGUF
量化
DeepSeek
技术硬核:突出FP8、3倍速度、90%成本暴降等技术参数,强化可信度
DeepSeek近期开源项目详细分析1.FlashMLA:大模型
推理
效率革命技术特点:首个开源项目FlashMLA是针对英伟达Hopper架构GPU(如H800)优化的高效多头潜在注意力(MLA)解码内核
guzhoumingyue
·
2025-02-26 20:45
AI
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他