E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理证明
字节的豆包和Kimi 的优劣势对比
自研模型聚焦复杂逻辑
推理
与代码生成,垂直领域优化。长文本处理支持
eso1983
·
2025-02-27 23:14
java
python
算法
两天速通力扣HOT100[DAY2] (55~100)
两天速通力扣HOT100[DAY2](55~100)本题解旨在以最简单的语言总结hot100各题思路,为每一题提供一个思考入口,但想要手撕出来,需要自己认真
推理
细节。
WynnLu
·
2025-02-27 21:29
算法
leetcode
c++
浅析 DeepSeek 开源的 FlashMLA 项目
趁热浏览一下:GitHub-deepseek-ai/FlashMLA一、概述传统的注意力计算方法在面对变长序列或长序列
推理
时
X.Cristiano
·
2025-02-27 20:18
FlashMLA
DeepSeek
深度学习
Ollama本地私有化部署通义千问大模型Qwen2.5
目录Qwen2.5介绍Qwen2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行Qwen2基于Transformers进行
推理
本文复现环境
ErbaoLiu
·
2025-02-27 20:17
数据分析&大模型
机器学习&大模型
自然语言处理&大模型
大模型
LLM
Qwen2.5
Qwen2
Ollama
LangChain入门:使用Python和通义千问打造免费的Qwen大模型聊天机器人
它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和
推理
能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。
闯江湖50年
·
2025-02-27 20:45
langchain
python
机器人
人工智能
2025,AI变现有哪些机遇与挑战?
大模型的能力边界在不断拓宽,主流云端大模型普遍具备了多模态
推理
能力。技术路线上,也不再局限于算力堆叠,而是探索强化学习、符号
推理
、类脑计算等新路径。
Imagination官方博客
·
2025-02-27 19:41
人工智能
电子电气架构 --- 车载以太网的未来已经来临
非必要不费力
证明
自己,无利益不试图说服别人,是精神上的节能减排。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的热情和定力。
车载诊断技术
·
2025-02-27 15:40
车载电子电气架构
车载通信架构
架构
服务器
电子电气架构
网络
网络管理
DeepSeek开源周合集
,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:DeepEP,一个高效的MOE架构专家并行通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于训练和
推理
填充的高吞吐量内核用于
推理
解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
深度学习模型大小与模型
推理
速度的探讨
**昨天看到了非常好的两篇文章想在此记录和保存,由于模型的实时
推理
包含很多方面的因素,因而也庆幸能有机会看到这样的文章。
ICUD
·
2025-02-27 09:01
深度学习
人工智能
python
工具方法 - 合规性矩阵
具体来说,Compliancematrix需要用一行一行的证据来
证明
被设计的产品针对每个需求的实际性能是满足要求的;它系统性地覆盖了从最低级别的性能到到最高级别的性能,而且它需要跟踪显示实际性能数据的来源
夜流冰
·
2025-02-27 08:18
工具方法
笔记
AI 平台技术架构设计方案
二、设计目标高效性:确保在训练和
推理
过程中能够充分利用计算资源,快速处理大量数据,缩短训练时间和
推理
延迟。灵活性:支持多种AI框架、算法和模型,能够适应不同的业务场景和需求变化。
数研妙手
·
2025-02-27 03:11
AI技术实践
人工智能
泛微全面接入DeepSeek大模型,助力组织升级数智化应用场景
在接入DeepSeek大模型后,泛微将借助DeepSeek强大的自然语言处理、机器学习、
推理
等能力,显著提升泛微各项产品
泛微OA办公系统
·
2025-02-27 03:10
泛微
DeepSeek
读心术思维导图
读心术思维导图把自己变成他人贴近对方的肢体行为模仿姿势延迟动作不要过于精确模仿对方的声音模仿面部表情同样的速度和节奏配合对方的精神状态注意对方的精力值,让精力充沛起来的练习言行一致,情绪状态看懂他人,语言、思维方式视觉记忆视觉记忆听觉记忆动觉记忆EAC模型视觉创建视觉回忆听觉创建听觉回忆动觉记忆自言自语(内在的
推理
者
胡西风_foxww
·
2025-02-27 00:15
#
思维导图
读心术
思维导图
模板
markdown
云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite
推理
2月25日,DeepSeek-AI面向社区开源了其技术成果FlashMLA(https://github.com/deepseek-ai/FlashMLA),这是一个面向
推理
优化的高效多层注意力(Multi-HeadLatentAttention
·
2025-02-27 00:41
deepseekllm人工智能
深入解析 DeepSeek R1:强化学习如何驱动大模型
推理
能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接训练
推理
能力,而非仅依赖传统的监督微调(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
YOLO11的单独
推理
程序
YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。
AIOT魔法师
·
2025-02-26 23:02
YOLOv5和YOLOv11
python
开发语言
GGUF 文件格式全解析
GGUF(GGMLUniversalFormat)作为一种新兴的二进制文件格式,旨在解决传统GGML及其衍生格式(如GGMF和GGJT)的局限性,为模型
推理
提供更高效、更灵活的解决方案。
Just_Paranoid
·
2025-02-26 22:25
技术流Clip
LLM
GGUF
量化
DeepSeek
技术硬核:突出FP8、3倍速度、90%成本暴降等技术参数,强化可信度
DeepSeek近期开源项目详细分析1.FlashMLA:大模型
推理
效率革命技术特点:首个开源项目FlashMLA是针对英伟达Hopper架构GPU(如H800)优化的高效多头潜在注意力(MLA)解码内核
guzhoumingyue
·
2025-02-26 20:45
AI
python
Proof Beyond Boundaries: Hong Kong zkNight——零知识
证明
技术的未来之夜
ZEROBASE创始人将在开场致辞中分享对零知识
证明
如何重塑隐私与效率的见解,并激发跨领域的合作灵感。届时,嘉宾将共聚一堂,
TechubNews
·
2025-02-26 20:44
web3
科技
大数据
DeepSeek-V3:最强开源MoE模型的技术解析与使用指南
追求极致的训练效率后训练:从DeepSeek-R1进行知识蒸馏模型下载评估结果基础模型标准基准测试上下文窗口聊天模型标准基准测试(大于67B的模型)开放式生成评估如何使用在线聊天与API平台本地运行指南模型权重转换
推理
示例使用
认识祂
·
2025-02-26 19:10
deepseek
开源
deepseek
AI岗位面试指南:高频文档问题解析与应答策略
应答框架:背景与目标:"项目源于客户需要将文本生成延迟从2秒压缩至800ms以内,同时保证BLEU分数不低于0.82"技术创新点:"采用知识蒸馏+动态量化方案,设计分层注意力裁剪策略"量化成果:"
推理
速度提升
阿三0812
·
2025-02-26 19:07
ai
人工智能
面试
全面分析 DeepSeek 的新开源 FlashMLA
这一进展对于大型语言模型(LLM)来说意义重大,因为大型语言模型在
推理
过程中面临内存和计算方面的挑战,尤其是长序列。
X.Cristiano
·
2025-02-26 19:34
FlashMLA
深度学习
人工智能
支持 40+ 插件,Spring AI Alibaba 简化智能体私有数据集成
RAG通过结合检索技术和生成模型的强大能力,使智能体能够实时从外部数据源获取信息,并在生成过程中增强其知识深度和
推理
能力。通过这种方式,智能体不仅能依赖于模型的预
·
2025-02-26 19:58
云原生
云原生周刊:云原生和 AI
FlashMLA是专为NVIDIAHopper架构GPU(如H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型
推理
性能,特别是针对可变长度序列进行了优化。
·
2025-02-26 19:58
云计算
DeepSeep开源周,第三天:DeepGEMM是啥?
矩阵乘法(GEMM)是深度学习模型的核心运算(如全连接层、卷积层等),其性能直接影响训练和
推理
效率。
程序员差不多先生
·
2025-02-26 19:33
pytorch
推荐:LangChain — 构建情境感知
推理
应用的利器
推荐:LangChain—构建情境感知
推理
应用的利器langchain⚡BuildingapplicationswithLLMsthroughcomposability⚡项目地址:https://gitcode.com
成婕秀Timothy
·
2025-02-26 19:33
DeepSeek 开源周:DeepEP 项目详解,GPU 压榨计划启动!
本文将详细介绍DeepEP的功能、应用场景以及如何使用它来提升AI训练和
推理
的效率。DeepEP概述功能与作用DeepEP是一个专门针对Mixture-of-Experts(
东方佑
·
2025-02-26 18:29
量子变法
开源
serverless framework 模块化部署
serverless/components源码食用本文使用的示例代码Forkedfromsecond-state/tencent-tensorflow-scf这个仓库可以直接部署成一个Serverless的AI
推理
函数
ice breaker
·
2025-02-26 17:27
Serverless
nodejs
serverless
framework
serverless
ChatGPT版本差异分析大全
o1系列(o1-preview/o1-mini)仅支持纯文本处理,但专注于深度
推理
和分析。GPT-3.5是早期版本,仅支持文本,且性能和上下文理解能力较弱。
爱吃青菜的大力水手
·
2025-02-26 17:26
chatgpt
人工智能
DeepSeek各模型现有版本对比分析
文章目录一、基础模型系列:V1到V3的演进二、专用模型系列:
推理
与多模态三、版本选型与商业化趋势DeepSeek作为最近特别火爆的模型,本文将对DeepSeek现有的主要版本进行对比分析,涵盖参数规模、
墨染夜雨笺
·
2025-02-26 17:22
DeepSeek
AI
DeepSeek 智慧城市应用:交通流量预测(918)
**摘要:**本文探讨了利用DeepSeek技术框架解决城市交通流量预测问题的方法,主要内容包括基于时空图卷积网络(ST-GCN)的预测模型、多传感器数据融合策略以及实时
推理
API服务的搭建,旨在为智慧城市的交通管理提供高效
web13508588635
·
2025-02-26 16:18
面试
学习路线
阿里巴巴
智慧城市
人工智能
使用 LangChain 与 Solar LLM 的快速集成示例
一、技术背景介绍LangChain是一个强大的框架,它可以帮助开发者轻松集成不同的自然语言处理(NLP)模型,并构建复杂的链式
推理
任务。SolarLL
qahaj
·
2025-02-26 16:15
langchain
python
开发语言
知识的诅咒
那台电脑是三年前我买来挖以太币的,赚了几天电费后,ETH完成了TheMerge,之后就不再依赖工作量
证明
验证交易和
·
2025-02-26 14:17
知识管理学习方法以太坊教育
三角函数和差角公式对于任意角的
证明
(代数法)
前置知识:平面向量、诱导公式和差角公式的
证明
如下:对于每个始边为xxx轴正半轴的角θ\thetaθ,令平面向量a⃗θ\veca_{\theta}aθ是xOyxOyxOy中,以OOO为起点,方向沿着的θ\
Jean·Gunnhildr
·
2025-02-26 14:29
高考
线性代数
使用 Apache Jena 构建 RDF 数据处理与查询服务
本文将通过一个示例项目,展示如何使用ApacheJena实现RDF数据的加载、查询、
推理
、插入和更新操作。二、项目概述本项目的目标是使用Apa
梦落青云
·
2025-02-26 13:23
apache
知识图谱
人工智能
深度求索DeepSeek:AI大模型的全域应用与技术突破
其基于DeepSeek-R1系列大模型的创新架构,以600万美元的超低训练成本(仅为OpenAI同类模型的1/30)3,在自然语言处理、逻辑
推理
、多模
量子纠缠BUG
·
2025-02-26 11:11
DeepSeek部署
DeepSeek
AI
人工智能
easyui
前端
《哪吒2》票房神话背后的启示:短剧市场的黄金机遇
这部影片的成功不仅
证明
了优质内容的强大生命力,也为其他文化娱乐领域带来了深刻的启示。
MaiTeKeJi
·
2025-02-26 11:10
哪吒票房突飞猛进
短剧市场新机遇
短剧源码
人工智能
大数据
创业创新
短剧
解读 DeepSeek 关键 RL 算法 GRPO
大家不难发现,无论是复杂的自然语言处理任务,还是充满挑战的智能
推理
难题,DeepSeek都能展现出卓越的性能。而这斐然成绩的背后
进一步有进一步的欢喜
·
2025-02-26 08:16
LLM
算法
DeepSeek
GRPO
绩效管理与业务流程
绩效管理本质就是价值管理,或者说是能力管理,也就是通过一系列的科技手段去发现、
证明
一个人的能力和价值,然后给予科学、合理的利益分配。
自由鬼
·
2025-02-26 08:45
IT应用探讨
行业发展
业务流程
绩效管理
【形式化】Coq 中的函数式编程基础(长文)
程序与简单数学对象之间的直接联系,既支持形式化的正确性
证明
,也有助于对程序行为进行合理的非正式
推理
。函数式编程“函数式”的另一层含义是,它强调将函数作为一等
老猿讲编程
·
2025-02-26 08:45
形式化验证
算法
coq
形式化验证
Qwen2.5 技术报告
在预训练方面,将高质量的预训练数据集从之前的7万亿个token扩展到18万亿个token,为常识、专家知识和
推理
能力提供坚实的基础。在后训练方面,用超过100万个样本
三谷秋水
·
2025-02-26 07:11
大模型
机器学习
人工智能
语言模型
机器学习
人工智能
爆发的AI智能体(4):智能体构建与开发
智能体可以被看作是一个系统,它能够感知环境,拥有一定的
推理
能力,并能根据这些信息做出决策和行动。智能体的基本架构通常包括感知模块、
推理
模块和行动模块。
caridle
·
2025-02-26 06:36
人工智能
DeepSeek的开源之路:一文读懂从V1-R1的技术发展,见证从开源新秀到
推理
革命的领跑者
作者:京东科技蔡欣彤一、引言:AI时代的挑战与DeepSeek的崛起在大模型时代,AI技术的飞速发展带来了前所未有的机遇,但也伴随着巨大的挑战。随着模型规模的不断扩大,算力需求呈指数级增长,训练成本飙升,而性能提升的边际收益却逐渐递减,形成了所谓的“ScalingLaw”瓶颈。与此同时,OpenAI、谷歌等巨头通过闭源策略垄断技术,限制了中小企业和研究机构的参与空间。在这样的背景下,DeepSee
·
2025-02-26 05:05
算法
高一英语拓展词汇第二版
文章目录高一英语拓展词汇第二版前言ABCDEFGHIJKLMNOPQRSTUVW高一英语拓展词汇第二版前言资质
证明
:老师是江苏省扬州中学英语骨干教师刘老师,作者本人扬州2024届中考英语149149149
Jean·Gunnhildr
·
2025-02-26 05:56
Jean带飞你的文化课
高考
笔记
【RAG系列】文字的数字化分身 - 向量嵌入的魔法世界
文字的数字化分身-向量嵌入的魔法世界文字向量编码器数字分身语义空间相似度计算代数运算关系
推理
一、认知革命:文字的数字基因工程1.1文字GPS坐标系想象每个词语都是银河系中的星球,向量坐标就是它们的星际坐标
什么都想学的阿超
·
2025-02-26 04:52
原理概念
#
深度学习
深度学习
人工智能
RAG
DeepSeek技术系列之解析DeepSeek蒸馏技术
大模型落地之痛当前千亿级大模型面临严峻的部署困境:GPT-4级模型的单次
推理
成本高达0.01美元,而工业场景往往要求响应速度<200ms。
小叔技研社
·
2025-02-26 02:37
AIGC
人工智能
深入探索 llama-cpp-python:在 LangChain 中启用本地 LLM
推理
Llama.cpp是一个用于
推理
许多LLM模型的开源库,它的Python绑定——llama-cpp-python提供了在Python中更加便捷的接口。
aehrutktrjk
·
2025-02-26 02:06
llama
python
langchain
GLake:优化GPU内存管理与IO传输的开源项目
GLake:突破GPU内存和IO瓶颈的利器在人工智能快速发展的今天,大模型训练和
推理
正面临着严峻的挑战。
2401_87458718
·
2025-02-26 02:35
开源
DeepSeek技术解析:降本增效的“双刃剑”如何重塑AI产业?
正面影响分析算力需求与成本大幅降低DeepSeek通过算法优化(如稀疏计算、知识蒸馏)和模型压缩技术,将云端训练算力需求降至传统大模型的35%,车端
推理
芯片需求减少至65%。
爱吃青菜的大力水手
·
2025-02-26 01:29
人工智能
突破性能极限:DeepSeek开源FlashMLA解码内核技术解析
引言:大模型时代的
推理
加速革命在生成式AI大行其道的今天,如何提升大语言模型的
推理
效率已成为行业焦点。
Shockang
·
2025-02-25 22:09
DeepSeek
DeepSeek
技术前沿
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他