E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#数学推理
大语言模型原理与工程实践:手把手教你训练 7B 大语言模型 自动化训练框架
分布式计算文章目录大语言模型原理与工程实践:手把手教你训练7B大语言模型自动化训练框架1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.3算法优缺点3.4算法应用领域4.
数学
模型和公式
AI天才研究院
·
2025-03-01 07:24
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
小白学Python:Numpy(二)
目录引言数组的基本
数学
运算数组变换总结引言NumPy库是Python中用于科学计算的核心库。它提供了一个高性能多维数组对象,以及使用和处理这些数组的工具。
洲洲的笔记
·
2025-03-01 07:51
小白学Python
python
numpy
数据分析
【读书笔记】《What is Mathematics》第一章:自然数
为什么要学
数学
?正如书的扉页所述:两千年以来,谙熟一定的
数学
知识是每一个文明人应有的基本智力为什么作为一个程序猿,也要从头学
数学
?
还没入门的大菜狗
·
2025-03-01 07:21
具体数学
读书笔记
torch对于tensor的常规操作
importtorchtorch.Tensor会继承某些torch的某些
数学
运算,例如sort,min/max....不需要调用相应的torch.funciton进行处理,下文中如果是torch/Tensor
何33512336
·
2025-03-01 06:16
Deep
Learning
python
python
pytorch
实战:基于Pandas的房价数据分析全流程深度解析(附高阶技巧与
数学
推导)(十二)
一、项目深度解析框架1.1分析维度全景图数据加载元数据分析数据清洗特征工程多维分析模型准备自动化报告1.2高阶分析工具链数据清洗:Missingno高级可视化、Optuna自动超参优化特征工程:TsFresh时序特征生成、FeatureTools自动化特征衍生可视化:Plotly动态交互、Altair声明式语法报告:JupyterNotebook魔法命令、Voila仪表板二、数据加载的工程级优化2
WHCIS
·
2025-03-01 05:37
Pandas
pandas
数据分析
python
Python 与 C++ 混合编程
目录概述实现混合编程的方式ctypes的使用方法pythran的使用方法概述Python是解释型语言,在进行
数学
运算场景下,性能是瓶颈。C++性能卓越,但学习门槛高且开发效率比Python低。
云淡丶风轻
·
2025-03-01 05:37
Python
python
c++
开发语言
【学写LibreCAD】0 仿写LibreCAD简介
数学
工具:向量、矩阵、几何计算等。文档管理:管理当前打开的CAD文档及其内容。用户界面模块(UI)功能:提供图形用户界面(GUI),包括菜单、工具栏、绘图区域等。
Source.Liu
·
2025-03-01 04:30
CXX
c++
rust
LibreCAD
数据库必知必会系列:数据库分片与分布式事务
文章目录1.背景介绍分库分表分片集群分布式事务数据迁移2.核心概念与联系主从复制活动复制CAP原则BASE理论3.核心算法原理和具体操作步骤以及
数学
模型公式详细讲解分库分表水平分表垂直分库分片集群垂直拆分水平切分垂直切分水平拆分根据主键范围根据业务字段划分分布式事务两阶段提交协议三阶段提交协议可靠消息最终一致性
AI天才研究院
·
2025-03-01 03:51
AI大模型企业级应用开发实战
大数据
人工智能
语言模型
Java
Python
架构设计
Amazon SageMaker 批量转换中的 JSON 处理技巧
背景介绍AmazonSageMaker提供了强大的批量转换功能,允许我们对大量数据进行
推理
。这在处理大规模数据集时非常有用。然而,当我们尝试将批量策略从SingleRecord切换到MultiRec
t0_54coder
·
2025-03-01 03:50
json
个人开发
概率论——5 事件的独立性
文章目录事件独立性描述性定义
数学
定义相关定理多事件独立性事件独立性描述性定义设A,BA,BA,B为两个事件,如果其中任何一个事件发生的概率不受另一个事件发生与否的影响,则称事件AAA与BBB相互独立。
黑曼巴、。;
·
2025-03-01 02:15
概率论
人类驾驶的人脑两种判断模式(反射和预判)-->自动驾驶两种AI模式
另一种模式是物理时空图式
推理
模式,判断是基于预判预测,人脑把物理世界的物理动态时空规则(规律)图像已经编码为脑内符号(语言或图式)系统,通过预判预测的思维链
推理
过程(语言符号或物理时空图式的
推理
运算,映射
推理
出了物理世界的后续时空图像
liron71
·
2025-03-01 02:14
人工智能
机器学习
DeepSeek技术全景解析:架构创新与行业差异化竞争力
深度优化的MoE架构:结合256个路由专家与1个共享专家,实现稀疏激活机制(每个Token仅激活8个专家),在代码生成任务中
推理
速度提升40%。混合模态支持:支持文本、代码、
数学
符号
二进制coder
·
2025-03-01 01:40
人工智能
架构
AGI
AI
DeepSeek入门:安装与配置
,以下是不同版本的硬件要求:DeepSeek-R1-1.5B:CPU:最低4核(推荐Intel/AMD多核处理器)内存:8GB+硬盘:3GB+存储空间(模型文件约1.5-2GB)显卡:非必需(纯CPU
推理
梦落青云
·
2025-03-01 01:08
deepseek
大模型研究:DeepSeek三个版本(初级中级高级)资源要求说明
DeepSeek-LLM6.7B三个版本模型所需硬件资源的介绍:DeepSeek-LLM6.7B最小最基础版本1.内存(RAM)非量化运行时,由于模型参数数量相对较少,大约需要13GB-14GB的系统内存来加载模型和进行基本
推理
程序猿学长
·
2025-03-01 01:08
大模型
人工智能
语言模型
DeepSeek 最新发布 DeepEP:一款用于 MoE 模型训练和
推理
的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的token,只有一部分专家是活跃的,因此在设备之间高效地交换数据至关重要。传统的全对全(all-to-all)通信方法可能会造成瓶颈,增加延迟,并导致GPU资源利用不足。在对延迟敏感的场景中,
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
深入探索 SymPy:Python 的符号计算利器
1.引言在
数学
、物理、工程和计算机科学领域,符号计算(SymbolicComputation)是一个至关重要的工具。与数值计算不同,符号计算处理的是
数学
表达式本身,而不是近似数值。
萧鼎
·
2025-03-01 01:06
python基础到进阶教程
python
开发语言
一文了解:部署 Deepseek 各版本的硬件要求
我们先看一下DeepSeek的部分通用版本(如下图),然后再介绍一下最近火热的R1
推理
版本的各规格的硬件要求。最后,会给出R1的各主流版本的资源参考列表(文末)。模型名参数大小文件格式标签公司
强哥之神
·
2025-03-01 00:04
人工智能
语言模型
AI代理
智能体
大模型
deepseek
继清华大学DeepSeek资料后,北京大学也出了内容主攻提示词和应用场景
以下是文件的主要内容摘要:1.DeepSeek-R1模型详解技术特性:DeepSeek-R1是一款专注于复杂
推理
任务的
推理
模型,擅长
数学
、编程和自然语言
推理
任务。
心灵宝贝
·
2025-03-01 00:04
deepseek
谁说消费级硬件不能玩 DeepSeek - R1 微调?手把手教你进阶AI玩家
一、大规模人工智能模型的微调DeepSeek最新的R1模型在
推理
性能方面树立了新的标杆,在保持开源的同时,可与专有模型相媲美。DeepSeek-R1的蒸
硅基创想家
·
2025-02-28 22:51
#
大模型-DeepSeek系列
人工智能
DeepSeek
大模型微调
大模型
GPU
编程中的拓扑思维:突破传统架构的创新之路
拓扑学基础与编程的关联拓扑学,作为
数学
的一个分支,主要研究几何图形在连续变形下保持不变的性质。在编程语境中,我们可以将软件系统看作是一
Kurbaneli
·
2025-02-28 22:50
架构
DeepSeek五天开源5大杀器实测:训练成本砍半+
推理
速度起飞,算法圈已疯(附删库跑路教程)
FlashMLA让
推理
速度飙升40%,DeepEP根治MoE通信癌,FP8核弹库DeepGEMM暴力提效,DualPipe+EPLB把GPU榨到一滴不剩,3FS化身数据闪电侠!
AI仙人掌
·
2025-02-28 22:18
人工智能
深度学习
人工智能
大模型
算法
开源
一文看懂 Claude 3.7 Sonnet,为什么是第一个融合
推理
模式的 AI 模型
Claude3.7Sonnet是Anthropic最新发布的AI模型,发布过程中,最突出最吸引眼球的特点是首个“融合
推理
”模型。什么是融合
推理
模型?
董董灿是个攻城狮
·
2025-02-28 22:45
人工智能
DeepSeek开源周Day1:FlashMLA引爆AI
推理
性能革命!
项目地址:GitHub-deepseek-ai/FlashMLA开源日历:2025-02-24起每日9AM(北京时间)更新,持续五天!一、开源周震撼启幕继上周预告后,DeepSeek于北京时间今晨9点准时开源「FlashMLA」,打响开源周五连发第一枪!作为专为Hopper架构GPU(H800/H100)优化的高效解码内核,该项目一经发布便引爆社区:上线45分钟斩获400+Star,3小时突破2.
歌刎
·
2025-02-28 18:48
每周追踪AI框架新动态
最前沿的大模型训练部署实践手册
DeepSeek
人工智能
深度学习
AIGC
NLP
DeepSeek
【AI论文】SongGen:用于文本到歌曲生成的单阶段自回归Transformer模型
现有方法通常采用多阶段生成流程,导致训练和
推理
过程繁琐。在本文中,我们提出了SongGen,一个完全开源的单阶段自回归Transformer模型,专为可控歌曲生成而设计。
东临碣石82
·
2025-02-28 15:58
人工智能
回归
transformer
JS宏案例:在wps编辑器中玩numpy
NumPy是Python中用于科学计算的一个基础库,它提供了大量的
数学
函数工具,尤其是用于高效处理大型多维数组和矩阵。NumPy是Python数据分析、机器学习、科学计算等领域中不可或缺的一部分。
jackispy
·
2025-02-28 15:57
JS宏实例
numpy
数据分析
javascript
以太坊客户端和以太坊网络
黄皮书结合了英文和
数学
,详细规定了以
倒霉男孩
·
2025-02-28 14:17
区块链
区块链
【星云 Orbit-F4 开发板】01. STM32F407 HAL库开发环境安装与工程模板创建
核心板型号处理器参
数学
习定位典型应用场景极光Orbit-C8STC8H8K64U(51架构/24MHz)单片机原理与应用GPIO控制/UART通信星火O
智木芯语
·
2025-02-28 13:14
【星云
Orbit-F4
开发板】
【星火
Orbit-F1开发板】
单片机
stm32
物联网
mcu
嵌入式硬件
微软发布 Phi-4 迷你模型,适合本地部署ChatBot
Phi-4-mini-instruct是一个轻量级的开放模型,它建立在合成数据和经过筛选的公开网站基础上,重点关注高质量、
推理
密集的数据。该模型属于Phi-4模型系列,支持128K标记上下文长度。
吴脑的键客
·
2025-02-28 13:43
人工智能
microsoft
人工智能
开源
AIGC
自然语言处理
语言模型
【JAVA-数据结构】Lambda表达式
Lambda表达式(Lambdaexpression),基于
数学
中的λ演算得名,也可称为闭包(Closure)。1.1L
Mr_star_galaxy
·
2025-02-28 12:07
数据结构
java
数据结构
开发语言
探秘 ES6 模板字符串:从基础语法到高级应用的全方位解析
传统字符串拼接的困境(二)模板字符串的简洁之美二、多行字符串:轻松实现复杂文本布局(一)传统方式处理多行字符串的难题(二)模板字符串的多行支持三、表达式求值:动态生成字符串内容(一)嵌入简单变量(二)进行
数学
运算
码上前端
·
2025-02-28 11:00
javascript
vue.js
Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
阿里云人工智能搜索是一种将高级人工智能功能与Elasticsearch工具相结合的解决方案,利用QwenLLM/DeepSeek-R1系列提供高级
推理
和分类模型。
·
2025-02-28 11:17
实现一个 RDMA 用户态驱动程序
实际上,高性能、易维护、易定制的网络基础设施对于提升AI训练、
推理
的效率是至关重要的一环。
·
2025-02-28 11:17
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的LLM
推理
新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的
推理
能力。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
然而,当我们试图让它们回答逻辑
推理
问题时,却发现它们的表现常常令人失望。比如,某顶尖LLM在回答以下问题时出现了自相矛
步子哥
·
2025-02-28 07:19
人工智能
深度解析:大模型开源的真与假
目录大模型企业开闭源策略各异开源大模型的定义与现状开源内容的局限性通常开放的内容实际未开放的关键内容法律与商业模式的约束开源许可证的重要性大模型的定制许可证及其限制性条款商业公司对开源大模型的策略和目的建立生态系统吸引开发者提升品牌形象保持竞争优势技术创新和改进技术与协助开发的挑战训练和
推理
过程的资源需求差异微调和衍生模型的技术实现及其局限性开源大模型在协作开发中的局限总结大模型的发展开启了
rs勿忘初心
·
2025-02-28 05:39
#
AI大模型
大模型
开源闭源对比
开源闭源区别
AI提示词终极秘籍:用「COT+分步法」让ChatGPT智商暴涨300%
当别人能用一句话得到媲美资深研究员的分析报告,而你的查询却得到敷衍回答时,很可能是因为缺少两个AI思维激活器:✅COT(ChainofThought):让AI学会像人类一样分步
推理
✅Step-by-Step
曦紫沐
·
2025-02-28 05:08
提示词
人工智能
提示词
游戏语音趋势解析,社交互动有助于营造沉浸式体验
语音交互的新架构出现2024年标志着对话语音AI取得了突破,出现了结合STT→LLM→TTS模型来聆听、
推理
和回应对话的协同语音系统。
网易数智
·
2025-02-28 03:22
IM即时通讯
游戏
人工智能
音视频
实时音视频
信息与通信
语音识别
【数据挖掘】NumPy
NumPy是Python中一个用于进行科学计算的基础库,它提供了高效的数组操作和
数学
运算功能。
dundunmm
·
2025-02-28 03:49
数据挖掘
数据挖掘
numpy
人工智能
阿里重磅模型深夜开源;DeepSeek宣布开源DeepGEMM;微软开源多模态AI Agent基础模型Magma...|网易数智日报
阿里重磅模型深夜开源:表现超越Sora、Pika,消费级显卡就能跑2月26日,25日深夜阿里云视频生成大模型万相2.1(Wan)正式宣布开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部
推理
代码和权重全部开源
网易数智
·
2025-02-28 03:16
网易数智日报
开源
人工智能
大数据
业界资讯
ai
AIGC
DeepSeek智能引擎:高效重塑创作与开发
该架构通过动态路由机制,使模型在处理复杂任务时能够自动调用最适配的专家模块,相较于传统单体模型,其
推理
效率提升约40%,同时保持90%以上的参数利用率。
智能计算研究中心
·
2025-02-28 02:44
其他
跨框架模型演进与行业应用路径
同时,针对模型优化技术领域,深入探讨迁移学习、超参数调优及模型压缩等方法的创新突破,揭示其在降低计算资源消耗、提升
推理
效率方面的关键作用。在行业
智能计算研究中心
·
2025-02-28 02:44
其他
使用Hugging Face Text Embeddings Inference进行文本嵌入
推理
在自然语言处理中,文本嵌入是一个重要的技术,它将文本转换为可以由机器学习算法处理的数字向量。在这篇文章中,我们将探讨如何使用HuggingFace的TextEmbeddingsInference(TEI)工具包来部署和服务开源文本嵌入和序列分类模型。TEI支持高性能提取,包括常用的嵌入模型如FlagEmbedding、Ember、GTE和E5。技术背景介绍文本嵌入在现代NLP任务中起着关键作用,它
dgay_hua
·
2025-02-28 01:40
python
当x趋于零时,零乘以无穷的极限等于多少
在
数学
中,0乘以无穷大(0×∞)是一个未定义的表达式,因为它涉及到两个相互矛盾的概念:0乘以任何有限数都等于0,而无穷大乘以任何非零数都应该是无穷大。
蓝桉802
·
2025-02-28 01:36
考研
通过vLLM部署LLM模型到生产环境中
它是一个专为大模型
推理
设计的开源框
MichaelIp
·
2025-02-28 01:04
人工智能实验室
大语言模型
人工智能
python
AIGC
自然语言处理
语言模型
prompt
llama
智能路径规划:从
数学
建模到算法优化的理论与实践
智能路径规划:从
数学
建模到算法优化的理论与实践一、引言在机器人学、自动驾驶、物流调度等领域,路径规划是实现自主导航的核心技术。
木子算法
·
2025-02-28 00:59
人工智能
数学建模
数学建模
算法
人工智能
量化交易如何利用算法模型进行股票筛选?其选股策略包含哪些方面?
前言量化交易是一种基于
数学
模型、统计分析和计算机算法的交易方式,通过系统化的方法筛选股票并进行投资决策。与传统交易依赖主观判断不同,量化交易强调数据驱动和模型优化,能够更高效地捕捉市场机会并控制风险。
量化问财
·
2025-02-28 00:28
量化投资
程序化炒股
券商API
算法
人工智能
python
【第三天】零基础学习量化基础代码分析-持续更新
量化投资模型框架总结每日-往期回看第一天零基础学量化基础知识点总览-持续更新第二天零基础学习量化基础代码总览-持续更新第三天零基础学习量化基础代码分析-持续更新记录量化基础代码总览引言量化投资是一种基于
数学
模型和计算机算法来制定投资策略的方法
Long_poem
·
2025-02-28 00:24
学习
字节的豆包和Kimi 的优劣势对比
自研模型聚焦复杂逻辑
推理
与代码生成,垂直领域优化。长文本处理支持
eso1983
·
2025-02-27 23:14
java
python
算法
AI笔记——浅谈发展历程
1950年代-1960年代:起步阶段1950年,英国
数学
家艾伦·图灵提出了“图灵测试”,这是第一个旨在检验机器智
Bqiuer
·
2025-02-27 22:37
AI
AI笔记
人工智能
ai
两天速通力扣HOT100[DAY2] (55~100)
两天速通力扣HOT100[DAY2](55~100)本题解旨在以最简单的语言总结hot100各题思路,为每一题提供一个思考入口,但想要手撕出来,需要自己认真
推理
细节。
WynnLu
·
2025-02-27 21:29
算法
leetcode
c++
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他