记忆训练第2页

记忆训练

模型部署全流程：SavedModel、TFLite、TF.js、ONNX 的导出与实战

从训练到导出，用户可根据目标平台灵活选择格式，部署到：服务端（TFServing/TensorRT）移动端（TensorFlowLite）浏览器端（TensorFlow.js）多框架跨平台（ONNX）本章我们将覆盖四大部署格式

AI筑梦师·2025-03-25 00:44

NPU上如何使能pytorch图模式

它通过将PyTorch的动态图转换为静态图，并利用Just-In-Time（JIT）编译技术，显著提高模型的推理速度和训练效率。

·2025-03-25 00:34

《 C++ 点滴漫谈：三十一》写好递归不踩坑：C++ 递归函数的精髓与实战

同时，针对递归的性能问题，我们探讨了优化策略，包括尾递归优化、记忆化搜索和动态规划等。

Lenyiin·2025-03-25 00:43

阿里一面都会考什么？

今天分享的是训练营的朋友在阿里一面的面试题，内容涉及Redis的核心知识点和LRU算法的实现。这些内容非常实用，尤其是对正在准备面试或工作中需要用到Redis的同学。一起来看看吧！

·2025-03-25 00:02

从沈抖到谢广军，百度智能云何时“云开月明”？

今年2月，百度智能云全员会上沈抖向友商“开炮”，表示DeepSeek的来势汹汹，首当其冲的AI产品，是字节跳动的豆包，理由是其训练成本和投流成本都很高。

互联网江湖·2025-03-25 00:39

基于Hugging Face的Transformer实战

HuggingFace生态提供：30,000+预训练模型（BERT、GPT、T5等）统一的TransformerAPI接口快速实现下游任务迁移企业级部署工具（Optimum、InferenceEndpoints

小诸葛IT课堂·2025-03-24 23:03

在 web 部署 YOLOv8目标检测（Django+html）

本文介绍如何将自己训练好的模型在网页上进行应用，使用Django+html进行部署，能够对视频和图像进行识别，并显示到页面上，下面是一个效果：上传和另外7个页面-个人-MicrosoftEdge2025

Edward-tan·2025-03-24 22:59

万字长文总结多模态大模型后训练

万字长文总结多模态大模型后训练作者：yearn原文：https://zhuanlan.zhihu.com/p/31278114666本文介绍下我们对多模态alignment近期一系列进展的整理和总结大语言模型

强化学习曾小健·2025-03-24 21:49

深度学习：让机器学会“思考”的魔法

1.训练过程：从“笨拙”到“熟练”2.损失函数：衡量“错误”的尺子3.反向传播：从错误中“反思”四、深度学习的“超能力”1.图像

AI极客Jayden　·2025-03-24 18:50

群体智能优化算法-模拟退火优化算法（Simulated Annealing, SA，含Matlab源代码）

SA具有收敛速度快、计算复杂度低、适用于连续优化问题等特点，被广泛应用于组合优化、函数优化、神经网络训练等领域。算法介绍1.主要

HR Zhou·2025-03-24 17:17

第三十九个问题-详细讲讲PPO & GRPO原理

PPO（ProximalPolicyOptimization）原理详解PPO（近端策略优化）是OpenAI于2017年提出的强化学习算法，旨在解决传统策略梯度方法中训练不稳定和样本效率低的问题。

释迦呼呼·2025-03-24 17:45

代码随想录算法训练营第四十一天 | hot65/100| 33.搜索旋转排序数组、153.寻找旋转排序数组中的最小值、155.最小栈、394.字符串解码

33.搜索旋转排序数组思路是：数组可能有两种情况2345671和6712345将数组一分为二，其中一定有一个是有序的，每次判断前半部分是有序的还是后半部分是有序的，每次只在有序的那部分里找。无序那部分不管（没找到会重新一分为二，继续在有序的一半里找，迟早会找到）注意点：这道题重点是记住边界条件（哪些是小于等于小于大于等于大于）有小于等于/大于等于的情况是因为，如果出现[2,1]中找1的情况，需要有

boguboji·2025-03-24 17:42

代码随想录算法训练营第三十八天 | hot57/100| 114.二叉树展开为链表、437.路径总和III、124.二叉树中的最大路径和、22.括号生成

114.二叉树展开为链表思路是：（1）定义方法，先序遍历保证顺序，把节点按顺序保存（2）再for循环转成链表，一列都是往右排列完整代码：classSolution{ publicvoidflatten(TreeNoderoot){ Listlist=newArrayList(); preorderTraversal(root,list); intsize=list.size()

boguboji·2025-03-24 17:42

代码随想录算法训练营第十天 | 栈与队列part01| 232.用栈实现队列、225. 用队列实现栈、 20. 有效的括号、1047. 删除字符串中的所有相邻重复项

232.用栈实现队列栈与队列的基本知识：Stackstack=newStackq=newLinkedListstack=newStack显然是存储整数类型，如果要存储字符，应该用Dequedeque=newLinkedListstack=newStack<>();还有我写for(inti=0;i

boguboji·2025-03-24 17:12

代码随想录算法训练营第二十三天 | 回溯算法part02| 39. 组合总和、40.组合总和II、131.分割回文串

39.组合总和这道题和前面组合问题的区别是，取的元素可以重复，也就是遍历的时候，同一个元素可以一直取。所以for循环里，逐个添加元素，判断和大于目标时break（否则会一直加）还是新建二维数组放结果，一维数组放path。输入参数为放结果数组、path、提供的数组、目标值、目前总和sum、startIndex提前把提供的数组排序，用Arrays.sort()这样sum超过target就break递归

boguboji·2025-03-24 17:41

LLM大模型提示工程Prompt Engineering

在LLM中影响词汇的分布主要通过两种方式，一种是通过提示（Prompting），另外一种就是通过训练（Training）。

Langchain·2025-03-24 16:08

AI算力要变天了？一文搞懂ASIC和GPU

从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化

·2025-03-24 15:08

优选算法训练篇07--力扣LCR179.查找总价格为目标值的两个商品

目录1.题目链接：LCR179.查找总价格为目标值的两个商品2.题目描述：3.解法一(暴力解法，会超时)：4.解法二(双指针-对撞指针):1.题目链接：LCR179.查找总价格为目标值的两个商品2.题目描述：购物车内的商品价格按照升序记录于数组price。请在购物车中找到两个商品的价格总和刚好是target。若存在多种情况，返回任一结果即可。示例1：输入：price=[3,9,12,15],tar

大胆飞猪·2025-03-24 15:28

算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案

引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。

·2025-03-24 14:07

英伟达开源超强模型Nemotron-70B；OpenAI推出Windows版ChatGPT桌面客户端

该模型在多项基准测试中表现优异，采用混合训练方法和人类反馈强化学习，模型权重已在HuggingFace发布。Niemotron-70B的开发基于Llama-3.1，且开源数据集加强其训练效果。

go2coding·2025-03-24 14:55

代码随想录算法训练营Day19| LeetCode 77 组合、216 组合总和 III、17 电话号码的字母组合

理论基础回溯的本质是穷举，也就是暴力求解，它是递归的一部分。所有回溯法解决的问题都可以抽象为树形结构，因为回溯法解决的都是在集合中递归查找子集，集合的大小构成了树的宽度，递归的深度就构成了树的深度（cr.代码随想录）。应用回溯一般被用于以下几种问题（cr.代码随想录）的求解中：组合问题：N个数里面按一定规则找出k个数的集合切割问题：一个字符串按一定规则有几种切割方式子集问题：一个N个数的集合里有多

今天也要早睡早起·2025-03-24 13:17

【AI大模型】搭建本地大模型GPT-NeoX：详细步骤及常见问题处理

搭建本地大模型GPT-NeoX：详细步骤及常见问题处理GPT-NeoX是一个开源的大型语言模型框架，由EleutherAI开发，可用于训练和部署类似GPT-3的大型语言模型。

qzw1210·2025-03-24 09:13

LLMOps 是什么？

这些操作可以涵盖多个领域，例如模型的训练、推理优化、部署、监控、故障排除等。在实际应用中，LLMOps的目标是提高语言模型的效率和效果，确保模型能够在各种实际场景中顺利运行。

AI Agent首席体验官·2025-03-24 08:35

万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？

引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。

羊不白丶·2025-03-24 07:55

YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）

多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练

@M_J_Y@·2025-03-24 07:20

Deepseek和豆包在技术创新方面有哪些相同点与不同点？

该架构将模型拆分为多个“专家”，训练和推理时让不同“专家”负责不同任务或数据子集，提高模型表达能力和效率，降低训练成本。模型优化以提升性能：都通过

alankuo·2025-03-24 06:16

【机器学习】算法分类

1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。

CH3_CH2_CHO·2025-03-24 05:08

基于 PyTorch 的 MNIST 手写数字分类模型

代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。

欣然～·2025-03-24 04:27

使用Titan Takeoff进行高效的自然语言处理模型推理

在自然语言处理(NLP)领域，每一家企业都在寻求更高效的模型训练和推理解决方案。TitanML的平台通过训练、压缩和推理优化帮助企业构建和部署更佳、更小、更便宜、更快速的NLP模型。

scaFHIO·2025-03-24 04:54

代码随想录算法训练营DAY59｜110.字符串接龙、105.有向图的完全可达性、106. 岛屿的周长

110.字符串接龙fromcollectionsimportdequedeffindshortestpath(strlist,beginstr,endstr):que=deque()visited={}que.append(beginstr)visited[beginstr]=1result=0whileque:cur=que.popleft()result=visited[cur]foriinr

阿緑·2025-03-24 03:42

基于NanoDet的无人机交通违规监控系统设计与实现

本博客详细介绍了数据集的构建、模型的训练与推理、碰撞检测算法的实

深度学习&目标检测实战项目·2025-03-24 02:09

代码训练day7哈希表2

1.四数相加IIleetcode454哈希表判断是否存在classSolution{//四数相加ii统计个数publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMapmap=newHashMapmagazine.length())returnfalse;//java字符串长度s.length()for(cha

徵686·2025-03-24 02:02

量化交易系统中如何处理机器学习模型的训练和部署？

microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程

openwin_top·2025-03-24 01:27

算法训练（leetcode）第四十六天 | 110. 字符串接龙、105. 有向图的完全可达性、106. 岛屿的周长

刷题记录*110.字符串接龙105.有向图的完全可达性邻接矩阵邻接表106.岛屿的周长深搜简化代码*110.字符串接龙题目地址使用广搜。本题相当于求最短路径，因此使用广搜。如何应用广搜是一个难点，因为题目给的是字符串而非图的表示（邻接矩阵、邻接表），因此需要自行构建连接关系。题目要求每一步只能修改一个字符，因此从起始字符串开始，对字符串中的每一个字符进行修改，修改后在输入的字符串列表中查找是否存在

Star Patrick·2025-03-24 01:21

笔记：代码随想录算法训练营day60：并查集理论基础、寻找存在的路径

本文为学习并查集理论基础|代码随想录、代码随想录过程中的思考find是找的顶头上司，而不是当前上司，最后怎么也得找到一个顶头上司的上司是自己，要不然这个结构也不成立使用issame替换会使被操作者为当前节点，而非根节点。join(u,v)的功能为将v的根节点挂到u的根节点下模拟过程可以看出，join中的find中的路径压缩要在长度大于2（路径大于1）的时候才会体现出来107.寻找存在的路径卡码网题

jingjingjing1111·2025-03-24 00:47

stc89c51单片机音乐盒系统设计_基于单片机STC89C52的数字音乐盒设计

对学生进行基本技能训练，例如：组成系统、编程、调试、查阅资料、焊接电路板等。使学生理论联系实际，提高动手能力和分析问题、解决问题的能力。1.2设计的基本要求(1)利用I/O口产生一定频率的

Fax Caelestis·2025-03-24 00:42

六十天前端强化训练之第二十九天之深入解析：从零构建企业级Vue项目的完整指南

=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、Vite核心原理与开发优势二、项目创建深度解析三、配置体系深度剖析四、企业级项目架构设计五、性能优化实战六、开发提效技巧七、质量保障体系八、扩展阅读推荐一、Vite核心原理与开发优势1.1为什么选择Vite？Vite采用现代浏览器原生ES模块系统（NativeESM）作为开发服务器，颠覆了传统打包工具的

编程星辰海·2025-03-23 22:35

【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set

比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。

开心星人·2025-03-23 22:34

【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现

虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分

LittleNyima·2025-03-23 22:02

震惊！ “深度学习”都在学习什么

常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本

扉间798·2025-03-23 22:01

【论文阅读】Availability Attacks Create Shortcuts

还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。

开心星人·2025-03-23 22:01

NLP高频面试题（十）——目前常见的几种大模型架构是啥样的

LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理

Chaos_Wang_·2025-03-23 22:30

代码随想录算法训练营Day10 | Leetcode 150逆波兰表达式求值、239滑动窗口最大值、 347前 K 个高频元素

代码随想录算法训练营Day10|Leetcode150逆波兰表达式求值、239滑动窗口最大值、347前K个高频元素一、反转字符串相关题目：Leetcode150文档讲解：Leetcode150视频讲解：

Dominic_Holmes·2025-03-23 22:58

【机器学习】朴素贝叶斯入门：从零到垃圾邮件过滤实战

Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain

吴师兄大模型·2025-03-23 18:22

Sklearn.model_selection.GridSearchCV

cv:S折交叉验证的折数，即将训练集分成多少份来进行交叉验证。默认是3,。如果样本较多的话，可以适度增大cv的值。scoring:评价标准。获取最好的模型

kakak_·2025-03-23 17:47

【机器学习】机器学习四大分类

机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。

藓类少女·2025-03-23 17:16

OCR识别常见开源库

准确识别的前提是找到正确的字体进行训练，字体很重要，要覆盖所有识别的场景。Tess

yxfamyself·2025-03-23 17:44

A800核心加速技术深度剖析

通过实测数据显示，在典型AI训练场景下，A800相较于前代架构实现了3.2倍的吞吐量提升，同时单位功耗下的指令执行效率优化达47%。技术维度第二代架构A800架构提升

智能计算研究中心·2025-03-23 15:56

H200架构升级与实战解析

本文将从芯片级设计革新出发，剖析其多维度升级路径：首先解读计算单元拓扑重组带来的并行效率提升，阐释内存子系统的带宽优化策略；继而拆解面向AI训练场景的混合精度加速机制，以及科学计算工作负载的动态资源调度方案