推理训练第4页

ollama 基本使用教程

目录1.安装OllamamacOS或LinuxWindows(WSL2)2.基础命令启动与停止更新Ollama3.模型管理下载预训练模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4

海上彼尚·2025-03-21 12:17

【新品发售】NVIDIA 发布全球最小个人 AI 超级计算机 DGX Spark

DGXSpark(前身为ProjectDIGITS)支持AI开发者、研究人员、数据科学家和学生，在台式电脑上对大模型进行原型设计、微调和推理。

·2025-03-21 12:09

Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！）

HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。

y江江江江·2025-03-21 10:31

Open-Sora - 为所有人实现高效的视频制作大众化

小众AI·2025-03-21 10:57

机器学习课堂4线性回归模型+特征缩放

一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt

木尘152132·2025-03-21 09:17

风控算法（一）——数据测试

确定样本（对齐样本与时间，去除假样本）——确定特征（确认目前特征）——数据信息（返回的数据字典、收费方式、底层数据：特征、分数）——数据清洗（缺失值替换）——数据训练形成报告。

月亮月亮要去太阳·2025-03-21 09:15

Adam-mini：深度学习内存效率新突破

在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的

XianxinMao·2025-03-21 08:42

【机器学习】模型拟合

无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。

CH3_CH2_CHO·2025-03-21 08:41

笔记：代码随想录算法训练营day57：99.岛屿数量深搜、岛屿数量广搜、100.岛屿的最大面积

学习资料：代码随想录注：文中含大模型生成内容99.岛屿数量卡码网题目链接（ACM模式）先看深搜方法：找到未标标记过的说明找到一片陆地的或者一片陆地的一个角落，dfs搜索是寻找相连接的陆地其余部分并做好标记#include#includeusingnamespacestd;intdirection[4][2]={0,1,-1,0,0,-1,1,0};voiddfs(constvector>&B612

jingjingjing1111·2025-03-21 07:36

笔记：代码随想录算法训练营day56:图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础

学习资料：代码随想录连通图是给无向图的定义，强连通图是给有向图的定义朴素存储：二维数组邻接矩阵邻接表：list基础知识：C++容器类|菜鸟教程深搜是沿着一个方向搜到头再不断回溯，转向；广搜是每一次搜索要把当前能够得到的方向搜个遍深搜三部曲：传入参数、终止条件、处理节点+递推+回溯98.所有可达路径卡码网题目链接（ACM模式）先是用邻接矩阵，矩阵的x,y表示从x到y有一条边主要还是用回溯方法遍历整个

jingjingjing1111·2025-03-21 07:01

群体智能优化算法-粒子群优化算法（Particle Swarm Optimization, PSO，含Matlab源代码）

PSO具有收敛速度快、实现简单、计算复杂度低等优点，广泛应用于函数优化、神经网络训练、工程优化等领域。算法介绍1.主

HR Zhou·2025-03-21 07:57

IsaacLab最新2025教程(3)-搭建训练场景

前言本文将详细介绍如何使用IsaacLab进行场景搭建与物理仿真，为后续的训练打下基础。

Calm_dw·2025-03-21 06:51

高性能计算:GPU加速与分布式训练

传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。

AI天才研究院·2025-03-21 06:17

LLM(7)：文本分词 token 化

此处用于训练LLM的文本是伊迪斯·沃顿的短篇小说《TheVerdict》，该作品已进入公

CS创新实验室·2025-03-21 05:17

基于Python的智能决策支持系统：实现智能化决策的关键要素

文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法

AI天才研究院·2025-03-21 05:13

代码随想录算法训练营第三十五天（20250303） |01背包问题二维，01背包问题一维，416. 分割等和子集 -[补卡20250316]

01背包问题二维链接遍历物品没有大小顺序要求重点是模拟，推导出递推公式#include#includeintmain(){intm,n;std::cin>>m>>n;std::vectorweight(m,0),value(m,0);for(inti{0};i>weight[i];}for(inti{0};i>value[i];}std::vector>dp(m,std::vector(n+1,0

ZXZ_13·2025-03-21 04:10

32.代码随想录算法训练营第三十二天|509. 斐波那契数,70. 爬楼梯，746. 使用最小花费爬楼梯

32.代码随想录算法训练营第三十二天|509.斐波那契数,70.爬楼梯，746.使用最小花费爬楼梯DP数组的定义以及下标的含义递推公式动态规划的初始化是很重要的遍历顺序打印数组509.斐波那契数-力扣（

白鹭鸣鸣！·2025-03-21 04:10

NLU-预训练模型-2018：Bert（二）【“Masked LM”缺点：①预训练与微调不一致；②忽略了掩码位置间的依赖关系】【复杂度：O(n^2·d)；n：输入序列长度（规定最长512）】

五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如，如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配，这些表示将帮助准确的检索匹配客户意图和上下文含义的结果，即使没有关键字或短语重叠。其次，或许更重要的是，这些向量被

u013250861·2025-03-21 04:08

大模型微调

文章目录前言一、使用的库二、数据预处理1.引入库2.读入数据3.对数据进行预处理4.转换为json格式文件三，使用算子分析数据并进行数据处理四，划分训练集和测试集五，编写训练脚本开始训练六，进行模型推理人工评估总结前言这是使用知乎评论进行模型微调

归一码字·2025-03-21 04:36

AI 大模型应用数据中心的数据迁移架构

这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据

AGI大模型与大数据研究院·2025-03-21 03:34

DeepLabv3+改进18:在主干网络中添加REP_BLOCK

本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络（ConvNet）构建模块，可在不增加推理时间成本的情况下提升性能

AICurator·2025-03-21 03:01

六十天前端强化训练之第二十一天大师级详解 React Context API：从原理到实战

=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、庖丁解牛：深入理解ContextAPI1.1设计哲学与运转机制工作原理三步曲：1.2核心三剑客详解1.3性能优化要诀二、手把手实现主题切换系统2.1完整代码实现（逐行注释版）2.2配套CSS样式设计三、关键知识点拆解3.1状态初始化策略3.2CSS变量注入原理3.3性能优化实践3.4可访问性最佳实践四、

编程星辰海·2025-03-21 02:26

华为OD机试九日集训第2期 - 按算法分类，由易到难，循序渐进，提升编程能力和解题技巧，从而提高机试通过率

目录一、适合人群二、本期训练时间三、如何参加四、数据结构与算法大纲五、华为OD九日集训第1期第1天、逻辑分析第2天、队列第3天、双指针第4天栈第5天滑动窗口第6天、二叉树第7天、并查集第8天、矩阵第9天

哪吒·2025-03-21 02:48

模型部署实战：PyTorch生产化指南

模型部署是将训练好的模型‌投入实际应用‌的关键步骤，涉及：模型格式转换（TorchScript/ONNX）性能优化（量化/剪枝）构建API服务移动端集成本章使用ResNet18实现图像分类，并演示完整部署流程

小诸葛IT课堂·2025-03-21 01:45

H800核心性能优化技术

这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的

智能计算研究中心·2025-03-21 01:13

Qwen2-Audio：通义千问音频大模型技术解读

引言：从llm到mlm（audio）大型语言模型（LLM）的发展日新月异，它们在文本理解、生成、推理等方面展现出惊人的能力。

kakaZhui·2025-03-21 01:41

【AI论文】RWKV-7“鹅”模型，具备富有表现力的动态状态演化能力

摘要：我们推出RWKV-7“鹅”，这是一种全新的序列建模架构，同时发布的还有预训练语言模型。

东临碣石82·2025-03-21 00:02

Dify 项目开源大模型应用开发平台

其核心功能包括：可视化工作流构建通过可视化画布（如ReactFlow）编排AI工作流，支持多步骤任务处理，例如文档解析、模型推理和

魔王阿卡纳兹·2025-03-20 23:30

基于Python的金融领域AI训练数据抓取实战（完整技术解析）

项目背景与需求分析场景描述为训练一个覆盖全球金融市场的多模态大语言模型（LLM），需实时采集以下数据：全球30+主要证券交易所（NYSE、NASDAQ、LSE、TSE等）的上市公司公告企业财报PDF文档及结构化数据社交媒体舆情数据

海拥✘·2025-03-20 23:57

PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧

前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、

lmtealily·2025-03-20 21:37

数据分析_python进行数据筛选1_行筛选

以titanic的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin

Monkey*王·2025-03-20 20:28

《魔兽争霸-黑潮》游戏秘籍

DECKMEOUT部队升级EVERYLITTLETHINGSHEDOES魔法升级GLITTERINGPRIZES增加黄金、木材、油量ITISAGOODDAYTODIE无敌MAKEITSO加快建筑、训练、

小魚資源大雜燴·2025-03-20 19:25

【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练

目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3

Donvink·2025-03-20 19:24

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-20 19:23

基于大模型的腮腺多形性腺瘤全周期诊疗方案研究报告

目录一、引言1.1研究背景与目的1.2研究现状与趋势二、大模型预测原理与方法2.1大模型概述2.2数据收集与预处理2.3模型训练与优化三、术前预测与评估3.1肿瘤特征预测3.2风险评估3.3案例分析四、

LCG元·2025-03-20 19:53

PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法

在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。

进取星辰·2025-03-20 19:52

知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色

知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。

PersistDZ·2025-03-20 18:47

一切皆是映射：DQN训练加速技术：分布式训练与GPU并行

1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用

AI天才研究院·2025-03-20 18:45

LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人

它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。

南七小僧·2025-03-20 18:44

大规模语言模型从理论到实践分布式训练的集群架构

大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型

AI智能涌现深度研究·2025-03-20 18:14

图生视频技术的发展与展望：从技术突破到未来图景

早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD

Liudef06·2025-03-20 18:12

附tensorrt推理代码

设备：cuda12.1,cudnn8.9.2,tensorrt8.6.11.问题tensorrt的推理没输出？？？

李卓璐·2025-03-20 18:11

Hugging Face 模型格式全解析：从 PyTorch 到 GGUF

HuggingFace模型格式全解析：从PyTorch到GGUFHuggingFace生态支持多种模型格式，以满足不同场景下的存储、部署和推理需求。

mingo_敏·2025-03-20 17:37

【机器视觉】少量样本图片情况下的图片识别技术方案

以下是一些应对小样本问题的有效方案：1.数据增强（DataAugmentation）通过对现有样本进行各种变换来生成更多的训练数据，例如：几何变换：旋转、缩放、平移、翻转等。

yuanpan·2025-03-20 16:01

模型微调：让AI更懂你的魔法棒

模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。

带上一无所知的我·2025-03-20 14:10

聊聊关于Python与人工智能那些事

Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。

小G-biu-·2025-03-20 13:37

用LangChain构建自愈式生成式AI：颠覆传统知识库的智能问答系统实战

本文将揭秘如何通过LangChain框架构建具有自进化能力的智能问答系统，实现企业知识库的实时动态更新与智能推理。通过本文，您将掌握一套让AI系统在运行中持续学习、自主优化的创新架构。

煜bart·2025-03-20 13:32

复旦：过程奖励优化多模态推理

2503.10291摘要我们引入了VisualPRM，这是一种具有8B参数的高级多模态过程奖励模型（PRM），它通过Best-of-N（BoN）评估策略提高了现有多模态大型语言模型（MLLM）在不同模型尺度和族之间的推理能力

大模型任我行·2025-03-20 13:59

使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）

2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.

一碗黄焖鸡三碗米饭·2025-03-20 12:28

集成学习（Ensemble Learning）基础知识1

4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？

代码骑士·2025-03-20 12:57

推荐频道

推理训练