训练第8页

QPython双核攻略：从零基础到AI开发，你的手机就是全栈训练营

主题一：《编程小白必看！在手机上种下你的第一行代码》✨北京优趣天下信息技术有限公司重磅出品我们比谁都清楚：✔️86%的初学者因环境配置放弃编程✔️72%的上班族只有碎片化学习时间✔️95%的自学者需要即时答疑支持为什么QPython成为2025现象级学习工具？▸全栈开发环境：解释器+编辑器+控制台三合一▸AI导师常驻：集成DeepSeek代码助手（支持中英双语提问）▸极速学习路径：Q派课程7天完成

程之编·2025-03-11 09:39

“大语言模型微调”（Fine-tuning）与“大语言模型应用”（LLM Applications）之间的区别

1.概念与定义大语言模型微调微调指的是在一个经过大规模预训练的通用语言模型基础上，利用针对性较强的小规模数据集对模型进行进一步训练，从而使模型在特定领域或任务上表现得更优秀。

AI Echoes·2025-03-11 09:06

Python第十六课：深度学习入门 | 神经网络解密

本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的训练过程掌握防止过拟合的基础策略一、神经网络基础（大脑的数字化仿生）1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和

程之编·2025-03-11 09:03

【大模型开发】Megatron-LM 深度解析：原理、应用与代码实现

所有内容基于Megatron-LM官方实现（GitHub:NVIDIA/Megatron-LM），并结合大规模模型训练的关键理念进行介绍。

云博士的AI课堂·2025-03-11 08:27

【大模型开发】深入解析 DeepSpeed：原理、核心技术与示例代码

深入解析DeepSpeed：原理、核心技术与示例代码DeepSpeed是由微软开源的高性能深度学习训练优化引擎，专注于帮助研究人员和工程团队在分布式环境中高效地训练超大规模模型。

云博士的AI课堂·2025-03-11 08:57

【大模型开发】大模型背后的基础组件与生态概览

本文将介绍其中几大核心组件和框架，包括HuggingFaceTransformers、DeepSpeed、Megatron-LM，以及其他相关工具和方法，展示它们在训练效率

云博士的AI课堂·2025-03-11 08:56

一学就会的深度学习基础指令及操作步骤（6）迁移学习

文章目录迁移学习模型准备数据增强模型训练模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上，以提高新任务的学习效率和性能。

小圆圆666·2025-03-11 07:49

领域大模型之微调技术和最佳实践

BERT和GPT-3等语言模型针对语言任务进行了预训练。微调使它们适应特定领域，如营销、医疗保健、金融。在本指南中，您将了解LLM架构、微调过程以及如何为NLP任务微调自己的预训练模型。

程序员莫玛·2025-03-11 07:17

学睿德毅育贤才，AI 剪辑绽华彩

“小白AI短视频训练营”,恰似一把钥匙,为零基础学员开启AI短视频创作的大门。在这里,学员能够借助AI技术,探索记录生活的全新视角,以独特的剪辑手法展现生活的精彩

互联网之声·2025-03-11 06:13

AI 技术引入 RTK（实时动态定位）系统，可以实现智能化管理和自动化运行

通过历史数据训练模型，实现快速解算。实例：某无人机公司使用A

小赖同学啊·2025-03-11 06:39

如何对大模型进行微调？从原理到实战全解析

微调指在预训练大模型（如GPT-3.5、LLaMA）的基础上，使用特定领域的数据进行二次训练，使模型适应新任务或领域需求。

挣扎与觉醒中的技术人·2025-03-11 05:32

在LangChain中运行Replicate模型的实用指南

##技术背景介绍Replicate是一个平台，可以轻松调用各种预训练的AI模型。与传统的模型托管和调用相比，Replicate提供了简单的API接口，使开发者能够快速集成和使用强大的AI模型。

fgayif·2025-03-11 04:50

3.10 项目总结

今天的项目是一个使用PyTorch框架构建和训练神经网络的实例，旨在实现手写数字识别。以下是项目的总结、内容分析以及优化建议：项目总结1.目标：使用神经网络对MNIST数据集中的手写数字进行分类。

不要不开心了·2025-03-11 01:58

点云语义分割：PointNet++在S3DIS数据集上的训练

点云语义分割：PointNet++在S3DIS数据集上的训练点云语义分割是计算机视觉领域的一个重要任务，旨在将点云数据中的每个点分配给其对应的语义类别。

完美代码·2025-03-11 00:25

windows11家庭版安装ubuntu子系统训练深度模型

文章目录环境准备前提条件安装环境安装Hyper-V安装Linux分发版升级WSL内核启用虚拟机功能安装ubuntu24.04安装桌面环境安装远程控制软件xrdp从Windows启动桌面版Ubuntu环境准备前提条件windows机器需要支持虚拟化，并且需要在BIOS中开启虚拟化技术，因为WSL2基于hyper-V，查看是否开启虚拟化：按住Windows+R输入cmd打开命令行，输入systemin

吃水果不削皮·2025-03-10 23:16

在Ubuntu系统下部署大语言模型

前言在Ubuntu系统下部署大语言模型，可以使用HuggingFace的Transformers库来加载和使用预训练的模型。

脱泥不tony·2025-03-10 22:39

机器学习算法（2）—— 线性回归算法

82,80],[85,78],[90,90],[86,82],[82,90],[78,80],[92,94]]y=[84.2,80.6,80.1,90,83.2,87.6,79.4,93.4]‘’‘模型训练

疯狂的石头。·2025-03-10 21:35

Compressed Channel Estimation for Intelligent Reflecting Surface-Assisted Millimeter Wave Systems

为了减少训练开销，利用了毫米波信

No_one-_-2022·2025-03-10 20:21

AI产品大模型学习指南：清晰路线，AI产品经理必备知识点一网打尽！_AI产品经理

实际上AI只是一种对传统产品或服务赋能的手段而已，将各种“中间件”（通常是一种训练好的模型，当输入一定数据后自动返回一定的输出值）、传感器等不同形式的软件、硬件融入传统产品或服务的使用或体验流程中。

AGI大模型学习·2025-03-10 18:38

Training-Free Transformer Architecture Search WithZero-Cost Proxy Guided Evolution（预览版本）

为了提高搜索效率，基于无训练代理的方法已在神经架构搜索(NAS)中得到广泛采用。然而，这些代理被发现不足以很好地推广到Transformer搜索空间，这一点已被多项研究和我们自己的实

境心镜·2025-03-10 18:05

用双色球数据集微调后的大模型

最近用Qwen/Qwen1.5-1.8B-Chat大模型来微调训练双色球2003001-2025011的数据集，实验测一下大模型出球的预测情况。

qq_29790801·2025-03-10 17:33

深度学习项目十一：mmdetection训练自己的数据集

mmdetection训练自己的数据集这里写目录标题mmdetection训练自己的数据集一：环境搭建二：数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式

小啊磊_Vv·2025-03-10 17:02

深度学习 PyTorch 中 18 种数据增强策略与实现

深度学习pytorch之简单方法自定义9类卷积即插即用数据增强通过对训练数据进行多种变换，增加数据的多样性，它帮助我们提高模型的鲁棒性，并减少过拟合的风险。

@Mr_LiuYang·2025-03-10 16:25

从前端程序员到大模型工程师的转型攻略

在科技日新月异的今天，人工智能（AI）特别是大规模预训练模型（大模型）的发展正引领着新一轮的技术革命。

七七Seven～·2025-03-10 15:19

深度学习笔记——Resnet和迁移学习

这使得深层网络难以训练。梯度消失：梯度消失是指在训练深度神经网络时，通过多层传递的梯度(误差)变得非常小，接近于零。这导致网络中较早层的权重更新非常缓慢，甚至几乎不更新。

肆——·2025-03-10 15:17

MMDetection实用工具详解（上）：日志分析、结果分析、混淆矩阵

实用工具目录一、日志分析使用方法实际案例二、结果分析pkl结果文件生成使用方法实际案例三、混淆矩阵使用方法实际案例遇到的UserWarning解决方案MMDetection官方除了训练和测试脚本，他们还在

MickeyCV·2025-03-10 15:46

Vision Transformer 分类水果图片集 Python 代码（可训练自己数据集）

代码链接:https://github.com/Illusionna/ComputerVision/tree/main/EfficientTransformerArepositoryforViT.ContributetoIllusionna/TransformerdevelopmentbycreatinganaccountonGitHub.https://github.com/Illusionna

Illusionna.·2025-03-10 14:37

AI浪潮下的数据保卫战：SSL证书为何成为企业刚需？

无论是训练AI模型、优化算法，还是提供个性化服务，数据的安全性和隐私保护都至关重要。

·2025-03-10 13:16

深度学习在SSVEP信号分类中的应用分析

目录前言1.SSVEP信号分类的处理流程2.模型输入和数据预处理3.模型结构设计3.1卷积神经网络（CNN）3.2长短期记忆网络（LSTM）4.训练方法与激活函数5.性能评估与挑战6.未来方向前言随着脑机接口

自由的晚风·2025-03-10 12:00

AF3 block_delete_msa函数解读

这在训练时可能用于数据增强（防止模型对MSA过度依赖）。推理（inference）时不会使用，因为完整MSA对预测准确性很重要。

qq_27390023·2025-03-10 10:43

基于PyTorch的深度学习4——使用numpy实现机器学习vs使用Tensor及Antograd实现机器学习

利用数组x，y的数据为训练数据。最后，采用梯度梯度下降法，通过多次迭代，学习到w、b的值。以下为具体步骤：1)导入需要的库。

Wis4e·2025-03-10 09:09

论文阅读笔记——Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware

具体来说，当智能体（agent）在测试时遇到训练集中未见过的情况时，可能会产生预测误差。这些误差会逐步累积，导致智能体进入未知状态，最终

寻丶幽风·2025-03-10 09:09

AI 大模型应用数据中心建设：数据中心成本优化

无论是进行深度学习模型的训练，还是大模型应用的推理，数据中心都需要提供充足的计算资源、存储空间和网络带宽。

杭州大厂Java程序媛·2025-03-10 09:38

Process-based Self-Rewarding Language Models 论文简介

基于过程的自奖励语言模型：LLM优化的新范式引言大型语言模型（LLM）在多种任务中展现出了强大的能力，尤其是在使用人工标注的偏好数据进行训练时。

ZHOU_CAMP·2025-03-10 08:31

实战1. 利用Pytorch解决 CIFAR 数据集中的图像分类为 10 类的问题

实战1.利用Pytorch解决CIFAR数据集中的图像分类为10类的问题加载数据建立模型模型训练测试评估你的任务是建立一个用于CIFAR图像分类的神经网络，并实现分类质量>0.5。

啥都鼓捣的小yao·2025-03-10 08:57

Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）

然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种

境心镜·2025-03-10 08:54

谷歌搜索并发搜索/cookie并发生成方案

20并发，则可以每秒保持千次cookie的生成并发查询嘎嘎快，单条cookie存活为60秒，可以重复查询200次以内需要联系另外腾讯系阿里系AI训练标注也可以联系

背拥·2025-03-10 07:17

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty（三）

无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。另外，使用Docker实现便捷测试成为一种高效的解决方案。

开源技术探险家·2025-03-10 06:43

构建一个完整的视觉Transformer（ViT）图像分类模型 VIT （vision transformer）图像分类

Jackie_AI·2025-03-10 04:29

Windows下的PaddleOCR本地部署

anaconda（网上教程很多很详细）2.创建环境3.激活环境并在该环境下安装PaddlePaddle框架4.下载requirments.txt中的库（二）PaddleOCR安装【非重点】二、在自己的数据集上训练模型

wangkun_cl·2025-03-10 03:22

神经网络|(十四)|霍普菲尔德神经网络-Hebbian训练

【1】引言前序学习进程中，除了对基本的神经网络知识进行了学习，还掌握了SOM神经网络原理，文章链接包括且不限于：神经网络|(十一)|神经元和神经网络-CSDN博客神经网络|(十二)|常见激活函数-CSDN博客神经网络|(十三)|SOM神经网络-CSDN博客在此基础上，本篇文章学习一个新的神经网络：霍普菲尔德神经网络。【2】霍普菲尔德神经网络原理霍普菲尔德神经网络和SOM神经网络一样不走寻常路，SO

西猫雷婶·2025-03-10 02:17

语义检索-BAAI Embedding语义向量模型深度解析[1-详细版]：预训练至精通、微调至卓越、评估至精准、融合提升模型鲁棒性

语义检索-BAAIEmbedding语义向量模型深度解析[1-详细版]：预训练至精通、微调至卓越、评估至精准、融合提升模型鲁棒性语义向量模型（EmbeddingModel）已经被广泛应用于搜索、推荐、数据挖掘等重要领域

汀、人工智能·2025-03-10 01:36

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/

心心喵·2025-03-10 01:02

WebGPT: 基于浏览器辅助的问答系统，结合人类反馈优化答案质量

【摘要】本论文介绍了WebGPT，这是一种通过浏览器辅助问答系统来使用人类反馈进行训练和优化的模型。

土豆.exe·2025-03-10 00:30

数字识别项目

集成算法·Stacking·堆叠：很暴力，拿来一堆直接上（各种分类器都来了）·可以堆叠各种各样的分类器（KNN,SVM,RF等等）·分阶段：第一阶段得出各自结果，第二阶段再用前一阶段结果训练实现神经网络实例利用

不要天天开心·2025-03-10 00:29

自我训练模型：通往未来的必经之路？

摘要在探讨是否唯有通过自我训练模型才能掌握未来的问题时，文章强调了底层技术的重要性。当前，许多人倾向于关注应用层的便捷性，却忽视了支撑这一切的根本——底层技术。

耶耶Norsea·2025-03-09 22:11

代码随想录算法训练营第八天|代码随想录 541. 反转字符串 II

Day8代码随想录字符串代码随想录541.反转字符串II反转字符串如何调用函数×reverse(s[i],s[n-1])√reverse(s.begin()+i,s.end())×reverse(s[i],s[i+k-1])√reverse(s.begin()+i,s.begin()+i+k);reverse左闭右开不包含第二个参数的位置如果要反转i到i+k-1区间内的字符应该reverse(s.

心爱心爱·2025-03-09 22:34

使用DeepSeek来构建LangGraph Agent

随着DeepseekR1的发布，我们不得不把目光聚焦在这个能赶超多个顶流大模型的模型身上，它主要是其在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

乔巴先生24·2025-03-09 21:59

无监督AI训练:机遇与挑战并存

无监督AI训练：机遇与挑战并存关键词：无监督学习、AI训练、机器学习、聚类算法、降维技术、深度学习摘要：本文深入探讨无监督AI训练这一新兴领域，首先介绍了其基本概念与原理，然后详细解析了无监督AI训练的核心技术

AI天才研究院·2025-03-09 21:28

PyTorch：Python深度学习框架使用详解

自动微分：自动计算梯度，简化了机器学习模型的训练过程。丰富的API：提供了丰富的神经网络层、函数和损失函数。跨平

零度°·2025-03-09 21:25

推荐频道

训练