小游戏逻辑思维训练

LeetCode解决方案集：编程与面试技能提升

本文还有配套的精品资源，点击获取简介：LeetCode是一个编程训练平台，提供了大量编程题目，用于提升开发者的算法技能和面试准备。

徐子贡·2025-02-19 04:37

Python库 - transformers

它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。

司南锤·2025-02-19 03:28

conda更换环境版本（比如torch版本）

pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡训练的时候

挨打且不服66·2025-02-19 03:57

流行编程语言全解析：优势、应用与短板

机器学习与人工智能：构建和训练模型。典型示例：OpenAI在很多人工智能项目中广泛使用Python，如GPT系列模型的研发。网络爬虫：轻松从网页

a小胡哦·2025-02-19 03:27

LLaMA系列大模型调研与整理-llama-alpaca-lora

alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词：大模型，LLaMA，Alpaca，Lora，Belle，模型训练

AI大模型-大飞·2025-02-19 02:17

deepseek和ChatGPT 4o比较

后训练+RL/RLHFDeepSeekR1等推理模型是在通用模型的基础上进行“特训”（后训练+SFT/RL/RLHF），使其不仅知道得多还用得好

调皮的芋头·2025-02-19 02:46

采用分布式部署deepseek

分布式部署DeepSeek涉及使用多个计算节点来加速模型训练或提升推理效率。下面是一个基本的指南，帮助您了解如何进行分布式部署。

慧香一格·2025-02-19 02:14

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章

无需网络连接的数据隐私保护跨平台架构设计：支持Windows/macOS/Linux全平台模型管理引擎：自动化处理模型依赖与版本控制1.2DeepSeek模型特性多模态处理能力：文本生成、代码理解、数学推理中文优化架构：针对中文语料的特殊训练策略模型家族图谱

Allen-Steven·2025-02-19 01:05

【JAVA工程师从0开始学AI】，第四步：闭包与高阶函数——用Python的“魔法函数“重构Java思维

这里没有类的枷锁，函数既是武器又是盾牌，高阶函数组合出的"代码万花筒"，正是AI数据处理、模型训练的核心密码。本文将用J

架构默片·2025-02-19 01:03

腾讯云大模型知识引擎×DeepSeek赋能文旅

其核心优势包括：动态知识更新：突破传统大模型预训练数据的时间

繁依Fanyi·2025-02-19 00:55

huggingface/pytorch-image-models

huggingface/pytorch-image-models1.使用技巧1.1.训练指令单卡：pythontrain.py--pretrained--input-size3224224--mean000

GarryLau·2025-02-19 00:23

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

PyTorch.pth转ONNX：从模型训练到跨平台部署在深度学习里，模型的格式决定了它的可用性。如果你是PyTorch用户，你可能熟悉.pth文件，它用于存储训练好的模型。

MO__YE·2025-02-18 23:46

什么是Scaling Laws（缩放定律）；DeepSeek的Scaling Laws

ScalingLaws（缩放定律）ScalingLaws（缩放定律）在人工智能尤其是深度学习领域具有重要意义，以下是相关介绍及示例：定义与内涵ScalingLaws主要描述了深度学习模型在规模（如模型参数数量、训练数据量

ZhangJiQun&MXP·2025-02-18 23:14

智能算力中心万卡GPU集群架构深度解析

超万卡集群缩短训练时间，加速迭代，助力市场趋势应对。在超万卡集群中，高效稳定地训练大模型面临双重挑战：确保集群算力最大化、网

科技互联人生·2025-02-18 23:13

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

PyTorch.pth转ONNX：从模型训练到跨平台部署在深度学习里，模型的格式决定了它的可用性。如果你是PyTorch用户，你可能熟悉.pth文件，它用于存储训练好的模型。

MO__YE·2025-02-18 23:12

如何训练LLM“思考”（像o1和DeepSeek-R1一样, 高级推理模型解析

2024年9月，OpenAI发布了它的o1模型，该模型基于大规模强化学习训练，赋予了它“高级推理”能力。不幸的是，他们是如何做到这一点的细节从未被公开披露。

果冻人工智能·2025-02-18 22:06

商汤绝影端到端自动驾驶的迭代优化

自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型训练,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展，自动驾驶汽车从科幻走进了现实。

AGI大模型与大数据研究院·2025-02-18 22:33

2. 从HuggingFace下载千问模型、数据、微调并运行

视频链接（1）3.从HuggingFace下载千问模型、数据、微调并运行（上）_哔哩哔哩_bilibili在本课程中，我们将带你下载并本地运行一个大模型，进行模型的微调训练等,视频播放量525、弹幕量0

ApiChain·2025-02-18 20:45

解剖DeepSeek四把刀，一场深到源码，大到行业，细到人心盛宴

他们公开的是经过蒸馏的“成品模型”，而非原始训练框架：就像给你组装好的乐高战舰，却藏起了设计图纸。这种半开放式开源既能吸引开发者构建生态，又

leluckys·2025-02-18 19:33

SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别

和RLHF（基于人类反馈的强化学习）的区别STF（SupervisedFine-Tuning）和RLHF（ReinforcementLearningfromHumanFeedback）是两种不同的模型训练方法

钟小宇·2025-02-18 18:11

【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码

2.2ELM的学习过程介绍ELM的学习算法和训练过程。三、半监督极限学习机（SS-ELM）3.1SS-ELM的提

默默科研仔·2025-02-18 18:09

DeepSeek为什么超越了OpenAI

其中，技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预训练"架构，在特定领域的推理效率比OpenAI的GPT-4提升40%以上（根据2023年MLPerch基准测试）。

·2025-02-18 17:19

DeepSeek的训练与优化流程

DeepSeek的训练与优化流程一、数据工程体系1.多模态数据融合处理动态数据湖架构：实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB，支持200+文件格式自动解析智能清洗流水线

程序猿000001号·2025-02-18 17:01

机器学习基本篇

1基本概念机器学习，分为回归，分类，聚类，降维有监督学习回归，分类，有特征，有标签，进行训练，然后对新数据进行预测无监督学习聚类，降维。

胖胖的小肥猫·2025-02-18 16:51

deepseek本地部署后做微调训练实现智能对话的一些建议

在本地部署大模型后，进行微调和训练以实现智能对话，通常需要按照以下步骤操作。以下是详细的指导内容：1.准备数据集在微调大模型之前，需要准备适合的训练数据集。

慧香一格·2025-02-18 14:34

机器学习和线性回归、softmax回归

分类——交叉熵样本属于“哪一类”的问题称为分类问题回归是训练一个回归函数来输出一个数值；分类是训练一个分

小名叫咸菜·2025-02-18 13:53

大模型AI应用安全与合规测试实战指南-模型层

核心痛点直击：黑盒失控：生成内容不可预测，传统规则引擎失效数据深渊：训练数据含敏感信息，清洗难度指数级上升合规迷宫：全球AI监

测试匠心：技能精进·职场跃迁·面试赢家·2025-02-18 12:13

AI赋能教育：深度解析大模型在教育场景中的应用与架构设计【无标题】

在这篇文章中，我们将基于一张完整的应用设计架构图，从应用场景到AI核心能力、训练标注平台、智能处理引擎以及业务数据，全方位剖析大模型如何助力教育行业实现突破，真正实现“AI赋能教育，重塑未来”。

和老莫一起学AI·2025-02-18 11:33

算法训练Day01 Leetcode704.二分查找

0.学习资料来源题目链接：力扣https://leetcode.cn/problems/binary-search/文章讲解：代码随想录代码随想录PDF，代码随想录百度网盘，代码随想录知识星球，代码随想录八股文PDF，代码随想录刷题路线，代码随想录知识星球八股文https://programmercarl.com/0704.%E4%BA%8C%E5%88%86%E6%9F%A5%E6%89%BE.

weixin_47284299·2025-02-18 10:25

数学建模基础训练-1：概念解析

文章目录数学建模基础训练-1：概念解析问题一：如何找到“概念”？问题二：如何全面理解概念的基础含义？问题三：如何深刻理解概念并作出创新点发掘？

MPCTHU·2025-02-18 09:44

InspireMusic - 阿里通义实验室开源音乐生成框架支持音乐、歌曲、音频生成本地一键整合包下载

InspireMusic不仅为研究者和开发者提供了丰富的音乐/歌曲/音频生成模型的训练和调优工具，还为他们配备了高效的模型，以便优化生成效果。

昨日之日2006·2025-02-18 09:12

驾培行业转战无人机飞手执照培训的优缺点分析及技术详解

2.场地与设施优势：驾培场地通常较为宽敞，且部分场地可改造为无人机飞行训练场地，节省场地租赁成本。可利用现有设施进行无人机组装、调试和维修等实操培训。3.人力资源利用：驾培行业的

无人机技术圈·2025-02-18 05:03

DeepSeek对AI发展的范式革新与推动：研究报告

其核心技术突破包括：低算力消耗的模型训练通过蒸馏训练策略、动态模型剪枝和稀疏训练，DeepSeek将训练成本降至OpenAI同类模型的1/10，同时保持性能可比甚至超越。

芝士AI吃鱼·2025-02-18 05:57

强化学习原理与代码实战案例讲解

想象一下，你正在训练一只小狗学习坐下。你不会给它看成千上万张“坐下”的照片，而是会给它一些指令，比如“坐下”，如果它照

AI天才研究院·2025-02-18 05:53

OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP

它提供了一种方式来创建和训练多层感知器模型，以解决分类、回归等

村北头的码农·2025-02-18 04:51

Pytorch实现mnist手写数字识别

>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**我的环境：语言环境：Python3.8编译器：JupyterLab深度学习环境：torch==1.12.1+cu113torchvision

Zn要学习·2025-02-18 04:49

《DeepSeek训练算法：开启高效学习的新大门》

DeepSeek作为其中的佼佼者，凭借其独特的训练算法和高效的学习能力，吸引了众多目光。今天，就让我们深入探究DeepSeek训练算法的独特之处，以及它是如何保证模型实现高效学习的。

·2025-02-18 04:41

DeepSeek推理模型架构以及DeepSeek爆火的原因

在训练过程中，DeepSeek广泛应用蒸馏技术，通过生成高质量数据和将大型模型的推理能力迁移至小型模型，大幅提升训练效率与模型性能。Deep

微学AI·2025-02-18 03:06

【LLM】大模型基础--大规模预训练语言模型的开源教程笔记

1.引言本文以DataWhale大模型开源教程为学习路线，进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列（token）的概率分布，可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看，LM（languagemodle）可以简单的分为：自回归模型非自回归模型特点逐字生成文本，每个词的生成都依赖于上文，关联性好一次性生成整个文本序列，不捕捉上文信息优点内容质量高生成速度快

Langchain·2025-02-18 02:00

模型GPU-＞NPU(Ascend)迁移训练简述

目录一、迁移训练流程图解二、详细流程步骤1.模型训练与日志记录2.跨平台精度对齐对比3.问题定位与修复4.迭代验证三、关键技术点四、常见问题与解决方案一、迁移训练流程图解通过华为云的modelart进行运行环境选型北京四使用

終不似少年遊*·2025-02-18 01:12

python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）...

第二章：怎么样训练

weixin_39576066·2025-02-17 23:49

翻译Deep Learning and the Game of Go（14）第十二章采用actor-critic方法的强化学习

本章包括:利用优势使强化学习更有效率用actor-critic方法来实现自我提升AI设计和训练Keras的多输出神经网络如果你正在学习下围棋，最好的改进方法之一是让一个水平更高的棋手给你复盘。

idol_watch·2025-02-17 22:16

【漫话机器学习系列】041.信息丢失（dropout）

信息丢失（Dropout）Dropout是一种广泛应用于神经网络训练中的正则化技术，旨在减少过拟合（overfitting），提高模型的泛化能力。

IT古董·2025-02-17 22:40

第二章：12.3 建立表现基准

在这个过程中，算法的性能可以通过训练误差和交叉验证误差来评估。误差定义训练误差（Jtrain）：指算法在训练数据集上无法正确转录的音频片段的百分比。

望云山190·2025-02-17 22:40

第二章：12.4 学习曲线

学习曲线的基本概念学习曲线是展示机器学习模型性能如何随着训练数据量增加而变化的图表。它们可以帮助我们理解模型在不同数据量下的表现，以及模型是否过拟合或欠拟合。

望云山190·2025-02-17 22:05

星辰瑞云·2025-02-17 20:55

【DeepSeek】一文详解GRPO算法——为什么能减少大模型训练资源？

GRPO，一种新的强化学习方法，是DeepSeekR1使用到的训练方法。

FF-Studio·2025-02-17 20:19

AIMv2：多模态自回归预训练的视觉新突破

AIMv2：多模态自回归预训练的视觉新突破阅读时长：19分钟发布时间：2025-02-17近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM

·2025-02-17 20:28

Audio-Visual Speech Enhancement（视听语音增强）领域近三年研究进展与国内团队及手机厂商动态分析

一、视听语音增强领域近三年研究进展多模态融合与模型轻量化多模态特征融合：中国科学技术大学团队提出通过引入超声舌头图像和唇部视频的联合建模，结合知识蒸馏技术，在训练阶段利用教师模型传递舌部运动知识，从而在推断时仅依赖唇部视频即可提升语音增强效果

AndrewHZ·2025-02-17 20:47

Aerospike

文章来源：拉勾教育Java高薪训练营第3期Aerospike介绍Aerospike（简称AS）是一个分布式，可扩展的键值存储的NoSQL数据库。

小的~~·2025-02-17 17:22

推荐频道

小游戏逻辑思维训练

LeetCode解决方案集：编程与面试技能提升

Python库 - transformers

conda更换环境版本（比如torch版本）

流行编程语言全解析：优势、应用与短板

LLaMA系列大模型调研与整理-llama-alpaca-lora

deepseek和ChatGPT 4o比较

采用分布式部署deepseek

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章

【JAVA工程师从0开始学AI】，第四步：闭包与高阶函数——用Python的“魔法函数“重构Java思维

腾讯云大模型知识引擎×DeepSeek赋能文旅

huggingface/pytorch-image-models

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

什么是Scaling Laws（缩放定律）；DeepSeek的Scaling Laws

智能算力中心万卡GPU集群架构深度解析

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

如何训练LLM“思考”（像o1和DeepSeek-R1一样, 高级推理模型解析

商汤绝影端到端自动驾驶的迭代优化

2. 从HuggingFace下载千问模型、数据、微调并运行

解剖DeepSeek四把刀，一场深到源码，大到行业，细到人心盛宴

SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别

【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码

DeepSeek为什么超越了OpenAI

DeepSeek的训练与优化流程

机器学习基本篇

deepseek本地部署后做微调训练实现智能对话的一些建议

机器学习和线性回归、softmax回归

大模型AI应用安全与合规测试实战指南-模型层

AI赋能教育：深度解析大模型在教育场景中的应用与架构设计【无标题】

算法训练Day01 Leetcode704.二分查找

数学建模基础训练-1：概念解析

InspireMusic - 阿里通义实验室开源音乐生成框架 支持音乐、歌曲、音频生成 本地一键整合包下载

驾培行业转战无人机飞手执照培训的优缺点分析及技术详解

DeepSeek对AI发展的范式革新与推动：研究报告

强化学习原理与代码实战案例讲解

OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP

Pytorch实现mnist手写数字识别

《DeepSeek训练算法：开启高效学习的新大门》

DeepSeek推理模型架构以及DeepSeek爆火的原因

【LLM】大模型基础--大规模预训练语言模型的开源教程笔记

模型GPU-＞NPU(Ascend)迁移训练简述

python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）...

翻译Deep Learning and the Game of Go（14）第十二章 采用actor-critic方法的强化学习

【漫话机器学习系列】041.信息丢失（dropout）

第二章：12.3 建立表现基准

第二章：12.4 学习曲线

机器学习相关基础

【DeepSeek】一文详解GRPO算法——为什么能减少大模型训练资源？

AIMv2：多模态自回归预训练的视觉新突破

Audio-Visual Speech Enhancement（视听语音增强）领域近三年研究进展与国内团队及手机厂商动态分析

Aerospike

InspireMusic - 阿里通义实验室开源音乐生成框架支持音乐、歌曲、音频生成本地一键整合包下载

翻译Deep Learning and the Game of Go（14）第十二章采用actor-critic方法的强化学习