训练吃显卡

LLM大模型安全概述

,AI)模型通用理解和生成能力的同时，也带来了前所未有的安全风险.大模型的能力与风险生成式大模型因其强大的智能能力和巨大的应用潜力吸引了众多研究者和企业的关注.从智能能力的角度来看，研究人员观测到：当训练数据和参

LLM教程·2025-03-09 06:06

2025寒假天梯训练7

7-8古风排版-2025寒假天梯赛训练7（2223届）思路：pta风格模拟题。

osir.·2025-03-09 06:26

代码随想录算法训练营第 42 天 |LeetCode 188.买卖股票的最佳时机IV LeetCode309.最佳买卖股票时机含冷冻期 LeetCode714.买卖股票的最佳时机含手续费

代码随想录算法训练营Day42代码随想录算法训练营第42天|LeetCode188.买卖股票的最佳时机IVLeetCode309.最佳买卖股票时机含冷冻期LeetCode714.买卖股票的最佳时机含手续费目录代码随想录算法训练营前言

HIT最菜电控·2025-03-09 05:19

代码随想录算法训练营第16天|LeetCode112路径总和LeetCode113路径总和iiLeetCode106.从中序与后序遍历序列构造二叉树LeetCode105从前序与中序遍历序列构造二叉树

代码随想录算法训练营Day16代码随想录算法训练营第16天|LeetCode112路径总和LeetCode113路径总和iiLeetCode106.从中序与后序遍历序列构造二叉树LeetCode105.

HIT最菜电控·2025-03-09 05:49

2025天梯训练1

PTA|L3-1直捣黄龙30分思路：多关键字最短路，同时还要记录最短路径条数。typedefstructnode{intfrom,d,pass,kl;booloperatorx.d;if(pass!=x.pass)returnpassha;unordered_mapantHa;intenemys[205];intidx=0;vector>vct[205];intdis[205];//到达i城镇的最

osir.·2025-03-09 05:18

【神经网络】python实现神经网络（一）——数据集获取

二.测试训练数据集的获取首先我们需要通过官网获取到手写数字识别数据集，数据集一共分为四个部分，分别是训练集的图片（六万张）、训练集的标签、测试集的图片

师兄师兄怎么办·2025-03-09 03:06

Python学习之-分支语句-基础训练

第1关：计算并输出圆的面积和周长。任务描述从键盘输入圆的半径，如果半径大于等于0，则计算并输出圆的面积和周长。相关知识判断半径是不是小于零测试说明平台会对你编写的代码进行测试：示例代码：#单分支#coding=utf-8#********Begin**********r=float(input())s=3.1415*pow(r,2)c=2*3.1415*rprint("圆的面积为：%.2f"%s)

YMLT花岗岩·2025-03-09 01:10

转换器与预估器，KNN算法，朴素贝叶斯算法，决策树，随机森林的特点，优缺点

转换器与预估器，KNN算法，朴素贝叶斯算法，决策树，随机森林的特点，优缺点1转换器与预估器实例化转换器fit_transform转换实例化预估器fit将训练集的特征值和目标值传进来fit运行完后，已经把这个模型训练出来了

qq_43625764·2025-03-09 01:05

决策树、朴素贝叶斯、随机森林、支持向量机、XGBoost 和 LightGBM算法的R语言实现

并根据这些特征变量的线性组合生成一个二分类的响应变量y；（2）将生成的数据存储在数据框中，处理缺失值，并将响应变量转换为因子类型；（3）使用决策树、朴素贝叶斯、随机森林、支持向量机、XGBoost和LightGBM六种机器学习模型算法对数据进行训练和评估

生信与基因组学·2025-03-09 00:18

AI芯片概述-分类、应用、技术（APU、CPU、DPU、GPU、NPU和TPU）及厂家

二、AI芯片分类1.Training(训练)2.Inference(推理)三、AI芯片应用领域四、AI芯片技术路线五、APU、CPU、DPU、GPU、NPU和TPU六、AI芯片厂家一、AI芯片是什么？

一码当前·2025-03-09 00:27

初学——DFS（深度优先搜索）

题目描述猪猪Hanke特别喜欢吃烤鸡（本是同畜牲，相煎何太急！）Hanke吃鸡很特别，为什么特别呢？因为他有10种配料（芥末、孜然等），每种配料可以放1到3克，任意烤鸡的美味程度为所有配料质量之和。

g927zz·2025-03-09 00:15

解决Python中加载sklearn加州房价数据集出错的问题

其中，加州房价数据集是一个常用的示例数据集之一，用于回归问题的训练和测试。

冰雪之境·2025-03-09 00:39

《探秘课程蒸馏体系“三阶训练法”：解锁知识层级递进式迁移的密码》

课程蒸馏体系中的“三阶训练法”，作为一种创新的知识迁移模式，正逐渐崭露头角，为解决这一难题提供了全新的思路。

·2025-03-08 23:52

使用 DeepSeek 训练属于自己写小说的模型

如果你想使用DeepSeek训练一个专门用于写小说的模型，以下是详细的指导指南。DeepSeek是一个强大的深度学习框架，支持自然语言处理任务。

xinxiyinhe·2025-03-08 23:02

Qwen1.5-7B-实现RAG应用详细步骤

Transformers：HuggingFace提供的库，支持加载和运行预训练模型。FAISS：用于向量检索的高效库。GPTQ支持库：如auto-gptq或gptqmodel。

大数据追光猿·2025-03-08 23:01

Opacus库快速上手！使用Opacus库在Mnist数据集实现差分隐私

opacus官网为：GitHub-pytorch/opacus：使用差分隐私训练PyTorch模型（2）完整代码#-*-coding:utf-8-*-#Step1:导入必要的库和模块importto

还不秃顶的计科生·2025-03-08 22:06

腾讯云大模型知识引擎驱动的DeepSeek满血版医疗顾问大模型搭建实战

腾讯云大模型知识引擎驱动的DeepSeek满血版医疗顾问大模型搭建实战是一个非常具有挑战性的项目，涉及从数据的处理到模型的训练、部署及优化等多个环节，旨在为医疗领域提供高效、精准的智能化服务。

金枝玉叶9·2025-03-08 21:29

【AI-42】如何调整参数和超参

作用：在模型训练过程中，权重不断调整，使得模型能够学习到输入数据中的各种特征和模式，从而实现对数据的准确

W Y·2025-03-08 19:59

使用Python和机器学习技术对高中物理题目进行分类的示例代码

模型训练：使用训练数据训练分类模型。模型评估：使用测试数据评估模型的性能。预测：使用训练好的模型对新的物理题目进行分类。

max500600·2025-03-08 19:17

深度学习篇---Opencv中的机器学习和深度学习

文章目录前言一、OpenCV中的机器学习1.概述2.使用步骤步骤1：准备数据步骤2：创建模型步骤3：训练模型步骤4：预测3.优点简单易用轻量级实时性4.缺点特征依赖性能有限二、OpenCV中的深度学习1

Ronin-Lotus·2025-03-08 19:05

解决电脑问题（7）——软件问题

比如一些大型游戏要求特定版本的Windows系统以及一定的显卡性能。

电摇小人·2025-03-08 18:21

Mark Github上的一个项目，VLM-R1。GRPO为什么促使MLLM在部分垂域比SFT更好的表现

GitHub-om-ai-lab/VLM-R1:SolveVisualUnderstandingwithReinforcedVLMs最近做毕设，看到VLM-R1项目，一个有趣的现象：在Grounding任务中，GRPO训练的模型不仅展现出更稳定的训练曲线

朱韬韬·2025-03-08 16:40

深度学习笔记——神经网络

本文为在拓尔思智能举办的训练营中学习内容的总结，部分内容摘自百度百科个人在这里推荐一个好用的软件，Trae，主要是免费。人工神经元是人工神经网络的基本单元。

肆——·2025-03-08 16:10

Triplet Loss原理及 Python实现

最初是谷歌在FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering论文中提出的，可以学到较好的人脸的embeddingTripletLoss是一种用于训练特征嵌入

AIGC_ZY·2025-03-08 15:21

代码随想录---算法训练营---总结

我总共参加了60天这个代码随想录的算法训练营，每天按照计划逐步进行算法训练，卡尔老师讲的很好，要是有不理解的，偶尔会给他提建议，提问题。

感谢上Di_123·2025-03-08 15:50

Manus的基于Sentence-BERT与ChromaDB的语义检索系统设计与实现

针对传统关键词匹配方法在语义鸿沟问题上的局限性，采用预训练语言模型生成768维语义向量，通过ChromaDB实现高效向量存储与近似最近邻搜索（ANN）。实验表明，在MSMARCO数据集上，

设计狗和程序猿·2025-03-08 13:28

3.6手写数字识别项目

-使用`DataLoader`创建训练和测试数据集的生成器。2.可视化源数据：-使用`matplotlib`库可视化测试集中的部分图像，并显示其对应的真实标签。3.构建模型：-定义一个包含两个隐藏层

不要不开心了·2025-03-08 11:33

大模型的定义、基本架构、训练、经典代表、应用和挑战全解析

本文将带您深入探索大模型的神秘世界，从其定义、基本原理、训练三步骤，到Prompt技术的巧妙应用，以及大模型在各行业的广泛应用和面临的挑战。

和老莫一起学AI·2025-03-08 11:30

TikTok账号矩阵如何做？要用海外住宅代理吗？

TikTok的账号矩阵，可能听起来还比较陌生，但随着TikTok业务已经成为吃手可热的跨境业务，TikTok多账号矩阵已成为流行策略。但它有什么优点呢？操作多个帐户会导致被禁止吗？

Snow跨境日记·2025-03-08 09:05

打卡代码随想录算法训练营第11天： 150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素

代码随想录文中含LLM回答内容150.逆波兰表达式求值力扣题目链接思路K:先理解逆波兰表达式是啥，是把运算符放在了两个要运算的数字的后边，又叫后缀表达式。遇见数字就入栈，遇见算符就计算栈里前两个数字，算完再存回去classSolution{public:intevalRPN(vector&tokens){stackpoland;for(inti=0;ique;voidpop(intval){if(

jingjingjing1111·2025-03-08 07:51

智能算法安全优化与关键技术实践

在医疗影像分析、金融风控、自动驾驶等场景中，联邦学习的分布式协作机制有效解决了数据孤岛问题，而生成对抗网络通过对抗训练增强数据生成能力，为小样本场景提供技术支撑。

智能计算研究中心·2025-03-08 03:02

音频 bug 大全

解决：OSError:libsox.so:cannotopensharedobjectfile:Nosuchfileordirectory运行funasr训练时出现该错误安装个库就好了sudoaptinstalllibsox-dev

DEDSEC_Roger·2025-03-08 03:54

PyTorch 深度学习快速入门教程

本教程将带你快速掌握PyTorch的基本用法，涵盖张量（Tensor）操作、自动求导（Autograd）、构建神经网络以及模型训练。

有人给我介绍对象吗·2025-03-08 02:16

基于YOLOv5深度学习的田间杂草检测系统：UI界面 + YOLOv5 + 数据集详细教程

我们将分步骤进行，包括环境配置、数据集准备、模型训练、实时杂草检测系统的实现等内容。目录引言目录

深度学习&目标检测实战项目·2025-03-08 00:50

llama-factory生成Meta-Llama-3-8B-Instruct模型api服务

使用llama-factory完成模型的微调训练后，需要开启其api服务进行调用，参考官方https://github.com/hiyouga/LLaMA-Factory/blob/main/examples

码不动了鸭·2025-03-08 00:19

Llama3-8B+ LLaMA-Factory 中文微调

Llama3-8B+LLaMA-Factory中文微调Llama3是目前开源大模型中最优秀的模型之一，但是原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方便略微欠佳！

猫猫姐·2025-03-07 23:46

机器学习基础（4）

训练深度学习模型就好比在平行世界里按下发射火箭的按钮，你听不到也看不到。你无法观察流形学习过程，它发生在数千维空间中，即使投影到三维空间中，你也无法解释它。

yyc_audio·2025-03-07 23:42

代码随想录算法训练营第四十八天|583. 两个字符串的删除操作，72. 编辑距离

系列文章目录代码随想录算法训练营第一天|数组理论基础，704.二分查找，27.移除元素代码随想录算法训练营第二天|977.有序数组的平方，209.长度最小的子数组，59.螺旋矩阵II代码随想录算法训练营第三天

丁希希哇·2025-03-07 23:11

算法训练（leetcode）二刷第三十八天 | 1143. 最长公共子序列、1035. 不相交的线、53. 最大子数组和、392. 判断子序列

刷题记录1143.最长公共子序列1035.不相交的线53.最大子数组和动态规划优化版392.判断子序列1143.最长公共子序列leetcode题目地址本题和300.最长递增子序列相似（题解）。使用动态规划：dp数组含义：dp[i][j]表示以text1[i-1]结尾的子串A和以text2[j-1]结尾的子串B的最长公共子序列的长度。思路同300.最长递增子序列，每个状态更新基于前面的状态，为了防止

Star Patrick·2025-03-07 23:41

*算法训练（leetcode）第三十九天 | 115. 不同的子序列、583. 两个字符串的删除操作、72. 编辑距离

刷题记录*115.不同的子序列*583.两个字符串的删除操作解法一解法二*72.编辑距离*115.不同的子序列leetcode题目地址dp[i][j]代表：以i-1结尾的s中包含以j-1结尾的t的个数。有以下两种情况：s[i-1]==t[i-1]：考虑s[i-1]不考虑s[i-1]s[i-1]!=t[i-1]题解思路时间复杂度：O(n2)O(n^2)O(n2)空间复杂度：O(n∗m)O(n*m)O

Star Patrick·2025-03-07 23:41

*算法训练（leetcode）第十七天 | 235. 二叉搜索树的最近公共祖先、701. 二叉搜索树中的插入操作、450. 删除二叉搜索树中的节点

刷题记录235.二叉搜索树的最近公共祖先递归非递归701.二叉搜索树中的插入操作递归非递归*450.删除二叉搜索树中的节点235.二叉搜索树的最近公共祖先leetcode题目地址二叉搜索树（BST），左小右大。在BST中查找两个节点p、q的最近公共祖先时，使用前序遍历，访问到的第一个在两个节点的区间内[p,q]的节点就是公共祖先节点。当前节点值超出区间时借助BST性质（左小右大）向对应的方向缩小范

Star Patrick·2025-03-07 23:10

算法训练（leetcode）第二十三天 | 455. 分发饼干、*376. 摆动序列、53. 最大子数组和

刷题记录455.分发饼干*376.摆动序列53.最大子数组和455.分发饼干leetcode题目地址贪心，两个数组排序，从前向后或从后向前均可，二者需保持同序，使用两个指针分别指向两个数组，当胃口满足时两个指针同时后移并计数，若不满足则饼干指针后移寻找合适的饼干。由于使用了两次快排，所以时间复杂度为O(nlogn)。时间复杂度：O(nlogn)O(nlogn)O(nlogn)空间复杂度：O(1)O

Star Patrick·2025-03-07 23:10

算法训练（leetcode）二刷第三十九天 | 115. 不同的子序列、583. 两个字符串的删除操作、72. 编辑距离

刷题记录*115.不同的子序列583.两个字符串的删除操作思路一：转求公共子序列思路二：编辑距离（统计删除次数）72.编辑距离*115.不同的子序列leetcode题目地址编辑距离问题。题目要求在s串中查找t串出现的次数。dp数组含义：dp[i][j]表示以s[i-1]结尾的子串A中出现以t[j-1]为结尾的子串B的个数状态转移方程：题目要求在s串中查找t串出现的次数，因此只考虑对s串进行编辑。当

Star Patrick·2025-03-07 21:28

2025年AI编程的进展与突破

2025年AI编程的进展与突破1.AI编程能力达到中级工程师水平核心技术突破：大语言模型（如GPT-4、Claude3.5）通过海量代码训练，已能理解自然语言需求并生成符合规范的代码，支持复杂任务（如多文件修改

调皮的芋头·2025-03-07 20:19

复现：latent diffusion（LDM）stable diffusion

https://github.com/CompVis/latent-diffusion然后运行环境配置：condaenvcreate-fenvironment.yamlcondaactivateldm下载预先训练的权重

JokerSZ.·2025-03-07 20:40

阿里云CTO：通义稳居全球最强开源大模型，性能接近GPT-4o

来源：@首席数智官9月19日，在2024杭州云栖大会上，阿里云CTO周靖人表示，阿里云正在围绕AI时代，树立一个AI基础设施的新标准，全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系

首席数智官·2025-03-07 20:39

特斯拉FSD不同版本的进化

特斯拉，FSD，自动驾驶，深度学习，计算机视觉，强化学习，神经网络，模型训练1.背景介绍特斯拉自2016年推出Autopilot以来，一直致力于开发全自动驾驶系统，其目标是实现完全无人驾驶，让汽车能够像人类一样感知周围环境

AI智能涌现深度研究·2025-03-07 19:35

如何通过卷积神经网络（CNN）有效地提取图像的局部特征，并在CIFAR-10数据集上实现高精度的分类？

目录1.CNN提取图像局部特征的原理2.在CIFAR-10数据集上实现高精度分类的步骤2.1数据准备2.2构建CNN模型2.3定义损失函数和优化器2.4训练模型2.5测试模型3.提高分类精度的技巧卷积神经网络

浪九天·2025-03-07 19:27

一文读懂！OpenCV 实时人脸识别从 0 到 1，小白也能轻松实操的超详细教程（完整教程及源码）

深入阐述特征提取、模型训练方法，包含传统与深度学习方式，还介绍OpenCV预训练模型的使用与评估。详细讲解实时识别过程，包括打开摄像头、逐帧处理及结果显示优化。

AI_DL_CODE·2025-03-07 18:21

【硬核拆解】DeepSeek开源周五连击：中国AI底层技术的“破壁之战”

从GPU计算内核到分布式训练框架，用五大开源项目，在硬件适配、算力优化、通信调度等“卡脖子”领域打

shelly聊AI·2025-03-07 18:50

推荐频道