平时训练

【Swift 算法实战】利用 KMP 算法高效求解最短回文串

网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java

网罗开发·2025-02-24 22:49

探索Omniglot：一个无尽的手写字符集合

探索Omniglot：一个无尽的手写字符集合omniglotomniglot-一个包含大量不同语言手写字符图像的数据集，用于机器学习模型的训练和评估。

宋溪普Gale·2025-02-24 22:46

cap4：YoloV5的TensorRT部署指南（python版）

专栏文章目录：《TensorRT全流程部署指南》专栏主页cap1：TensorRT介绍及CUDA环境安装cap2：1000分类的ResNet的TensorRT部署指南（python版）cap3：自定义数据集训练

我是一个对称矩阵·2025-02-24 21:14

基于Python开发的使用多个单视图特征融合的基于图卷积网络（GCN）的肺结节检测系统的示例

模型训练：使用训练数据对模型进行训练。模型评估：使

go5463158465·2025-02-24 20:06

基于YOLOv5、FaceNet与KNN的人脸识别系统

步骤1：环境配置安装依赖库：安装Python3.x安装TensorFlow、Keras、OpenCV等深度学习库获取数据集：收集训练用的多个人脸图像（每个用户至少几十张）将图像按用户分类存放在data/

reset2021·2025-02-24 19:29

软考高项备考技巧

分阶段备考：将备考过程分为不同的阶段，如基础学习阶段、强化训练阶段和冲刺复习阶段。每个阶段都有明确的学习目标和任务，确保备考过程有条不紊。

chengxuyuan1213_·2025-02-24 19:26

Meta官宣Llama3：迄今为止最强大的开源大模型

此版本具有经过预训练和指令微调的语言模型，具有8B(80亿)和70B(700亿)参数，可以支持广泛的用例。Llama3在各种行业基准上展示了最先进的性能，并提供了新功能，包括改进的推理能力。

·2025-02-24 19:09

第G9周：ACGAN理论与实战

>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch

OreoCC·2025-02-24 18:50

【DeepSeek零基础入门】从零开始：如何训练自己的AI模型

从零开始：如何训练自己的AI模型在人工智能的世界里，训练一个属于自己的AI模型，就像是在培养一个新生儿。你需要耐心、技巧，以及对数据的深刻理解。

Evaporator Core·2025-02-24 18:20

DeepSeek 和 Qwen 模型快速部署指南

DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构训练方法包含预训练

moton2017·2025-02-24 18:47

P3405 [USACO16DEC] Cities and States S题解

为了训练奶牛们的智力，FarmerJohn在谷仓的墙上放了一张美国地图。地图上表明了每个城市及其所在州的代码（前两位大写字母）。由于奶牛在谷仓里花了很多时间看这张地图，他们开始注意到一些奇怪的关系。

互联网的猫·2025-02-24 18:17

DeepSeek混合精度训练核心技术解析与实践指南

1.主题背景1.1Why混合精度训练（价值）混合精度训练通过结合FP16和FP32数据格式，在保证模型精度的前提下实现：40-60%显存占用降低（ResNet50案例：从7.8GB降至4.2GB）1.5

燃灯工作室·2025-02-24 15:33

Qwen2.5-Coder Technical Report

Qwen2.5-Coder技术报告摘要1引言2模型架构3预训练3.1预训练数据3.1.1数据组成3.1.2数据混合3.2训练策略3.2.1文件级预训练3.2.2仓库级预训练4后训练4.1指令数据的配方4.2

UnknownBody·2025-02-24 13:16

什么是Grok-3？技术特点，场景，潜在问题与挑战

Grok-3的技术特点与优势1.超大算力与训练规模算力投入：Grok-3使用了20万块英伟达H100GPU，分两个阶段训练（第一阶段10万GPU训练144天，第二阶段20万GPU训练92天），总计算量是前代

AndrewHZ·2025-02-24 13:46

ChatGLM-6B中英双语对话大模型Windows本地部署实战

公司于2020年底研发GLM预训练架构，2021年训练完成百亿参数模型GLM-10B，利用MoE架构成功训练出收敛的万亿稀疏模型，2

ErbaoLiu·2025-02-24 13:45

模型算力需求估算

计算模型的算力需求，通常基于模型的参数量（BillionParameters，简称B）和训练/推理的计算任务复杂度，结合硬件计算能力（例如每秒浮点运算次数，FLOPS）来估算。

由数入道·2025-02-24 12:06

蓝桥杯训练题(1)

幂ab的末3位数是多少？输入两个正整数a，b。1≤a≤100，1≤b≤10000。输出从高位到低位输出幂的末三位数字，中间无分隔符。若幂本身不足三位，在前面补零。样例输入72011样例输出743答案#includeintmain(){inta,b;intret=1;scanf("%d%d",&a,&b);inti;for(i=0;i

wuhu_king·2025-02-24 11:58

蓝桥杯真题训练

目录1.2.3.4.5.1..题目描述在电子计算机普及以前，人们经常用一个粗略的方法来验算四则运算是否正确。比如：248*15=3720把乘数和被乘数分别逐位求和，如果是多位数再逐位求和，直到是1位数，得2+4+8=14==>1+4=5;1+5=65*6而结果逐位求和为35*6的结果逐位求和与3符合，说明正确的可能性很大！！（不能排除错误）请你写一个计算机程序，对给定的字符串逐位求和：输入输入为一

怀化第一深情·2025-02-24 11:26

蓝桥杯训练题No.6

#includeusingnamespacestd;signedmain()//正在研究signed{intn;cin>>n;cout.fill('0');//不足位数补0coutusingnamespacestd;typedeflonglongll;lla[100005];llw[105];intmain(){intn;cin>>n;for(lli=0;i>w[i];a[0]=1;memset(

GC_Lion·2025-02-24 11:56

蓝桥杯真题训练五一 4/5

1217垒骰子矩阵快速幂op[i]表示的是与i的对面的数。如果有面互斥，就在矩阵中标记为零，否则标记为4，代表顶和底确定的时候可以有四种情况。（矩阵乘法）就是快速幂里面的乘法变成了矩阵乘法。#includeusingnamespacestd;constintmod=1e9+7;typedeflonglongll;constintmaxn=6;lln,m;inta,b;intvis[7][7];in

iuk11·2025-02-24 10:55

数据标注中的归类与定义，从聚类，相关，关联，回归四个方面分析

在数据标注和AI训练过程中，数据的归类与定义是关键步骤，不同的数据分析方法可以用于不同的场景。

小宝哥Code·2025-02-24 10:23

冬训周报（四）

一、补题天梯赛训练补题-CSDN博客蓝桥杯训练补题-CSDN博客二、算法本周主要是蓝桥杯的一个训练，这其中对于搜索和二分的算法居多，对于搜索而言，简单的搜索可能还不成问题，但稍微一复杂写起来还是有些吃力的

HL0614SC·2025-02-24 10:49

冬训周报（二）

一、天梯训练赛L2-1插松枝模拟题：有一个推送器和一个盒子，推送器会给出松针片，松针下面的片一定要比上面的大，看能组合成一些什么样的松针感觉没什么特别的地方，模拟就行了，但是赛时写拉了，只拿了19分#includeusingnamespacestd

HL0614SC·2025-02-24 10:49

暑期集训周报（第一周）

第☝️周训练内容个人赛为主，加上题单的练习，主要的算法包括二分，三分，栈，队列，01分数规划等等。

HL0614SC·2025-02-24 10:19

蓝桥杯-算法训练-无聊的逗c++

问题描述逗志芃在干了很多事情后终于闲下来了，然后就陷入了深深的无聊中。不过他想到了一个游戏来使他更无聊。他拿出n个木棍，然后选出其中一些粘成一根长的，然后再选一些粘成另一个长的，他想知道在两根一样长的情况下长度最长是多少。输入格式第一行一个数n，表示n个棍子。第二行n个数，每个数表示一根棍子的长度。输出格式一个数，最大的长度。样例输入41231样例输出3数据规模和约定n<=15解题思路观察这道题，

懵懂1111·2025-02-24 10:48

LLM的MoE架构的“动态路由”为什么能训练出来？

互联网各领域资料分享专区(不定期更新)：Sheet正文大型语言模型（MoE）架构中的“动态路由”之所以能够被有效训练，关键在于其设计融合了可微分的路由机制、专家协同优化以及负载均衡约束。

互联网之路.·2025-02-24 09:46

适用于呼叫中心质检的离线ASR模型

优势：预训练模型基于AIShell等中文数据集，准确率高。低延迟，适合实时处理（如质检中的实时监控）。支持GPU/CPU部署，提供Python和C++接口。部署

狂爱代码的码农·2025-02-24 08:07

DeepSeek模型微调的原理和方法

预训练模型在大规模通用数据上进行了无监督或有监督的训练，学习到了丰富的语言知识、语义表示和通用模式。这些知识和模式具有一定的通用性，可以迁移到其他相关的任务中。

alankuo·2025-02-24 07:01

垂类大模型微调（二）：使用LLaMA-Factory

上一篇博文和大家一起安装了LLaMA-Factory工具，并下载了大模型在上面进行了简单的加载和推理，今天尝试通过LoRa技术对大模型进行微调；一、训练集准备1.1介绍训练集结构这里演示对Qwen2.5

CITY_OF_MO_GY·2025-02-24 07:00

Yolov8-pose：从零开始训练Yolov8关键点检测模型

/ultralytics#创建预训练模型文件夹，并下载关键点检测预训练模型mkdirweightscd.

CITY_OF_MO_GY·2025-02-24 07:00

RAG+LLM和直接将整理的知识训练到模型中去有什么区别，各自有什么优缺点

1.RAG(Retrieval-AugmentedGeneration)+LLM(LargeLanguageModel)概念RAG是将信息检索与生成模型相结合的一种方法。具体来说，RAG会从一个知识库（如数据库、文档库、向量数据库等）中检索相关的信息片段或条目，然后将这些信息与输入的查询一起传递给一个生成模型（如GPT、T5、BERT等）进行回答生成。这个过程通常包括以下步骤：检索：从一个知识库中

MonkeyKing.sun·2025-02-24 06:54

覆盖从供应、生产、销售到运营的全过程，引领行业数智化转型新方向的智慧快消开源了

基于多年的深度学习技术研究和业务应用为基础，集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体，是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基

AI服务老曹·2025-02-24 04:39

GPU与FPGA加速：硬件赋能AI应用

然而,训练和部署AI模型需要大量计算资源,这对传统的CPU架构提出了巨大挑战。1.2硬件加速的必要性为满足AI算法对计算能力的巨大需求,硬件加速技术应运而生。专用硬件如GPU(图形

AI天才研究院·2025-02-24 01:20

LLaMA-Factory|微调大语言模型初探索(3)，qlora微调deepseek记录

QLoRA通过反量化到BF16进行训练，在保持计算精度的同时，进一步节省显存和提高效率。QLoRA在加载、训练、以及权重

闻道且行之·2025-02-24 01:49

手撸 chatgpt 大模型:单词向量化编码和绝对位置编码算法

最初，向量中的各个字段会被初始化为随机数，然后通过大量的数据和深度学习模型来训练这些向量。训练过程逐步改变向量字段的值，从而使这些字段包含某种“知识”。

coding 迪斯尼·2025-02-24 00:11

TikTok运营的思路和思维

TIKTOKHEZI·2025-02-23 23:37

立体匹配常用数据集整理

文章目录前言一、常用数据集1.SceneFlow数据集2.KITTI数据集3.Middlebury数据集二、关于自己构建数据集训练的一些问题前言本文主要对立体匹配算法常用的公开数据集进行整理，包括数据集的简要介绍和下载链接

Scurry﹉·2025-02-23 21:18

目前（2025年2月）计算机视觉（CV）领域一些表现优异的深度学习模型

PaLI：这是一个多模态模型，结合了40亿参数的视觉Transformer（ViT）和多种大型语言模型（LLM），并在包含100多种语言的100亿图像和文本数据集上进行训练。PaLI在图像描述、视

空空转念·2025-02-23 20:18

当你给大模型一段输入之后，它是怎么得到答案的

2.动用毕生所学（模型“回想”知识）大模型并不是真有一个“数据库”，而是依靠训练时海量的知识联结：（类似人类的经验积累）内在规律：从上学过的教材、论文、百科中记住过“地球自转导致太阳视运动”这个常识。

牛不才·2025-02-23 19:37

图像处理：模拟色差的生成

但在实际生产环境中，瓷砖色差检测的数据量较少，无法直接获取足够的数据来训练和优化深度学习模型。于是就考虑通过人为生成色差数据的方式来扩充数据集，进行色差的模拟。1.什么是色差？

何以为皇·2025-02-23 18:33

大学生创新训练项目经验分享

前几天有同学问我能不能写一个科研竞赛什么的经验贴，给新生们分享一下，正好最近事情不是很多，所以打算写一个关于大创申报的帖子，供有需要的同学参考。本人计算机学院22级的学生，大二下学期的时候申报的大创项目，然后顺利拿到了2024年大创国家级重点立项，（PS：学校共立项481项，其中仅2个国家级重点项目。一、回顾本人的准备过程（仅供参考）大一下学期的时候，了解到有大创这个平台，也希望自己本科阶段，能够

菜就多练@Jade·2025-02-23 18:32

如何在 Hugging Face 上下载和使用模型—全面指南

无论你是从事学术研究还是在工业中应用NLP技术，HuggingFace都为你提供了丰富的预训练模型和工具库，这些资源大大加速了NLP任务的开发和部署。

Hello.Reader·2025-02-23 18:01

谁掌握了体育数据的密码就是胜利者

这种转变不仅改变了球队的训练和比赛策略，更深刻地影响着体育产业的发展方向。一、数据采集：竞技体育的数字化基础现代体育数据的采集已经形成了完整的生态系统。在NBA赛场上，每块场地安装的6个追踪摄

翱翔的猪脑花·2025-02-23 17:54

AI如何预测比赛结果：体育预测技术全解析

一、系统架构设计1.整体架构数据采集层数据处理层模型训练层预测服务层应用展示层2.技术选型Python3.8+TensorFlow/PyTorchScikit-learnPandas/NumpyFlask

翱翔的猪脑花·2025-02-23 17:54

Python+Spark地铁客流数据分析与预测系统地铁大数据地铁流量预测

本系统基于大数据设计并实现成都地铁客流量分析系统，使用网络爬虫爬取并收集成都地铁客流量数据，运用机器学习和时间序列分析等方法，对客流量数据进行预处理和特征选择，构建客流量预测模型，利用历史数据对模型进行训练和优化

qq_79856539·2025-02-23 16:16

大语言模型训练数据集格式

1.SFT（有监督微调）的数据集格式对于大语言模型的训练中，SFT（SupervisedFine-Tuning）的数据集格式可以采用以下方式：输入数据：输入数据是一个文本序列，通常是一个句子或者一个段落

香菜烤面包·2025-02-23 16:13

大模型训练 && 微调数据格式

对于大语言模型的训练中，SFT（SupervisedFine-Tuning）的数据集格式可以采用以下方式：输入数据：输入数据是一个文本序列，通常是一个句子或者一个段落。

comli_cn·2025-02-23 16:43

通俗理解Test time Scaling Law、RL Scaling Law和预训练Scaling Law

一、ScalingLaw解释1、预训练阶段的ScalingLaw（打地基阶段）通俗解释：就像建房子时，地基越大、材料越多、施工时间越长，房子就能盖得越高越稳。

老A的AI实验室·2025-02-23 16:12

Python基础训练100题（带答案）

文末有彩蛋！！！Python3100例实例001：数字组合题目有四个数字：1、2、3、4，能组成多少个互不相同且无重复数字的三位数？各是多少？程序分析遍历全部可能，把有重复的剃掉。total=0foriinrange(1,5):forjinrange(1,5):forkinrange(1,5):if((i!=j)and(j!=k)and(k!=i)):print(i,j,k)total+=1pri

乔代码嘚·2025-02-23 16:12

大语言模型：从开发到运行的深度解构

一、LLM开发训练的全流程解析1.数据工程的炼金术数据采集：构建涵盖网页文本（CommonCrawl）、书籍、论文、代码等领域的超大规模语料库，典型规模可达数十TB。

nbsaas-boot·2025-02-23 15:38

上一页 1 2 3 4 5 6 7 8 下一页

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

推荐频道