yolov3预训练权重第4页

深入理解旋转位置编码（RoPE）及其在大型语言模型中的应用

RotaryEmbedding类设计2、apply_rotary_pos_emb函数3、demo_apply_rotary_pos_emb函数三、完整RoPE代码Demo前言随着自然语言处理（NLP）领域的快速发展，预训练的语言模型如

tangjunjun-owen·2025-01-23 21:00

TRELLIS文本或图像生3d模型一键整合包win版本，省去繁琐安装、效果超Wonder3D，对硬件要求更低速度更快16g N卡可流畅运行

我们提供大规模预训练模型，参数高达20亿

struggle2025·2025-01-23 21:28

Copilot 概述

Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。

计算机萍萍学姐·2025-01-23 19:13

Spring Boot编程训练系统：测试驱动开发（TDD）实践

本文介绍了编程训练系统的开发全过程。通过分析编程训练系统管理的不足，创建了一个计算机管理编程训练系统的方案。

原机小子·2025-01-23 18:39

【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶

机器学习能够根据日志的历史数据和行为模式，通过训练模型检测异常情况，不

·2025-01-23 18:58

龙年公仔放送 | EdgeOne网站加速与防护训练营，鹅厂大牛带你实战无忧！

在数字化时代，网站的性能与安全性直接关系到用户体验和业务连续性，而当前许多网站面临着访问速度慢、加载时间长、易受DDoS攻击、CC攻击等安全威胁的困扰，而EdgeOne作为腾讯云下一代的CDN，集加速与安全防护于一身，已广泛应用于电商、金融、游戏等行业。如何应用EdgeOne，高效玩转网站加速与防护？腾讯云开发者社区携手EdgeOne团队精心打造《EdgeOne一站式玩转网站加速与防护实战营》，鹅

·2025-01-23 17:21

QAT与PTQ模型量化方法的区别

1.QAT（QuantizationAwareTraining）定义：QAT是在模型训练过程中引入量化操作，使模型在训练时就能感知到量化带来的影响，从而更好地适应量化后的精度损失。流程：在训练

old_power·2025-01-23 17:28

高斯混合模型（GMM）：用“高斯家族”描绘数据的“模样”

2.算法原理2.1模型结构GMM的核心组成包括：混合权重：每个高斯分量

ningaiiii·2025-01-23 15:45

机器人学习的范式转变：从专用走向通用基础模型

然而，这一转变面临两大关键挑战：机器人硬件的高昂成本限制了大规模部署和数据采集，以及获取足够规模和多样性的训练数据存在实际困难。突破这些瓶颈需要在制造工艺创新、数据共享生态

XianxinMao·2025-01-23 14:42

强化学习代码实践1.DDQN:在CartPole游戏中实现 Double DQN

强化学习代码实践1.DDQN:在CartPole游戏中实现DoubleDQN1.导入依赖2.定义Q网络3.创建Agent4.训练过程5.解释6.调整超参数在CartPole游戏中实现DoubleDQN（

洪小帅·2025-01-23 12:58

深度学习中的通道(Channel)概念详解

2.大语言模型中的通道2.1全连接层的通道概念2.1.1基本结构输入：[batch_size,input_features]权重：[input_features,output_features]输出：[

小·恐·龙·2025-01-23 09:33

未登录词 Out-of-Vocabulary, OOV

未登录词oov未登录词（Out-of-Vocabulary,OOV）是指在训练数据中没有出现过的词汇，但在测试数据或实际应用中却出现了。

risc123456·2025-01-23 08:30

高效使用Alibaba Cloud PAI EAS进行AI模型推理

技术背景介绍在当今的AI模型开发中，高效的推理服务是将训练好的模型投入实际应用的关键环节。

sagvWSRJHMNEB·2025-01-23 08:30

使用OpenAI Chat模型进行自然语言处理的实战指南

一、技术背景介绍OpenAI的Chat模型是一类专门用于对话任务的预训练语言模型。它们可以处理多种输入类型，支持丰富的功能调用，适用于各种自然语言处理场景。从翻译到对话生成

GEAWfaacc·2025-01-23 06:09

大语言模型原理与工程实践：预训练数据构建

大语言模型原理与工程实践：预训练数据构建1.背景介绍大语言模型（LargeLanguageModels,LLMs）近年来在自然语言处理（NLP）领域取得了显著的进展。

AI大模型应用之禅·2025-01-23 06:38

机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测

64141d6b1c8c8b518ba97dcc1.算法简介和应用1.1算法简介BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络

墨枣·2025-01-23 05:02

WebRover ：一个功能强大的 Python 库，用于从 Web 内容生成高质量的数据集。

该数据集旨在为大型语言模型（LLM）和人工智能应用的训练提供丰富的数据资源。

·2025-01-23 05:58

【Codex】Evaluating Large Language Models Trained on Code

这篇文章来解读最近比较有意思的Transformer预训练模型在自动生成代码方面的应用，PaperLink:EvaluatingLargeLanguageModelsTrainedonCode自动生成Code

NLP_wendi·2025-01-23 05:57

3D Gaussian Splatting 部署

它们是一类辐射场方法（如NeRF），但同时训练速度更快（同等质量）、渲染速度更快，并达到更好或相似的质量。

学术菜鸟小晨·2025-01-23 05:57

使用ModelScope实现高效句嵌入生成

ModelScope是阿里云开源的一个模型和数据集管理平台，提供了大量预训练模型，涵盖了各种领域和任务。ModelScopeEmbeddings是一个与LangChain社区集成的工具类，

dagGAIYD·2025-01-23 04:23

WebRover：专为训练大型语言模型和 AI 应用程序而设计的 Python 库

该数据集旨在为大型语言模型（LLM）和人工智能应用的训练提供丰富的数据资源。

·2025-01-23 01:54

蓝桥杯试题算法训练最小距离 ( C++ )

最小距离最小距离算法题目算法代码算法的核心思路最小距离算法题目资源限制时间限制：1.0s内存限制：256.0MB最小距离问题描述数轴上有n个数字，求最近的两个数，即min(abs(x-y))输入格式第一行包含一个整数n。接下来一行，表示n整数。输出格式一个整数表示最小距离样例输入673411917样例输出1样例说明取3和4数据规模和约定n#includeusingnamespacestd;cons

ghost_him·2025-01-23 01:19

信息流广告预估技术在美团外卖的实践思维导图-java架构

这个思维导图将涵盖从数据收集、特征工程、模型选择与训练、系统架构设计到性能优化和效果评估的关键领域。

用心去追梦·2025-01-22 22:59

gradio库的基本使用

它允许你基于预训练模型、函数或任意代码块创建实时演示和部署模型的图形用户界面（GUI）。使用Gradio库，你可以轻松创建Web界面，用于输入数据、调用模型、显示结果，并为用户提供与模型交互的功能。

Echo.....·2025-01-22 21:57

大型语言模型高效预训练策略的比较研究

文章目录摘要1.引言2.背景与挑战2.1LLM中的预训练2.2扩展LLM的挑战3.高效预训练策略3.1增量训练3.1.1理论基础3.1.2实际实现3.1.3实验结果3.2混合优化3.2.1理论基础3.2.2

二进制独立开发·2025-01-22 21:27

PX4源码学习二--PX4环境搭建

Ubuntu16.04环境搭建：预环境处理：（把用户添加到用户组"dialout":重新登录一回使其生效）sudousermod-a-Gdialout$USER#ubuntu自带端口管理会影响这个sudoapt-getremovemodemmanager

znr1995·2025-01-22 21:52

如何在 PyTorch 分布式训练中使用 TORCH_DISTRIBUTED_DEBUG=INFO 进行调试

如何在PyTorch分布式训练中使用TORCH_DISTRIBUTED_DEBUG=INFO进行调试在使用PyTorch进行分布式训练时，调试分布式训练过程中的问题可能非常棘手。

weixin_48705841·2025-01-22 20:50

在 PyTorch 训练中使用 `tqdm` 显示进度条

在PyTorch训练中使用tqdm显示进度条在深度学习的训练过程中，实时查看训练进度是非常重要的，它可以帮助我们更好地理解训练的效率，并及时调整模型或优化参数。

weixin_48705841·2025-01-22 20:50

【在 PyTorch 中使用 tqdm 显示训练进度条，并解决常见错误TypeError: ‘module‘ object is not callable】

在PyTorch中使用tqdm显示训练进度条，并解决常见错误TypeError:'module'objectisnotcallable在进行深度学习模型训练时，尤其是在处理大规模数据时，实时了解训练过程中的进展是非常重要的

weixin_48705841·2025-01-22 20:50

深度学习模型开发文档

深度学习模型开发文档1.简介2.深度学习模型开发流程3.数据准备3.1数据加载3.2数据可视化4.构建卷积神经网络(CNN)5.模型训练5.1定义损失函数和优化器5.2训练过程6.模型评估与优化6.1模型评估

Ares代码行者·2025-01-22 20:47

代码随想录算法训练营day28（0121）

1.买卖股票的最佳时机II想到思路其实代码非常简单，其实也跟之前做的那一题摆动序列有一点关联，只不过更加地简单这题的代码，思路很巧妙！题目122.买卖股票的最佳时机II给你一个整数数组prices，其中prices[i]表示某支股票第i天的价格。在每一天，你可以决定是否购买和/或出售股票。你在任何时候最多只能持有一股股票。你也可以先购买，然后在同一天出售。返回你能获得的最大利润。示例1：输入：pr

Lazy.land·2025-01-22 19:43

联邦学习中客户端发送的梯度是vector而不是tensor

在联邦学习中，当本地使用神经网络或深度学习模型时，训练的梯度通常是与模型参数（权重和偏置）相对应的梯度数据。

wzx_Eleven·2025-01-22 18:33

蓝桥杯训练—完美的代价

文章目录一、题目二、示例三、解析四、代码一、题目回文串，是一种特殊的字符串，它从左往右读和从右往左读是一样的。现在给你一个串，它不一定是回文的，请你计算最少的交换次数使得该串变成一个完美的回文串。交换的定义是：交换两个相邻的字符例如mamad第一次交换ad：mamda第二次交换md：madma第三次交换ma：madam输入格式：输入一行，是一个字符串，长度为n，只包括小写字母输出格式：如果可能，输

初春十九·2025-01-22 18:33

1. 基于大模型能力，如何提炼出优质prompt（入门版）

本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。

姚瑞南·2025-01-22 17:56

论文阅读--Qwen2&2.5技术报告

Qwen21引言所有模型都是在超过7trilliontoken（7万亿）的高质量、大规模数据集上预训练的2Tokenizer&Model2.1Tokenizer沿用Qwen（Bai等人，2023a）的做法

__如果·2025-01-22 17:55

几个导致DeepFaceLab训练速度较慢的原因

可能有几个原因导致DeepFaceLab训练速度较慢：复杂度：DeepFaceLab的算法和模型较为复杂，需要处理大量数据和计算复杂的数学运算，这可能导致训练速度较慢。

AlphaFinance·2025-01-22 17:23

R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）

包导入数据数据预处理数据分割MCFS运行MCFS-ID过程混淆矩阵重要特征的RI最小阈值距离与共同部分收敛特征重要性排序选择重要特征构建特征依赖图提取重要特征基于重要特征构建随机森林模型混淆矩阵评估模型AUC曲线刻画模型在训练和测试数据集的表现总结系统信息介绍特征选择

生信学习者1·2025-01-22 17:21

昇腾910-PyTorch 实现 GoogleNet图像分类

PyTorch实现GoogleNet用于图像分类本实验主要介绍了如何在昇腾上，使用pytorch对经典的GoogleNet模型在公开的CIFAR10数据集进行分类训练的实战讲解。

·2025-01-22 16:34

美国采取行动扩大人工智能出口限制

新规创建三级体系，对不同国家区别对待，并首次限制大型AI模型封闭权重出口。规则运作方式意见征询与生效：新规在媒体曝光后发布，设120天公众意见征询期，供新政府参考调整，预计一年后生效。

数据分析能量站·2025-01-22 16:08

Python中实现多层感知机（MLP）的深度学习模型

每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非

Echo_Wish·2025-01-22 12:43

【人工智能】Python常用库-Keras：高阶深度学习 API

Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。

IT古董·2025-01-22 11:33

小土堆学习笔记10（利用GPU训练于模型验证）

1.利用GPU训练GPU可优化操作如下操作方法1方法2数据获取判断是否可以使用GPU，如果可以直接model.cuda()先设定device，用的时候直接model.to（“device”）损失函数1.1

干啥都是小小白·2025-01-22 11:03

【大模型应用开发动手做AI Agent】AutoGen

这些模型通常在大规模文本数据集上进行预训练，以便能够生成与上下文相关的高质量文本。然而，对于特定领域或特定任务的需求，往往需要对这些通用模

AI大模型应用之禅·2025-01-22 11:02

【强化学习】Unity ML-Agents框架

实战项目与案例研究九、未来展望与发展趋势十、结语一、UnityML-Agents简介UnityML-Agents是一个由UnityTechnologies开发的开源项目，它允许开发者利用机器学习技术来训练虚拟环境中的智能代理

大雨淅淅·2025-01-22 11:00

python3.6 split用法_对sklearn的使用之数据集的拆分与训练详解(python3.6)

主要演示大致的过程：导入->拆分->训练->模型报告以及几个重要问题：①标签二值化②网格搜索法调参③k折交叉验证④增加噪声特征(之前涉及)fromsklearnimportdatasets#从cross_validation

weixin_39849054·2025-01-22 10:57

论文笔记 U-Net: Convolutional Networks for Biomedical Image Segmentation

摘要：人们普遍认为，深度网络的成功训练需要数千个带注释的训练样本。在本文中，我们提出了一种网络和训练策略，该策略依赖于大量使用数据增强来更有效地使用可用的注释样本。

城南皮卡丘·2025-01-22 10:24

第十九周：SSD（Single Shot MultiBox Detector）

SSD（SingleShotMultiBoxDetector）摘要Abstract1引言2SSD框架2.1设计理念2.2训练2.3预测3创新与不足总结参考摘要本篇博客介绍了SSD（SingleShotMultiBoxDetector

L-含光承影·2025-01-22 10:52

宇宙规律对可转移量子强化学习架构的启示

它利用量子计算机的优势，在训练和优化模

AI天才研究院·2025-01-22 05:22

【教程】Ollama 部署 MindSpore 训练的大模型

gguf-mindspore本项目（gguf-mindspore）帮助用户快速的将MindSpore生成的大模型的ckpt文件，转换为Ollama可以加载的GGUF格式文件，主要思路是针对已有的如Huggingface上的对应模型的GGUF文件，利用MindSpore生成的ckpt文件，替换掉GGUF文件中的张量信息部分，生成自己的GGUF文件。依赖gguf==0.6.0mindsporenump

Hsiayukoo·2025-01-22 05:48

清华和哈工大把大模型量化做到了1比特，把世界顶尖多模态大模型开源大模型量化个人电脑运行！机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能，视 Mamba速度提升2.8倍，内存能省87%

在追求更高效的机器学习模型部署时，模型量化技术应运而生，它通过降低权重矩阵的位宽来显著减少大型语言模型的存储和计算需求。我们一般的双精度浮点型double是64位

代码讲故事·2025-01-22 05:45

推荐频道

yolov3预训练权重

深入理解旋转位置编码（RoPE）及其在大型语言模型中的应用

TRELLIS文本或图像生3d模型一键整合包win版本，省去繁琐安装、效果超Wonder3D，对硬件要求更低速度更快16g N卡可流畅运行

Copilot 概述

Spring Boot编程训练系统：测试驱动开发（TDD）实践

【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶

龙年公仔放送 | EdgeOne网站加速与防护训练营，鹅厂大牛带你实战无忧！

QAT与PTQ模型量化方法的区别

高斯混合模型（GMM）：用“高斯家族”描绘数据的“模样”

机器人学习的范式转变：从专用走向通用基础模型

强化学习代码实践1.DDQN:在CartPole游戏中实现 Double DQN

深度学习中的通道(Channel)概念详解

未登录词 Out-of-Vocabulary, OOV

高效使用Alibaba Cloud PAI EAS进行AI模型推理

使用OpenAI Chat模型进行自然语言处理的实战指南

大语言模型原理与工程实践：预训练数据构建

机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测

WebRover ：一个功能强大的 Python 库，用于从 Web 内容生成高质量的数据集。

【Codex】Evaluating Large Language Models Trained on Code

3D Gaussian Splatting 部署

使用ModelScope实现高效句嵌入生成

WebRover： 专为训练大型语言模型和 AI 应用程序而设计的 Python 库

蓝桥杯 试题 算法训练 最小距离 ( C++ )

信息流广告预估技术在美团外卖的实践 思维导图-java架构

gradio库的基本使用

大型语言模型高效预训练策略的比较研究

PX4源码学习二--PX4环境搭建

如何在 PyTorch 分布式训练中使用 TORCH_DISTRIBUTED_DEBUG=INFO 进行调试

在 PyTorch 训练中使用 `tqdm` 显示进度条

【在 PyTorch 中使用 tqdm 显示训练进度条，并解决常见错误TypeError: ‘module‘ object is not callable】

深度学习模型开发文档

代码随想录算法训练营day28（0121）

联邦学习中客户端发送的梯度是vector而不是tensor

蓝桥杯训练—完美的代价

1. 基于大模型能力，如何提炼出优质prompt（入门版）

论文阅读--Qwen2&2.5技术报告

几个导致DeepFaceLab训练速度较慢的原因

R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）

昇腾910-PyTorch 实现 GoogleNet图像分类

美国采取行动扩大人工智能出口限制

Python中实现多层感知机（MLP）的深度学习模型

【人工智能】Python常用库-Keras：高阶深度学习 API

小土堆学习笔记10（利用GPU训练于模型验证）

【大模型应用开发 动手做AI Agent】AutoGen

【强化学习】Unity ML-Agents框架

python3.6 split用法_对sklearn的使用之数据集的拆分与训练详解(python3.6)

论文笔记 U-Net: Convolutional Networks for Biomedical Image Segmentation

第十九周：SSD（Single Shot MultiBox Detector）

宇宙规律对可转移量子强化学习架构的启示

【教程】Ollama 部署 MindSpore 训练的大模型

清华和哈工大把大模型量化做到了1比特，把世界顶尖多模态大模型开源大模型量化个人电脑运行！机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能，视 Mamba速度提升2.8倍，内存能省87%

WebRover：专为训练大型语言模型和 AI 应用程序而设计的 Python 库

蓝桥杯试题算法训练最小距离 ( C++ )

信息流广告预估技术在美团外卖的实践思维导图-java架构

【大模型应用开发动手做AI Agent】AutoGen