bp神经网络训练第9页

通俗易懂之广义加性模型GAM时序预测(pyGAM)

本文将详细介绍如何在Python中实现广义加性模型进行时间序列预测，包括所需的库、数据预处理、模型构建、训练以及评估。如果这篇文章对你有一点点的帮助，欢迎点赞、关注、收藏、转发、评论哦！

智识小站·2025-01-19 20:23

工业大模型市场图谱：53个工业大模型全面梳理

根据沙丘智库发布的《2024年中国工业大模型应用跟踪报告》，工业大模型是指在通用基础大模型（例如文心一言、通义千问等）的基础上，结合行业&场景数据进行预训练和微调，并进行模型压缩（裁剪、蒸馏等）所形成的大模型

大模型常客·2025-01-19 19:21

透过生活小故事，轻松理解大模型开发的五种核心方法

本文将以贴近生活的五个场景，通俗易懂地讲解大模型开发中的五种核心方法：提示词工程和外部函数、Agent设计、RAG设计（检索增强生成）、微调以及预训练。让我们一同走进这些故事，揭开大模型

·2025-01-19 19:54

【大模型】从零样本到少样本学习：一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用！

尤其是在大规模预训练模型（如GPT系列）的推动下，这些技术得到了广泛应用和关注。本篇文章将带你全面了解这三种学习方法的核心概念、原理和实际应用场景。1.什么是

橙子小哥的代码世界·2025-01-19 17:06

构建功能-vite、rollup

一、vite基础1.简介vite是一个构建工具，相较于webpack，vite采用了不同的运行方式：开发阶段：在开发阶段，Vite的工作流程如下：依赖预构建：Vite会先将项目中的第三方依赖（如node_modules

小天呐·2025-01-19 17:59

什么是AI显卡，英伟达与AMD显卡的全面对比

在人工智能领域，尤其是深度学习中，训练和推理任务需要处理大量的矩阵运算，这正是GPU擅长的领域。AI显卡通过高度并行的架构，可以显著提升训练速度和模型性能，同时降低功耗和延迟。

wit_@·2025-01-19 16:53

深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术

深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术导语卷积神经网络（CNN）是现代深度学习领域中最重要的模型之一，特别在计算机视觉（CV）领域具有革命性的影响。

wit_@·2025-01-19 16:50

从零开始的 AI Infra 学习之路

从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM

SSS不知-道·2025-01-19 15:15

【YOLOV8】YOLOV8模型训练train及参数详解

介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。

小小小小祥·2025-01-19 15:10

【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小

对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？

小小小小祥·2025-01-19 15:40

ChatGPT4.0最新功能和使用技巧，助力日常生活、学习与工作！

自动生成代码等方面的强大功能，系统学习人工智能（包括传统机器学习、深度学习等）的基础理论知识，以及具体的代码实现方法，同时掌握ChatGPT4.0在科研工作中的各种使用方法与技巧，以及人工智能领域经典机器学习算法（BP

WangYan2022·2025-01-19 14:34

深入解读ChatGPT的工作原理及底层逻辑

ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。

NAR_鱼丸·2025-01-19 13:59

厉害了，LSTM+Transformer王炸创新，精准度又高了！

这种创新的结合不仅提升了模型的预测精度，还优化了性能和训练效率，使其在序列分析任务中展现出卓越的能力。例如，最

马拉AI·2025-01-19 12:48

详解深度学习中的Dropout

Dropout是一种在神经网络训练中常用的正则化技术，其操作是在每次训练迭代中随机“丢弃”一部分神经元（即将其输出置为零）。

nk妹妹·2025-01-19 11:43

深度强化学习(DRL)原理与代码实战案例讲解

符号主义AI试图通过逻辑和符号系统来模拟人类的思维过程，而连接主义AI则侧重于构建类似于人脑神经网络的结构，通过大量数据进行训练，从而实现智能。

AI大模型应用之禅·2025-01-19 09:27

神经网络常见操作（卷积）输入输出

卷积dim=d的tensor可以进行torch.nn.Convnd(in_channels,out_channels),其中n=d-1,d-2对于torch.nn.Convnd(in_channels,out_channels)，改变的是tensor的倒数n+1维的大小全连接使用torch.nn.Linear(in_features,out_features,bias)实现Y=XWT+b,其中X的

被放养的研究生·2025-01-19 09:54

数据增强方法及其工具

数据增强（DataAugmentation）是指在训练深度学习模型时，通过对现有数据进行一系列变换，从而生成新的样本。

cxr828·2025-01-19 07:09

大模型训练显卡选择

大模型训练显卡对比大模型训练时A100是首选，A40用于推理，目前还推出了H100为下一代替换A100的产品。大模型的训练用4090可以吗？

kcarly·2025-01-19 07:39

基于深度学习CNN网络 mini-xception网络实现构建一个完整的人脸表情检测_识别分类系统，包括训练、评估、前端和服务端代码

人脸表情检测该项目已训练好网络模型，配置好环境即可运行使用，效果见图像，实现图像识别、摄像头识别、摄像头识别/识别分类项目-说明文档-UI界面-cnn网络项目基本介绍：【网络】深度学习CNN网络mini-xception

计算机c9硕士算法工程师·2025-01-19 07:35

单层感知机----或门实现

文章目录一、前言---感知机二、实现过程1.引入库2.或门真值表-训练集数据3.建立model,初始化定义权重、偏置、学习率4.前向传播定义5.训练过程(更新权重和偏置)6.训练模型一、前言—感知机感知机

翔翔子1号·2025-01-19 06:30

大模型-Qwen2.5 技术报告解读

Abstract主要是在介绍通义千问2.5（Qwen2.5）这一大型语言模型系列，涵盖了它在不同训练阶段的改进、多样化配置、可获取途径以及在各项性能评测中的出色表现等多个方面，旨在展示其先进性与实用性。

数据分析能量站·2025-01-19 06:55

【深度学习】AMP（Automatic Mixed Precision，自动混合精度）

AutomaticMixedPrecision，自动混合精度）AMP在深度学习中，AMP（AutomaticMixedPrecision，自动混合精度）是一种通过混合使用单精度（FP32）和半精度（FP16）来加速训练并减少显存占用的技术

shanks66·2025-01-19 04:38

【安利一个超高性价比的GPU租赁平台使用分享】

这时候要是有8个4090该多好......正在训练的例子一、租蓝耘GPU服务器1、租用服务器首先需要进入蓝耘官网，登录官网后，点击【容器云市场】，租用配置合适的服务器。很便宜，随用随租，计费精

放飞自我的Coder·2025-01-19 04:30

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

文章目录1深度学习1.1神经网络和深度学习1.2神经网络的工作原理1.3神经网络的专业术语2LLM概述2.1大模型的"大"是指什么?2.2训练大模型有多烧钱？2.3如何入门大模型？

皮皮冰燃·2025-01-19 04:58

从零开始构建一个大语言模型-第二章第一节

第二章目录**2.1理解词嵌入**2.2文本分词2.3将词元转换为词元ID2.4添加特殊上下文词元2.5字节对编码2.6使用滑动窗口进行数据采样2.7创建词元嵌入2.8编码词位置#本章涵盖为大型语言模型训练准备文本

释迦呼呼·2025-01-19 03:55

深度学习笔记——前向传播与反向传播、神经网络（前馈神经网络与反馈神经网络）、常见算法概要汇总

本文简要介绍深度学习的前向传播与反向传播，以及前馈神经网络与反馈神经网络。

好评笔记·2025-01-19 03:25

深度学习笔记——生成对抗网络GAN

文章目录一、基本结构生成器判别器二、损失函数判别器生成器交替优化目标函数三、GAN的训练过程训练流程概述训练流程步骤1.初始化参数和超参数2.定义损失函数3.训练过程的迭代判别器训练步骤生成器训练步骤4

好评笔记·2025-01-19 03:25

RPA 机器人到底有啥用？一文全知晓

一、RPA如何成为企业的智能助手（一）精准模仿人类操作，开启自动化之旅RPA机器人宛如一位训练有素的数字助手，其核心能力便是精准地模仿人类在计算机系统中的各种操作行为。

RPAdaren·2025-01-19 03:21

代码随想录算法训练营总结

本人是一名普普通通的计算机专业的毕业生，在大学学数据结构和算法就感觉非常难，到毕业也没刷过几道题，所幸后来入职的公司也没有考察算法相关的内容。到现在已经工作两年多了，看到过许多聊面试聊算法的文章，也接触到一些对我来说很厉害的大佬，发现在面试尤其是大厂面试时对算法的考察还是很重要的，遂重新打开leetcode开始刷题，起初只是实在无聊的时候看下每日一题，这里用“看题”主要是因为完全不会做啊，毫不夸张

whpu_yb·2025-01-19 01:12

神经网络初始化 (init) 介绍

常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型训练与评估

迷路爸爸180·2025-01-18 23:25

3.ChatClient&Chat Model简化与AI模型的交互

通过向预训练语言模型（如GPT等）发送提示词或部分对话内容，模型依据自身训练数据及对自然语言模式的理解，生成对话的延续或完整回复，并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。

laopeng301·2025-01-18 23:20

吴恩达系列——微调（Fine-tuning）与生成模型的应用

微调（Fine-tuning）是指在已有预训练模型的基础上，对模型进行进一步训练，以适应特定任务或需求。

疯狂小料·2025-01-18 21:04

Android开发中图片处理

图片优化：选择合适的图片格式：使用适当的图片格式（如PNG、JPEG或WebP）以获得最佳的图片质量和文件大小。

wayne214·2025-01-18 21:26

Pytorch 三小时极限入门教程

无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。

power-辰南·2025-01-18 20:43

【Python篇】深入机器学习核心：XGBoost 从入门到实战

2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优

半截诗·2025-01-18 19:06

【YOLOv8杂草作物目标检测】

以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。

stsdddd·2025-01-18 19:35

eBPF 底层结构剖析

所以我们的寄存器,通常分为下面几种:数据寄存器,一般用于存储数据地址寄存器,用于存储地址,常见的有段指针在eBPF中常见的寄存器有下面这几种:R0,这个寄存器一般用于存储对应函数返回值R1-R5,这几个寄存器用于存储函数的参数值

·2025-01-18 18:07

NVIDIA Hopper解说

白总Server·2025-01-18 17:24

LLMs，即大型语言模型

LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。

maopig·2025-01-18 17:52

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

第60期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

【LLM】大语言模型（LLMs）

它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。

林九生·2025-01-18 17:21

全新 Hopper 架构的Transformer 引擎有什么特点？

Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。

扫地的小何尚·2025-01-18 17:50

大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了

如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage

大模型零基础教程·2025-01-18 17:19

《多模态语言模型：一个开放探索的技术新领域》

核心主题多模态语言模型的特点仍处于探索和定义阶段没有固定的标准任务和评估方法研究方向高度开放技术路径主要存在两种方法：后期融合(LateFusion)从语言模型backbone开始添加图像编码器效果稳定，成本可控早期融合(EarlyFusion)从多模态数据集预训练效果尚不明显需要更大规模计算资源开放和透明的重要性促进知识累积和技术迭代降低技术准入门槛避免技术垄断便于安全性审计主要挑战技术层面数据

XianxinMao·2025-01-18 17:16

1.4走向不同：GPT 与 BERT 的选择——两大NLP模型的深度解析

它们都基于Transformer架构，但在设计理念、任务应用和训练方式等方面存在显著差

少林码僧·2025-01-18 16:12

1.8 GPT-4：开创人工智能的新纪元

少林码僧·2025-01-18 16:12

第83期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 16:11

使用神经网络拟合6项参数

使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3

Andrew_Xzw·2025-01-18 15:06

3DUnetCNN 项目常见问题解决方案

designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN项目基础介绍3DUnetCNN是一个基于PyTorch的3DU-Net卷积神经网络

魏纯漫·2025-01-18 14:27

推荐频道

bp神经网络训练

通俗易懂之广义加性模型GAM时序预测(pyGAM)

工业大模型市场图谱：53个工业大模型全面梳理

透过生活小故事，轻松理解大模型开发的五种核心方法

【大模型】从零样本到少样本学习：一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用！

构建功能-vite、rollup

什么是AI显卡，英伟达与AMD显卡的全面对比

深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术

从零开始的 AI Infra 学习之路

【YOLOV8】YOLOV8模型训练train及参数详解

【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小

ChatGPT4.0最新功能和使用技巧，助力日常生活、学习与工作！

深入解读ChatGPT的工作原理及底层逻辑

厉害了，LSTM+Transformer王炸创新，精准度又高了！

详解深度学习中的Dropout

深度强化学习(DRL)原理与代码实战案例讲解

神经网络常见操作（卷积）输入输出

数据增强方法及其工具

大模型训练显卡选择

基于深度学习CNN网络 mini-xception网络实现 构建一个完整的人脸表情检测_识别分类系统，包括训练、评估、前端和服务端代码

单层感知机----或门实现

大模型-Qwen2.5 技术报告解读

【深度学习】AMP（Automatic Mixed Precision，自动混合精度）

【安利一个超高性价比的GPU租赁平台 使用分享】

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

从零开始构建一个大语言模型-第二章第一节

深度学习笔记——前向传播与反向传播、神经网络（前馈神经网络与反馈神经网络）、常见算法概要汇总

深度学习笔记——生成对抗网络GAN

RPA 机器人到底有啥用？一文全知晓

代码随想录算法训练营总结

神经网络初始化 (init) 介绍

3.ChatClient&Chat Model简化与AI模型的交互

吴恩达系列——微调（Fine-tuning）与生成模型的应用

Android开发中图片处理

Pytorch 三小时极限入门教程

【Python篇】深入机器学习核心：XGBoost 从入门到实战

【YOLOv8杂草作物目标检测】

eBPF 底层结构剖析

NVIDIA Hopper解说

LLMs，即大型语言模型

第79期 | GPTSecurity周报

第60期 | GPTSecurity周报

【LLM】大语言模型（LLMs）

全新 Hopper 架构的Transformer 引擎有什么特点？

大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了

《多模态语言模型：一个开放探索的技术新领域》

1.4走向不同：GPT 与 BERT 的选择——两大NLP模型的深度解析

1.8 GPT-4：开创人工智能的新纪元

第83期 | GPTSecurity周报

使用神经网络拟合6项参数

3DUnetCNN 项目常见问题解决方案

基于深度学习CNN网络 mini-xception网络实现构建一个完整的人脸表情检测_识别分类系统，包括训练、评估、前端和服务端代码

【安利一个超高性价比的GPU租赁平台使用分享】