Nenu复建训练第3页

一文看懂llama2（原理&模型&训练）

自从Transformer架构问世以来，大型语言模型（LargeLanguageModels,LLMs）以及AIGC技术的发展速度惊人，它们不仅在技术层面取得了重大突破，还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出，这一技术日益走进大众视野，这也预示着一个由生成式AI塑造的未来正在加速到来。与此同时，MetaAIMetaAI在2023年推出了LLama（LargeLan

Qpeterqiufengyi·2025-01-20 07:38

图像生成大模型：Imagen 详解

本文将详细讲解Imagen的基本原理、架构、训练流程及应用场景。1.Imagen的基本原理1.1什么是Imagen？

转角再相遇·2025-01-20 04:17

知识付费的理由不能是焦虑

有不少同学是重度知识付费用户，当然我其实也算其中一类，付费的课程，社群，训练营，圈子等等都不少。有人属于为改变付费，有人属于为焦虑付费。

小路哥v·2025-01-20 04:14

人工智能伦理：技术发展背后的思考

AI系统依赖海量数据训练，这些数据包含个人信息、医疗记录等敏感内容。若数据保护不当，极易引发数据泄露风险，侵犯个人隐私。

m0_72547478·2025-01-20 04:13

使用Python实现LLM的文本生成：风格迁移与内容控制

文章目录引言1.大型语言模型（LLM）概述1.1Transformer架构1.2预训练与微调2.文本生成基础2.1无条件生成2.2条件生成3.风格迁移3.1风格迁移的基本原理3.2使用Python实现风格迁移

二进制独立开发·2025-01-20 02:46

计算机视觉与深度学习：使用深度学习训练基于视觉的车辆检测器（MATLAB源码-Faster R-CNN）

本文将介绍如何使用MATLAB和深度学习技术，特别是FasterR-CNN模型，来训练一个车辆检测器。文章目录一

ZhShy23·2025-01-20 00:04

GAN在图像增强中的应用实战指南

通过生成器和判别器的对抗性训练，GAN可以生成逼真图像、修复低质量图像、扩增数据集并进行风格迁移。本项目将介绍如何使用Python及其相关库实现GAN图像增强，包括模型的构建、训练和评估。

码字仙子·2025-01-20 00:03

这样能训练好 GAN 做图像转换吗？

前言GAN似乎离不开大量的训练数据量。

weixin_39972741·2025-01-20 00:03

DNA图谱分析：自动分析DNA图谱中的变异YOLOv5、YOLOv8、YOLOv10

目录引言项目背景与目标YOLO模型简介DNA图谱数据集准备YOLOv5、YOLOv8和YOLOv10模型训练与优化DNA图谱变异检测的实现UI界面设计与实现评估与优化未来展望结论完整代码实现1.引言随着基因组学的进步

2025年数学建模美赛·2025-01-19 23:58

机器学习-期末测试

机器学习-期末测试线性回归1.代码展示#coding=UTF-8#拆分训练集和测试集importmatplotlib.pyplotaspltfromsklearn.model_selectionimporttrain_test_split

难以触及的高度·2025-01-19 23:19

Kaggle欺诈检测：使用生成对抗网络（GAN）解决正负样本极度不平衡问题

然而，欺诈交易数据往往呈现出正负样本极度不平衡的特点，这给机器学习模型的训练带来了挑战。

Loving_enjoy·2025-01-19 22:46

YOLOv10改进，YOLOv10检测头融合RepConv卷积，添加小目标检测层（四头检测）+CA注意机制，全网首发

摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。

挂科边缘·2025-01-19 22:42

C#遇见TensorFlow.NET：开启机器学习的全新时代

今天，我们将一起探索如何利用这一强大的工具，在熟悉的.NET环境中轻松构建、训练和

墨夶·2025-01-19 21:34

YOLOv11改进，YOLOv11检测头融合RepConv卷积，并添加小目标检测层（四头检测），适合目标检测、分割等任务

摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。

挂科边缘·2025-01-19 21:01

工业场景将成为AI大模型的重要战场！零基础入门AI大模型，看这篇就够了！

随着GPT-4o、Gemini1.5Pro、LLaVA1.6的发布，基于Transformer架构和海量数据训练的多模态大模型再次点燃通用人工智能（AGI），其对文本、图像等多模态输入的支持和强大的理解能力也象征着人工智能迈向通用人工智能

大模型扬叔·2025-01-19 20:29

通俗易懂之广义加性模型GAM时序预测(pyGAM)

本文将详细介绍如何在Python中实现广义加性模型进行时间序列预测，包括所需的库、数据预处理、模型构建、训练以及评估。如果这篇文章对你有一点点的帮助，欢迎点赞、关注、收藏、转发、评论哦！

智识小站·2025-01-19 20:23

工业大模型市场图谱：53个工业大模型全面梳理

根据沙丘智库发布的《2024年中国工业大模型应用跟踪报告》，工业大模型是指在通用基础大模型（例如文心一言、通义千问等）的基础上，结合行业&场景数据进行预训练和微调，并进行模型压缩（裁剪、蒸馏等）所形成的大模型

大模型常客·2025-01-19 19:21

透过生活小故事，轻松理解大模型开发的五种核心方法

本文将以贴近生活的五个场景，通俗易懂地讲解大模型开发中的五种核心方法：提示词工程和外部函数、Agent设计、RAG设计（检索增强生成）、微调以及预训练。让我们一同走进这些故事，揭开大模型

·2025-01-19 19:54

【大模型】从零样本到少样本学习：一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用！

尤其是在大规模预训练模型（如GPT系列）的推动下，这些技术得到了广泛应用和关注。本篇文章将带你全面了解这三种学习方法的核心概念、原理和实际应用场景。1.什么是

橙子小哥的代码世界·2025-01-19 17:06

什么是AI显卡，英伟达与AMD显卡的全面对比

在人工智能领域，尤其是深度学习中，训练和推理任务需要处理大量的矩阵运算，这正是GPU擅长的领域。AI显卡通过高度并行的架构，可以显著提升训练速度和模型性能，同时降低功耗和延迟。

wit_@·2025-01-19 16:53

从零开始的 AI Infra 学习之路

从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM

SSS不知-道·2025-01-19 15:15

【YOLOV8】YOLOV8模型训练train及参数详解

介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。

小小小小祥·2025-01-19 15:10

【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小

对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？

小小小小祥·2025-01-19 15:40

深入解读ChatGPT的工作原理及底层逻辑

ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。

NAR_鱼丸·2025-01-19 13:59

厉害了，LSTM+Transformer王炸创新，精准度又高了！

这种创新的结合不仅提升了模型的预测精度，还优化了性能和训练效率，使其在序列分析任务中展现出卓越的能力。例如，最

马拉AI·2025-01-19 12:48

详解深度学习中的Dropout

Dropout是一种在神经网络训练中常用的正则化技术，其操作是在每次训练迭代中随机“丢弃”一部分神经元（即将其输出置为零）。

nk妹妹·2025-01-19 11:43

深度强化学习(DRL)原理与代码实战案例讲解

符号主义AI试图通过逻辑和符号系统来模拟人类的思维过程，而连接主义AI则侧重于构建类似于人脑神经网络的结构，通过大量数据进行训练，从而实现智能。

AI大模型应用之禅·2025-01-19 09:27

数据增强方法及其工具

数据增强（DataAugmentation）是指在训练深度学习模型时，通过对现有数据进行一系列变换，从而生成新的样本。

cxr828·2025-01-19 07:09

大模型训练显卡选择

大模型训练显卡对比大模型训练时A100是首选，A40用于推理，目前还推出了H100为下一代替换A100的产品。大模型的训练用4090可以吗？

kcarly·2025-01-19 07:39

基于深度学习CNN网络 mini-xception网络实现构建一个完整的人脸表情检测_识别分类系统，包括训练、评估、前端和服务端代码

人脸表情检测该项目已训练好网络模型，配置好环境即可运行使用，效果见图像，实现图像识别、摄像头识别、摄像头识别/识别分类项目-说明文档-UI界面-cnn网络项目基本介绍：【网络】深度学习CNN网络mini-xception

计算机c9硕士算法工程师·2025-01-19 07:35

单层感知机----或门实现

文章目录一、前言---感知机二、实现过程1.引入库2.或门真值表-训练集数据3.建立model,初始化定义权重、偏置、学习率4.前向传播定义5.训练过程(更新权重和偏置)6.训练模型一、前言—感知机感知机

翔翔子1号·2025-01-19 06:30

大模型-Qwen2.5 技术报告解读

Abstract主要是在介绍通义千问2.5（Qwen2.5）这一大型语言模型系列，涵盖了它在不同训练阶段的改进、多样化配置、可获取途径以及在各项性能评测中的出色表现等多个方面，旨在展示其先进性与实用性。

数据分析能量站·2025-01-19 06:55

【深度学习】AMP（Automatic Mixed Precision，自动混合精度）

AutomaticMixedPrecision，自动混合精度）AMP在深度学习中，AMP（AutomaticMixedPrecision，自动混合精度）是一种通过混合使用单精度（FP32）和半精度（FP16）来加速训练并减少显存占用的技术

shanks66·2025-01-19 04:38

【安利一个超高性价比的GPU租赁平台使用分享】

这时候要是有8个4090该多好......正在训练的例子一、租蓝耘GPU服务器1、租用服务器首先需要进入蓝耘官网，登录官网后，点击【容器云市场】，租用配置合适的服务器。很便宜，随用随租，计费精

放飞自我的Coder·2025-01-19 04:30

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

2.2训练大模型有多烧钱？2.3如何入门大模型？

皮皮冰燃·2025-01-19 04:58

从零开始构建一个大语言模型-第二章第一节

第二章目录**2.1理解词嵌入**2.2文本分词2.3将词元转换为词元ID2.4添加特殊上下文词元2.5字节对编码2.6使用滑动窗口进行数据采样2.7创建词元嵌入2.8编码词位置#本章涵盖为大型语言模型训练准备文本

释迦呼呼·2025-01-19 03:55

深度学习笔记——生成对抗网络GAN

文章目录一、基本结构生成器判别器二、损失函数判别器生成器交替优化目标函数三、GAN的训练过程训练流程概述训练流程步骤1.初始化参数和超参数2.定义损失函数3.训练过程的迭代判别器训练步骤生成器训练步骤4

好评笔记·2025-01-19 03:25

RPA 机器人到底有啥用？一文全知晓

一、RPA如何成为企业的智能助手（一）精准模仿人类操作，开启自动化之旅RPA机器人宛如一位训练有素的数字助手，其核心能力便是精准地模仿人类在计算机系统中的各种操作行为。

RPAdaren·2025-01-19 03:21

代码随想录算法训练营总结

本人是一名普普通通的计算机专业的毕业生，在大学学数据结构和算法就感觉非常难，到毕业也没刷过几道题，所幸后来入职的公司也没有考察算法相关的内容。到现在已经工作两年多了，看到过许多聊面试聊算法的文章，也接触到一些对我来说很厉害的大佬，发现在面试尤其是大厂面试时对算法的考察还是很重要的，遂重新打开leetcode开始刷题，起初只是实在无聊的时候看下每日一题，这里用“看题”主要是因为完全不会做啊，毫不夸张

whpu_yb·2025-01-19 01:12

神经网络初始化 (init) 介绍

常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型训练与评估

迷路爸爸180·2025-01-18 23:25

3.ChatClient&Chat Model简化与AI模型的交互

通过向预训练语言模型（如GPT等）发送提示词或部分对话内容，模型依据自身训练数据及对自然语言模式的理解，生成对话的延续或完整回复，并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。

laopeng301·2025-01-18 23:20

吴恩达系列——微调（Fine-tuning）与生成模型的应用

微调（Fine-tuning）是指在已有预训练模型的基础上，对模型进行进一步训练，以适应特定任务或需求。

疯狂小料·2025-01-18 21:04

【Python篇】深入机器学习核心：XGBoost 从入门到实战

2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优

半截诗·2025-01-18 19:06

【YOLOv8杂草作物目标检测】

以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。

stsdddd·2025-01-18 19:35

NVIDIA Hopper解说

白总Server·2025-01-18 17:24

LLMs，即大型语言模型

LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。

maopig·2025-01-18 17:52

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

第60期 | GPTSecurity周报