E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
自我训练
《自然语言处理实战入门》深度学习 ---- 预
训练
模型初探
文章大纲前言预
训练
模型简介语言表示学习神经上下文编码器为何需要预
训练
模型发展历史主流预
训练
模型预
训练
模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展,各种神经网络被广泛用于解决自然语言处理
shiter
·
2025-03-12 02:21
AI重制版】
预训练
NLP
自然语言处理
DeepSeek发展背景和前景
2.技术演进:2024年1月:发布首个大模型DeepSeekLLM,包含670亿参数,在2万亿token的数据集上
训练
,性能超越Llama270BBase。202
爱吃苹果的日记本
·
2025-03-12 02:18
人工智能
第20周:Pytorch文本分类入门
目录前言一、前期准备1.1环境安装导入包1.2加载数据1.3构建词典1.4生成数据批次和迭代器二、准备模型2.1定义模型2.2定义示例2.3定义
训练
函数与评估函数三、
训练
模型3.1拆分数据集并运行模型3.2
weixin_46620278
·
2025-03-12 01:44
pytorch
分类
人工智能
NLP新手入门-第N1周:Pytorch文本分类入门
本文为365天深度学习
训练
营中的学习记录博客原作者:K同学啊|接辅导、项目定制目录一、课题背景和开发环境二、环境安装三、文本分类1.加载数据2.构建词典3.生成数据批次和迭代器4.定义模型5.定义实例6
Oaix Nay
·
2025-03-12 01:42
365天深度学习训练记录
pytorch
自然语言处理
分类
28.代码随想录算法
训练
营第二十八天|122. 买卖股票的最佳时机 II,55. 跳跃游戏,45. 跳跃游戏 II,1005. K 次取反后最大化的数组和
28.代码随想录算法
训练
营第二十八天|122.买卖股票的最佳时机II,55.跳跃游戏,45.跳跃游戏II,1005.K次取反后最大化的数组和122.买卖股票的最佳时机II-力扣(LeetCode)给你一个整数数组
白鹭鸣鸣!
·
2025-03-12 00:08
算法
java
Python 在深度学习中的应用
深度学习是机器学习的一个分支,它通过构建和
训练
深层神经网络来实现对数据的学习和理解。Python作为一种简洁、易读、功能强大的编程语言,在深度学习领域得到了广泛的应用。
2501_90435375
·
2025-03-12 00:38
人工智能
python
深度学习
开发语言
Bert的使用
dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimporttrain_test_split#给X,Y和分割比例,分割出来一个
训练
集和验证机的
巨鹿..
·
2025-03-12 00:31
深度学习记录
bert
人工智能
深度学习
PyTorch 中的混合精度
训练
方法,从 autocast 到 GradScalar
PyTorch的混合精度
训练
主要由两个方法实现:amp.autocast和amp.GradScalar。在这两个工具的帮助下,可以实现以torch.float16的混合精度
训练
。
Syntax_CD
·
2025-03-12 00:01
PyTorch
必知必会
pytorch
人工智能
python
“知识海洋”的探险之旅,考研复习等你来挑战
在知识的广袤天地中,我们如同勇敢的水手,驾驶着智慧的船只,穿越波涛汹涌的思想之海,探索未知的知识领域,每一次航行都是一次心灵的冒险,每一次探索都是对
自我
认知的深化。
闲虎考研
·
2025-03-11 23:22
考研复习
考研经验
考研
考研复习时间规划:从迷茫到高效备考的进阶之路
基础阶段需要全面梳理知识体系,强化阶段着重攻克重点难点,冲刺阶段则要进行查漏补缺和模拟
训练
。每个阶段都有其特定的任务和目标,考生需要根据这些特征合理安排时间。考研复习的时
闲虎考研
·
2025-03-11 22:16
考研经验
考研
模型优化前沿趋势与行业应用实战
以联邦学习为代表的数据隐私保护技术,正在重构跨机构协作的模型
训练
范式,而量子计算与神经架构搜索(NAS)的结合,为超参数优化开辟了新维度。
智能计算研究中心
·
2025-03-11 22:12
其他
算力安全创新驱动未来趋势endofsentence
例如,异构计算通过CPU、GPU、FPGA的协同加速,使复杂模型
训练
效率提升40%以上。关键数据:根据IDC预测,到2025年全球智能算力需求将增长30倍,
智能计算研究中心
·
2025-03-11 22:42
其他
H800实战应用深度解析endofsentence
下表展示了H800在不同场景下的性能表现对比:场景类型
训练
速度提升推理延迟降低能效比提升自然语言处理35%22%40%计算机视觉28%18%33%推荐系统41%29%37%资深系统架构师指出:"H800
智能计算研究中心
·
2025-03-11 22:12
其他
DeepSeek高效AI创作成本革新endofsentence
该系统通过多任务联合
训练
框架,在自然语言理解、代码生成和跨模态处理方面展现出显著优势。其混合专家架构采用动态路由机制,实现参数利用率提升40%以上,在保持模型容量的同时将推理成本降低68%。
智能计算研究中心
·
2025-03-11 22:12
其他
DeepSeek大语言模型下几个常用术语
AI人工智能实现人类第二脑”(大概是这个意思)更多内容,可关注公众号“一名程序媛”,我们一起从0-1学编程基本概念AI人工智能NLP自然语言处理LLM大语言模型HuggingFace一个提供了丰富的预
训练
模型和工具库的平台网站
曲幽
·
2025-03-11 21:36
AI
计算机
语言模型
人工智能
自然语言处理
deepseek
ollama
ai
Python机器学习实战:使用Flask构建机器学习API
机器学习实战:使用Flask构建机器学习API作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域,模型
训练
和部署一直是重要的挑战
AI天才研究院
·
2025-03-11 20:03
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
入坑 Python 全能实战小白
训练
营,470 集干货 12.9G 大揭秘!
家人们,我最近挖到了一个Python学习的宝藏——Python全能实战小白
训练
营。整整470集,内容超丰富,资源包有12.9G,完全就是为咱们这些想系统学习Python的小白量身定制的。
七七知享
·
2025-03-11 19:54
Python
python
开发语言
pandas
numpy
matplotlib
java
php
深度学习
训练
中GPU内存管理
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、梯度累积概述在深度学习模型
训练
中,主流GPU显存通常为8GB~80GB,内存不足会导致
训练
中断或
@Mr_LiuYang
·
2025-03-11 19:24
遇到过的问题
内存管理
内存溢出
out
of
memory
GPU内存
一学就会的深度学习基础指令及操作步骤(5)使用预
训练
模型
文章目录使用预
训练
模型加载预
训练
模型图像加载与预处理预测使用预
训练
模型查看模型库和常用模型加载预
训练
模型fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16
小圆圆666
·
2025-03-11 19:53
深度学习
人工智能
python
卷积神经网络
【LLM】预
训练
的具体流程
分词器
训练
预
训练
模型:就像你已经学会了一些基础知识的“大脑”,我们可以在这个基础上继续学习新东西。比如,有些模型已经学会了英语,但中文学得不够好。
FOUR_A
·
2025-03-11 17:05
LLM
python
人工智能
深度学习
大模型
YOLO
训练
指南(以V3为例)
YOLO
训练
指南(以V3为例)前言了解yolo3https://cloud.tencent.com/developer/news/76803https://www.bilibili.com/video/
niuTaylor
·
2025-03-11 16:28
YOLO
目标检测
深度学习
机器学习
深度学习:偏差和方差
高偏差模型的
训练
误差和测试误差可能都较高。解决方法:增加模型复杂度:例如增加多项式的阶数、增加神经网络的层数等。使用更多的
壹十壹
·
2025-03-11 16:25
深度学习
深度学习
人工智能
python
机器学习
《 YOLOv5、YOLOv8、YOLO11
训练
的关键文件:data.yaml文件编写全解》
走进YOLOv5、YOLOv8、YOLO11的data.yaml在计算机视觉领域的广袤星空中,目标检测无疑是一颗璀璨的明星,它广泛应用于自动驾驶、智能安防、工业检测、医疗影像分析等众多关键领域,发挥着不可或缺的作用。而YOLO系列算法,更是以其独特的“一次看全(YouOnlyLookOnce)”理念和卓越的性能,在目标检测领域中独树一帜,成为了众多研究者和开发者的首选工具。从最初的YOLOv1横空
空云风语
·
2025-03-11 15:51
人工智能
YOLO
机器视觉
目标跟踪
人工智能
计算机视觉
YOLO
Qt程序闪退如何查原因呢,闪退点不是自己应用代码
问题描述 Qt程序闪退如何查原因呢,闪退点不是自己应用代码如图,因为是qt底层,这种闪退该怎么查原因和避免呢,现在遇到很多这种底层报错又没办法查代码如上问题有来
自我
自身项目
bug菌¹
·
2025-03-11 15:19
#
CSDN问答解惑(全栈版)
全栈Bug调优(实战版)
qt
数据库
开发语言
c++
基于transformer实现机器翻译(日译中)
文章目录一、引言二、使用编码器—解码器和注意力机制来实现机器翻译模型2.0含注意力机制的编码器—解码器2.1读取和预处理数据2.2含注意力机制的编码器—解码器2.3
训练
模型2.4预测不定长的序列2.5评价翻译结果三
小白_laughter
·
2025-03-11 15:46
课程学习
transformer
机器翻译
深度学习
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language
本文提出SeisMoLLM,这是首个利用跨模态迁移进行地震监测的基础模型,它无需在地震数据集上进行直接预
训练
,就能充分发挥大规模预
训练
大语言模型的强大能力。
UnknownBody
·
2025-03-11 12:29
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
【每日一题 | 2025】3.3 ~ 3.9
个人主页:Guiat归属专栏:每日一题文章目录1.【3.3】10387[蓝桥杯2024省A]
训练
士兵2.【3.4】P8601[蓝桥杯2013省A]剪格子3.【3.5】P9241[蓝桥杯2023省B]飞机降落
Guiat
·
2025-03-11 12:58
每日一题
每日一题
【Hugging Face】transformers 库中 model 的常用方法和属性
HuggingFacetransformers库中model的常用方法和属性在transformers库中,model代表预
训练
的Transformer模型,可用于文本分类、问答、文本生成等任务。
彬彬侠
·
2025-03-11 11:53
Hugging
Face
model
模型的属性和方法
transformers
Hugging
Face
python
知识蒸馏论文精选——《Graph-Free Knowledge Distillation for Graph Neural Networks 》
Graph-FreeKnowledgeDistillationforGraphNeuralNetworks》2021作者是XiangDeng和ZhongfeiZhang,来自纽约州立大学宾汉姆顿分校论文地址见文末摘要知识蒸馏(KnowledgeDistillation,KD)通过强制学生网络模仿在
训练
数据上预
训练
老师网络的输出
宇直不会放弃
·
2025-03-11 11:20
GKD-Output
layer
人工智能
数据挖掘
机器学习
深度学习
神经网络
cnn
pytorch
HarmonyNext实战案例:基于ArkTS的高性能分布式机器学习应用开发
通过分布式机器学习,开发者可以充分利用多设备的计算资源,实现复杂模型的
训练
与推理。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的分布式机器学习应用,涵盖从基础概念到高级技巧的全面讲解。
·
2025-03-11 11:52
harmonyos-next
成功案例丨开发时间从1小时缩短到3分钟:如何利用历史数据
训练
AI模型,预测设计性能?
在其首个AI驱动项目——摩托车把手设计优化中,Hero采用了PhysicsAI™几何深度学习解决方案,利用历史数据
训练
AI模型并预测设计性能。A
Altair澳汰尔
·
2025-03-11 11:45
PhysicsAI
仿真
AI
机器学习
HyperWorks
数据分析
关于两次项目的学习感悟
经过这两次项目,我学到了以下几点:1.模块化与结构化思维:代码展示了如何将深度学习任务分解为多个模块(如数据加载、模型定义、
训练
循环、评估等)。
罗婕斯特
·
2025-03-11 10:43
大数据
QPython双核攻略:从零基础到AI开发,你的手机就是全栈
训练
营
主题一:《编程小白必看!在手机上种下你的第一行代码》✨北京优趣天下信息技术有限公司重磅出品我们比谁都清楚:✔️86%的初学者因环境配置放弃编程✔️72%的上班族只有碎片化学习时间✔️95%的自学者需要即时答疑支持为什么QPython成为2025现象级学习工具?▸全栈开发环境:解释器+编辑器+控制台三合一▸AI导师常驻:集成DeepSeek代码助手(支持中英双语提问)▸极速学习路径:Q派课程7天完成
程之编
·
2025-03-11 09:39
python
开发语言
青少年编程
人工智能
“大语言模型微调”(Fine-tuning)与“大语言模型应用”(LLM Applications)之间的区别
1.概念与定义大语言模型微调微调指的是在一个经过大规模预
训练
的通用语言模型基础上,利用针对性较强的小规模数据集对模型进行进一步
训练
,从而使模型在特定领域或任务上表现得更优秀。
AI Echoes
·
2025-03-11 09:06
人工智能
机器学习
深度学习
GitLab:GitLab问题追踪与项目协作_2024-07-18_01-47-52.Tex
它最初是作为GitHub的一个替代品而设计的,旨在提供一个
自我
托管的Git仓库管理工具。GitLab的第一个版本是在RubyonRails上构建的,随着时间的推移,它逐渐发展成为
chenjj4003
·
2025-03-11 09:35
游戏开发
gitlab
github
git
elasticsearch
大数据
Python第十六课:深度学习入门 | 神经网络解密
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的
训练
过程掌握防止过拟合的基础策略一、神经网络基础(大脑的数字化仿生)1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和
程之编
·
2025-03-11 09:03
Python全栈通关秘籍
python
神经网络
青少年编程
【大模型开发】Megatron-LM 深度解析:原理、应用与代码实现
所有内容基于Megatron-LM官方实现(GitHub:NVIDIA/Megatron-LM),并结合大规模模型
训练
的关键理念进行介绍。
云博士的AI课堂
·
2025-03-11 08:27
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型开发
Hugging
Face
大模型生态
机器学习
Megatron-LM
并行训练
大模型加速
【大模型开发】深入解析 DeepSpeed:原理、核心技术与示例代码
深入解析DeepSpeed:原理、核心技术与示例代码DeepSpeed是由微软开源的高性能深度学习
训练
优化引擎,专注于帮助研究人员和工程团队在分布式环境中高效地
训练
超大规模模型。
云博士的AI课堂
·
2025-03-11 08:57
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型开发
大模型微调
deepseek
deepspeed
python
人工智能
pytorch
【大模型开发】大模型背后的基础组件与生态概览
本文将介绍其中几大核心组件和框架,包括HuggingFaceTransformers、DeepSpeed、Megatron-LM,以及其他相关工具和方法,展示它们在
训练
效率
云博士的AI课堂
·
2025-03-11 08:56
深度学习
哈佛博后带你玩转机器学习
大模型技术开发与实践
大模型开发
Hugging
Face
DeepSpeed
大模型生态
机器学习
深度学习
大模型技术栈
一学就会的深度学习基础指令及操作步骤(6)迁移学习
文章目录迁移学习模型准备数据增强模型
训练
模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上,以提高新任务的学习效率和性能。
小圆圆666
·
2025-03-11 07:49
深度学习
迁移学习
人工智能
卷积神经网络
领域大模型之微调技术和最佳实践
BERT和GPT-3等语言模型针对语言任务进行了预
训练
。微调使它们适应特定领域,如营销、医疗保健、金融。在本指南中,您将了解LLM架构、微调过程以及如何为NLP任务微调自己的预
训练
模型。
程序员莫玛
·
2025-03-11 07:17
人工智能
深度学习
语言模型
金融
学睿德毅育贤才,AI 剪辑绽华彩
“小白AI短视频
训练
营”,恰似一把钥匙,为零基础学员开启AI短视频创作的大门。在这里,学员能够借助AI技术,探索记录生活的全新视角,以独特的剪辑手法展现生活的精彩
互联网之声
·
2025-03-11 06:13
人工智能
AI 技术 引入 RTK(实时动态定位)系统,可以实现智能化管理和自动化运行
通过历史数据
训练
模型,实现快速解算。实例:某无人机公司使用A
小赖同学啊
·
2025-03-11 06:39
人工智能
低空经济
人工智能
自动化
运维
如何对大模型进行微调?从原理到实战全解析
微调指在预
训练
大模型(如GPT-3.5、LLaMA)的基础上,使用特定领域的数据进行二次
训练
,使模型适应新任务或领域需求。
挣扎与觉醒中的技术人
·
2025-03-11 05:32
人工智能
外包转型
集成学习
chatgpt
gpt-3
软件工程
在LangChain中运行Replicate模型的实用指南
##技术背景介绍Replicate是一个平台,可以轻松调用各种预
训练
的AI模型。与传统的模型托管和调用相比,Replicate提供了简单的API接口,使开发者能够快速集成和使用强大的AI模型。
fgayif
·
2025-03-11 04:50
langchain
人工智能
python
3.10 项目总结
今天的项目是一个使用PyTorch框架构建和
训练
神经网络的实例,旨在实现手写数字识别。以下是项目的总结、内容分析以及优化建议:项目总结1.目标:使用神经网络对MNIST数据集中的手写数字进行分类。
不要不开心了
·
2025-03-11 01:58
pyqt
深度学习
机器学习
数据挖掘
人工智能
点云语义分割:PointNet++在S3DIS数据集上的
训练
点云语义分割:PointNet++在S3DIS数据集上的
训练
点云语义分割是计算机视觉领域的一个重要任务,旨在将点云数据中的每个点分配给其对应的语义类别。
完美代码
·
2025-03-11 00:25
3d
neo4j
点云
windows11家庭版安装ubuntu子系统
训练
深度模型
文章目录环境准备前提条件安装环境安装Hyper-V安装Linux分发版升级WSL内核启用虚拟机功能安装ubuntu24.04安装桌面环境安装远程控制软件xrdp从Windows启动桌面版Ubuntu环境准备前提条件windows机器需要支持虚拟化,并且需要在BIOS中开启虚拟化技术,因为WSL2基于hyper-V,查看是否开启虚拟化:按住Windows+R输入cmd打开命令行,输入systemin
吃水果不削皮
·
2025-03-10 23:16
ubuntu
linux
windows
在Ubuntu系统下部署大语言模型
前言在Ubuntu系统下部署大语言模型,可以使用HuggingFace的Transformers库来加载和使用预
训练
的模型。
脱泥不tony
·
2025-03-10 22:39
ubuntu
语言模型
linux
人工智能
大数据
产品经理
transformer
机器学习算法(2)—— 线性回归算法
82,80],[85,78],[90,90],[86,82],[82,90],[78,80],[92,94]]y=[84.2,80.6,80.1,90,83.2,87.6,79.4,93.4]‘’‘模型
训练
疯狂的石头。
·
2025-03-10 21:35
算法
机器学习
线性回归
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他