E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
nlp预训练
机器学习入门指南:从 TensorFlow 到 PyTorch
机器学习是一种通过数据
训练
模型,使计算机能够自动学习和改进的技术。它主要分
6v6-博客
·
2025-03-12 06:23
机器学习
tensorflow
pytorch
Faster R-CNN原理详解以及Pytorch实现模型
训练
与推理
《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【YOLOv8多目标识别与自动标注软件开发】8.【基于深度学习的行人跌倒检测系统】9.【基于深度学习的PCB板缺陷检测系统
阿_旭
·
2025-03-12 05:51
深度学习实战
cnn
pytorch
人工智能
Faster
RCNN
cornell grasp data 康奈尔大学抓取数据集 百度云
目前先进的基于视觉和机器人抓取方法都是在该数据集上
训练
过。该数据集共十组,每组100个物体,共计1000个物体,不仅包含物体的图像,还包含物体的抓取位姿。
工科pai
·
2025-03-12 05:20
深度学习
自主抓取
康奈尔抓取数据集
自主抓取
RK3568笔记五十六:yolov8_obb旋转框
训练
部署
本文基于rknn_model_zoo和山水无移大佬的博客和代码
训练
模型并部署到正点原子的ATK-DLRK3568板子测试。
殷忆枫
·
2025-03-12 04:07
RK3568学习笔记
笔记
YOLO
RK3568笔记六十八:Yolov11目标检测部署测试
这里不
训练
自己的模型了,使用官方模型测试。
殷忆枫
·
2025-03-12 04:07
RK3568学习笔记
笔记
YOLO
【大数据】大数据处理-Lambda架构-Kappa架构
大数据处理-Lambda架构-Kappa架构elasticsearch-headElasticsearch-sqlclient
NLP
china/elasticsearch-sql:UseSQLtoqueryElasticsearch360
weixin_33884611
·
2025-03-12 04:37
大数据
系统架构
对开源VLA sota π0的微调——如何基于各种开源数据集、以及你自己的私有数据集微调π0(含我司的微调实践)
前言25年2.4日,几个月前推出π0的公司PhysicalIntelligence(π)宣布正式开源π0及π0-FAST,如之前所介绍的,他们对用超过10,000小时的机器人数据进行了
预
训练
该GitHub
v_JULY_v
·
2025-03-12 04:07
通用机械臂之路:
π0等VLA
sota模型
开源VLA的sota模型
微调π0
微调VLA模型
基于私有数据集微调π0
基于开源数据集微调π0
使用OpenAI API实现自然语言处理应用
使用OpenAIAPI实现自然语言处理应用技术背景介绍随着人工智能技术的不断发展,自然语言处理(
NLP
)在各种应用中的地位越来越重要。
shuoac
·
2025-03-12 04:06
自然语言处理
人工智能
python
《自然语言处理实战入门》深度学习 ----
预
训练
模型初探
文章大纲前言
预
训练
模型简介语言表示学习神经上下文编码器为何需要
预
训练
模型发展历史主流
预
训练
模型
预
训练
模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展,各种神经网络被广泛用于解决自然语言处理
shiter
·
2025-03-12 02:21
AI重制版】
预训练
NLP
自然语言处理
DeepSeek发展背景和前景
2.技术演进:2024年1月:发布首个大模型DeepSeekLLM,包含670亿参数,在2万亿token的数据集上
训练
,性能超越Llama270BBase。202
爱吃苹果的日记本
·
2025-03-12 02:18
人工智能
第20周:Pytorch文本分类入门
目录前言一、前期准备1.1环境安装导入包1.2加载数据1.3构建词典1.4生成数据批次和迭代器二、准备模型2.1定义模型2.2定义示例2.3定义
训练
函数与评估函数三、
训练
模型3.1拆分数据集并运行模型3.2
weixin_46620278
·
2025-03-12 01:44
pytorch
分类
人工智能
第N3周:
NLP
中的数据集构建
本人往期文章可查阅:深度学习总结对于初学者,
NLP
中最烦人的问题之一就是数据集的构建问题,处理不好就会引起shape问题(各种由于shape错乱导致的问题)。
OreoCC
·
2025-03-12 01:43
自然语言处理
深度学习
pytorch
NLP
新手入门-第N1周:Pytorch文本分类入门
本文为365天深度学习
训练
营中的学习记录博客原作者:K同学啊|接辅导、项目定制目录一、课题背景和开发环境二、环境安装三、文本分类1.加载数据2.构建词典3.生成数据批次和迭代器4.定义模型5.定义实例6
Oaix Nay
·
2025-03-12 01:42
365天深度学习训练记录
pytorch
自然语言处理
分类
28.代码随想录算法
训练
营第二十八天|122. 买卖股票的最佳时机 II,55. 跳跃游戏,45. 跳跃游戏 II,1005. K 次取反后最大化的数组和
28.代码随想录算法
训练
营第二十八天|122.买卖股票的最佳时机II,55.跳跃游戏,45.跳跃游戏II,1005.K次取反后最大化的数组和122.买卖股票的最佳时机II-力扣(LeetCode)给你一个整数数组
白鹭鸣鸣!
·
2025-03-12 00:08
算法
java
Python 在深度学习中的应用
深度学习是机器学习的一个分支,它通过构建和
训练
深层神经网络来实现对数据的学习和理解。Python作为一种简洁、易读、功能强大的编程语言,在深度学习领域得到了广泛的应用。
2501_90435375
·
2025-03-12 00:38
人工智能
python
深度学习
开发语言
Bert的使用
dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimporttrain_test_split#给X,Y和分割比例,分割出来一个
训练
集和验证机的
巨鹿..
·
2025-03-12 00:31
深度学习记录
bert
人工智能
深度学习
PyTorch 中的混合精度
训练
方法,从 autocast 到 GradScalar
PyTorch的混合精度
训练
主要由两个方法实现:amp.autocast和amp.GradScalar。在这两个工具的帮助下,可以实现以torch.float16的混合精度
训练
。
Syntax_CD
·
2025-03-12 00:01
PyTorch
必知必会
pytorch
人工智能
python
第6篇:Transformer架构详解(下):多头注意力机制与位置编码
Transformer模型自提出以来,已经在自然语言处理(
NLP
)领域取得了巨大的成功。其核心创新包括多头注意力机制和位置编码,这些技术使得Transformer能够高效处理长序列数据。
Gemini技术窝
·
2025-03-12 00:00
transformer
深度学习
人工智能
自然语言处理
机器学习
chatgpt
nlp
考研复习时间规划:从迷茫到高效备考的进阶之路
基础阶段需要全面梳理知识体系,强化阶段着重攻克重点难点,冲刺阶段则要进行查漏补缺和模拟
训练
。每个阶段都有其特定的任务和目标,考生需要根据这些特征合理安排时间。考研复习的时
闲虎考研
·
2025-03-11 22:16
考研经验
考研
模型优化前沿趋势与行业应用实战
以联邦学习为代表的数据隐私保护技术,正在重构跨机构协作的模型
训练
范式,而量子计算与神经架构搜索(NAS)的结合,为超参数优化开辟了新维度。
智能计算研究中心
·
2025-03-11 22:12
其他
算力安全创新驱动未来趋势endofsentence
例如,异构计算通过CPU、GPU、FPGA的协同加速,使复杂模型
训练
效率提升40%以上。关键数据:根据IDC预测,到2025年全球智能算力需求将增长30倍,
智能计算研究中心
·
2025-03-11 22:42
其他
H800实战应用深度解析endofsentence
下表展示了H800在不同场景下的性能表现对比:场景类型
训练
速度提升推理延迟降低能效比提升自然语言处理35%22%40%计算机视觉28%18%33%推荐系统41%29%37%资深系统架构师指出:"H800
智能计算研究中心
·
2025-03-11 22:12
其他
DeepSeek高效AI创作成本革新endofsentence
该系统通过多任务联合
训练
框架,在自然语言理解、代码生成和跨模态处理方面展现出显著优势。其混合专家架构采用动态路由机制,实现参数利用率提升40%以上,在保持模型容量的同时将推理成本降低68%。
智能计算研究中心
·
2025-03-11 22:12
其他
DeepSeek大语言模型下几个常用术语
站看到复旦赵斌老师说的一句话“科幻电影里在人脑中植入芯片或许在当下无法实现,但当下可以借助AI人工智能实现人类第二脑”(大概是这个意思)更多内容,可关注公众号“一名程序媛”,我们一起从0-1学编程基本概念AI人工智能
NLP
曲幽
·
2025-03-11 21:36
AI
计算机
语言模型
人工智能
自然语言处理
deepseek
ollama
ai
H100架构解析与性能优化策略
本文将从核心架构创新与典型场景调优两个维度展开:首先解析第三代TensorCore的稀疏计算加速机制、FP8混合精度支持特性及其对矩阵运算的优化效果;其次,针对显存子系统中HBM3堆栈布局、L2缓存分区策略以及数据
预
取算法的协同优化进行拆解
智能计算研究中心
·
2025-03-11 21:36
其他
Python机器学习实战:使用Flask构建机器学习API
机器学习实战:使用Flask构建机器学习API作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域,模型
训练
和部署一直是重要的挑战
AI天才研究院
·
2025-03-11 20:03
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
入坑 Python 全能实战小白
训练
营,470 集干货 12.9G 大揭秘!
家人们,我最近挖到了一个Python学习的宝藏——Python全能实战小白
训练
营。整整470集,内容超丰富,资源包有12.9G,完全就是为咱们这些想系统学习Python的小白量身定制的。
七七知享
·
2025-03-11 19:54
Python
python
开发语言
pandas
numpy
matplotlib
java
php
深度学习
训练
中GPU内存管理
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、梯度累积概述在深度学习模型
训练
中,主流GPU显存通常为8GB~80GB,内存不足会导致
训练
中断或
@Mr_LiuYang
·
2025-03-11 19:24
遇到过的问题
内存管理
内存溢出
out
of
memory
GPU内存
一学就会的深度学习基础指令及操作步骤(5)使用
预
训练
模型
文章目录使用
预
训练
模型加载
预
训练
模型图像加载与预处理预测使用
预
训练
模型查看模型库和常用模型加载
预
训练
模型fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16
小圆圆666
·
2025-03-11 19:53
深度学习
人工智能
python
卷积神经网络
【LLM】
预
训练
的具体流程
分词器
训练
预
训练
模型:就像你已经学会了一些基础知识的“大脑”,我们可以在这个基础上继续学习新东西。比如,有些模型已经学会了英语,但中文学得不够好。
FOUR_A
·
2025-03-11 17:05
LLM
python
人工智能
深度学习
大模型
固定表头、首列 —— uniapp、vue 项目
:也可以在【微信小程序】搜索体验:xny.handbook另一个体验项目:官网一、效果展示二、代码展示(1)html部分股票代码建议投金额实际投金额建议股数实际股数◎原单价涨出-单价↑跌出+单价↓+○
预
赚
菲力蒲LY
·
2025-03-11 17:34
vue.js
uni-app
前端
YOLO
训练
指南(以V3为例)
YOLO
训练
指南(以V3为例)前言了解yolo3https://cloud.tencent.com/developer/news/76803https://www.bilibili.com/video/
niuTaylor
·
2025-03-11 16:28
YOLO
目标检测
深度学习
机器学习
深度学习:偏差和方差
高偏差模型的
训练
误差和测试误差可能都较高。解决方法:增加模型复杂度:例如增加多项式的阶数、增加神经网络的层数等。使用更多的
壹十壹
·
2025-03-11 16:25
深度学习
深度学习
人工智能
python
机器学习
《 YOLOv5、YOLOv8、YOLO11
训练
的关键文件:data.yaml文件编写全解》
走进YOLOv5、YOLOv8、YOLO11的data.yaml在计算机视觉领域的广袤星空中,目标检测无疑是一颗璀璨的明星,它广泛应用于自动驾驶、智能安防、工业检测、医疗影像分析等众多关键领域,发挥着不可或缺的作用。而YOLO系列算法,更是以其独特的“一次看全(YouOnlyLookOnce)”理念和卓越的性能,在目标检测领域中独树一帜,成为了众多研究者和开发者的首选工具。从最初的YOLOv1横空
空云风语
·
2025-03-11 15:51
人工智能
YOLO
机器视觉
目标跟踪
人工智能
计算机视觉
YOLO
基于transformer实现机器翻译(日译中)
文章目录一、引言二、使用编码器—解码器和注意力机制来实现机器翻译模型2.0含注意力机制的编码器—解码器2.1读取和预处理数据2.2含注意力机制的编码器—解码器2.3
训练
模型2.4预测不定长的序列2.5评价翻译结果三
小白_laughter
·
2025-03-11 15:46
课程学习
transformer
机器翻译
深度学习
【
NLP
39、激活函数 ⑤ Swish激活函数】
我的孤独原本是座荒岛,直到你称成潮汐,原来爱是让个体失序的永恒运动——25.2.25Swish激活函数是一种近年来在深度学习中广泛应用的激活函数,由GoogleBrain团队在2017年提出。其核心设计结合了Sigmoid门控机制和线性输入的乘积,通过引入平滑性和非单调性来提升模型性能。一、数学定义与变体1.基础形式Swish的标准表达式为:Swish(x)=x⋅σ(βx)其中:σ(x)是Sigm
L_cl
·
2025-03-11 14:44
NLP
自然语言处理
人工智能
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language
本文提出SeisMoLLM,这是首个利用跨模态迁移进行地震监测的基础模型,它无需在地震数据集上进行直接
预
训练
,就能充分发挥大规模
预
训练
大语言模型的强大能力。
UnknownBody
·
2025-03-11 12:29
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
【每日一题 | 2025】3.3 ~ 3.9
个人主页:Guiat归属专栏:每日一题文章目录1.【3.3】10387[蓝桥杯2024省A]
训练
士兵2.【3.4】P8601[蓝桥杯2013省A]剪格子3.【3.5】P9241[蓝桥杯2023省B]飞机降落
Guiat
·
2025-03-11 12:58
每日一题
每日一题
【Hugging Face】transformers 库中 model 的常用方法和属性
HuggingFacetransformers库中model的常用方法和属性在transformers库中,model代表
预
训练
的Transformer模型,可用于文本分类、问答、文本生成等任务。
彬彬侠
·
2025-03-11 11:53
Hugging
Face
model
模型的属性和方法
transformers
Hugging
Face
python
知识蒸馏论文精选——《Graph-Free Knowledge Distillation for Graph Neural Networks 》
Graph-FreeKnowledgeDistillationforGraphNeuralNetworks》2021作者是XiangDeng和ZhongfeiZhang,来自纽约州立大学宾汉姆顿分校论文地址见文末摘要知识蒸馏(KnowledgeDistillation,KD)通过强制学生网络模仿在
训练
数据上
预
训练
老师网络的输出
宇直不会放弃
·
2025-03-11 11:20
GKD-Output
layer
人工智能
数据挖掘
机器学习
深度学习
神经网络
cnn
pytorch
HarmonyNext实战案例:基于ArkTS的高性能分布式机器学习应用开发
通过分布式机器学习,开发者可以充分利用多设备的计算资源,实现复杂模型的
训练
与推理。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的分布式机器学习应用,涵盖从基础概念到高级技巧的全面讲解。
·
2025-03-11 11:52
harmonyos-next
成功案例丨开发时间从1小时缩短到3分钟:如何利用历史数据
训练
AI模型,预测设计性能?
在其首个AI驱动项目——摩托车把手设计优化中,Hero采用了PhysicsAI™几何深度学习解决方案,利用历史数据
训练
AI模型并预测设计性能。A
Altair澳汰尔
·
2025-03-11 11:45
PhysicsAI
仿真
AI
机器学习
HyperWorks
数据分析
关于两次项目的学习感悟
经过这两次项目,我学到了以下几点:1.模块化与结构化思维:代码展示了如何将深度学习任务分解为多个模块(如数据加载、模型定义、
训练
循环、评估等)。
罗婕斯特
·
2025-03-11 10:43
大数据
QPython双核攻略:从零基础到AI开发,你的手机就是全栈
训练
营
主题一:《编程小白必看!在手机上种下你的第一行代码》✨北京优趣天下信息技术有限公司重磅出品我们比谁都清楚:✔️86%的初学者因环境配置放弃编程✔️72%的上班族只有碎片化学习时间✔️95%的自学者需要即时答疑支持为什么QPython成为2025现象级学习工具?▸全栈开发环境:解释器+编辑器+控制台三合一▸AI导师常驻:集成DeepSeek代码助手(支持中英双语提问)▸极速学习路径:Q派课程7天完成
程之编
·
2025-03-11 09:39
python
开发语言
青少年编程
人工智能
“大语言模型微调”(Fine-tuning)与“大语言模型应用”(LLM Applications)之间的区别
1.概念与定义大语言模型微调微调指的是在一个经过大规模
预
训练
的通用语言模型基础上,利用针对性较强的小规模数据集对模型进行进一步
训练
,从而使模型在特定领域或任务上表现得更优秀。
AI Echoes
·
2025-03-11 09:06
人工智能
机器学习
深度学习
Python第十六课:深度学习入门 | 神经网络解密
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的
训练
过程掌握防止过拟合的基础策略一、神经网络基础(大脑的数字化仿生)1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和
程之编
·
2025-03-11 09:03
Python全栈通关秘籍
python
神经网络
青少年编程
【大模型开发】Megatron-LM 深度解析:原理、应用与代码实现
所有内容基于Megatron-LM官方实现(GitHub:NVIDIA/Megatron-LM),并结合大规模模型
训练
的关键理念进行介绍。
云博士的AI课堂
·
2025-03-11 08:27
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型开发
Hugging
Face
大模型生态
机器学习
Megatron-LM
并行训练
大模型加速
【大模型开发】深入解析 DeepSpeed:原理、核心技术与示例代码
深入解析DeepSpeed:原理、核心技术与示例代码DeepSpeed是由微软开源的高性能深度学习
训练
优化引擎,专注于帮助研究人员和工程团队在分布式环境中高效地
训练
超大规模模型。
云博士的AI课堂
·
2025-03-11 08:57
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型开发
大模型微调
deepseek
deepspeed
python
人工智能
pytorch
【大模型开发】大模型背后的基础组件与生态概览
本文将介绍其中几大核心组件和框架,包括HuggingFaceTransformers、DeepSpeed、Megatron-LM,以及其他相关工具和方法,展示它们在
训练
效率
云博士的AI课堂
·
2025-03-11 08:56
深度学习
哈佛博后带你玩转机器学习
大模型技术开发与实践
大模型开发
Hugging
Face
DeepSpeed
大模型生态
机器学习
深度学习
大模型技术栈
一学就会的深度学习基础指令及操作步骤(6)迁移学习
文章目录迁移学习模型准备数据增强模型
训练
模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上,以提高新任务的学习效率和性能。
小圆圆666
·
2025-03-11 07:49
深度学习
迁移学习
人工智能
卷积神经网络
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他