E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
阿里云训练
通过LoRA(Low-Rank Adaptation)低秩矩阵分解来高效微调权重变化
这种方法通过减少微调的参数数量来提高
训练
效率。
背太阳的牧羊人
·
2025-03-20 08:53
模型微调
矩阵
线性代数
深度学习
人工智能
自然语言处理
LoRA
神经网络之参数初始化
引言:参数初始化是
训练
深度神经网络的一个关键步骤,目的是给网络中权重(weights)和偏置(biases)赋予初始值。
硬水果糖
·
2025-03-20 08:21
人工智能
神经网络
人工智能
深度学习
神经网络基础之正则化
一、正则化目的防止过拟合:当模型过于复杂(例如神经网络层数过多、参数过多)时,容易在
训练
数据上“记忆”噪声或细节,导致在测试数据上表现差。简化模型:正则化通过限制模型参数的大小或数量,迫
硬水果糖
·
2025-03-20 07:45
人工智能
神经网络
人工智能
机器学习
【阿里百炼大模型-使用】
参照
阿里云
百炼网址服务配置开通服务如果没有注册
阿里云
账号,先注册一个https://www.aliyun.com/?
y_dd
·
2025-03-20 07:14
深度学习
语言模型
人工智能
TDE透明加密技术:免改造实现华为云ECS中数据库和文件加密存储
在数字经济与云计算深度融合的今天,华为云ECS(弹性云服务器)已成为企业数字化转型的核心载体,承载着数据库、文件存储、AI
训练
等关键业务。
安 当 加 密
·
2025-03-20 07:43
华为云
数据库
谈高考真题的使用(数学)
2019独角兽企业重金招聘Python工程师标准>>>在高三数学复习中,大家常说“以本为本,以纲为纲,高考真题当主粮”,就是以教材内容为根本,以“考试大纲”为准绳,以高考真题的
训练
为主线;抓住了本,把握了纲
weixin_34116110
·
2025-03-20 06:33
python
测试
利用 HAI 平台进行 DeepSeek 模型
训练
的详细指南
摘要本文旨在为非专业用户提供在HAI平台上进行DeepSeek模型
训练
的详细步骤。从创建项目、上传数据集、配置
训练
参数到启动
训练
任务并监控
训练
过程,本文将逐步指导用户完成整个流程。
·
2025-03-20 06:41
policy_does_not_allow_file_overwrite
uniapp云开发
阿里云
上传文件uniapp的出现,让前端人员和后端人员实现了“全栈”的小梦想,当然,真正跨端开发的时候,还是会遇到不少的问题,比如今天我们的主角,uniCloud.uploadFile
·
2025-03-20 05:39
前端uniapp云存储
Ai时代初期全球不同纬度的层级辐射现象
现象可被科学解构为以下六大维度,结合技术演进、产业实践和社会影响进行系统性分析:一、技术能力的层级跃迁模型效率革命DeepSeek研发的R1-Zero模型通过动态架构设计,将样本利用率提升40%以上,
训练
周期大幅缩短
龙胥伯
·
2025-03-20 04:48
人工智能
2025实战指南:基于VMware 17与Linux的Dify私有化部署——从零构建企业级AI开发平台
一、环境准备与系统配置1.1VMware17虚拟机创建新建虚拟机:选择“典型”安装模式,指定CentOS7镜像文件(建议使用
阿里云
镜像源获取最新稳定版)1硬件资源配置:内存:≥4GB(推荐8GB
Tec_Bit
·
2025-03-20 02:34
人工智能
centos
linux
人工智能
chatgpt
1.1PaddleTS_环境配置:一个易用的深度时序建模的Python库
PaddleTS的主要特性包括:设计统一数据结构,实现对多样化时序数据的表达,支持单目标与多目标变量,支持多类型协变量封装基础模型功能,如数据加载、回调设置、损失函数、
训练
过程控制等公共方法,帮助开发
pythonQA
·
2025-03-20 01:27
python
paddlepaddle
【大模型科普】AIGC技术发展与应用实践(一文读懂AIGC)
大模型是千亿参数的深度神经网络(如ChatGPT),经海量数据
训练
后能完成文本生成、图像创作等复杂任务,显著提升效率,但面临算力消耗、数据偏见等挑战。
·
2025-03-20 01:36
人工智能
AI编程工具领域:深度理解项目架构篇
以下是基于最新信息的工具评估与分析:1.通义灵码(
阿里云
)核心能力:@workspace功能:基于RAG技术,支持本地代码库的索引和深度感知,可分析项目完整结构,生成文件解释、代码逻辑查询和整体修改建议
xinxiyinhe
·
2025-03-20 00:16
AI编程
python
人工智能
AI编程
人工智能
大模型相关网站整理
目录一:大模型开发网站1.开源模型平台2.私有化部署大模型3.LangChain中文网4.LangChain4j5.通过标准的OpenAIAPI格式访问所有的大模型二:国内AI大模型应用盘点聊天1、
阿里云
gorgor在码农
·
2025-03-20 00:45
AI实战
python
java
人工智能
数据增强:扩充数据集提升模型泛化能力
一个泛化能力强的模型能够在未见数据上表现良好,而过拟合的模型则会在
训练
数据上表现出色,但在新数据上表现糟糕。
AI天才研究院
·
2025-03-19 23:06
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
数据增强:扩充数据集,提升模型的鲁棒性
数据增强:扩充数据集,提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是
训练
模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。
AI天才研究院
·
2025-03-19 23:05
DeepSeek
R1
&
大数据AI人工智能大模型
LLM大模型落地实战指南
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
NLP高频面试题(三)——普通RNN的梯度消失和梯度爆炸问题
普通RNN(循环神经网络)的梯度消失和梯度爆炸问题是指在
训练
深层或长序列的RNN模型时出现的两种典型问题:一、梯度消失(VanishingGradient)梯度消失是指在反向传播过程中,梯度逐层传播时变得越来越小
Chaos_Wang_
·
2025-03-19 23:34
NLP常见面试题
自然语言处理
rnn
人工智能
vscode连接远程服务器docker里的容器--使用remote ssh
背景介绍:因为工作的原因,图像相关,模型
训练
,需要在服务器上面搞,同时,服务器上面的环境配置,全部使用的是docker创建容器的方式。
欢仔要学习
·
2025-03-19 22:28
python
学习
ubuntu
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发
安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架,提供了丰富的工具和库来构建和
训练
各种深度
UwoiGit
·
2025-03-19 22:25
tensorflow
opencv
pygame
【C#语言】C#中的同步与异步编程:原理、示例与最佳实践
⭐总结标题详情作者JosieBook头衔CSDN博客专家资格、
阿里云
JosieBook
·
2025-03-19 21:20
#
C#语言
c#
开发语言
同步异步
思途CMS高并发、高性能、高可用架构设计
二、各层技术特点及实现方式客户层1.1CDN加速思途CMS支持与主流CDN服务商(如
阿里云
CDN、腾讯云CDN等
·
2025-03-19 21:29
php
MMScan数据集:首个最大的多模态3D场景数据集,包含层次化的语言标注
数据集的建立,不仅推动了3D场景理解的研究进展,还为
训练
和评估多模态3D感知模型提供了宝贵的资源。
·
2025-03-19 21:28
数据集
深度革命:ResNet 如何用 “残差连接“ 颠覆深度学习
更令人震撼的是,ResNet将神经网络的深度推至152层,彻底打破了"深层网络无法
训练
"的魔咒。这场革命的核心,正是一个简单
安意诚Matrix
·
2025-03-19 20:46
机器学习笔记
深度学习
人工智能
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的
训练
后优化综述——第9部分——应用
应用尽管预
训练
为大型语言模型(LLMs)赋予了强大的基础能力,但在部署于专业领域时,LLMs仍经常遇到持续的限制,包括上下文长度受限、容易产生幻觉(hallucination)、推理能力欠佳和固有的偏见
王金-太想进步了
·
2025-03-19 19:31
语言模型
人工智能
自然语言处理
阿里云
ECS服务器挂载数据盘教程(Linux)
阿里云
ECS服务器挂载数据盘教程(Linux)在
阿里云
上挂载磁盘的过程可以分为几个步骤。以下是一个详细的教程,帮助你在
阿里云
的云服务器(ECS)上挂载磁盘。
A5云服务商
·
2025-03-19 18:28
服务器
阿里云
linux
云计算
运维
运维开发
Yolov8
训练
自己的数据集(脱离ultralytics库)
比如在使用v8的时候需要安装ultralytics库,然后再调用YOLO进行
训练
或者预测,那么就有这几个问题:问题1:安装了ultralytics库后如何使用YOLO呢
爱吃肉的鹏
·
2025-03-19 17:22
YOLO
迁移学习基础知识
简介使用迁移学习的优势:1、能够快速的
训练
出一个理想的结果2、当数据集较小时也能
训练
出理想的效果。注意:在使用别人预
训练
的参数模型时,要注意别人的预处理方式。
zhooooooou
·
2025-03-19 16:44
深度学习
迁移学习
人工智能
机器学习
迁移学习入门
迁移学习1迁移学习的概念预
训练
模型定义:简单来说别人
训练
好的模型。
EmbodiedTech
·
2025-03-19 16:14
人工智能
大模型
迁移学习
人工智能
机器学习
pip install速度慢怎么解决
例如,清华大学、
阿里云
、网易等都提供了Python镜像源。
滴答滴答滴嗒滴
·
2025-03-19 15:33
pip
python
Dify知识库构建流程及示例
3.向量化(Embedding)嵌入模型:调用预
训练
cqbelt
·
2025-03-19 14:54
ai
笔记
AI应用
MNIST数据集&手写数字识别
它提供了一种基于数据流图的编程模型,用于构建和
训练
机器学习模型。TensorFlow的核心概念是张量(Tensor)和流图(Graph)。
Zoro|
·
2025-03-19 13:18
keras
tensorflow
人工智能
机器学习
Codeforces Round 995 (Div. 3)
在这第iii天,如果Monocarp准备
训练
,那么他将完成aia_iai题,同样的,如果Stereocarp也在这天准备
训练
,那么他将完成bib_ibi题。
polarours
·
2025-03-19 13:17
Codeforces
算法
c++
数据结构
医疗影像联邦学习可解释性算法研究
本研究以跨机构医疗影像协作场景为核心,系统性探讨联邦学习框架下可解释性算法的创新路径,重点解决医疗AI模型在分布式
训练
中的透明度缺失问题。
智能计算研究中心
·
2025-03-19 11:36
其他
【Python】测试数据生成工具 --- Faker
Faker的应用不仅限于测试,它还广泛应用于数据分析、机器学习
训练
集的准备以及任何需要大量样本数据的场景。Faker安装前提:已安装python、pip安装命令如下:pipinst
·
2025-03-19 11:00
pythonfaker数据分析
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式
训练
架构实践
在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,不受制于供应商限制。本文将深入探讨如何混合AMD/NVIDIAGPU集群以支持PyTorch分布式训
·
2025-03-19 11:59
深度学习框架PyTorch——从入门到精通(4)数据转换
转换(Transforms)很多时候,数据并不总是以
训练
机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理,使其适合
训练
。
Fansv587
·
2025-03-19 11:01
Torch框架学习
深度学习
pytorch
人工智能
python
经验分享
深度学习框架PyTorch——从入门到精通(5)构建神经网络
构建神经网络获取
训练
设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的,这些层和模块会对数据进行各种操作
Fansv587
·
2025-03-19 11:58
Torch框架学习
深度学习
pytorch
神经网络
经验分享
最新xhs旋转滑块验证码分析(含识别与轨迹算法)
Python领域优质创作者、CSDN博客专家、
阿里云
博客专家、华为云享专家。一路走来长期坚守并致力于Python与爬虫领域研究与开发工作!
吴秋霖
·
2025-03-19 10:24
深耕爬虫领域
算法
验证码
滑块验证
Python
大语言模型的
训练
数据清洗策略
目录大语言模型的
训练
数据清洗策略1.数据去重与标准化问题解决方案示例代码(Python实现数据去重):2.过滤有害内容问题解决方案示例代码(基于关键词过滤有害内容):3.纠正数据不均衡问题解决方案示例代码
gs80140
·
2025-03-19 10:23
AI
python
Megatron-LM
训练
框架和Deepspeed
训练
框架最主要的异同和优劣是什么
核心异同点并行策略Megatron-LM核心:以张量并行(TensorParallelism)和流水线并行(PipelineParallelism)为主,结合数据并行。张量并行通过切分模型层(如注意力头、MLP块)到不同设备,利用NVLink高速通信提升效率。流水线并行将不同层分配到不同设备,通过P2P通信协调。DeepSpeed核心:ZeRO优化技术(ZeroRedundancyOptimize
强化学习曾小健
·
2025-03-19 09:15
人工智能
OctoTools:一个具有复杂推理可扩展工具的智体框架
现有方法使用外部工具增强大语言模型(LLM),但仅限于专业领域、有限的工具类型或需要额外的
训练
数据。本文的OctoTools,是一个无需
训练
、用户友好且易于扩展的
三谷秋水
·
2025-03-19 09:09
智能体
大模型
机器学习
人工智能
语言模型
机器学习
深度学习框架PyTorch——从入门到精通(5)自动微分
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在
训练
神经网络时,最常用的算法是反向传播。
Fansv587
·
2025-03-19 06:20
深度学习
pytorch
人工智能
【python】Python中常见的KeyError报错分析
✨✨欢迎大家来到景天科技苑✨✨养成好习惯,先赞后看哦~作者简介:景天科技苑《头衔》:大厂架构师,华为云开发者社区专家博主,
阿里云
开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等
景天科技苑
·
2025-03-19 05:35
python
开发语言
python报错
KeyError
标签转换脚本 - VOC格式转COCO格式,即voc2coco,xml2json 附VOC及COCO标签格式详解
专栏目录:YOLO
训练
/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址:YOLO
训练
/写作脚本——丰富文章内容,增强实验信服力,助力发文!!!
Limiiiing
·
2025-03-19 04:57
YOLO训练/写作脚本
YOLO
计算机视觉
目标检测
深度学习
标签转换脚本 - VOC格式转YOLO格式,即voc2yolo,xml2txt 附VOC及YOLO标签格式详解
专栏目录:YOLO
训练
/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址:YOLO
训练
/写作脚本——丰富文章内容,增强实验信服力,助力发文!!!
Limiiiing
·
2025-03-19 04:26
YOLO训练/写作脚本
YOLO
深度学习
计算机视觉
目标检测
自建智能算力中心 vs 第三方算力租赁:AI企业的算力博弈与最优解
从ChatGPT到DeepSeek,从自动驾驶到智能医疗,AI模型的
训练
和推理需求呈现指数级增长。在这场技术革命中,算力已成为企业竞争的“命脉”。
·
2025-03-19 03:50
快速部署一个k8s集群
2.2添加
阿里云
YUM软件源。2.3安装kubeadm,kubelet和kubectl.三,部署Kubern
懒人P
·
2025-03-19 00:22
Kubernetes
云原生
kubernetes
容器
运维
Spring AI Alibaba 应用框架挑战赛圆满落幕,恭喜获奖选手
本项目基于Pivotal公司开源的SpringAI开源项目构建,突出SpringAI与
阿里云
开源/商业生态的集成与最佳实践,集成范围涉及百炼、云原生
·
2025-03-18 22:44
云原生
RAG 在多模态数据处理中的应用探索:结合图像与文本生成
目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型
训练
应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展
hy098543
·
2025-03-18 22:40
AIGC
如何计算一个7B的模型
训练
需要的参数量以及
训练
时需要的计算资源
计算理论过程见:transformer中多头注意力机制的参数量是多少?1.模型参数量的计算7B参数模型的总参数量是70亿(7billion)。这些参数主要分布在以下几个部分:Transformer层:多头注意力机制(Multi-HeadAttention)前馈神经网络(Feed-ForwardNetwork)嵌入层(EmbeddingLayer):词嵌入(TokenEmbeddings)位置编码(
yxx122345
·
2025-03-18 20:59
算法
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他