E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bert模型训练
HarmonyOS Next数据处理与
模型训练
优化
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中数据处理与
模型训练
优化相关技术细节,基于实际开发实践进行总结。
·
2025-02-20 17:51
harmonyos
【自然语言处理|迁移学习-08】:中文语料完型填空
文章目录1中文语料完型填空任务介绍2数据集加载及处理3定义下游任务模型4
模型训练
5.模型测试1中文语料完型填空任务介绍任务介绍:完成中文语料完型填空完型填空是一个分类问题,[MASK]单词有21128种可能数据构建实现分析
爱学习不掉头发
·
2025-02-20 14:50
深度学习
自然语言处理(NLP)
自然语言处理
迁移学习
人工智能
BP 神经网络在考古数据分析中的应用
通过丰富的代码示例展示了如何运用BP神经网络进行考古文物的分类鉴定、年代预测以及遗址空间分布分析等任务,涵盖数据预处理、网络构建、
模型训练
与评估等关键环节。
fanxbl957
·
2025-02-20 13:42
人工智能理论与实践
神经网络
数据分析
人工智能
如果MLlib 中没有所需要的模型,如何使用 Spark 进行分布式训练?
如果MLlib中没有你所需要的模型,并且不打算结合更强大的框架(如TensorFlowOnSpark或Horovod),仍然可以使用Spark进行分布式训练,但需要手动处理训练任务的分配、数据准备、
模型训练
是纯一呀
·
2025-02-20 08:57
WSL
Docker
AI
spark
分布式
mllib
DeepSeek掀起推理服务器新风暴,AI应用迎来变革转折点?
其发展分数据收集整理、
模型训练
、推理应用三个阶段,过去重
模型训练
,如今大量预训练模型出现,如何高效应用成新挑战,推理服务器应运而生。
小深ai硬件分享
·
2025-02-20 08:20
人工智能
大数据
华为的云端训练算力与迭代效率
华为云、云端训练、算力、迭代效率、人工智能、深度学习、
模型训练
、分布式训练、优化算法1.背景介绍人工智能(AI)技术近年来发展迅速,深度学习作为其核心驱动力,在图像识别、自然语言处理、语音识别等领域取得了突破性进展
AI大模型应用之禅
·
2025-02-20 05:34
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用LangChain与Clarifai模型进行交互
在现代AI应用开发中,Clarifai提供了一个完整的AI生命周期管理平台,包括数据探索、数据标注、
模型训练
、评估和推理。本文将探讨如何使用LangChain库与Clarifai的模型进行交互。
vaidfl
·
2025-02-20 02:06
langchain
交互
python
吐血整理!权重持久化方案优化,让你的模型性能飙升
权重持久化方案优化,让你的模型性能飙升引言你是否在做深度学习项目时,遭遇过
模型训练
结果无法有效保存,导致之前的努力付诸东流的痛苦?又或者在模型权重持久化时,发现保存和加载的速度极慢,严重影响项目进度?
盼达思文体科创
·
2025-02-20 01:57
经验分享
吐血整理!训练时数据增强策略调整,让模型性能飙升
训练时数据增强策略调整,让模型性能飙升引言你是否遇到过
模型训练
效果不佳,明明投入了大量数据,可模型的准确率、泛化能力就是提不上去?其实啊,很多时候问题就出在数据增强策略上。
盼达思文体科创
·
2025-02-20 01:26
经验分享
模型版本回滚机制支持,让你的
模型训练
不再走弯路
模型版本回滚机制支持,让你的
模型训练
不再走弯路引言你是否遇到过
模型训练
过程中,因为一个小失误导致之前的努力白费,只能从头再来的糟心事?为什么辛辛苦苦训练出来的模型,突然效果变差,却找不到问题所在?
盼达思文体科创
·
2025-02-20 01:26
经验分享
吐血整理!过拟合抑制策略调整方法大揭秘,让模型性能飙升
为啥
模型训练
得好好的,实际应用时却差强人意呢?这其实就是过拟合在捣乱!接下来,我就带你深入了解过拟合抑制策略的调整方法,让你的模型告别过拟合,重获新生!
盼达思文体科创
·
2025-02-20 01:56
经验分享
梯度累积和优化器配置差异,让
模型训练
效果天差地别!
梯度累积和优化器配置差异,让
模型训练
效果天差地别!引言你是否还在为
模型训练
效果不佳而苦恼?明明花费了大量时间和精力,模型的性能却始终无法达到预期。其实,很多时候问题可能就出在梯度累积和优化器配置上。
盼达思文体科创
·
2025-02-20 01:26
经验分享
还在为模型权重共享效率发愁?模型权重共享策略优化让效果飙升
模型权重共享策略优化让效果飙升引言你是否在进行
模型训练
时,常常被漫长的训练时间和巨大的计算资源消耗搞得焦头烂额?为什么明明使用了模型权重共享策略,却还是达不到理想的训练效果和效率?
盼达思文体科创
·
2025-02-20 01:26
经验分享
深度学习torch之19种优化算法(optimizer)解析
Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析,博客旨在为机器学习工程师和研究人员提供清晰的理论指导,帮助读者选择合适的优化算法提升
模型训练
效率
@Mr_LiuYang
·
2025-02-19 23:06
论文阅读
深度学习
optimizer
Adam
学习率调整
优化算法
AI架构师必知必会系列:强化学习在金融领域的应用
文章目录AI架构师必知必会系列:强化学习在金融领域的应用1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系1.强化学习交易系统的总体架构2.强化学习
模型训练
流程3.
AI天才研究院
·
2025-02-19 09:45
AI实战
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek自研AI芯片,AI算力新变革?
AI算力告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂
模型训练
,到日常生活里智能语音助手的实时交互,算力成了决定AI发展的关键因素。作为大模型领域的后起之秀,DeepSeek对计算资源
·
2025-02-19 07:19
人工智能深度学习机器学习算法
Python库 - transformers
以下是关于transformers库的详细介绍:1.主要特点预训练模型:transformers库包含了多种预训练的语言模型,如
BERT
、GPT、T5、XLNet等。这些模型在大规模文本
司南锤
·
2025-02-19 03:28
PYTHON库
python机器学习
python
开发语言
【NLP-04】tranformers库保姆级使用教程---以
BERT
模型为例
安装要安装一个非常轻量级的Transformers库,您可以执行以下步骤:1、打开终端或命令提示符。2、运行以下命令来安装Transformers库:pipinstalltransformers这将使用pip工具从PythonPackageIndex(PyPI)下载并安装Transformers库。请确保您的计算机上已经安装了pip。然后,您可以在Python代码中导入Transformers库:
云天徽上
·
2025-02-19 03:28
NLP
bert
人工智能
深度学习
自然语言处理
机器学习
numpy
信息可视化
LLaMA系列大模型调研与整理-llama-alpaca-lora
alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词:大模型,LLaMA,Alpaca,Lora,Belle,
模型训练
AI大模型-大飞
·
2025-02-19 02:17
llama
AI大模型
AI
职场和发展
人工智能
采用分布式部署deepseek
分布式部署DeepSeek涉及使用多个计算节点来加速
模型训练
或提升推理效率。下面是一个基本的指南,帮助您了解如何进行分布式部署。
慧香一格
·
2025-02-19 02:14
AI
学习
分布式
deepseek
【JAVA工程师从0开始学AI】,第四步:闭包与高阶函数——用Python的“魔法函数“重构Java思维
这里没有类的枷锁,函数既是武器又是盾牌,高阶函数组合出的"代码万花筒",正是AI数据处理、
模型训练
的核心密码。本文将用J
架构默片
·
2025-02-19 01:03
JAVA工程师从0开始学AI
人工智能
java
python
PyTorch `.pth` 转 ONNX:从
模型训练
到跨平台部署
PyTorch.pth转ONNX:从
模型训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储训练好的模型。
MO__YE
·
2025-02-18 23:46
人工智能
PyTorch `.pth` 转 ONNX:从
模型训练
到跨平台部署
PyTorch.pth转ONNX:从
模型训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储训练好的模型。
MO__YE
·
2025-02-18 23:12
pytorch
人工智能
python
商汤绝影端到端自动驾驶的迭代优化
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,
模型训练
,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展,自动驾驶汽车从科幻走进了现实。
AGI大模型与大数据研究院
·
2025-02-18 22:33
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别
监督微调)和RLHF(基于人类反馈的强化学习)的区别STF(SupervisedFine-Tuning)和RLHF(ReinforcementLearningfromHumanFeedback)是两种不同的
模型训练
方法
钟小宇
·
2025-02-18 18:11
LLM
人工智能
语言模型
机器学习基本篇
题目越多,训练越好,2基本流程数据预处理——
模型训练
与评估可以优化为获取数据——数据预处理——EDA分析——特征工程——
模型训练
——可解释性分析2.0数据获取利用kaggle,天池等平台的开源数据,2.1
胖胖的小肥猫
·
2025-02-18 16:51
机器学习
DeepSeek对AI发展的范式革新与推动:研究报告
其核心技术突破包括:低算力消耗的
模型训练
通过蒸馏训练策略、动态模型剪枝和稀疏训练,DeepSeek将训练成本降至OpenAI同类模型的1/10,同时保持性能可比甚至超越。
芝士AI吃鱼
·
2025-02-18 05:57
DeepSeek
AI
OpenAI
LLM
模型GPU->NPU(Ascend)迁移训练简述
目录一、迁移训练流程图解二、详细流程步骤1.
模型训练
与日志记录2.跨平台精度对齐对比3.问题定位与修复4.迭代验证三、关键技术点四、常见问题与解决方案一、迁移训练流程图解通过华为云的modelart进行运行环境选型北京四使用
終不似少年遊*
·
2025-02-18 01:12
深度学习
人工智能
迁移学习
GPU
NPU
华为云
书籍-《掌握Transformer:从
BERT
到大模型和Stable Diffusion(第二版)》
书籍:MasteringTransformers:TheJourneyfrom
BERT
toLargeLanguageModelsandStableDiffusion,2ndEdition作者:SavaşYıldırım
·
2025-02-18 00:36
【DeepSeek】一文详解GRPO算法——为什么能减少大
模型训练
资源?
GRPO,一种新的强化学习方法,是DeepSeekR1使用到的训练方法。今天的这篇博客文章,笔者会从零开始,层层递进地为各位介绍一种在强化学习中极具实用价值的技术——GRPO(GroupRelativePolicyOptimization)。如果你是第一次听说这个概念,也不必慌张,笔者会带领你从最基础的强化学习背景知识讲起,一步步剖析其来龙去脉,然后再结合实例讲解GRPO在实际应用中的思路和操作示
FF-Studio
·
2025-02-17 20:19
DeepSeek
R1
算法
红 - 黑树和 B+树?
红黑树是一种自平衡二叉查找树,由RudolfBayer发明,在1978年被LeoJ.Guibas和Ro
bert
Sedgewick改称为“红黑树”。
百态老人
·
2025-02-17 16:43
笔记
Lua 5.1 参考手册
Lua5.1参考手册byRo
bert
oIerusalimschy,LuizHenriquedeFigueiredo,WaldemarCeles云风译www.codingnow.comCopyright©
weixin_30822451
·
2025-02-17 14:51
Python 循环神经网络(RNN)算法详解与应用案例
的优势与挑战二、Python中RNN的面向对象实现2.1`RNNCell`类的实现2.2`RNNModel`类的实现2.3`Trainer`类的实现三、案例分析3.1序列预测3.1.1数据准备3.1.2
模型训练
闲人编程
·
2025-02-17 13:48
python
python
rnn
算法
循环神经网络
深度学习
文本生成
CAP与BASE:分布式系统设计的灵魂与妥协
2000年,由加州大学伯克利分校的EricBrewer教授在分布式计算原理研讨会(PODC)上提出,因此CAP定理又被称作布鲁尔定理(Brewer’stheorem)2年后,麻省理工学院的SethGil
bert
·
2025-02-17 11:37
后端java分布式
第TR5周:Transformer实战:文本分类
数据预处理2.1构建词典2.2生成数据批次和迭代器2.3构建数据集3.模型构建3.1定义位置编码函数3.2定义Transformer模型3.3初始化模型3.4定义训练函数3.5定义评估函数4.训练模型4.1
模型训练
计算机真好丸
·
2025-02-17 07:56
transformer
分类
深度学习
知识图谱大模型系列之 11什么是 Neo4j LLM 知识图谱构建器?
推荐文章《使用ChatGPT从视频脚本创建知识图谱,使用GPT-4作为领域专家来帮助您从视频转录中提取知识(教程含完整源码)》权重2,知识图谱类《赋能知识图谱形成:利用
BERT
opic、DataMapPlo
知识大胖
·
2025-02-17 07:53
NVIDIA
GPU和大语言模型开发教程
知识图谱
neo4j
人工智能
llm
大数据知识图谱之深度学习——基于
BERT
+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_
bert
+lstm
文章目录大数据知识图谱之深度学习——基于
BERT
+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介
2301_76348014
·
2025-02-17 06:49
程序员
深度学习
大数据
知识图谱
深度剖析DeepSeek本地部署:技术、实践与优化策略
OpenAI的GPT系列模型凭借其出色的语言理解与生成能力,在全球范围内掀起了AI应用的热潮;Google的
BERT
模型则在自然语言理解任务中取得
Abossss
·
2025-02-17 05:11
AI
论文
python
ai
人工智能
使用Python实现深度学习模型:知识蒸馏与模型压缩
目录引言知识蒸馏概述模型压缩概述实现步骤数据准备教师
模型训练
学生
模型训练
(知识蒸馏)模型压缩代码实现结论1.引言在实际应用中,深
Echo_Wish
·
2025-02-17 04:34
Python
笔记
从零开始学Python人工智能
Python算法
python
深度学习
开发语言
一、大模型微调的前沿技术与应用
大模型微调的前沿技术与应用随着大规模预训练模型(如GPT、
BERT
、T5等)的广泛应用,大模型微调(Fine-Tuning,FT)成为了提升模型在特定任务中性能的关键技术。
伯牙碎琴
·
2025-02-16 20:31
大模型微调
人工智能
大模型
微调
Deepseek
如何使用DeepSeek训练模型
目录准备工作硬件要求软件环境数据收集与预处理数据收集数据预处理模型构建与训练模型构建
模型训练
模型评估与调优评估指标调优方法部署与应用部署方式应用集成✍️相关问答DeepSeek模型在医疗领域的具体应用案例有哪些
LCG元
·
2025-02-16 18:17
大模型
人工智能
AI 大模型创业:如何利用市场优势?
大模型是指在特定领域中应用广泛、参数量巨大的神经网络模型,如
BERT
、GPT-3、DALL-E等。
SuperAGI2025
·
2025-02-16 12:37
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
labelme转YOLOv8、YOLOv5 标签格式 标注数据
前言本文分析将labelme的标签,转为YOLOv8、YOLOv5的格式,实现
模型训练
。首先了解YOLOv8和YOLOv5标签格式,然后了解labelme标签格式,最近实现数据格式转换。
一颗小树x
·
2025-02-16 10:20
YOLO目标检测
实践应用
labelme
YOLOv8
YOLOv5
标签格式
标注数据
GitHub 热点项目介绍
可通过pip安装并使用CRI命令进行
模型训练
、评估和推理。项目中还提供了详细的not
tomlone
·
2025-02-16 08:34
技术热点
人工智能
大模型参数高效微调(PEFT)技术解析及微调加速实践
2023年,大模型如雨后春笋般爆发,58同城TEG-AILab作为AI平台部门,紧跟大语言模型技术发展步伐,打造了大语言模型平台,支持大语言
模型训练
和推理部署,并基于大语言模型平台构建了58同城生活服务领域
AI产品经理
·
2025-02-16 03:53
人工智能
自然语言处理
深度学习
语言模型
Transformer以及
BERT
阅读参考博文
Transformer以及
BERT
阅读参考博文Transformer学习:已有博主的讲解特别好了:李沐:Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili知乎:Transformer
mumukehao
·
2025-02-15 17:41
文本属性图
文本属性图
ML.NET库学习006:成人人口普查数据分析与分类预测
文章目录ML.NET库学习006:成人人口普查数据分析与分类预测概述数据集数据字段解释为何数据准备很重要主要功能与模块数据准备机器学习工作流代码结构说明数据准备模块机器学习工作流数据加载与分割特征工程与
模型训练
模型评估与预测实现细节与注意事项数据准备模块机器学习工作流性能优化项目优势
North_D
·
2025-02-15 14:18
ML.NET库
机器学习
人工智能
深度学习
数据挖掘
目标检测
自然语言处理
神经网络
AI大模型(如GPT、
BERT
等)可以通过自然语言处理(NLP)和机器学习技术,显著提升测试效率
在软件测试中,AI大模型(如GPT、
BERT
等)可以通过自然语言处理(NLP)和机器学习技术,显著提升测试效率。
小赖同学啊
·
2025-02-15 11:56
python
人工智能
自动化测试(app
pc
API)
人工智能
自然语言处理
gpt
基于YOLOv5深度学习的木材表面缺陷检测系统:UI界面 + YOLOv5 + 数据集详细教程
本博客将详细介绍如何构建一个基于YOLOv5的木材表面缺陷检测系统,包括数据集准备、
模型训练
、UI界面开发及完整代码实现。目录目
深度学习&目标检测实战项目
·
2025-02-15 04:27
YOLO
深度学习
ui
YOLOv5
人工智能
计算机视觉
大语言模型原理基础与前沿 通过稀疏MoE扩展视觉语言模型
大语言模型(LargeLanguageModels,LLMs)如GPT-3、
BERT
等,已经在自然语言处理(NLP)任务中取得了显著的成果。
AI天才研究院
·
2025-02-14 12:52
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他