E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2018暑假训练
深入解析ReLU激活函数的优缺点及其平衡策略
影响:这有助于模型更快地收敛,因为梯度不会因为负值而减小,从而避免负向因素对模型
训练
的不良影响。结论:这使得
weixin_40941102
·
2025-02-12 15:08
深度学习
人工智能
深度学习语义分割实战:ResNet 与 ViT 结合的模型解析
本文将详细解析该模型的架构、
训练
流程及其应用。2.语义分割模型解析本项目采用ResNet和ViT结合的方式进行语义分割,并使用CBAM注意力机制增强特征提取能力。涉及的核心文件
高山仰星
·
2025-02-12 15:06
深度学习
亚马逊云科技Bedrock知识库自定义语义搜索配置教程
给知识库挂载额外的数据有助于模型生成更相关、基于上下文的准确响应,而无需重新
训练
AI模型。
佛州小李哥
·
2025-02-12 13:57
AWS技术
科技
人工智能
亚马逊云科技
aws
ai
语言模型
知识库
DeepSeek-V3:模型与权重全面解析
DeepSeek-V3是一款开创性的混合专家(Mixture-of-Experts,MoE)语言模型,以其创新的架构设计、高效的
训练
方法和卓越的性能,成为开源大语言模型领域的标杆。
步子哥
·
2025-02-12 11:13
AGI通用人工智能
人工智能
DeepSeek V3 两周使用总结
官方宣称:(1)基于自研的MoE模型和671B参数,在14.8Ttoken上进行了预
训练
;(2)多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405
AI生成曾小健
·
2025-02-12 11:12
LLM大语言模型
Deepseek原理与使用
人工智能
一文带大家了解DeepSeek不同版本 1.5B、7B、14B、32B、70B的含义以及应用场景
1.参数量的意义参数量:指模型中可
训练
的参数总数,包括权重和偏置等。单位:-1B=10亿参数-7B=70亿参数-70B=700亿参数2.不同版本的特点版本参数
测试开发Kevin
·
2025-02-12 10:10
AI相关
人工智能
pytorch深度学习模型推理和部署、pytorch&ONNX&tensorRT模型转换以及python和C++版本部署
engine文件3.2tensorrt推理4.采用tensorrt进行推理(c++环境)5.采用torch2trt进行推理(python环境)在pytorch框架下,可以很方便进行深度学习模型的搭建、
训练
和保存
机械心
·
2025-02-12 10:40
深度学习
python
pytorch
如何从零开始,
训练
AI大模型?零基础入门到精通,收藏这一篇就够了
导读大模型作为目前最前沿的技术,是如何开发或者
训练
出来的呢。本文就为大家总结了大模型
训练
各阶段的最新技术方法,希望对大家有所帮助。1背景根据scalinglaw,模型越大,高质量数据越多,效果越好。
网络安全大白
·
2025-02-12 10:09
科技
程序员
大模型
人工智能
大模型
.safetensors 文件、.ckpt文件、.pth和.bin文件
safetensors文件1.1.背景和定义:1.2.特点:1.2.1.安全性:1.2.2.内存高效:1.3.应用场景:二..ckpt文件(CheckpointFile)2.1.背景和定义:2.2.特点:2.2.1.包含
训练
状态信息
李直气壮壮
·
2025-02-12 10:38
笔记
【Python】科研代码学习:十七 模型参数合并,safetensors / bin
save_pretrained还会新增的文件知识点:在保存模型参数时,大小发生了成倍的变化前言众所周知,LLM的模型参数一般保存在.safetensors或者.bin结尾的大文件但是通过一个RLHF的一个
训练
后
溢流眼泪
·
2025-02-12 10:08
【科研代码】
python
学习
开发语言
使用yolo11x进行物体分类
利用yolo11x进行物体识别一、物品分类代码说明模型加载:加载yolo11x.pt模型,如果这个模型在物体分类上表现不佳,可以考虑使用像yolov8n.pt这类通用的预
训练
模型。
欣然~
·
2025-02-12 10:35
分类
人工智能
深度学习
【野生动物识别系统】Python+深度学习+人工智能+卷积神经网络算法+TensorFlow+ResNet+图像识别
并通过对18种动物数据集进行
训练
,最后得到一个识别精度较高的模型。并基于Django框架,开发网页端操作平台,实现用户上传一张动物图片识别其名称。
·
2025-02-12 09:10
图像识别深度学习
蓝桥杯
训练
——奇怪的捐赠——题解
先上题目:地产大亨Q先生临终遗愿是:拿出100万元给X社区的居民抽奖,麻烦的是,他有个奇怪的要求:1.100万元必须被正好分成若干份(不能有剩余)。每份必须是7的若干次方元。比如:1元,7元,49元,343元,……2.相同金额的份数不能超过5份。3.在满足上述要求的情况下,分成的份数越多越好!请你帮忙算一算,最多可以分为多少份?一、OK,说一下我一开始的解题思路(错误),利用枚举:1.先将7的若干
老狐Nick
·
2025-02-12 09:00
蓝桥杯
python
蓝桥杯
训练
奇怪的捐赠 题解
题目:地产大亨Q先生临终遗愿是:拿出100万元给X社区的居民抽奖,麻烦的是,他有个奇怪的要求:1.100万元必须被正好分成若干份(不能有剩余)。每份必须是7的若干次方元。比如:1元,7元,49元,343元,……2.相同金额的份数不能超过5份。3.在满足上述要求的情况下,分成的份数越多越好!请你帮忙算一算,最多可以分为多少份?思路:换个角度考虑,如果拿出1234567890元分给居民,每份必须是10
SkyeBCI
·
2025-02-12 09:56
算法
数学
蓝桥杯
百度千帆大模型实战:AI大模型开发的调用指南
1.千帆大模型平台简介在AI蓬勃发展的时代,大模型平台作为支撑大规模数据处理和复杂模型
训练
的基石,正逐渐成为推动科技创新和产业升级的重要力量。千帆大模型平台,凭
AGI大模型学习
·
2025-02-12 08:55
百度
人工智能
大模型教程
学习
产品经理
大模型学习
大模型
蓝桥杯
训练
——奇怪的捐赠
地产大亨Q先生临终的遗愿是:拿出100100万元给X社区的居民抽奖,以稍慰藉心中愧疚。麻烦的是,他有个很奇怪的要求:100100万元必须被正好分成若干份(不能剩余)。每份必须是77的若干次方元。比如:11元,77元,4949元,343343元,...相同金额的份数不能超过55份。在满足上述要求的情况下,分成的份数越多越好!请你帮忙计算一下,最多可以分为多少份?———————————————————
赛一罗
·
2025-02-12 08:55
蓝桥杯
职场和发展
四、自然语言处理_08Transformer翻译任务案例
0、前言在Seq2Seq模型的学习过程中,做过一个文本翻译任务案例,多轮
训练
后,效果还算能看Transformer作为NLP领域的扛把子,对于此类任务的处理会更为强大,下面将以基于Transformer
学不会lostfound
·
2025-02-12 08:53
AI
自然语言处理
人工智能
深度学习
transformer
encode-decode
基于PyTorch框架实现,展示如何使用ResNet50进行特征提取,并结合MMD用于领域适应,迁移学习在轴承故障诊断中的应用
文章目录1.环境准备2.数据准备3.模型定义4.
训练
过程1.导入必要的库2.定义模型3.数据准备4.
训练
过程5.运行代码6.注意事项附说明:、pytorch版本,ResNet50进行特征提取,mmd最
QQ_767172261
·
2025-02-12 07:15
轴承类
pytorch
迁移学习
人工智能
策略泛化的无动作推理
端到端模仿学习为
训练
机器人策略提供一种有前途的方法。然而,泛化到新环境(例如未见过的场景、任务和目标实例)仍然是一项重大挑战。
硅谷秋水
·
2025-02-12 07:44
智能体
大模型
计算机视觉
人工智能
深度学习
机器学习
计算机视觉
语言模型
冲一下阿里,感觉不是很难
新的一周又来了,今天分享的是
训练
营的朋友在阿里的一面,看了一下面试的内容,感觉挺简单的,你做一下试试:Redis数据消失的原因Redis中的数据如果既没有设置过期时间也没有被显式删除但仍然消失了,可能是因为配置了持久化策略
·
2025-02-12 05:37
后端go
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
是一种有效的自适应策略,它不会引入额外的推理延迟,并在保持模型质量的同时显着减少下游任务的可
训练
参数数量。2.2.参数高效微调(PEF
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
揭幕 DeepSeek-V2.5-1210:革新人工智能能力
技术背景DeepSeek-V2.5-1210在DeepSeekV2系列的基础上进行了微调,利用后
训练
迭代提升了其在数学、编程、写作和
吴脑的键客
·
2025-02-12 03:16
人工智能
人工智能
搜索引擎
自动评估基准 | 技巧与提示
缓解措施有:测试集中加入哨兵字符串(canarystring)(如BigBench),这是一种特殊的字符组合,使得模型创建者可以在
训练
集中查找,来表明该数据中是否包含评估。
·
2025-02-12 01:00
人工智能
人工评估 | 基础概念
本文讨论的都是后验评估,即模型已经完成
训练
,给定一个任务让人类进行评估。
·
2025-02-12 01:57
人工智能
【蔬菜识别】Python+深度学习+CNN卷积神经网络算法+TensorFlow+人工智能+模型
训练
作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆','大白菜','大葱','莲藕','菠菜','西红柿','韭菜','黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代
训练
最后得到一个识别精度较高的模型文件
·
2025-02-12 01:24
图像识别深度学习人工智能
深度学习-与OCR结合
整体思路结合深度学习实现OCR通常包含以下几个步骤:数据准备:收集和标注包含文本的图像数据,构建
训练
集和测试集。模型构建:选择合适的深度学习模型,如卷积神经网络(CNN)结合循环神经网络(RN
小赖同学啊
·
2025-02-11 22:11
人工智能
深度学习
ocr
人工智能
快速搭建GRU循环神经网络预测模型
但是,我需要确保MATLAB支持GRU网络的创建和
训练
。让我想想,MATLAB的DeepLearningToolbox提供了设计和
训练
神经网络的功能,包括GRU层。
智汇未来
·
2025-02-11 22:38
rnn
深度学习
gru
人工智能
神经网络
matlab
算法
【专题】DeepSeek颠覆性在于实现AI平权、惊艳世界,算力与应用将迎来结构性变化报告汇总PDF洞察(附原数据表)
同时,它的
训练
和使用成本大幅降低
·
2025-02-11 21:14
数据挖掘深度学习机器学习算法
AI赋能灯塔低代码平台,AI应用落地“加速器”
传统开发方式在算法研究、模型
训练
、代码编写、系统集成及测试优化等环节,不仅需要专业技术人员的深度参与,还耗费大量时间和资源。这些挑战使得AI应用的落地变得异常艰难。
·
2025-02-11 21:13
人工智能
大模型推理服务全景图
作者:望宸随着DeepSeekR1和Qwen2.5-Max的发布,国内大模型推理需求激增,性能提升的主战场将从
训练
转移到推理。由于无论是
训练
还是推理,如何提升性能都是业内讨论最多的话题之一。
·
2025-02-11 21:12
云原生阿里云
迁移学习 Transfer Learning
迁移学习是一种机器学习方法,它的核心思想是利用已有模型的知识来帮助新的任务或数据集进行学习,从而减少
训练
数据的需求、加快
训练
速度,并提升模型性能。1.为什么需要迁移学习?
有人给我介绍对象吗
·
2025-02-11 20:23
模块
迁移学习
人工智能
机器学习
预
训练
语言模型:从BERT到GPT,NLP的新纪元
自然语言处理(NLP)在过去几年中经历了翻天覆地的变化,而这一变化的催化剂无疑是预
训练
语言模型(Pre-trainedLanguageModels,PLMs)的崛起。
Evaporator Core
·
2025-02-11 20:23
自然语言处理
人工智能
Python开发经验
自然语言处理
语言模型
bert
DeepSeek图神经网络(Graph Neural Networks, GNNs)基础与实践
DeepSeek提供了强大的工具和API,帮助我们高效地构建和
训练
图神经网络。本文将详细介绍如何使用DeepSeek进行图神经网络的基础与实践,并通过代码示例帮助你掌握这些
Evaporator Core
·
2025-02-11 20:22
Python开发经验
深度学习
DeepSeek快速入门
神经网络
人工智能
深度学习
【深度学习实战:kaggle自然场景的图像分类-----使用keras框架实现vgg16的迁移学习】
数据集train.csv-
训练
集test.csv-测试集SceneImages-图像文件夹
训练
机器学习司猫白
·
2025-02-11 20:18
深度学习
分类
keras
DeepSeek迁移学习与预
训练
模型应用
迁移学习是一种利用预
训练
模型的知识来加速新任务
训练
的技术。通过迁移学习,我们可以在数据量有限的情况下,快速构建高性能的模型。
Evaporator Core
·
2025-02-11 19:48
DeepSeek快速入门
人工智能
深度学习
迁移学习
机器学习
深度学习
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如Llama2、GPT-3)的高
训练
与推理成本问题
热爱分享的博士僧
·
2025-02-11 18:36
架构
史上最厉害的Java进阶之路
这是Java的流程控制,操控“一切”那些年,那些大神玩的数组来场刺激的数组
训练
吧!
m0_51274464
·
2025-02-11 17:31
面试
学习路线
阿里巴巴
java
开发语言
实践深度学习:构建一个简单的图像分类器
本文将指导你如何使用深度学习框架来构建一个简单的图像分类器,我们将以Python和TensorFlow为例,展示从数据准备到模型
训练
的完整流程。
是Dream呀
·
2025-02-11 17:58
深度学习
人工智能
AI换脸技术原理以及为什么需要进行海量次数的模型
训练
?
AI换脸技术通俗点说就是“深度伪造技术”,是基于人工智能,特别是深度学习和生成对抗网络(GANs)的一种技术,能够将一个人的面部特征与另一个人的面部特征进行交换,从而生成非常真实的换脸视频或图像。AI换脸技术的基本原理生成对抗网络(GANs)GANs是AI换脸技术背后的核心算法,它由两个神经网络组成,一个是生成器,负责生成新的图像或视频;另一个是判别器,负责判断生成的图像是否真实。通过不断的“对抗
码场老菜鸟
·
2025-02-11 16:55
人工智能
Java分布式流处理,flink+kafka实现电商网站个性化商品推荐系统
文章目录戳底部名片,一起变现技术栈选择设计实现思路实现步骤及示例代码1.数据采集2.数据预处理3.特征工程4.模型
训练
5.结果输出6.前端展示戳底部名片,一起变现在现代电商环境中,用户每天都会浏览大量商品页面
图苑
·
2025-02-11 16:24
分布式
java
flink
千帆大模型提示词调优实践
大模型场景实战培训,提示词效果调优,大模型应用定制开发,点击咨询原始提示词以下是减重
训练
计划的提示词#能力与角色:作为一名经验丰富的注册营养师和运动健身教练,我将根据您的具体情况,为您制定一个为期{duration
·
2025-02-11 16:57
prompt大模型
【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团(附面题)
大模型算法高频面题(全面整理ʘ‿ʘ)一、大模型(LLMs)基础面大模型(LLMs)架构篇注意力机制(Attention)篇Transformer理论篇二、大模型微调面有监督微调(SFT)篇高效微调篇提示学习篇人类对齐
训练
青松ᵃⁱ
·
2025-02-11 13:37
NLP
百面百过
AI面试
NLP面试
算法面试
人工智能
如何
训练
自己的数据集之——无人机视觉定位数据集,视觉定位,无人机视觉定位数据集无人机图像的空间分辨率
数据集旨在通过提供多样化的数据来支持无人机视觉定位模型的
训练
和测试。该数据集包含6,742幅无人机图像和11幅卫星影像。无人机图像
计算机c9硕士算法工程师
·
2025-02-11 13:01
数据集
遥感类数据集
无人机类数据集
无人机
卫星影像空间
无人机视觉定位数据集
遥感影像
视觉定位
唤醒 AI 算力,专有云 ABC Stack 面向企业级智算平台的 GPU 提效实践
大模型
训练
的时候,我们会请技术专家
·
2025-02-11 12:16
百度
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
为了实现高效的推理和成本效益的
训练
,DeepSeek-V3采用了MLA(Multi-headLatentAttention)和DeepSeekMoE架构。
·
2025-02-11 11:44
DeepSeek与ChatGPT对比:技术、应用与未来趋势
DeepSeek和ChatGPT作为其中的典型代表,各自凭借独特的技术架构、
训练
方式和应用优势,在不同领域展现出卓越的性能。
CodeJourney.
·
2025-02-11 11:49
人工智能
数据库
算法
DeepSeek Coder 填空任务在代码生成和补全中具体是如何实现的?
DeepSeekCoder在代码生成和补全中的实现主要依赖于其强大的预
训练
机制和特定的
训练
任务设计。
百态老人
·
2025-02-11 10:09
人工智能
大数据
笔记
DeepSeek-v3笔记(1)
它主要解决不同routeexpert
训练
不平衡问题,思路就是谁训得少了就把谁被选中的概率抬高。至于MLA
蒸土豆的技术细节
·
2025-02-11 09:06
笔记
算法
训练
day51Leetcode139.单词拆分 多重背包了解 背包问题总结
139.单词拆分.-力扣(LeetCode)题目分析初始化:初始化一个布尔型向量dp,大小为s.size()+1,所有值初始化为false,除了dp[0]被设置为true。这个布尔数组代表字符串s[0..i]能否通过拼接字典中的单词来形成。dp[0]=true的原因是一个空字符串总是可以被形成。转换wordDict:输入的wordDict被转换成一个无序集合wordset,以便高效查找单词。动态规
dc爱傲雪和技术
·
2025-02-11 09:36
算法训练
算法
人工智能在制造业的具体应用案例-总纲
模型
训练
:使用ML.NET或TensorFlow.NET
训练
回归模型,预测设备剩余寿命。实时预测:将模型部署到C
局外人_Jia
·
2025-02-11 09:05
人工智能
c#
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他