E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
思维训练
四、自然语言处理_08Transformer翻译任务案例
0、前言在Seq2Seq模型的学习过程中,做过一个文本翻译任务案例,多轮
训练
后,效果还算能看Transformer作为NLP领域的扛把子,对于此类任务的处理会更为强大,下面将以基于Transformer
学不会lostfound
·
2025-02-12 08:53
AI
自然语言处理
人工智能
深度学习
transformer
encode-decode
基于PyTorch框架实现,展示如何使用ResNet50进行特征提取,并结合MMD用于领域适应,迁移学习在轴承故障诊断中的应用
文章目录1.环境准备2.数据准备3.模型定义4.
训练
过程1.导入必要的库2.定义模型3.数据准备4.
训练
过程5.运行代码6.注意事项附说明:、pytorch版本,ResNet50进行特征提取,mmd最
QQ_767172261
·
2025-02-12 07:15
轴承类
pytorch
迁移学习
人工智能
策略泛化的无动作推理
端到端模仿学习为
训练
机器人策略提供一种有前途的方法。然而,泛化到新环境(例如未见过的场景、任务和目标实例)仍然是一项重大挑战。
硅谷秋水
·
2025-02-12 07:44
智能体
大模型
计算机视觉
人工智能
深度学习
机器学习
计算机视觉
语言模型
常用工具+开发工具
常用工具:时间管理工具滴答清单+番茄todo笔记工具vscode+印象笔记+cdsn(博客)+网易云笔记+editPlus截图工具Snipaste
思维
导图,xmind的编辑工具MindMaster画图工具
__Winni__
·
2025-02-12 05:02
测试工具
冲一下阿里,感觉不是很难
新的一周又来了,今天分享的是
训练
营的朋友在阿里的一面,看了一下面试的内容,感觉挺简单的,你做一下试试:Redis数据消失的原因Redis中的数据如果既没有设置过期时间也没有被显式删除但仍然消失了,可能是因为配置了持久化策略
·
2025-02-12 05:37
后端go
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
是一种有效的自适应策略,它不会引入额外的推理延迟,并在保持模型质量的同时显着减少下游任务的可
训练
参数数量。2.2.参数高效微调(PEF
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
揭幕 DeepSeek-V2.5-1210:革新人工智能能力
技术背景DeepSeek-V2.5-1210在DeepSeekV2系列的基础上进行了微调,利用后
训练
迭代提升了其在数学、编程、写作和
吴脑的键客
·
2025-02-12 03:16
人工智能
人工智能
搜索引擎
自动评估基准 | 技巧与提示
缓解措施有:测试集中加入哨兵字符串(canarystring)(如BigBench),这是一种特殊的字符组合,使得模型创建者可以在
训练
集中查找,来表明该数据中是否包含评估。
·
2025-02-12 01:00
人工智能
人工评估 | 基础概念
本文讨论的都是后验评估,即模型已经完成
训练
,给定一个任务让人类进行评估。
·
2025-02-12 01:57
人工智能
【蔬菜识别】Python+深度学习+CNN卷积神经网络算法+TensorFlow+人工智能+模型
训练
作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆','大白菜','大葱','莲藕','菠菜','西红柿','韭菜','黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代
训练
最后得到一个识别精度较高的模型文件
·
2025-02-12 01:24
图像识别深度学习人工智能
对初入芯片行业新人的建议
首要一点:摆脱小农
思维
束缚,不要试图学会所有技能。刚开始流片,最纠结的点在于,对光刻、干法、高温等工艺,我到底要了解多深?
晏小北
·
2025-02-11 23:17
经验分享
求职招聘
职场和发展
科技
深度学习-与OCR结合
整体思路结合深度学习实现OCR通常包含以下几个步骤:数据准备:收集和标注包含文本的图像数据,构建
训练
集和测试集。模型构建:选择合适的深度学习模型,如卷积神经网络(CNN)结合循环神经网络(RN
小赖同学啊
·
2025-02-11 22:11
人工智能
深度学习
ocr
人工智能
快速搭建GRU循环神经网络预测模型
但是,我需要确保MATLAB支持GRU网络的创建和
训练
。让我想想,MATLAB的DeepLearningToolbox提供了设计和
训练
神经网络的功能,包括GRU层。
智汇未来
·
2025-02-11 22:38
rnn
深度学习
gru
人工智能
神经网络
matlab
算法
02.11 数据库
1.
思维
导图2.题目将epoll服务器、客户端拿来用客户端:写一个界面,里面有注册登录服务器:处理注册和登录逻辑,注册的话将注册的账号密码写入数据库,登录的话查询数据库中是否存在账号,并验证密码是否正确服务器代码
Unique_yt
·
2025-02-11 22:35
数据库
sqlite3
【专题】DeepSeek颠覆性在于实现AI平权、惊艳世界,算力与应用将迎来结构性变化报告汇总PDF洞察(附原数据表)
同时,它的
训练
和使用成本大幅降低
·
2025-02-11 21:14
数据挖掘深度学习机器学习算法
如何高效学习设计模式?
掌握设计模式不仅能让代码更加模块化、可扩展、易维护,还可以提升程序员的架构
思维
和工程能力。但很多初学者在学习设计模式时,往往会遇到以下问题:设计模式种类多,记不住、分不清。只看理论,不知如何应用。
莫比乌斯之梦
·
2025-02-11 21:56
技术#设计模式
设计模式
AI赋能灯塔低代码平台,AI应用落地“加速器”
传统开发方式在算法研究、模型
训练
、代码编写、系统集成及测试优化等环节,不仅需要专业技术人员的深度参与,还耗费大量时间和资源。这些挑战使得AI应用的落地变得异常艰难。
·
2025-02-11 21:13
人工智能
大模型推理服务全景图
作者:望宸随着DeepSeekR1和Qwen2.5-Max的发布,国内大模型推理需求激增,性能提升的主战场将从
训练
转移到推理。由于无论是
训练
还是推理,如何提升性能都是业内讨论最多的话题之一。
·
2025-02-11 21:12
云原生阿里云
02.07 TCP服务器与客户端的搭建
一.
思维
导图二.使用动态协议包实现服务器与客户端1.协议包的结构定义首先,是协议包的结构定义。
Unique_yt
·
2025-02-11 21:25
服务器
运维
迁移学习 Transfer Learning
迁移学习是一种机器学习方法,它的核心思想是利用已有模型的知识来帮助新的任务或数据集进行学习,从而减少
训练
数据的需求、加快
训练
速度,并提升模型性能。1.为什么需要迁移学习?
有人给我介绍对象吗
·
2025-02-11 20:23
模块
迁移学习
人工智能
机器学习
预
训练
语言模型:从BERT到GPT,NLP的新纪元
自然语言处理(NLP)在过去几年中经历了翻天覆地的变化,而这一变化的催化剂无疑是预
训练
语言模型(Pre-trainedLanguageModels,PLMs)的崛起。
Evaporator Core
·
2025-02-11 20:23
自然语言处理
人工智能
Python开发经验
自然语言处理
语言模型
bert
DeepSeek图神经网络(Graph Neural Networks, GNNs)基础与实践
DeepSeek提供了强大的工具和API,帮助我们高效地构建和
训练
图神经网络。本文将详细介绍如何使用DeepSeek进行图神经网络的基础与实践,并通过代码示例帮助你掌握这些
Evaporator Core
·
2025-02-11 20:22
Python开发经验
深度学习
DeepSeek快速入门
神经网络
人工智能
深度学习
【深度学习实战:kaggle自然场景的图像分类-----使用keras框架实现vgg16的迁移学习】
数据集train.csv-
训练
集test.csv-测试集SceneImages-图像文件夹
训练
机器学习司猫白
·
2025-02-11 20:18
深度学习
分类
keras
DeepSeek迁移学习与预
训练
模型应用
迁移学习是一种利用预
训练
模型的知识来加速新任务
训练
的技术。通过迁移学习,我们可以在数据量有限的情况下,快速构建高性能的模型。
Evaporator Core
·
2025-02-11 19:48
DeepSeek快速入门
人工智能
深度学习
迁移学习
机器学习
深度学习
go os包介绍及示例
关注我,持续分享逻辑
思维
&管理
思维
&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。
借雨醉东风
·
2025-02-11 19:16
热点追踪
golang
microsoft
开发语言
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如Llama2、GPT-3)的高
训练
与推理成本问题
热爱分享的博士僧
·
2025-02-11 18:36
架构
史上最厉害的Java进阶之路
这是Java的流程控制,操控“一切”那些年,那些大神玩的数组来场刺激的数组
训练
吧!
m0_51274464
·
2025-02-11 17:31
面试
学习路线
阿里巴巴
java
开发语言
实践深度学习:构建一个简单的图像分类器
本文将指导你如何使用深度学习框架来构建一个简单的图像分类器,我们将以Python和TensorFlow为例,展示从数据准备到模型
训练
的完整流程。
是Dream呀
·
2025-02-11 17:58
深度学习
人工智能
思维
导图 代码示例(java 架构)
解决消息队列的延时、过期失效问题以及应对消息积压的情况,需要从多个角度进行优化和管理。以下是针对这些问题的一些策略和技术:解决消息队列延时及过期失效问题的方法设置消息TTL(Time-to-Live)为消息设置生存时间(TTL),超过此期限的消息将自动被丢弃或转发到死信交换器。这有助于防止长时间未处理的消息占用资源,并确保及时清理无效消息。配置死信交换器(DeadLetterExchange,DL
用心去追梦
·
2025-02-11 17:57
java
架构
python
AI换脸技术原理以及为什么需要进行海量次数的模型
训练
?
AI换脸技术通俗点说就是“深度伪造技术”,是基于人工智能,特别是深度学习和生成对抗网络(GANs)的一种技术,能够将一个人的面部特征与另一个人的面部特征进行交换,从而生成非常真实的换脸视频或图像。AI换脸技术的基本原理生成对抗网络(GANs)GANs是AI换脸技术背后的核心算法,它由两个神经网络组成,一个是生成器,负责生成新的图像或视频;另一个是判别器,负责判断生成的图像是否真实。通过不断的“对抗
码场老菜鸟
·
2025-02-11 16:55
人工智能
Java分布式流处理,flink+kafka实现电商网站个性化商品推荐系统
文章目录戳底部名片,一起变现技术栈选择设计实现思路实现步骤及示例代码1.数据采集2.数据预处理3.特征工程4.模型
训练
5.结果输出6.前端展示戳底部名片,一起变现在现代电商环境中,用户每天都会浏览大量商品页面
图苑
·
2025-02-11 16:24
分布式
java
flink
千帆大模型提示词调优实践
大模型场景实战培训,提示词效果调优,大模型应用定制开发,点击咨询原始提示词以下是减重
训练
计划的提示词#能力与角色:作为一名经验丰富的注册营养师和运动健身教练,我将根据您的具体情况,为您制定一个为期{duration
·
2025-02-11 16:57
prompt大模型
【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团(附面题)
大模型算法高频面题(全面整理ʘ‿ʘ)一、大模型(LLMs)基础面大模型(LLMs)架构篇注意力机制(Attention)篇Transformer理论篇二、大模型微调面有监督微调(SFT)篇高效微调篇提示学习篇人类对齐
训练
青松ᵃⁱ
·
2025-02-11 13:37
NLP
百面百过
AI面试
NLP面试
算法面试
人工智能
如何
训练
自己的数据集之——无人机视觉定位数据集,视觉定位,无人机视觉定位数据集无人机图像的空间分辨率
数据集旨在通过提供多样化的数据来支持无人机视觉定位模型的
训练
和测试。该数据集包含6,742幅无人机图像和11幅卫星影像。无人机图像
计算机c9硕士算法工程师
·
2025-02-11 13:01
数据集
遥感类数据集
无人机类数据集
无人机
卫星影像空间
无人机视觉定位数据集
遥感影像
视觉定位
Grafana 分布式监控系统学习
思维
导图与架构设计
好的,用户的问题是询问Grafana分布式监控系统的学习
思维
导图和架构设计。我需要先理解用户的需求。
用心去追梦
·
2025-02-11 12:27
grafana
分布式
学习
唤醒 AI 算力,专有云 ABC Stack 面向企业级智算平台的 GPU 提效实践
大模型
训练
的时候,我们会请技术专家
·
2025-02-11 12:16
百度
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
为了实现高效的推理和成本效益的
训练
,DeepSeek-V3采用了MLA(Multi-headLatentAttention)和DeepSeekMoE架构。
·
2025-02-11 11:44
DeepSeek与ChatGPT对比:技术、应用与未来趋势
DeepSeek和ChatGPT作为其中的典型代表,各自凭借独特的技术架构、
训练
方式和应用优势,在不同领域展现出卓越的性能。
CodeJourney.
·
2025-02-11 11:49
人工智能
数据库
算法
DeepSeek Coder 填空任务在代码生成和补全中具体是如何实现的?
DeepSeekCoder在代码生成和补全中的实现主要依赖于其强大的预
训练
机制和特定的
训练
任务设计。
百态老人
·
2025-02-11 10:09
人工智能
大数据
笔记
DeepSeek-v3笔记(1)
它主要解决不同routeexpert
训练
不平衡问题,思路就是谁训得少了就把谁被选中的概率抬高。至于MLA
蒸土豆的技术细节
·
2025-02-11 09:06
笔记
算法
训练
day51Leetcode139.单词拆分 多重背包了解 背包问题总结
139.单词拆分.-力扣(LeetCode)题目分析初始化:初始化一个布尔型向量dp,大小为s.size()+1,所有值初始化为false,除了dp[0]被设置为true。这个布尔数组代表字符串s[0..i]能否通过拼接字典中的单词来形成。dp[0]=true的原因是一个空字符串总是可以被形成。转换wordDict:输入的wordDict被转换成一个无序集合wordset,以便高效查找单词。动态规
dc爱傲雪和技术
·
2025-02-11 09:36
算法训练
算法
人工智能在制造业的具体应用案例-总纲
模型
训练
:使用ML.NET或TensorFlow.NET
训练
回归模型,预测设备剩余寿命。实时预测:将模型部署到C
局外人_Jia
·
2025-02-11 09:05
人工智能
c#
大数据
【代码随想录
训练
营】【Day05休息】【Day06】第三章|哈希表|哈希表理论基础|242.有效的字母异位词|349. 两个数组的交集|202. 快乐数|1. 两数之和
哈希表理论基础总结:当我们遇到了要快速判断一个元素是否出现在集合里或者重复出现时,就要考虑哈希法。哈希法是用空间换时间的方法,因为我们要使用额外的数组,set或者是map来存放数据,才能实现快速的查找。更多有关哈希表的理论基础可查阅:《代码随想录》哈希表理论基础242.有效的字母异位词题目详细:LeetCode.242当两个字符串具有以下特点时,则称它们互为字母异位词:字符串的长度相等字符串中的每
蚝油菜花
·
2025-02-11 09:35
散列表
哈希算法
leetcode
『大模型笔记』国外大神对DeepSeek R1的科普!
时间线推理与Agent推理模型≠Agent推理为什么重要推理需要变得廉价R1的重要意义AI的发展走势预
训练
规模扩张的路走不通了推理阶段的规模定律缩小模型体量(新的规模定律?)强化学习(新的规模定律?)
AI大模型前沿研究
·
2025-02-11 09:02
大模型笔记
笔记
Deepseek
deepseek
R1
Deepseek
v3
GPT
O1
GPT
O3
[机缘参悟-233]:从人工智能的角度上看:神经网络模型确定的情况下,
训练
的数据决定了神经网络的权重,预测的准确性取决于
训练
的数据。这既称为经验,也称为成见,也称为认知。
前言:从人工智能的角度上看:神经网络模型确定的情况下,
训练
的数据决定了神经网络的权重,预测的准确性取决于
训练
的数据。
文火冰糖的硅基工坊
·
2025-02-11 09:31
创业之路
人工智能
神经网络
深度学习
深度学习|表示学习|Batch Normalization 详解:数学、代码与经验总结|22
如是我闻:在深度学习模型中,BatchNormalization(简称BN)是一种常用的技术,能有效加速
训练
并提高模型的稳定性。
漂亮_大男孩
·
2025-02-11 08:56
表示学习
深度学习
batch
人工智能
神经网络
cnn
TensorFlow 学习笔记--基础文本分类
这笔记里代码里都改过来了文章目录电影评论文本分类导入库下载IMDB数据集加载数据集对
训练
数据进行预处理创建神经网络模型编译模型
训练
模型评估模型导出模型对新数据进行预测参考:[基本文本分类](htt
小陈加油中···
·
2025-02-11 08:55
tensorflow
学习
笔记
Transformer 的辉煌与大模型方向确立,点燃AGI之火把
DeepSeek-V3,指明下一个阶段大模型发张方向,破壁:资金壁垒:
训练
成本降低,适配丰富硬件,总过进一步降低资金需求。
dingcb168
·
2025-02-11 07:47
搜索引擎
自然语言处理
AI知识库和全文检索的区别
1.2知识推理逻辑推理:通过知识图谱或预
训练
模型,AI知识库可以进行逻辑推理,回答复杂问题。多跳推理:能够从多个数据源中提取信息,综合生成答案。1.
xixingzhe2
·
2025-02-11 07:44
AI
人工智能
如何通过腾讯 ima.copilot
训练
自己的知识库
如何通过腾讯ima.copilot
训练
自己的知识库在信息爆炸的时代,拥有一个专属的知识库,能让我们在学习、工作中快速获取所需信息,极大地提升效率。
老黄浅谈质量
·
2025-02-11 07:13
copilot
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他