E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2020牛客组队训练
AI学习指南HuggingFace篇-高级优化技巧
一、引言在深度学习和自然语言处理(NLP)中,模型
训练
的效率和性能至关重要。HuggingFace提供了多种高级优化技巧,帮助开发者提升模型
训练
的效率和效果。
俞兆鹏
·
2025-02-04 10:35
AI学习指南
ai
DeepSeek- R1 原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习(RL)的开源推理模型,其核心原理和特点如下:1.核心技术与架构强化学习驱动:DeepSeek-R1是首个完全通过强化学习
训练
的大型语言模型
kcarly
·
2025-02-04 08:50
大模型知识乱炖
杂谈
DeepSeek
R1
原理介绍
深度学习框架PyTorch原理与实践
3.2PyTorch的特点1)自动求导机制2)GPU加速3)模型部署4)数据管道5)代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义
训练
测试整体代码
AI天才研究院
·
2025-02-04 07:47
AI实战
大数据
人工智能
语言模型
Java
Python
架构设计
自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测
1.引言在这篇博客中,我们将使用PaddlePaddle框架实现一个逻辑回归模型,利用NumPy自定义数据集进行
训练
,并保存模型。最后,我们将演示如何加载保存的模型并进行预测。
辞落山
·
2025-02-04 07:16
逻辑回归
Databricks 开源 LLM,
训练
只需三个小时
像ChatGPT和Bard这样的生成式AI,它们使用的数据通常来自于在成千上万不同网站,使用的数据量十分惊人,而且想要使用这些数据
训练
AI还需要数以千计的强大GPU在背后提供支持。
唐 城
·
2025-02-04 07:15
AI-毕业设计全套
spring
log4j
postgresql
数据库
java
解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load
Aloadpersistentidinstructionwasencountered,butnopersistent_loadfunctionwasspecified.报错原因:在加载模型参数时,torch版本发生变化,我报错因为
训练
前
邻家的狗2
·
2025-02-04 07:14
深度学习
人工智能
机器学习
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模强化学习(RL)
训练
的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
老马啸西风
·
2025-02-04 06:04
java
Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型,旨在以更少的参数和计算量实现更高的准确率
高效计算:使用MoE架构,40B总参数中仅有3.7B激活参数,
训练
计算消耗仅为同规模密集模型的9.25%,推理成本与3.7B参数的密集模型相当。
东方佑
·
2025-02-04 06:01
量子变法
架构
语言模型
人工智能
【分割评价指标-nnUNet V2
训练
】- AutoDL
目录一、DSC二、IOU三、VOE(VolumeOverlapError)四、RVD(RelativeVolumeDifference)五、Hausdorff95(95thPercentileofHausdorffDistance)六、ASSD(AverageSymmetricSurfaceDistance)七、MSD(MeanSurfaceDistance)八、NSD(NormalizedSur
HUI 别摸鱼了
·
2025-02-04 05:00
深度学习PyTorch
算法
人工智能
python
PyTorch
训练
一个分类器
文章目录0前言1加载和规范化CIFAR102定义一个卷积网络3定义损失函数和优化器4
训练
网络5测试网络6在GPU上
训练
模型参考资料0前言 TRAINGINGACLASSIFIER这篇教程很清楚的描述了如何使用
亚里
·
2025-02-04 05:59
平台工具类
pytorch训练网络
蓝桥杯——试题集——入门
训练
入门
训练
BEGIN-1A+B问题问题描述输入A、B,输出A+B。输入格式输入的第一行包括两个整数,由空格分隔,分别表示A、B。输出格式输出一行,包括一个整数,表示A+B的值。
唐煜鑫
·
2025-02-04 04:54
蓝桥杯
c语言
蓝桥杯
训练
1——缩位求和
缩位求和例如123输出为6n=int(input())lst=list(str(n))sum=0foriinlst:sum+=int(i)whilesum>=10:s=0lst1=list(str(sum))foriteminlst1:s+=int(item)sum=sprint(s)
会编程的小孩
·
2025-02-04 04:52
蓝桥杯
职场和发展
python中keras_Python深度学习——keras(一)
大多数深度学习,都是将若干个简单的层给链接起来,实现渐进式的数据过滤,也就是数据蒸馏(过滤到一定程度就等同于蒸馏)首先来看一个数字识别的案例(1)读取
训练
集和测试集fromkeras.datasetsimportmnist
weixin_39534321
·
2025-02-04 04:48
python中keras
Solidity/Rust 实战 —— Web3 开发者免费
训练
营(第 21 期)
HackQuest第21期Solidity/Rust共学营即将开营!Solidity/Rust共学营信息清单7月23日-8月1日免费(成功结营的小伙伴还将获得专属周边)全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书主办社区:HackQuestHackQuest是一个充满活力的Web3开发者教育社区,我们的目标是培养下一代Web3开发者。目前,HackQuest组织的共学营已达20期
·
2025-02-04 03:50
Move on Sui 实战 —— Web3 开发者免费
训练
营「第22期」
HackQuest第22期MoveonSui共学营即将开营!MoveonSui共学营信息清单7月31日-8月8日免费(成功结营的小伙伴还将获得Sui基金会提供的奖金)全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区,我们的目标是培养下一代Web3开发者。目前我们的产品仍处于内测阶段,我们计划招募小伙伴们一起
·
2025-02-04 03:50
程序员区块链
Web3 黑客松
组队
报名 — 10000 美金奖池,新手友好,需要前后端,设计,产品,合约工程师
Linea黑客松基本信息ℹ️报名截止6月30日10,000美金奖池在HackQuest平台举办,新手友好,适合Web2转型Web3的开发者参与需要前端,后端,设计,产品,合约工程师关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区,我们的目标是培养下一代Web3开发者。黑客松要求✍️本次黑客松由HackQuest和Linea合作推,仅在HackQuest平台组织和举办不
·
2025-02-04 03:20
前端智能合约区块链以太坊
机器学习笔记20241017
文章目录torchvisiondataloadernn.module卷积非线性激活模型选择
训练
误差泛化误差正则化权重衰退的基本概念数学表示权重衰退的效果物理解释数值稳定性(GradientVanishing
tt555555555555
·
2025-02-04 03:11
学习笔记
深度学习
机器学习
笔记
人工智能
Transformer预测模型及其Python和MATLAB实现
这些模型虽然在许多任务中取得了成功,但由于其计算效率低下以及长距离依赖关系处理的不足,导致模型
训练
时间漫长,并在处理较长文本时效果不佳。
追蜻蜓追累了
·
2025-02-04 03:10
transformer
深度学习
人工智能
机器学习
算法
回归算法
神经网络
MOE模型入门
如何
训练
、微调MOE模型?基础架构优缺点不同MOE模型实现方式、
训练
方法二、实现定义:MOE架构MOE:混合专家模型,多个专家共同决策的模型。
云帆@
·
2025-02-04 01:29
AI
人工智能
MIT 6.S081 实验6 笔记与心得
Lab6:COWFork文章目录Lab6:COWFork背景知识Implementcopy-onwrite([hard](https://pdos.csail.mit.edu/6.828/
2020
/labs
cube__4
·
2025-02-04 01:56
操作系统
risc-v
架构
linux
c语言
Web3 黑客松
组队
报名 — 30000 美金奖池,需要前后端,设计,产品,合约工程师
MantleAPACHackathon基本信息ℹ️项目提交截至12月15日30,000美金奖池三大赛道:DeFi、Infra&AI、Gaming&Meme需要前端,后端,设计,产品,合约工程师黑客松要求✍️本次黑客松由MantleFoundation联合Hackguest和OpenBuild共同打造,面向亚太地区开发者和区块链爱好者的线上黑客马拉松不限制主题部署在Mantle测试网上谁适合参加UI
·
2025-02-04 00:16
web3
本周AI动态:生成型AI的命运掌握在法院手中
诉讼声称,Udio和Suno在未经音乐公司同意的情况下,使用这些公司的音乐
训练
生成型AI模型,要求每首涉嫌侵权的作品赔偿15万美元。唱片公司在投诉中表示,“合成音乐输出可能会使市场充斥机器生成的
·
2025-02-04 00:15
Solidity/Rust 实战 —— Web3 开发者免费
训练
营(第17期)
HackQuest第17期Solidity/Rust共学营即将开营!Solidity/Rust共学营信息清单6月18日-6月27日免费(成功结营的小伙伴还将获得专属周边)全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区,我们的目标是培养下一代Web3开发者。目前我们的产品仍处于内测阶段,我们计划招募小伙伴们
·
2025-02-04 00:44
智能合约区块链以太坊比特币
DeepSeek的出现对全球GPT产业产生的冲击
特别是以GPT(GenerativePre-trainedTransformer)系列模型为代表的大规模预
训练
语言模型,已经在全球范围内引发了广泛关注和应用。
不要em0啦
·
2025-02-03 23:07
机器学习
gpt
python 图像特征提取_python实现LBP方法提取图像纹理特征实现分类的步骤
题目描述这篇博文是数字图像处理的大作业.题目描述:给定40张不同风格的纹理图片,大小为512*512,要求将每张图片分为大小相同的9块,利用其中的5块作为
训练
集,剩余的4块作为测试集,构建适当的模型实现图片的分类
weixin_39969060
·
2025-02-03 22:28
python
图像特征提取
张家口市塞北地图矢量cdr格式ai
2020
年内容测评
2020
年版本,全区县范围的图,不是城区范围图。范围看预览图。
天赐信息科技
·
2025-02-03 21:57
贴图
pdf
打架检测系统:基于YOLOv5的实时人群打架行为识别
本博客将详细介绍如何使用YOLOv5模型搭建一个打架检测系统,包含数据集准备、YOLOv5
训练
、UI界面设计以及优化和部署
2025年数学建模美赛
·
2025-02-03 21:56
YOLO
深度学习
ui
计算机视觉
视觉检测
A deep multimodal fusion method for personality traits prediction
研究方法模型架构:视觉特征提取:使用预
训练
模型ViT-B16和VGG16。音频特征提取:使用预
训练
模型VGGish。文本分析:使用预
训练
模型GloVe。
m0_59933522
·
2025-02-03 21:20
python
人工智能
机器学习
神经网络
深度学习
目标检测
计算机视觉
Qwen2.5-Max
Qwen2.5-Max是阿里巴巴于2024年1月29日发布的一款旗舰级人工智能模型,基于混合专家(MoE)架构开发,拥有超过20万亿tokens的超大规模预
训练
数据。
百态老人
·
2025-02-03 20:18
笔记
大数据
人工智能
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模强化学习(RL)
训练
的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-03 20:09
后端java
代码随想录算法
训练
营Day51 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿
文章目录101.孤岛的总面积思路与重点102.沉没孤岛思路与重点103.水流问题思路与重点104.建造最大岛屿思路与重点101.孤岛的总面积题目链接:101.孤岛的总面积讲解链接:代码随想录状态:直接看题解了。思路与重点nextx或者nexty越界了则说明当前的x或y处于边界处,所以当前的岛不是孤岛,不能记入总面积。#include#includeusingnamespacestd;intdir[
Harryline-lx
·
2025-02-03 19:43
代码随想录
算法
深度优先
Ubuntu16.04环境下安装cuda10+pytorch1.2
1、背景环境:Ubuntu16.04&titanx作为新一代的人工智能
训练
平台的PYTORCH,有其独特的优势,为此,完整的安装这一平台,是开展所有工作的首要条件,一开始,笔者认为应该轻松的完成,但是发现实际上要从零完成这一工作
小楼昨夜,东风
·
2025-02-03 19:11
pytorch
深度学习
神经网络
【PyTorch】6.张量运算函数:一键开启!PyTorch 张量函数的宝藏工厂
它作为强大的深度学习框架,为构建和
训练
神经网络提供了高效且灵活的平台。神经网络作为人工智能的核心技术,能够处理复杂的数据模式。
Icomi_
·
2025-02-03 19:39
805.Pytorch入门
pytorch
人工智能
python
c语言
c++
深度学习
机器学习
机器学习—大语言模型:推动AI新时代的引擎
2.Transformer架构3.模型
训练
二、大语言模型的应用场景1.文本生成2.问答系统3.编码助手4.多语言翻译三、大语言模型的最新进展1.GPT-42.开源模型四、构建和部署一个简单的大语言模型1
云边有个稻草人
·
2025-02-03 19:38
人工智能
机器学习
语言模型
4、PyTorch 第一个神经网络,手写神经网络的基本部分组成
以下实例展示了如何使用神经网络完成简单的二分类任务,为更复杂的任务奠定了基础,通过PyTorch的模块化接口,神经网络的构建、
训练
和可视化都非常直观。
找个栗子
·
2025-02-03 19:35
PyTorch开始到sci
pytorch
神经网络
人工智能
M|哪吒之魔童闹海
上映时间:<19901990s2000s2010s
2020
s主题表达:差普通深度欠缺晦涩好情节逻辑:差一般基本严密但没亮点适当牺牲逻辑性(合理降智等)基本严密而有亮点人物塑造:差大部分合格主要人
影林握雪
·
2025-02-03 18:57
M电影
其他
生活
笔记
经验分享
DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力
工作原理:主要技术,就是
训练
出一些专有用途小模型,来帮助大模型
训练
。主要技术:1.强化学习(RL)核心是强化学习技术,像
训练
小狗一样,当模型做出正确的推理步骤或得到正确的
davenian
·
2025-02-03 18:56
评论
语言模型
人工智能
深度学习
DeepSeek
Apache Iceberg数据湖技术在海量实时数据处理、实时特征工程和模型
训练
的应用技术方案和具体实施步骤及代码
ApacheIceberg在处理海量实时数据、支持实时特征工程和模型
训练
方面的强大能力。Iceberg支持实时特征工程和模型
训练
,特别适用于需要处理海量实时数据的机器学习工作流。
weixin_30777913
·
2025-02-03 15:07
音视频
语言模型
大数据
人工智能
线性回归的简单实现
本文是《动手学深度学习》的笔记文章目录线性回归的简单实现生成随机数据集读取数据初始化模型参数定义模型定义损失函数定义优化算法
训练
模型线性回归的简洁实现生成数据集读取数据定义模型初始化模型参数定义损失函数定义优化算法
训练
模型线性回归的简单实现用了
SkaWxp
·
2025-02-03 14:58
深度学习
深度学习
机器学习
mxnet
gluon
hive分区和分桶详解
1)分区表基本操作(1)引入分区表(需要根据日期对日志进行管理,通过部门信息模拟)dept_
2020
0401.logdept_
2020
CodeShelby
·
2025-02-03 14:56
hive
大数据
hive
【论文笔记】基于图神经网络的多视角视觉重定位 GRNet CVPR
2020
论文笔记
GRNet:LearningMulti-viewCameraRelocalizationwithGraphNeuralNetworks驭势科技,北京大学机器感知重点实验室,北京长城航空测控技术研究所本文提出了一种使用多视角图像进行相机重定位的图神经网络。该网络可以使得不连续帧之间进行信息传递,相比于只能在相邻前后帧之间进行信息传递的序列输入和LTSM,其能捕获更多视角信息以进行重定位。因此LSTM
phy12321
·
2025-02-03 14:26
相机重定位
初入机器学习
写在前面本专栏专门撰写深度学习相关的内容,防止自己遗忘,也为大家提供一些个人的思考一切仅供参考概念辨析深度学习:本质是建模,将
训练
得到的模型作为系统的一部分使用侧重于发现样本集中隐含的规律难点是认识并了解模型
辰尘_星启
·
2025-02-03 14:54
机器学习
人工智能
深度学习
python
mxnet
深度学习:基于MindNLP的RAG应用开发
与传统LLM的区别:传统LLM仅依赖预
训练
参数中的静态知
Landy_Jay
·
2025-02-03 13:47
深度学习
人工智能
跟李沐学AI:视频生成类论文精读(Movie Gen、HunyuanVideo)
MovieGen:ACastofMediaFoundationModels简介MovieGen是Meta公司提出的一系列内容生成模型,包含了3.2.1预
训练
数据MovieGen采用大约100M的视频-文本对和
Landy_Jay
·
2025-02-03 13:16
人工智能
TensorFlow:tensorflow.keras.Model.fit()报错: TypeError: Failed to convert elements of xxx
一、问题在使用TensorFlow进行数据
训练
的时候,报了下面这样的一个错误。
向小凯同学学习
·
2025-02-03 12:45
tensorflow
keras
人工智能
常用软件安装包
1ddVXKjxPZ5OL4gPSKMzwLg提取码:wmwkvivado2021.2链接:链接:https://pan.baidu.com/s/1EcrkcZzTe6v9LRnc5Fp0bg提取码:9tf8vivado
2020
.3
sinat_39901027
·
2025-02-03 12:45
eda
ic
拼多多2025届校招开起,无拼不青春,欢迎加入!!!
部门是做硅片对专项练习
训练
营打卡第一天专项练习
训练
营打卡第一天实习大家好,我现在是大三暑假,刚刚找到一个实习Linux开发工程师,是第一份实习,现在有必要去吗?
愤怒的小青春
·
2025-02-03 12:14
java
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在预
训练
新的大模型,在Llama2或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
Uboot中外存MMC(sd/iNand等)驱动架构代码简单分析
2020
-7-519:50北京晴屋内开空调不知道外面啥情况一天没出屋外面貌似闷热吧!本文仅作为技术积累,方便日后查阅!
IT悟物穷理IT
·
2025-02-03 10:18
uboot和系统移植
python3 mysql8_python3连接MySQL8.0的两种方式
python3连接MySQL8.0的两种方式发布时间:
2020
-09-1913:15:14来源:脚本之家阅读:111作者:兔猪合家欢1、下载MySQL官方的mysql-connector-python-
weixin_39872123
·
2025-02-03 09:14
python3
mysql8
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他