E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
专项训练
深度学习篇---深度学习框架
简介特点动态计算图易于上手强大的社区支持与Python的集成度高核心组件2.TensorFlow简介特点静态计算图跨平台强大的生态系统Keras集成核心组件3.PaddlePaddle简介特点易于使用高性能工业级应用丰富的预
训练
模型核心组件第二部分
Ronin-Lotus
·
2025-01-31 21:05
深度学习篇
深度学习
人工智能
python
Pytorch
TensorFlow
paddlepaddle
DeepSeek-V3 技术报告
为了实现高效的推理和经济高效的
训练
,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了充分验证。
mingo_敏
·
2025-01-31 20:01
LLM
深度学习
人工智能
原创prompt:员工加班助手
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-01-31 19:45
prompt实战应用案例
prompt
修改
训练
配置记录
修改影响:调整此值可以显著影响模型的
训练
速度和最终性能。
positive546
·
2025-01-31 18:42
深度学习
人工智能
机器学习
特征选择(机器学习)
伪代码示例):2.3嵌入式(EmbeddedMethods)小示例(Lasso伪代码示例):3.实践建议4.小结1.为什么需要特征选择在机器学习任务中,经常会遇到以下问题:特征(变量)数量过多,导致计算量大、
训练
速度
赵孝正
·
2025-01-31 18:10
机器学习算法
机器学习
人工智能
YOLO系列之
训练
环境(GPU)搭建篇
YOLOv8专栏导航:点击此处跳转Pytorch环境配置(Windows)Anaconda安装此处下载安装即可⭐温馨提示:安装路径
w94ghz
·
2025-01-31 17:01
YOLO改进系列
YOLOv8改进系列
YOLO
深度学习
人工智能
python
目标检测
【大模型入门必看】LLM大语言模型导读
本章将简要梳理大语言模型的技术要点以及构建过程,并且列举了可用于预
训练
以及微调模型的常用数据集,介绍了目前开发大语言模型常用的代码库、预
训练
大语言模型的步骤以及涉及的关键技术,包括数据准备阶段、模型
古-月
·
2025-01-31 16:24
LLM
大语言模型
python 使用Whisper模型进行语音翻译
多尺寸预
训练
模型:官方提供了5个不同大小的模型(tiny,
哦里 哦里哦里给
·
2025-01-31 15:16
AI
大语言模型实战
python
whisper
python 阴暗图像 亮度增强 对比度增强 去雾
解决时,可以在
训练
样本中加入类似的图像,或者手动把相关图像进行颜色变化。这里主要介绍手工颜色变化。
weixin_37763484
·
2025-01-31 14:06
python
数据挖掘
深度学习
python
opencv
计算机视觉
图像处理
目标检测
DeepSeek优势方法策略
DeepSeek优势方法策略目录DeepSeek优势方法策略DeepSeek在
训练
阶段压缩时间空间复杂度的方法DeepSeek和ChatGPT在压缩时间空间复杂度上的不同之处DeepSeek能降低显卡使用的原因
ZhangJiQun&MXP
·
2025-01-31 14:03
2021
论文
2021
AI
python
教学
人工智能
语言模型
自然语言处理
gpt
深度学习
基于YOLOv11无人机视角船舶检测系统:项目概述与技术实现
**实时处理能力**数据准备与模型
训练
1.**数据集构建**2.**模型
训练
**系统功能与使用方法1.**实时目标检测**2.**静态图片检测**3.**视频文件处理**4.
qq1309399183
·
2025-01-31 14:03
计算机视觉实战项目集合
YOLO
无人机
人工智能
计算机视觉
无人机视角船舶检测
yolo11改进
yolo11涨点
Llama大型语言模型原理详解
本文将详细解析Llama模型的原理,包括其结构、
训练
过程以及工作机制,帮助读者深入理解这一先进的模型。
摆烂大大王
·
2025-01-31 11:40
llama
llama
语言模型
人工智能
Rollup:专注类库和框架打包
文章内容输出来源:拉勾大前端高薪
训练
营-概述-也是一款ESModules打包器-也可以将项目中的一些散落的细小模块打包为整块代码-rollup与webpack作用类似-rollup更为小巧,仅仅是一款ESM
时解之
·
2025-01-31 10:06
JS专区
Rollup
Rollup打包
大前端
Javascript
基于Transformer的多通道肌电信号序列分类
本项目基于Transformer实现对表面肌电信号的分类,数据使用excel进行保存,使用Pytorch架构建立模型并
训练
,利用基于Paramiko库的SSH连接来实现对NAO机器人的远程控制。
咖啡百怪
·
2025-01-31 10:04
transformer
深度学习
人工智能
Pix2PixHD代码小白注释(1)——train.py
关于fp16AMP自动混合精度
训练
,见下文:AMP自动混合精度
训练
https://blog.csdn.net/ytusdc/article/details/122152244importtimeimportosimportnumpyasnpimporttorchfromtorch.autogradimportVariablefromcollectionsimportOrderedDictfroms
咖啡百怪
·
2025-01-31 10:04
Pix2PixHD代码解读
深度学习
机器学习
人工智能
python
PyTorch 快速入门
PyTorch是一个开源的机器学习库,它提供了丰富的工具和库,帮助我们轻松地构建、
训练
和测试神经网络模型。
無量空所
·
2025-01-31 10:02
深度学习
机器学习
pytorch
开源
PennyLane: 探索量子计算的新里程
由PennyLaneAI团队开发,该项目提供了一个直观且灵活的方式来设计、
训练
和优化涉及量子硬件的机器学习模型。其目标是让研究人员和开发者能够轻松地在本地或云端的量子计算机上进行实验。
戴艺音
·
2025-01-31 09:23
Deepseek两项关键发现:无需人类专家介入SFT、有自己
目前尚未实现AGI,主流AI行业和公众普遍认为通过扩大纯语言模型(LLM)的预
训练
规模就能实现突破
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
DeepSeek极端榨取硬件性能被曝光
AI开发者的普遍看法是,大规模GPU集群仍然是
训练
顶尖AI模型的关键。DeepSeek做了什么?DeepSeek的
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
GGUF 大模型文件格式
1.基础原理GGUF简介当前的大模型的参数规模较大,数以千亿的参数导致了它们的预
训练
结果文件都在几十GB甚至是几百GB,这不仅导致其使用成本很高,在不同平台进行交换也非常困难。
香菜烤面包
·
2025-01-31 07:04
AI
系统与算法部署
语言模型
书生浦语第五期
简单来说,模型部署就是将
训练
好的深度学习模型在特定环境中运行的过程。目前大模型部署面临的挑战计算量巨大内
晴斋1216
·
2025-01-31 06:27
语言模型
TensorFlow 简介
它提供了一个强大的工具集,用于构建和
训练
各种机器学习模型。
九月十九
·
2025-01-31 05:14
tensorflow
人工智能
python
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测
3.
训练
模型定义损失函数和优化器,然后进行模型
训练
。4.保存模型
训练
完成后,我们可以保存模型的状态字典。5.加载模型并进行预测加载保存的模型,并进行预测。
知识鱼丸
·
2025-01-31 04:12
machine
learning
逻辑回归
算法
机器学习
使用numpy自定义数据集 使用tensorflow框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预
在本篇博客中,我们将使用numpy生成一个简单的自定义数据集,并使用TensorFlow框架构建和
训练
逻辑回归模型。
训练
完成后,我们会保存模型,并演示如何加载保存的模型进行预测。
辞落山
·
2025-01-31 04:11
numpy
tensorflow
逻辑回归
深度学习过程是什么
用差值数据对权重和偏差求偏导,这里的偏导数的值也就是使得损失减小的最佳方向,然后根据偏导数的方向和步长更新权重和偏差,对吗答:您的描述大致正确,但有一些细节需要澄清和修正,以更准确地反映深度学习中模型
训练
的过程
小松要进步
·
2025-01-31 01:15
李哥深度学习
深度学习
TensorBoard可视化工具支持哪些类型的图表?
TensorBoard支持多种类型的图表,以下是详细介绍:标量图(Scalars)定义与用途:用于展示单个数值随时间(通常是
训练
步骤或迭代次数)的变化情况。
alankuo
·
2025-01-31 01:43
人工智能
《解码AI大模型涌现能力:从量变到质变的智能跃迁》
随着互联网的迅猛发展,数据呈爆炸式增长,为大模型的
训练
提供了丰富的素材。以GPT-3为例,它的
训练
数据涵盖了海量的
·
2025-01-31 00:42
人工智能深度学习
【机器学习】如何在Jupyter Notebook中安装库以及简单使用Jupyter实现单变量线性回归的模型f
(终端或命令提示符)中安装二、使用JupyterNotebook实现单变量线性回归的模型fw,bf_{w,b}fw,b2.1工具2.2问题陈述2.3创建`x_train`和`y_train`变量2.4
训练
示例的数量
Lossya
·
2025-01-30 23:29
机器学习
jupyter
线性回归
人工智能
开发语言
python
学习
COCO8 数据集上
训练
YOLO11n:从入门到跑路(100 轮
训练
实战)
前言
训练
YOLO11n,听起来就像是给赛博世界的“战斗天使”装上双核发动机,而COCO8数据集,则是那个小小的试验场。
星际编程喵
·
2025-01-30 23:27
Python探索之旅
目标跟踪
人工智能
计算机视觉
机器学习
代码随想录算法
训练
营第三十九天-动态规划-337. 打家劫舍 III
老师讲这是树形dp的入门题目解题思路是以二叉树的遍历(递归三部曲)再结合动规五部曲dp数组如何定义:只需要定义一个二个元素的数组,dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历:使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti
taoyong001
·
2025-01-30 22:54
算法
动态规划
c++
leetcode
题目 1127: C语言
训练
-尼科彻斯定理
验证尼科彻斯定理,即:任何一个整数m的立方都可以写成m个连续奇数之和。输出典例:131313=2197=157+159+161+163+165+167+169+171+173+175+177+179+181#includeintmain(){intn,st;scanf("%d",&n);st=n*n-n+1;printf("%d*%d*%d=%d=%d",n,n,n,n*n*n,st);for(i
星海燚燚
·
2025-01-30 21:48
C语言刷题
c语言
AI 大模型创业:如何利用商业优势?
第1章:AI大模型概述1.1AI大模型的概念与演进AI大模型(Large-scaleArtificialIntelligenceModels)是指通过大规模数据
训练
得到的复杂神经网络模型。
AI天才研究院
·
2025-01-30 21:46
大数据AI人工智能
ChatGPT
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
AI绘画能取代设计师吗?
1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后,离不开图像风格迁移、图文预
训练
模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家,利用不同
网络安全我来了
·
2025-01-30 20:09
IT技术
AI作画
【DeepSeek】复现DeepSeek R1?快来看这个Open R1项目实践指南~
OpenR1项目基于DeepSeek-R1的技术报告和方法论,公开并复现R1的
训练
管线,并且希望所有开发者都能在这个基础上搭建自己的研究或应用。
FF-Studio
·
2025-01-30 19:24
DeepSeek
R1
语言模型
自然语言处理
深度学习
人工智能
实战LLM强化学习——使用GRPO(DeepSeek R1出圈算法)
在大模型的
训练
或微调当中,大多数场景我们都希望它能“自由发挥”,给出越丰富越好的答案。
FF-Studio
·
2025-01-30 19:54
DeepSeek
R1
算法
语言模型
人工智能
自然语言处理
机器学习
Apache Airflow 全面解析
其核心设计理念是“WorkflowsasCode”,通过编程方式定义、调度和监控复杂的数据流水线(Pipeline),适用于ETL、机器学习模型
训练
、数据湖管理、报表生成等场景。
由数入道
·
2025-01-30 18:20
人工智能
apache
Airflow
DeepSeek:LLM在MoE
训练
中的无损平衡
现有方法通常采用辅助损耗来促进负载平衡,但较大的辅助损耗会在
训练
中引入不可忽略的干扰梯度,从而损害模型性能。为了在
训练
过程中控制负载平衡,同时不产生不希望
大模型任我行
·
2025-01-30 16:24
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
基于CNN-GRU-Attention混合神经网络的负荷预测方法(Python代码实现)
本文目录如下:目录1概述一、引言二、模型结构三、数据预处理四、模型
训练
与评估五、实验结果与分析六、结论与展望2运行结果3参考文献4Python代码实现及数据1概述基于CNN-GRU(convolutionalneuralnetworks-gaterecurrentunit
宇哥预测优化代码学习
·
2025-01-30 16:22
神经网络
cnn
gru
Deepseek技术浅析(一)
其技术涵盖了从模型架构、
训练
方法到应用部署的多个层面,展现出强大的创新能力和应用潜力。以下将详细介绍DeepSeek的核心技术、工作原理以及具体实现方式。
爱研究的小牛
·
2025-01-30 12:58
AIGC—概述
大模型
AIGC
人工智能
深度学习
自然语言处理
python神经网络框架有哪些,python调用神经网络模型
Caffe中的网络结构与优化都以配置文件形式定义,容易上手,无须通过代码构建网络;网络
训练
速度快,能够
训练
大型数据集与S
小明技术分享
·
2025-01-30 12:56
python
神经网络
深度学习
代码随想录算法
训练
营第五十九天| 503.下一个更大元素II、42. 接雨水
代码随想录算法
训练
营第五十九天|503.下一个更大元素II、42.接雨水503.下一个更大元素II解题代码42.接雨水解题代码503.下一个更大元素II题目链接:503.下一个更大元素II解题代码funcnextGreaterElements
Joanna-升
·
2025-01-30 10:44
代码随想录训练营
算法
leetcode
数据结构
LeetCode-第一题
之前从没有接触过算法题的
训练
,也深知自己几斤几两,所以博客里可能会有很多不成熟的、不正确的想法和观点,十分欢迎混圈的大神们赐教,但更多的还是想记录自己青涩的成长之路。叨叨半天的废话,下面还是开始进入正
Joanna-升
·
2025-01-30 10:43
LeetCode解题篇
leetcode
c语言
【Leetcode 热题 100】32. 最长有效括号
新年的第二天,偷偷懒,这题就留到手边事情告一段落,专门
训练
动态规划的时候再写
冠位观测者
·
2025-01-30 09:36
Leetcode
Top
100
Liked
leetcode
算法
数据结构
Python-作业统计管理系统
模块选择2.界面设计3.模块实现五、总结六、感想七、Python源码mainexcelhandlejob一、设计目的1、教学目的本课程设计是学生学习完《Python程序设计》课程后,进行的一次全面的综合
训练
Vicky__3021
·
2025-01-30 09:32
Python实例
python
编程语言
大语言模型原理与工程实践:残差连接与层归一化
然而,这些网络在
训练
过程中经常遭遇梯度消失和梯度爆炸的问题。
AI大模型应用之禅
·
2025-01-30 08:27
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
模型架构选择:从传统NLP到Transformer
模型架构选择:从传统NLP到Transformer关键词:自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预
训练
模型文章目录模型架构选择:从传统NLP到Transformer1
AI天才研究院
·
2025-01-30 08:23
AI大模型应用入门实战与进阶
大数据AI人工智能
计算
大数据
人工智能
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
用自然语言与mysql数据库对话几种方案的思考
处于安全考虑,可
训练
一个本地大语言模型来完成此项任务,mysql服务器中的数据大约有两万多条记录,服务器的作用主要是记录设备的出库和回库的流水账(即以时间为序的记录),但有一些sql查询比较复杂,必须根据特定的
闲云野鹤_SG
·
2025-01-30 08:52
数据库
mysql
AI
text2sql
自然语言
本地部署
大模型
Llama 3:开源大模型的里程碑式突破
标题:Llama3:开源大模型的里程碑式突破文章信息摘要:Meta通过Llama3展现了开源LLM的重大突破:采用超大规模
训练
数据和多阶段
训练
方法(SFT、rejectionsampling、PPO和DPO
XianxinMao
·
2025-01-30 08:50
llama
开源
Transformer架构的GPU并行和之前的NLP算法并行有什么不同?
在深度学习中,GPU并行计算被广泛应用于
训练
神经网络,加速模型
训练
过程。在2017年之前,自然语言处理(NLP)领域的研究者们通常会从头开始
训练
模型,那时能够利用GPU进行
AI大模型学习不迷路
·
2025-01-30 07:49
transformer
自然语言处理
大模型
深度学习
NLP
LLM
大语言模型
代码随想录算法
训练
营第三十九天|198.打家劫舍、
题目链接:198.打家劫舍-力扣(LeetCode)思路:因为隔一家才能取,所以当前最大的价值要么是dp[i-2]+nums[i]或者是dp[i-1]classSolution(object):defrob(self,nums):""":typenums:List[int]:rtype:int"""dp=[0]*len(nums)if(len(nums)==1):returnnums[0]dp[0
jinshengqile
·
2025-01-30 06:41
算法
leetcode
动态规划
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他