E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
训练补题
Qwen2.5-Max
Qwen2.5-Max是阿里巴巴于2024年1月29日发布的一款旗舰级人工智能模型,基于混合专家(MoE)架构开发,拥有超过20万亿tokens的超大规模预
训练
数据。
百态老人
·
2025-02-03 20:18
笔记
大数据
人工智能
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模强化学习(RL)
训练
的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-03 20:09
后端java
代码随想录算法
训练
营Day51 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿
文章目录101.孤岛的总面积思路与重点102.沉没孤岛思路与重点103.水流问题思路与重点104.建造最大岛屿思路与重点101.孤岛的总面积题目链接:101.孤岛的总面积讲解链接:代码随想录状态:直接看题解了。思路与重点nextx或者nexty越界了则说明当前的x或y处于边界处,所以当前的岛不是孤岛,不能记入总面积。#include#includeusingnamespacestd;intdir[
Harryline-lx
·
2025-02-03 19:43
代码随想录
算法
深度优先
Ubuntu16.04环境下安装cuda10+pytorch1.2
1、背景环境:Ubuntu16.04&titanx作为新一代的人工智能
训练
平台的PYTORCH,有其独特的优势,为此,完整的安装这一平台,是开展所有工作的首要条件,一开始,笔者认为应该轻松的完成,但是发现实际上要从零完成这一工作
小楼昨夜,东风
·
2025-02-03 19:11
pytorch
深度学习
神经网络
【PyTorch】6.张量运算函数:一键开启!PyTorch 张量函数的宝藏工厂
它作为强大的深度学习框架,为构建和
训练
神经网络提供了高效且灵活的平台。神经网络作为人工智能的核心技术,能够处理复杂的数据模式。
Icomi_
·
2025-02-03 19:39
805.Pytorch入门
pytorch
人工智能
python
c语言
c++
深度学习
机器学习
机器学习—大语言模型:推动AI新时代的引擎
2.Transformer架构3.模型
训练
二、大语言模型的应用场景1.文本生成2.问答系统3.编码助手4.多语言翻译三、大语言模型的最新进展1.GPT-42.开源模型四、构建和部署一个简单的大语言模型1
云边有个稻草人
·
2025-02-03 19:38
人工智能
机器学习
语言模型
4、PyTorch 第一个神经网络,手写神经网络的基本部分组成
以下实例展示了如何使用神经网络完成简单的二分类任务,为更复杂的任务奠定了基础,通过PyTorch的模块化接口,神经网络的构建、
训练
和可视化都非常直观。
找个栗子
·
2025-02-03 19:35
PyTorch开始到sci
pytorch
神经网络
人工智能
DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力
工作原理:主要技术,就是
训练
出一些专有用途小模型,来帮助大模型
训练
。主要技术:1.强化学习(RL)核心是强化学习技术,像
训练
小狗一样,当模型做出正确的推理步骤或得到正确的
davenian
·
2025-02-03 18:56
评论
语言模型
人工智能
深度学习
DeepSeek
Apache Iceberg数据湖技术在海量实时数据处理、实时特征工程和模型
训练
的应用技术方案和具体实施步骤及代码
ApacheIceberg在处理海量实时数据、支持实时特征工程和模型
训练
方面的强大能力。Iceberg支持实时特征工程和模型
训练
,特别适用于需要处理海量实时数据的机器学习工作流。
weixin_30777913
·
2025-02-03 15:07
音视频
语言模型
大数据
人工智能
线性回归的简单实现
本文是《动手学深度学习》的笔记文章目录线性回归的简单实现生成随机数据集读取数据初始化模型参数定义模型定义损失函数定义优化算法
训练
模型线性回归的简洁实现生成数据集读取数据定义模型初始化模型参数定义损失函数定义优化算法
训练
模型线性回归的简单实现用了
SkaWxp
·
2025-02-03 14:58
深度学习
深度学习
机器学习
mxnet
gluon
初入机器学习
写在前面本专栏专门撰写深度学习相关的内容,防止自己遗忘,也为大家提供一些个人的思考一切仅供参考概念辨析深度学习:本质是建模,将
训练
得到的模型作为系统的一部分使用侧重于发现样本集中隐含的规律难点是认识并了解模型
辰尘_星启
·
2025-02-03 14:54
机器学习
人工智能
深度学习
python
mxnet
深度学习:基于MindNLP的RAG应用开发
与传统LLM的区别:传统LLM仅依赖预
训练
参数中的静态知
Landy_Jay
·
2025-02-03 13:47
深度学习
人工智能
跟李沐学AI:视频生成类论文精读(Movie Gen、HunyuanVideo)
MovieGen:ACastofMediaFoundationModels简介MovieGen是Meta公司提出的一系列内容生成模型,包含了3.2.1预
训练
数据MovieGen采用大约100M的视频-文本对和
Landy_Jay
·
2025-02-03 13:16
人工智能
TensorFlow:tensorflow.keras.Model.fit()报错: TypeError: Failed to convert elements of xxx
一、问题在使用TensorFlow进行数据
训练
的时候,报了下面这样的一个错误。
向小凯同学学习
·
2025-02-03 12:45
tensorflow
keras
人工智能
拼多多2025届校招开起,无拼不青春,欢迎加入!!!
部门是做硅片对专项练习
训练
营打卡第一天专项练习
训练
营打卡第一天实习大家好,我现在是大三暑假,刚刚找到一个实习Linux开发工程师,是第一份实习,现在有必要去吗?
愤怒的小青春
·
2025-02-03 12:14
java
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在预
训练
新的大模型,在Llama2或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
使用支持向量机和朴素贝叶斯对文本分类
1.2SVC的用法及参数通过以下方式创建SVC对象并进行
训练
:fromsklearn.svmimport
SSeaflower
·
2025-02-03 09:10
支持向量机
分类
算法
机器学习
python
Megatron:深度学习中的高性能模型架构
Megatron:深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大规模预
训练
模型框架,主要针对大规模Transformer架构模型的高效
训练
与推理。
gs80140
·
2025-02-03 08:06
基础知识科谱
AI
机器学习
人工智能
tf.Keras (tf-1.15)使用记录4-model.fit方法及其callbacks参数
model.fit()方法是TensorFlowKeras中用于
训练
模型的核心方法。
普通攻击往后拉
·
2025-02-03 07:32
NN技巧
tf.keras
keras
人工智能
深度学习
Python机器学习实战:人脸识别技术的实现和挑战
Python机器学习实战:人脸识别技术的实现和挑战作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:人脸识别技术,模型
训练
,多人识别,动态人脸检测,
AI天才研究院
·
2025-02-03 06:19
AI大模型企业级应用开发实战
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
谷歌Gemini1.5火速上线:MoE架构,100万上下文
Gemini1.5建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合(MoE)架构使Gemini1.5的
训练
和服务更加高效。
AI生成曾小健
·
2025-02-03 06:18
#
混合专家模型MOE
LLM大语言模型
人工智能
深度学习
pytorch
机器学习
python
代码随想录算法
训练
营Day38||完全背包问题、leetcode 518. 零钱兑换 II 、 377. 组合总和 Ⅳ 、70. 爬楼梯 (进阶)
一、完全背包问题相较于01背包,完全背包的显著特征是每个物品可以用无数次,遍历顺序也不需要为了保证每个物品只去一次而倒序遍历。#include#includeusingnamespacestd;intmain(){intN,V;cin>>N>>V;vectorweight(N+1,0);vectorvalue(N+1,0);for(inti=0;i>weight[i]>>value[i];}vec
jiegongzhu3z
·
2025-02-03 05:15
算法
leetcode
职场和发展
【TIMM应用】timm加载模型create_model,使用本地预
训练
模型
timm加载模型create_model使用本地预
训练
模型1.常规方式,从https://huggingface.co/上下载1-1.timm库中create_model函数的用法1.最简单的用法2.查看可以直接创建的预
训练
模型列表
pen-ai
·
2025-02-03 03:29
深度学习
python
深度学习
神经网络
卷积神经网络
AI模型升级版0.02
根据您的需求,我将提供一个升级版的AI对话模型的实现代码,该模型可以在Windows上运行,并支持
训练
和微调。我们将使用HuggingFace的transformers库和torch库来实现这个目标。
pps-key
·
2025-02-03 02:51
python
AI写作
学习
gpt
VARGPT:将视觉理解与生成统一在一个模型中,北大推出支持混合模态输入与输出的多模态统一模型
技术原理:基于自回归框架,采用三阶段
训练
策略,
蚝油菜花
·
2025-02-03 02:18
每日
AI
项目与应用实例
人工智能
开源
【代码随想录
训练
营】【Day01】第一章|数组|数组理论基础|704.二分查找|27.移除元素
数组理论基础数组是在编程中非常常见的数据存储结构,主要有以下几个特点:数组的存储地址是一片连续的空间数组中存储的元素都是相同类型的修改数组中某一元素的值时,只能覆盖(重新赋值)更多有关数组的理论基础可查阅:《代码随想录》数组理论基础704.二分查找题目详细:LeetCode.704注意:二分查找对数据样本有明确的要求,即数组中的元素是有序的,所以在今后遇到类似于“在有序的数据样本中查找某一目标数据
蚝油菜花
·
2025-02-03 02:48
算法
leetcode
代码随想录
【代码随想录
训练
营】【Day03】第二章|链表|链表理论基础|203.移除链表元素|707.设计链表|206.反转链表
链表理论基础链表的结构类似于一串珠子,每一颗珠子就相当于链表上的一个节点;每一个节点则由数据域和指针域构成,数据域用于存放数据,指针域用于指向其它一个节点或空节点(链表尾部)。链表与数组的主要区别在于:数组是在内存中是连续分布的,但是链表在内存中不是连续分布的。数组在定义的时候,长度就是固定的,如果想改动数组的长度,就需要重新定义一个新的数组。链表的长度是不固定的,可以进行动态增删,适合数据量不固
蚝油菜花
·
2025-02-03 02:45
链表
数据结构
代码随想录
训练
营Day3|Leetcode 203.移除链表元素 Leetcode 707.设计链表 Leetcode 206.反转链表
编程语言:C#链表定义*publicclassListNode{*publicintval;*publicListNodenext;*publicListNode(intval=0,ListNodenext=null){*this.val=val;*this.next=next;*}*}Leetcode203.移除链表元素题目链接:203.移除链表元素-力扣(LeetCode)题意:删除链表中等于
?��??
·
2025-02-03 01:44
leetcode
链表
算法
DeepSeek-V2:强大、经济、高效的专家混合语言模型
//gitcode.com/gh_mirrors/de/DeepSeek-V2项目介绍DeepSeek-V2是一款强大的专家混合(Mixture-of-Experts,MoE)语言模型,以其经济高效的
训练
和推理能力著称
乌芬维Maisie
·
2025-02-03 01:12
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
目录1.各个模型架构2.
训练
方式3.模型参数与规模4.应用场景5.性能表现6.发布时间7.价格1.各个模型架构DeepSeek-R1:未明确有特殊架构说明,但属于推理模型,可能在Transformer架构基础上针对推理做了优化
fpga和matlab
·
2025-02-03 01:12
前言技术汇集
#
人工智能
大模型
DeepSeek
强化学习中的关键模型与算法:从Actor-Critic到GRPO
在生成对抗网络中,生成器和判别器模型在整个
训练
过程中相互对抗。
·
2025-02-02 22:14
人工智能
从零开始大模型开发与微调:汉字拼音数据集处理
然而,LLM的
训练
与微调过程往往需要海量的文本数据,而这些数据通常以自然语言形式存在,难以直接用于模型
训练
。因此,如何从自然语言数据中提取结构
AGI大模型与大数据研究院
·
2025-02-02 22:43
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
2024年开源数据集地址汇总包含最新最全数据集在这你可以找到任何想要数据集
目标检测数据集和图像分类数据集是计算机视觉领域的两大重要资源,它们为
训练
和评估各种视觉模型提供了关键的数据支持。目标检测数据集主要用于
训练
模型以识别和定位图像中的特定物体。
萌萌哒240
·
2025-02-02 21:10
深度学习
目标跟踪
人工智能
计算机视觉
穷人为什么生活的很艰难?
这关于你的体能天赋,长时间的体能
训练
,以及你的技巧设计,如配速,呼吸调整,跑步姿势,营养补给,心理调整,赛前
北纬文公子
·
2025-02-02 20:03
生活
职场和发展
赚钱思考
开发、
训练
、部署全链路深度解析!
人工智能(AI)技术的快速发展,使得企业在AI模型的开发、
训练
、部署和运维过程中面临前所未有的复杂性。
和老莫一起学AI
·
2025-02-02 19:58
人工智能
数据挖掘
学习
llama
ai
大模型
程序员
【Legged Gym】Legged Gym
训练
参数详解与自定义任务实现
LeggedGym
训练
参数详解与自定义任务实现在进行机器人强化学习
训练
时,LeggedGym提供了一套灵活的参数配置系统,以适应不同的
训练
需求和环境。
啵啵啵啵哲
·
2025-02-02 19:28
人工智能
什么是“知识蒸馏”
知识蒸馏是一种将大型预
训练
模型(教师模型)的知识转移到较小模型(学生模型)的技术。这种方法不仅能保留原有模型的性能,还能显著降低模型的复杂度和计算需求,使其更适合在资源受限的环境中部署。知识蒸馏
清风AI
·
2025-02-02 19:55
深度学习
人工智能
神经网络
python
conda
isaac gym 和 legged gym 环境搭建记录
今天使用fanziqi大佬的rl_docker搭建了一个isaacgym下的四足机器人
训练
环境,成功运行leggedgym项目下的例子,记录一下搭建流程基础配置OperatingSystem:Ubuntu22.04.5LTSKernel
咋学都不累zgc
·
2025-02-02 19:24
ubuntu
DeepSeek 使用的核心技术预测
1.大规模预
训练
模型架构Transformer变种与优化:基于Transformer架构进行改进,可能引入稀疏注意力机制(如Longform
eso1983
·
2025-02-02 18:22
人工智能
深度学习
机器学习
python
LLM - 大模型 ScallingLaws 的设计 100B 预
训练
方案(PLM) 教程(5)
欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/145356022免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。ScalingLaws(缩放法则)是大模型领域中,用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
ManonLegrand
·
2025-02-02 18:21
大模型
(LLM)
人工智能
LLM
ScalingLaws
100B
预训练
DeepNorm
EGS
TensorFlow 示例摄氏度到华氏度的转换(一)
1.数据准备与预处理2.构建模型3.编译模型4.
训练
模型5.评估模型6.模型应用与预测7.保存与加载模型8.完整代码1.数据准备与预处理你提供了摄氏度和华氏度的数据,并进行了标准化。
李建军
·
2025-02-02 17:42
TensorFlow
tensorflow
人工智能
python
【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划(Python代码实现)
本文目录如下:目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络
训练
5.航线规划四、研究挑战与展望
科研_G.E.M.
·
2025-02-02 16:36
python
pytorch
算法
监督学习、无监督学习和强化学习的特点和应用场景
以下是对这三种学习方法的详细对比和总结:监督学习(SupervisedLearning)特点:数据标注:
训练
数据包含明确的输入特征和对应的标签(目标输出)。
BugNest
·
2025-02-02 16:03
AI
学习
ai
机器学习
人工智能
Scikit-learn_聚类算法_K均值聚类
小批量是输入数据的子集,是每次
训练
迭代中的随机抽样。小批量大
飞Link
·
2025-02-02 15:26
Water
算法
机器学习
人工智能
使用 Python 的 LSTM 进行股市预测
三、下载数据3.1从Alphavantage获取数据3.1从Kaggle获取数据3.3数据探索3.4数据可视化四、将数据拆分为
训练
集和测试集五、数据标准化六、通过平均进行一步预测6.1标准平均值6.2指数移动平均线
无水先生
·
2025-02-02 14:51
数据分析
深度学习
人工智能综合
python
lstm
开发语言
什么是LLM?看这一篇就够了!
大语言模型介绍什么是大语言模型(LLM)通过海量文本
训练
的、能识别人类语言、执行语言类任务、拥有大量参数的模型,称之为大语言模型。GPT、LLaMA、M
Python程序员罗宾
·
2025-02-02 14:50
人工智能
语言模型
AIGC
自然语言处理
Scikit-learn提供了哪些机器学习算法以及如何使用Scikit-learn进行模型
训练
和评估
Scikit-learn库的使用一、Scikit-learn提供的机器学习算法Scikit-learn(通常简称为sklearn)是一个广泛使用的Python机器学习库,它提供了多种用于数据挖掘和数据分析的算法。Scikit-learn支持的机器学习算法可以大致分为以下几类:分类算法:支持向量机(SVM)随机森林(RandomForest)逻辑回归(LogisticRegression)朴素贝叶斯
Java资深爱好者
·
2025-02-02 14:20
机器学习
scikit-learn
算法
【llm对话系统】大模型 Llama 源码分析之并行
训练
方案
1.引言
训练
大型语言模型(LLM)需要巨大的计算资源和内存。为了高效地
训练
这些模型,我们需要采用各种并行策略,将计算和数据分布到多个GPU或设备上。
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm对话系统】大模型 Llama 源码分析之 LoRA 微调
1.引言微调(Fine-tuning)是将预
训练
大模型(LLM)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【深度学习】因果推断与机器学习的高级实践 数学建模_问题根因 分析 机器学习
现阶段深度学习有三大特征:数据驱动:即数据
训练
,将数据输入到模型中进行
训练
;关联学习:模型基于给定
训练
数据集,进行关联学习;概率输出:即最后的输出,判断这个图片有“狗“的概率是多少。
2401_84239830
·
2025-02-02 13:41
程序员
深度学习
机器学习
数学建模
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他