E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
NLP预训练
我把DeepSeek-R1推理能力知识蒸馏到Qwen2,效果真的炸裂!!!
关于
NLP
那些你不知道的事2025年01月29日13:08我把DeepSeek-R1推理能力知识蒸馏到Qwen2,效果真的炸裂!!!一、什么是知识蒸馏?
AI生成曾小健
·
2025-01-31 03:00
自然语言处理
人工智能
深度学习过程是什么
用差值数据对权重和偏差求偏导,这里的偏导数的值也就是使得损失减小的最佳方向,然后根据偏导数的方向和步长更新权重和偏差,对吗答:您的描述大致正确,但有一些细节需要澄清和修正,以更准确地反映深度学习中模型
训练
的过程
小松要进步
·
2025-01-31 01:15
李哥深度学习
深度学习
TensorBoard可视化工具支持哪些类型的图表?
TensorBoard支持多种类型的图表,以下是详细介绍:标量图(Scalars)定义与用途:用于展示单个数值随时间(通常是
训练
步骤或迭代次数)的变化情况。
alankuo
·
2025-01-31 01:43
人工智能
《攻克语言密码:教AI理解隐喻与象征》
在自然语言处理(
NLP
)领域,让计算机理解人类语言中的隐喻和象征,是迈向更高语言理解水平的关键一步。
程序猿阿伟
·
2025-01-31 00:40
人工智能
《解码AI大模型涌现能力:从量变到质变的智能跃迁》
随着互联网的迅猛发展,数据呈爆炸式增长,为大模型的
训练
提供了丰富的素材。以GPT-3为例,它的
训练
数据涵盖了海量的
·
2025-01-31 00:42
人工智能深度学习
【机器学习】如何在Jupyter Notebook中安装库以及简单使用Jupyter实现单变量线性回归的模型f
(终端或命令提示符)中安装二、使用JupyterNotebook实现单变量线性回归的模型fw,bf_{w,b}fw,b2.1工具2.2问题陈述2.3创建`x_train`和`y_train`变量2.4
训练
示例的数量
Lossya
·
2025-01-30 23:29
机器学习
jupyter
线性回归
人工智能
开发语言
python
学习
COCO8 数据集上
训练
YOLO11n:从入门到跑路(100 轮
训练
实战)
前言
训练
YOLO11n,听起来就像是给赛博世界的“战斗天使”装上双核发动机,而COCO8数据集,则是那个小小的试验场。
星际编程喵
·
2025-01-30 23:27
Python探索之旅
目标跟踪
人工智能
计算机视觉
机器学习
代码随想录算法
训练
营第三十九天-动态规划-337. 打家劫舍 III
老师讲这是树形dp的入门题目解题思路是以二叉树的遍历(递归三部曲)再结合动规五部曲dp数组如何定义:只需要定义一个二个元素的数组,dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历:使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti
taoyong001
·
2025-01-30 22:54
算法
动态规划
c++
leetcode
题目 1127: C语言
训练
-尼科彻斯定理
验证尼科彻斯定理,即:任何一个整数m的立方都可以写成m个连续奇数之和。输出典例:131313=2197=157+159+161+163+165+167+169+171+173+175+177+179+181#includeintmain(){intn,st;scanf("%d",&n);st=n*n-n+1;printf("%d*%d*%d=%d=%d",n,n,n,n*n*n,st);for(i
星海燚燚
·
2025-01-30 21:48
C语言刷题
c语言
AI 大模型创业:如何利用商业优势?
第1章:AI大模型概述1.1AI大模型的概念与演进AI大模型(Large-scaleArtificialIntelligenceModels)是指通过大规模数据
训练
得到的复杂神经网络模型。
AI天才研究院
·
2025-01-30 21:46
大数据AI人工智能
ChatGPT
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
AI绘画能取代设计师吗?
1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后,离不开图像风格迁移、图文
预
训练
模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家,利用不同
网络安全我来了
·
2025-01-30 20:09
IT技术
AI作画
【DeepSeek】复现DeepSeek R1?快来看这个Open R1项目实践指南~
OpenR1项目基于DeepSeek-R1的技术报告和方法论,公开并复现R1的
训练
管线,并且希望所有开发者都能在这个基础上搭建自己的研究或应用。
FF-Studio
·
2025-01-30 19:24
DeepSeek
R1
语言模型
自然语言处理
深度学习
人工智能
实战LLM强化学习——使用GRPO(DeepSeek R1出圈算法)
在大模型的
训练
或微调当中,大多数场景我们都希望它能“自由发挥”,给出越丰富越好的答案。
FF-Studio
·
2025-01-30 19:54
DeepSeek
R1
算法
语言模型
人工智能
自然语言处理
机器学习
Apache Airflow 全面解析
其核心设计理念是“WorkflowsasCode”,通过编程方式定义、调度和监控复杂的数据流水线(Pipeline),适用于ETL、机器学习模型
训练
、数据湖管理、报表生成等场景。
由数入道
·
2025-01-30 18:20
人工智能
apache
Airflow
DeepSeek:LLM在MoE
训练
中的无损平衡
现有方法通常采用辅助损耗来促进负载平衡,但较大的辅助损耗会在
训练
中引入不可忽略的干扰梯度,从而损害模型性能。为了在
训练
过程中控制负载平衡,同时不产生不希望
大模型任我行
·
2025-01-30 16:24
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
基于CNN-GRU-Attention混合神经网络的负荷预测方法(Python代码实现)
本文目录如下:目录1概述一、引言二、模型结构三、数据预处理四、模型
训练
与评估五、实验结果与分析六、结论与展望2运行结果3参考文献4Python代码实现及数据1概述基于CNN-GRU(convolutionalneuralnetworks-gaterecurrentunit
宇哥预测优化代码学习
·
2025-01-30 16:22
神经网络
cnn
gru
词表设计:特殊Token区域与共享去区域的深入探讨
在自然语言处理(
NLP
)中,Tokenizer的设计对于模型性能有着至关重要的影响。
东方佑
·
2025-01-30 14:44
开发语言
Deepseek技术浅析(一)
其技术涵盖了从模型架构、
训练
方法到应用部署的多个层面,展现出强大的创新能力和应用潜力。以下将详细介绍DeepSeek的核心技术、工作原理以及具体实现方式。
爱研究的小牛
·
2025-01-30 12:58
AIGC—概述
大模型
AIGC
人工智能
深度学习
自然语言处理
Synthesia技术浅析(四):自然语言处理
Synthesia的自然语言处理(
NLP
)模块是其核心技术之一,涵盖了文本转语音(TTS)、情感分析以及多语言支持等多个方面。
爱研究的小牛
·
2025-01-30 12:28
AIGC—视频
AIGC—虚拟现实
AIGC—自然语言处理
自然语言处理
人工智能
AIGC
python神经网络框架有哪些,python调用神经网络模型
Caffe中的网络结构与优化都以配置文件形式定义,容易上手,无须通过代码构建网络;网络
训练
速度快,能够
训练
大型数据集与S
小明技术分享
·
2025-01-30 12:56
python
神经网络
深度学习
代码随想录算法
训练
营第五十九天| 503.下一个更大元素II、42. 接雨水
代码随想录算法
训练
营第五十九天|503.下一个更大元素II、42.接雨水503.下一个更大元素II解题代码42.接雨水解题代码503.下一个更大元素II题目链接:503.下一个更大元素II解题代码funcnextGreaterElements
Joanna-升
·
2025-01-30 10:44
代码随想录训练营
算法
leetcode
数据结构
LeetCode-第一题
之前从没有接触过算法题的
训练
,也深知自己几斤几两,所以博客里可能会有很多不成熟的、不正确的想法和观点,十分欢迎混圈的大神们赐教,但更多的还是想记录自己青涩的成长之路。叨叨半天的废话,下面还是开始进入正
Joanna-升
·
2025-01-30 10:43
LeetCode解题篇
leetcode
c语言
【Leetcode 热题 100】32. 最长有效括号
新年的第二天,偷偷懒,这题就留到手边事情告一段落,专门
训练
动态规划的时候再写
冠位观测者
·
2025-01-30 09:36
Leetcode
Top
100
Liked
leetcode
算法
数据结构
大模型问答机器人的智能化程度
大模型、问答机器人、智能化程度、自然语言处理、深度学习、Transformer模型、知识图谱、推理能力、对话系统1.背景介绍近年来,人工智能技术取得了飞速发展,特别是深度学习的兴起,为自然语言处理(
NLP
AI大模型应用之禅
·
2025-01-30 09:35
AI大模型与大数据
java
python
javascript
kotlin
golang
架构
人工智能
Python-作业统计管理系统
模块选择2.界面设计3.模块实现五、总结六、感想七、Python源码mainexcelhandlejob一、设计目的1、教学目的本课程设计是学生学习完《Python程序设计》课程后,进行的一次全面的综合
训练
Vicky__3021
·
2025-01-30 09:32
Python实例
python
编程语言
大语言模型原理与工程实践:残差连接与层归一化
1.背景介绍随着自然语言处理(
NLP
)的发展,深度学习在过去几年中取得了令人瞩目的成果。其中,循环神经网络(RNN)和卷积神经网络(CNN)在图像和文本分类、语义角色标注、机器翻译等领域表现出色。
AI大模型应用之禅
·
2025-01-30 08:27
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
模型架构选择:从传统
NLP
到Transformer
模型架构选择:从传统
NLP
到Transformer关键词:自然语言处理(
NLP
),模型架构,传统
NLP
,Transformer,RNN,CNN,
预
训练
模型文章目录模型架构选择:从传统
NLP
到Transformer1
AI天才研究院
·
2025-01-30 08:23
AI大模型应用入门实战与进阶
大数据AI人工智能
计算
大数据
人工智能
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
用自然语言与mysql数据库对话几种方案的思考
处于安全考虑,可
训练
一个本地大语言模型来完成此项任务,mysql服务器中的数据大约有两万多条记录,服务器的作用主要是记录设备的出库和回库的流水账(即以时间为序的记录),但有一些sql查询比较复杂,必须根据特定的
闲云野鹤_SG
·
2025-01-30 08:52
数据库
mysql
AI
text2sql
自然语言
本地部署
大模型
Llama 3:开源大模型的里程碑式突破
标题:Llama3:开源大模型的里程碑式突破文章信息摘要:Meta通过Llama3展现了开源LLM的重大突破:采用超大规模
训练
数据和多阶段
训练
方法(SFT、rejectionsampling、PPO和DPO
XianxinMao
·
2025-01-30 08:50
llama
开源
Transformer架构的GPU并行和之前的
NLP
算法并行有什么不同?
在深度学习中,GPU并行计算被广泛应用于
训练
神经网络,加速模型
训练
过程。在2017年之前,自然语言处理(
NLP
)领域的研究者们通常会从头开始
训练
模型,那时能够利用GPU进行
AI大模型学习不迷路
·
2025-01-30 07:49
transformer
自然语言处理
大模型
深度学习
NLP
LLM
大语言模型
代码随想录算法
训练
营第三十九天|198.打家劫舍、
题目链接:198.打家劫舍-力扣(LeetCode)思路:因为隔一家才能取,所以当前最大的价值要么是dp[i-2]+nums[i]或者是dp[i-1]classSolution(object):defrob(self,nums):""":typenums:List[int]:rtype:int"""dp=[0]*len(nums)if(len(nums)==1):returnnums[0]dp[0
jinshengqile
·
2025-01-30 06:41
算法
leetcode
动态规划
代码随想录算法
训练
营第三十九天-动态规划-198. 打家劫舍
动规五部曲dp[i]表示在下标为i的房间偷或不偷与前面所偷之和所能获得的最大价值递推公式:dp[i]=std::max(dp[i-2]+nums[i],dp[i-1])初始化:要给dp[0]与dp[1]来给定初始值,因为递推公式有-1与-2。dp[0]=nums[0],dp[1]=std::max(nums[0],nums[1]);其它下标值,初始成任意值都可以,因为其值是由前面元素推导出来的遍历
taoyong001
·
2025-01-30 06:08
算法
动态规划
c++
leetcode
【深度分析】Deepseek为什么会这么爆火?
算力霸权崩塌之夜:一场颠覆AI工业体系的静默革命当DeepSeek用600万美元
训练
成本击穿硅谷巨头60亿美元的护城河时,整个AI工业体系的地基正在发生断裂。
精通代码大仙
·
2025-01-30 06:35
深度分析
新媒体运营
创业创新
大型语言模型构建指南:从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF
通过从头开始构建一个大型语言模型,了解如何创建、
训练
和调整大型语言模型(LLMs)!一、构建大型语言模型(从头开始)在《构建大型语言模型(从头开始)》中,你将了解如何LLMs从内到外工作。
AGI大模型学习
·
2025-01-30 05:34
语言模型
pdf
人工智能
大模型
大模型学习
大模型教程
大模型书籍
书籍推荐:《从零构建大型语言模型》附免费PDF下载
通过从头开始构建一个大型语言模型,了解如何创建、
训练
和调整大型语言模型(LLMs)!一、构建大型语言模型(从头开始)在《构建大型语言模型(从头开始)》中,你将了解如何LLMs从内到外工作。
大模型入门学习
·
2025-01-30 05:33
语言模型
pdf
人工智能
产品经理
大模型学习
大模型教程
大模型入门
LLM based Single Agent System
ANewEraofIntelligentAutomation关键词:大语言模型,单智能体系统,强化学习,自然语言处理,智能自动化1.背景介绍近年来,随着深度学习技术的快速发展,大语言模型(LLM)在自然语言处理(
NLP
AGI大模型与大数据研究院
·
2025-01-30 05:03
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
代码随想录算法
训练
营第三十八天-动态规划-完全背包-279.完全平方数
把目标值当作背包容量,每个平方数当作物品,题目变更为装满指定容量的背包,最小用几个物品会不会出现拼凑不出来的情况?不会,因为有数字1,对任意正整数百分百能拼凑出来因此此题目与上一道题就变得一模一样了classSolution{public:intnumSquares(intn){std::vectordp(n+1,INT_MAX);dp.at(0)=0;for(inti=1;i*i<=n;++i)
taoyong001
·
2025-01-30 04:57
算法
动态规划
c++
leetcode
代码随想录算法
训练
营第三十八天-动态规划-完全背包-139.单词拆分
类似于回溯算法中的拆分回文串题目是要求拆分字符串,问这些字符串是否出现在字典里。但这道题可以反着来考虑,从字典中的单词能不能组成所给定的字符串如果这样考虑,这个字符串就背包,容器字典中的单词就是一个一个物品问题就转化成这些物品能不能正好装满这个背包,而且这些物品可以使用多次因此这是一个完全背包类问题动规五部曲dp[j]数组含义:把题目给定的字符串能不能用字典字符串来添满。字符串长度为j时,能被字典
taoyong001
·
2025-01-30 04:57
算法
动态规划
c++
leetcode
代码随想录算法
训练
营52期
flag:岁末年初,万籁俱寂,孤帆起伏,肃杀清凉。不以物喜,不以已悲,投身算法,杀回青春日期天数链接2024-12-11第一天数组理论基础,704.二分查找,27.移除元素数组理论基础,977.有序数组平方结果再排序2024-12-12第二天数组理论基础,59.螺旋矩阵II数组理论基础,209.长度最小的子数组2024-12-13第三天链表理论基础,203.移除链表元素链表理论基础,707.设计链
taoyong001
·
2025-01-30 04:56
算法
c++
leetcode
代码随想录算法
训练
营第三十八天|Day38 动态规划
322.零钱兑换视频讲解:https://www.bilibili.com/video/BV14K411R7yvhttps://programmercarl.com/0322.%E9%9B%B6%E9%92%B1%E5%85%91%E6%8D%A2.html思路#definemin(a,b)((a)>(b)?(b):(a))intcoinChange(int*coins,intcoinsSize,
是糖不是唐
·
2025-01-30 04:53
算法
动态规划
c语言
数据结构
【 书生·浦语大模型实战营】学习笔记(五):LMDeploy 量化部署
AI学习星球推荐:GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|
NLP
|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于前沿论文解读
GoAI
·
2025-01-30 03:18
深入浅出LLM
深入浅出AI
大模型
LLM
部署
人工智能
LMDeploy
PyTorch 框架实现线性回归:从数据预处理到模型
训练
全流程
系列文章目录Pytorch基础篇01-PyTorch新手必看:张量是什么?5分钟教你快速创建张量!02-张量运算真简单!PyTorch数值计算操作完全指南03-Numpy还是PyTorch?张量与Numpy的神奇转换技巧04-揭秘数据处理神器:PyTorch张量拼接与拆分实用技巧05-深度学习从索引开始:PyTorch张量索引与切片最全解析06-张量形状任意改!PyTorchreshape、tra
大模型铲屎官
·
2025-01-30 03:17
PyTorch
pytorch
线性回归
人工智能
深度学习
python
代码随想录算法
训练
营day32:动态规划01
动态规划理论基础动态规划刷题大纲适用范围:某一问题有很多重叠子问题,使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推导,而是从局部直接选最优的。套路:dp数组,下标的含义——定义一维或者二维的状态转移数组递推公式:当前状态是怎么被上一个状态决定出来的dp数组如何初始化遍历顺序打印dp数组——来check算法是否正确509.斐波那契数力
树懒爱沙发
·
2025-01-30 03:45
算法
动态规划
leetcode
数据结构
代码随想录算法
训练
营day10
代码随想录算法
训练
营day10来到了栈与队列,经过昨天的总结感觉自己快忘干净了。。有种G的感觉来到这先搞一下吧什么是栈?
魏进
·
2025-01-30 02:14
算法
数据结构
java
论文AI率:检测原理是什么?该如何降低论文AI率?
和AI大模型一样,AI检测的核心也是机器学习模型,它们在包含人类创作和AI生成文本样本的大型数据集上进行
训练
,通过学习每种文本中存在的模式和特征,以此来区分人类创作的文本和AI生成文本。
迪娜学姐
·
2025-01-30 02:40
人工智能
代码随想录算法
训练
营Day32
78.子集力扣题目链接classSolution{List>res=newArrayListpath=newLinkedList>subsets(int[]nums){dfs(nums,0);returnres;}publicvoiddfs(int[]nums,intstart){res.add(newArrayList(path));for(inti=start;i
Nruonan
·
2025-01-30 02:09
算法
算法
深度优先
如何评价deepseek上线的deepseek-V3模型?怎么使用?
DeepSeek-V3模型是深度求索公司最新推出的自研MoE(混合专家)模型,具有6710亿参数,激活参数为370亿,经过14.8万亿token的
预
训练
。
百态老人
·
2025-01-30 01:36
学习
【DL】神经网络与机器学习基础知识介绍(一)
原博客:https://mengwoods.github.io/post/dl/009-dl-fundamental/文章目录基本通用概念梯度下降算法数据工程
训练
技术偏差与方差防止过拟合评估指标决策树基本通用概念机器学习的类型
MengWoods
·
2025-01-30 01:01
深度学习
机器学习
神经网络
人工智能
DeepSeek V3 模型微调(SFT)技术详解
DeepSeekV3模型微调(SFT)技术详解目录引言背景知识2.1深度学习与
预
训练
模型2.2微调(Fine-tuning)的概念2.3监督微调(SupervisedFine-tuning,SFT)DeepSeekV3
zhangjiaofa
·
2025-01-30 00:28
大模型
DeepSeek
模型微调
DeepSeek 模型:架构创新与实际应用详解
DeepSeek模型是近年来在自然语言处理(
NLP
)领域备受瞩目的开源大规模语言模型系列。
汪子熙
·
2025-01-29 23:52
人工智能
架构
语言模型
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他