ACM-ICPC训练题解

模型架构选择：从传统NLP到Transformer

模型架构选择：从传统NLP到Transformer关键词：自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预训练模型文章目录模型架构选择：从传统NLP到Transformer1

AI天才研究院·2025-01-30 08:23

用自然语言与mysql数据库对话几种方案的思考

处于安全考虑,可训练一个本地大语言模型来完成此项任务,mysql服务器中的数据大约有两万多条记录,服务器的作用主要是记录设备的出库和回库的流水账(即以时间为序的记录),但有一些sql查询比较复杂,必须根据特定的

闲云野鹤_SG·2025-01-30 08:52

Llama 3：开源大模型的里程碑式突破

标题：Llama3：开源大模型的里程碑式突破文章信息摘要：Meta通过Llama3展现了开源LLM的重大突破：采用超大规模训练数据和多阶段训练方法（SFT、rejectionsampling、PPO和DPO

XianxinMao·2025-01-30 08:50

Transformer架构的GPU并行和之前的NLP算法并行有什么不同？

在深度学习中，GPU并行计算被广泛应用于训练神经网络，加速模型训练过程。在2017年之前，自然语言处理（NLP）领域的研究者们通常会从头开始训练模型，那时能够利用GPU进行

AI大模型学习不迷路·2025-01-30 07:49

代码随想录算法训练营第三十九天|198.打家劫舍、

题目链接：198.打家劫舍-力扣（LeetCode）思路：因为隔一家才能取，所以当前最大的价值要么是dp[i-2]+nums[i]或者是dp[i-1]classSolution(object):defrob(self,nums):""":typenums:List[int]:rtype:int"""dp=[0]*len(nums)if(len(nums)==1):returnnums[0]dp[0

jinshengqile·2025-01-30 06:41

代码随想录算法训练营第三十九天-动态规划-198. 打家劫舍

动规五部曲dp[i]表示在下标为i的房间偷或不偷与前面所偷之和所能获得的最大价值递推公式：dp[i]=std::max(dp[i-2]+nums[i],dp[i-1])初始化：要给dp[0]与dp[1]来给定初始值，因为递推公式有-1与-2。dp[0]=nums[0],dp[1]=std::max(nums[0],nums[1]);其它下标值，初始成任意值都可以，因为其值是由前面元素推导出来的遍历

taoyong001·2025-01-30 06:08

【深度分析】Deepseek为什么会这么爆火？

算力霸权崩塌之夜：一场颠覆AI工业体系的静默革命当DeepSeek用600万美元训练成本击穿硅谷巨头60亿美元的护城河时，整个AI工业体系的地基正在发生断裂。

精通代码大仙·2025-01-30 06:35

ambari-2.8源码编译

参考博客Ambari(二)----Ambari2.6.0源码编译安装及遇到的问题解决(超详细文档)_ambari2.6.0编译-CSDN博客注意

SmartManWind·2025-01-30 06:35

大型语言模型构建指南：从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF

通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。

AGI大模型学习·2025-01-30 05:34

书籍推荐：《从零构建大型语言模型》附免费PDF下载

大模型入门学习·2025-01-30 05:33

代码随想录算法训练营第三十八天-动态规划-完全背包-279.完全平方数

把目标值当作背包容量，每个平方数当作物品，题目变更为装满指定容量的背包，最小用几个物品会不会出现拼凑不出来的情况？不会，因为有数字1，对任意正整数百分百能拼凑出来因此此题目与上一道题就变得一模一样了classSolution{public:intnumSquares(intn){std::vectordp(n+1,INT_MAX);dp.at(0)=0;for(inti=1;i*i<=n;++i)

taoyong001·2025-01-30 04:57

代码随想录算法训练营第三十八天-动态规划-完全背包-139.单词拆分

类似于回溯算法中的拆分回文串题目是要求拆分字符串，问这些字符串是否出现在字典里。但这道题可以反着来考虑，从字典中的单词能不能组成所给定的字符串如果这样考虑，这个字符串就背包，容器字典中的单词就是一个一个物品问题就转化成这些物品能不能正好装满这个背包，而且这些物品可以使用多次因此这是一个完全背包类问题动规五部曲dp[j]数组含义：把题目给定的字符串能不能用字典字符串来添满。字符串长度为j时，能被字典

taoyong001·2025-01-30 04:57

代码随想录算法训练营52期

flag：岁末年初，万籁俱寂，孤帆起伏，肃杀清凉。不以物喜，不以已悲，投身算法，杀回青春日期天数链接2024-12-11第一天数组理论基础，704.二分查找，27.移除元素数组理论基础，977.有序数组平方结果再排序2024-12-12第二天数组理论基础，59.螺旋矩阵II数组理论基础，209.长度最小的子数组2024-12-13第三天链表理论基础，203.移除链表元素链表理论基础，707.设计链

taoyong001·2025-01-30 04:56

代码随想录算法训练营第三十八天|Day38 动态规划

322.零钱兑换视频讲解：https://www.bilibili.com/video/BV14K411R7yvhttps://programmercarl.com/0322.%E9%9B%B6%E9%92%B1%E5%85%91%E6%8D%A2.html思路#definemin(a,b)((a)>(b)?(b):(a))intcoinChange(int*coins,intcoinsSize,

是糖不是唐·2025-01-30 04:53

【日常运维】mongoDB学习-入门介绍-其强大之处以及用武之地

运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享

向往风的男子·2025-01-30 03:21

PyTorch 框架实现线性回归：从数据预处理到模型训练全流程

系列文章目录Pytorch基础篇01-PyTorch新手必看：张量是什么？5分钟教你快速创建张量！02-张量运算真简单！PyTorch数值计算操作完全指南03-Numpy还是PyTorch？张量与Numpy的神奇转换技巧04-揭秘数据处理神器：PyTorch张量拼接与拆分实用技巧05-深度学习从索引开始：PyTorch张量索引与切片最全解析06-张量形状任意改！PyTorchreshape、tra

大模型铲屎官·2025-01-30 03:17

代码随想录算法训练营day32：动态规划01

动态规划理论基础动态规划刷题大纲适用范围：某一问题有很多重叠子问题，使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的，这一点就区分于贪心，贪心没有状态推导，而是从局部直接选最优的。套路：dp数组，下标的含义——定义一维或者二维的状态转移数组递推公式：当前状态是怎么被上一个状态决定出来的dp数组如何初始化遍历顺序打印dp数组——来check算法是否正确509.斐波那契数力

树懒爱沙发·2025-01-30 03:45

代码随想录算法训练营day10

代码随想录算法训练营day10来到了栈与队列，经过昨天的总结感觉自己快忘干净了。。有种G的感觉来到这先搞一下吧什么是栈？

魏进·2025-01-30 02:14

论文AI率：检测原理是什么？该如何降低论文AI率？

和AI大模型一样，AI检测的核心也是机器学习模型，它们在包含人类创作和AI生成文本样本的大型数据集上进行训练，通过学习每种文本中存在的模式和特征，以此来区分人类创作的文本和AI生成文本。

迪娜学姐·2025-01-30 02:40

代码随想录算法训练营Day32

78.子集力扣题目链接classSolution{List>res=newArrayListpath=newLinkedList>subsets(int[]nums){dfs(nums,0);returnres;}publicvoiddfs(int[]nums,intstart){res.add(newArrayList(path));for(inti=start;i

Nruonan·2025-01-30 02:09

如何评价deepseek上线的deepseek-V3模型？怎么使用？

DeepSeek-V3模型是深度求索公司最新推出的自研MoE（混合专家）模型，具有6710亿参数，激活参数为370亿，经过14.8万亿token的预训练。

百态老人·2025-01-30 01:36

【无标题】

Llava环境构建遇到flash-attn问题解决flash-attn安装pip安装#使用pip安装pipinstallflash-attn--no-build-isolation使用whl文件离线安装下载

随心而动的动·2025-01-30 01:02

【DL】神经网络与机器学习基础知识介绍（一）

原博客：https://mengwoods.github.io/post/dl/009-dl-fundamental/文章目录基本通用概念梯度下降算法数据工程训练技术偏差与方差防止过拟合评估指标决策树基本通用概念机器学习的类型

MengWoods·2025-01-30 01:01

DeepSeek V3 模型微调（SFT）技术详解

DeepSeekV3模型微调（SFT）技术详解目录引言背景知识2.1深度学习与预训练模型2.2微调（Fine-tuning）的概念2.3监督微调（SupervisedFine-tuning,SFT）DeepSeekV3

zhangjiaofa·2025-01-30 00:28

牛客周赛 Round 77 题解

文章目录A-时间表B-数独数组D-隐匿社交网络E-1or0A-时间表签到题#includeusingnamespacestd;intmain(){inta[6]={20250121,20250123,20250126,20250206,20250208,20250211};intn;cin>>n;coutusingnamespacestd;constintN=1e5+10;inta[10];int

free-9d·2025-01-30 00:53

leetcode每日一题【Day4】——438. 找到字符串中所有字母异位词

参考题解：https://leetcode-cn.com/problems/longest-substring-without-repeating-c

thisissally·2025-01-29 22:43

【DeepSeek】大模型强化学习训练GRPO算法，你学会了吗？

如果你还不知道GRPO，你可以先看这篇帖子：【DeepSeek】一文详解GRPO算法——为什么能减少大模型训练资源？看了论文跟没看一样？做两道题练练！曾经最痛恨的应试教育，却能让你深深记住这知识点。

FF-Studio·2025-01-29 21:56

智联未来——打造基于机器学习的MySQL智能运维助手，开启协作新时代

今天，我们将深入了解如何训练这样一个基于机器学习的MySQL智能运维助手

墨夶·2025-01-29 19:45

【面试】【前端】【性能优化】前端性能优化总结

以下从性能优化的原则、方法、工具和常见问题解答入手，提供全面的总结。（一）性能优化的基本原则用户体验：少于0.1秒：用户不会注意到延迟。少于1秒：用户感知延迟但不会中断操作。

患得患失949·2025-01-29 19:40

Webstorm 配置Eslint ESLint: TypeError: this.libOptions.parse is not a function

(js,ts,jsx,tsx,html,vue)问题解决，亲测有效！

Dragon Wu·2025-01-29 19:09

【题解】Codeforces Round 996 C.The Trail D.Scarecrow

CodeforcesRound996比赛地址：https://codeforces.com/contest/2055ProblemC.TheTrail1.从数学上看，未知的数有n+m-1个位置的a[i]值，和行列总和x，解出他们需要n+m个独立的方程。对每一个未知的位置，有行和等于列和的方程，共n+m-1个，还有一个行和/列和=x的方程，恰好可解。所以只需要找到一种易于用代码表达的解方程方法即可。

所以遗憾是什么呢？·2025-01-29 18:34

大模型部署工具 llama.cpp 介绍与安装使用

1.大模型部署工具llama.cpp大模型的研究分为训练和推理两个部分。训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化，推理结果最优化的过程。

大模型柳儿·2025-01-29 18:03

自建stgcn数据集并训练

openpose+caffe）_Significance的博客-CSDN博客复现旧版STGCNGPU版（win10+openpose1.5.0）_Significance的博客-CSDN博客22.准备训练数据集官方使用

青年夏日科技工作者·2025-01-29 18:31

kinetics-skeleton格式行为数据提取方法

用自建kinetics-skeleton行为识别数据集训练st-gcn网络流程记录，利用Lightweight-OpenPose生成kinetics-skeleton格式数据0.准备工作1.下载/裁剪视频

青年夏日科技工作者·2025-01-29 18:31

第一章动态规划背包问题之有依赖的背包问题

1、问题解释什么是有依赖的背包问题呢？我们平时做的一般都是没有依赖的背包问题，也就是说，我取每个物品都可以取这个物品自己。而有依赖代表我取这个物品的同时也必须取某些其他的物品。

刘胖仔学后端·2025-01-29 18:00

火出圈的DeepSeeK R1详解

强化学习驱动的训练：采用大规模强化学习技术，仅需极少量标注数据，显著提升推理能力。长链推理（CoT）支持：思维链长度可达数万字，能逐步分解复杂问题，通过多步骤逻辑推理解决问题。

清风AI·2025-01-29 17:58

Quartus Prime 仿真相关报错解决方法

门外的兔子·2025-01-29 17:25

Transformer--概念、作用、原理、优缺点以及简单的示例代码

与传统的循环神经网络（RNN）和长短时记忆网络（LSTM）不同，Transformer完全摆脱了序列结构的依赖，可以并行处理数据，显著提高了训练效率和效果

Ambition_LAO·2025-01-29 17:23

DeepSeek：通用人工智能的技术前沿与创新突破

其研发方向覆盖自然语言处理、多模态交互、强化学习等领域，并在模型架构、训练效率及实际应用场景中取得显著成果。二、核心

热爱分享的博士僧·2025-01-29 17:52

如何从零开始训练大模型（预训练方向）

但还有一个很直观的情况，随着预训练样本的质量不断提升，训练手段的优化。新的模型，往往效果能轻松反超参数量两倍于它的模型。例如，最新出的minicpm，微信内部评测效果也是非常棒的。

AI小白熊·2025-01-29 16:43

如何用Python训练一个AI模型（超详细教程）非常详细收藏我这一篇就够了！

AI模型是通过训练得到的一种程序，能够利用海

程序员二飞·2025-01-29 15:42

万字精研：大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南

万字精研：大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南LLM训练时间和的成本太过庞大，况且个人卷训练经验极为困难，不妨从微调开始搞起。

汀、人工智能·2025-01-29 15:40

[c语言日寄]assert函数功能详解

【作者主页】siy2333【专栏介绍】⌈c语言日寄⌋：这是一个专注于C语言刷题的专栏，精选题目，搭配详细题解、拓展算法。从基础语法到复杂算法，题目涉及的知识点全面覆盖，助力你系统提升。

siy2333·2025-01-29 15:07

elementUI之el-select选择器赋值为空后无法选中回显

elementUI之el-select选择器赋值为空后无法选中回显问题原因：焦点问题解决办法：this.$set(this.form,'monthlyRent','');

上铺的老杨·2025-01-29 14:34

详解三种常用标准化：Batch Norm、Layer Norm和RMSNorm

在深度学习中，标准化技术是提升模型训练速度、稳定性和性能的重要手段。

yyytucj·2025-01-29 13:57

MATLAB设计控制系统仿真实验,基于MATLAB的自动控制原理实验仿真系统的设计

传统性实验训练了学生对以传递函数为核心的控制系统与模拟电

stellagugu·2025-01-29 13:55

YOLOv8改进策略【Backbone/主干网络】| 替换骨干网络为2023-CVPR ConvNeXt V2 （附网络详解和完整配置步骤）

本文将ConvNeXtV2应用于YOLOv8，一方面利用全卷积掩码自动编码器在训练时优化特征学习，减少模型对大规模标注数据的依赖；另一方面，通过全局响应归一化层增强特征竞争，缓解特征坍塌问题，提高特征多样性

Limiiiing·2025-01-29 13:54

GEE 训练教程——哨兵2号、Landsat-8以及DEM影像的可视化展示

目录简介1.哨兵2号（Sentinel-2）2.Landsat-83.CGIAR/SRTM90_V4函数visualize(bands,gain,bias,min,max,gamma,opacity,palette,forceRgbOutput)Arguments:Returns:Imageexpression(expression,map)Arguments:Returns:Imageee.Te

此星光明·2025-01-29 11:59

利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络

动态添加/移除层：可以在训练过程中根据需

drebander·2025-01-29 11:24

twrp选择sdcard为0B的问题解决

如果刷入的twrp版本在3.2.3版本以下的有无法选择sdcard的bug,必须先格式化Data分区,尝试一下.,请更新twrp版本尝试解决,由于笔者没有找到适用于我手机的(oppor11)的刷机包,所以我选择了去奇兔下载twrp,他的是3.2.3来的,更新好之后进入Rec,继续格式化Data,把Data分区文件系统改为ext4,然后重启到Recovery,再重启到系统,传好文件,再进入rec,之

新青年.·2025-01-29 10:52

上一页 1 2 3 4 5 6 7 8 下一页

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

推荐频道