E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
平时训练
【Swift 算法实战】利用 KMP 算法高效求解最短回文串
网罗开发(小红书、快手、视频号同名) 大家好,我是展菲,目前在上市企业从事人工智能项目研发管理工作,
平时
热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、HarmonyOS、Java
网罗开发
·
2025-02-24 22:49
Swift
vue.js
leetcode
算法
探索Omniglot:一个无尽的手写字符集合
探索Omniglot:一个无尽的手写字符集合omniglotomniglot-一个包含大量不同语言手写字符图像的数据集,用于机器学习模型的
训练
和评估。
宋溪普Gale
·
2025-02-24 22:46
cap4:YoloV5的TensorRT部署指南(python版)
专栏文章目录:《TensorRT全流程部署指南》专栏主页cap1:TensorRT介绍及CUDA环境安装cap2:1000分类的ResNet的TensorRT部署指南(python版)cap3:自定义数据集
训练
我是一个对称矩阵
·
2025-02-24 21:14
TensorRT全流程部署指南
YOLO
python
人工智能
TensorRT
模型部署
基于Python开发的使用多个单视图特征融合的基于图卷积网络(GCN)的肺结节检测系统的示例
模型
训练
:使用
训练
数据对模型进行
训练
。模型评估:使
go5463158465
·
2025-02-24 20:06
python
深度学习
算法
python
迁移学习
开发语言
基于YOLOv5、FaceNet与KNN的人脸识别系统
步骤1:环境配置安装依赖库:安装Python3.x安装TensorFlow、Keras、OpenCV等深度学习库获取数据集:收集
训练
用的多个人脸图像(每个用户至少几十张)将图像按用户分类存放在data/
reset2021
·
2025-02-24 19:29
人脸识别系统
YOLO
facenet
knn
人脸检测
软考高项备考技巧
分阶段备考:将备考过程分为不同的阶段,如基础学习阶段、强化
训练
阶段和冲刺复习阶段。每个阶段都有明确的学习目标和任务,确保备考过程有条不紊。
chengxuyuan1213_
·
2025-02-24 19:26
职场和发展
Meta官宣Llama3:迄今为止最强大的开源大模型
此版本具有经过预
训练
和指令微调的语言模型,具有8B(80亿)和70B(700亿)参数,可以支持广泛的用例。Llama3在各种行业基准上展示了最先进的性能,并提供了新功能,包括改进的推理能力。
·
2025-02-24 19:09
人工智能开源
第G9周:ACGAN理论与实战
>-**本文为[365天深度学习
训练
营]中的学习记录博客**>-**原作者:[K同学啊]**本人往期文章可查阅:深度学习总结我的环境:语言环境:Python3.11编译器:PyCharm深度学习环境:Pytorchtorch
OreoCC
·
2025-02-24 18:50
GAN
【DeepSeek零基础入门】从零开始:如何
训练
自己的AI模型
从零开始:如何
训练
自己的AI模型在人工智能的世界里,
训练
一个属于自己的AI模型,就像是在培养一个新生儿。你需要耐心、技巧,以及对数据的深刻理解。
Evaporator Core
·
2025-02-24 18:20
DeepSeek进阶开发与应用
#
DeepSeek快速入门
deepseek应用开发实例
deepseek
DeepSeek 和 Qwen 模型快速部署指南
DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构
训练
方法包含预
训练
moton2017
·
2025-02-24 18:47
深度学习
运维
模型部署
DeepSeek
Qwen
大型语言模型
LLM
人工智能
AI
P3405 [USACO16DEC] Cities and States S题解
为了
训练
奶牛们的智力,FarmerJohn在谷仓的墙上放了一张美国地图。地图上表明了每个城市及其所在州的代码(前两位大写字母)。由于奶牛在谷仓里花了很多时间看这张地图,他们开始注意到一些奇怪的关系。
互联网的猫
·
2025-02-24 18:17
集合应用
算法
c++
DeepSeek混合精度
训练
核心技术解析与实践指南
1.主题背景1.1Why混合精度
训练
(价值)混合精度
训练
通过结合FP16和FP32数据格式,在保证模型精度的前提下实现:40-60%显存占用降低(ResNet50案例:从7.8GB降至4.2GB)1.5
燃灯工作室
·
2025-02-24 15:33
Deepseek
数据挖掘
语音识别
计算机视觉
目标检测
机器学习
人工智能
Qwen2.5-Coder Technical Report
Qwen2.5-Coder技术报告摘要1引言2模型架构3预
训练
3.1预
训练
数据3.1.1数据组成3.1.2数据混合3.2
训练
策略3.2.1文件级预
训练
3.2.2仓库级预
训练
4后
训练
4.1指令数据的配方4.2
UnknownBody
·
2025-02-24 13:16
LLM
Daily
LLM
for
code
Technical
Report
语言模型
人工智能
自然语言处理
什么是Grok-3?技术特点,场景,潜在问题与挑战
Grok-3的技术特点与优势1.超大算力与
训练
规模算力投入:Grok-3使用了20万块英伟达H100GPU,分两个阶段
训练
(第一阶段10万GPU
训练
144天,第二阶段20万GPU
训练
92天),总计算量是前代
AndrewHZ
·
2025-02-24 13:46
深度学习新浪潮
深度学习
transformer
人工智能
语言模型
LLM
Grok-3
ElonMusk
ChatGLM-6B中英双语对话大模型Windows本地部署实战
公司于2020年底研发GLM预
训练
架构,2021年
训练
完成百亿参数模型GLM-10B,利用MoE架构成功
训练
出收敛的万亿稀疏模型,2
ErbaoLiu
·
2025-02-24 13:45
数据分析&大模型
自然语言处理&大模型
机器学习&大模型
ChatGLM
ChatGLM-6B
中英双语对话语言模型
LLM
大模型
GPT
聊天机器人
模型算力需求估算
计算模型的算力需求,通常基于模型的参数量(BillionParameters,简称B)和
训练
/推理的计算任务复杂度,结合硬件计算能力(例如每秒浮点运算次数,FLOPS)来估算。
由数入道
·
2025-02-24 12:06
人工智能
蓝桥杯
训练
题(1)
幂ab的末3位数是多少?输入两个正整数a,b。1≤a≤100,1≤b≤10000。输出从高位到低位输出幂的末三位数字,中间无分隔符。若幂本身不足三位,在前面补零。样例输入72011样例输出743答案#includeintmain(){inta,b;intret=1;scanf("%d%d",&a,&b);inti;for(i=0;i
wuhu_king
·
2025-02-24 11:58
算法
算法
蓝桥杯真题
训练
目录1.2.3.4.5.1..题目描述在电子计算机普及以前,人们经常用一个粗略的方法来验算四则运算是否正确。比如:248*15=3720把乘数和被乘数分别逐位求和,如果是多位数再逐位求和,直到是1位数,得2+4+8=14==>1+4=5;1+5=65*6而结果逐位求和为35*6的结果逐位求和与3符合,说明正确的可能性很大!!(不能排除错误)请你写一个计算机程序,对给定的字符串逐位求和:输入输入为一
怀化第一深情
·
2025-02-24 11:26
编程题集
蓝桥杯
蓝桥杯
c++
算法
蓝桥杯
训练
题No.6
#includeusingnamespacestd;signedmain()//正在研究signed{intn;cin>>n;cout.fill('0');//不足位数补0coutusingnamespacestd;typedeflonglongll;lla[100005];llw[105];intmain(){intn;cin>>n;for(lli=0;i>w[i];a[0]=1;memset(
GC_Lion
·
2025-02-24 11:56
蓝桥杯
蓝桥杯
c++
蓝桥杯真题
训练
五一 4/5
1217垒骰子矩阵快速幂op[i]表示的是与i的对面的数。如果有面互斥,就在矩阵中标记为零,否则标记为4,代表顶和底确定的时候可以有四种情况。(矩阵乘法)就是快速幂里面的乘法变成了矩阵乘法。#includeusingnamespacestd;constintmod=1e9+7;typedeflonglongll;constintmaxn=6;lln,m;inta,b;intvis[7][7];in
iuk11
·
2025-02-24 10:55
蓝桥杯刷题
数据标注中的归类与定义,从聚类,相关,关联,回归四个方面分析
在数据标注和AI
训练
过程中,数据的归类与定义是关键步骤,不同的数据分析方法可以用于不同的场景。
小宝哥Code
·
2025-02-24 10:23
人工智能训练师
聚类
回归
数据挖掘
冬训周报(四)
一、补题天梯赛
训练
补题-CSDN博客蓝桥杯
训练
补题-CSDN博客二、算法本周主要是蓝桥杯的一个
训练
,这其中对于搜索和二分的算法居多,对于搜索而言,简单的搜索可能还不成问题,但稍微一复杂写起来还是有些吃力的
HL0614SC
·
2025-02-24 10:49
算法
蓝桥杯
冬训周报(二)
一、天梯
训练
赛L2-1插松枝模拟题:有一个推送器和一个盒子,推送器会给出松针片,松针下面的片一定要比上面的大,看能组合成一些什么样的松针感觉没什么特别的地方,模拟就行了,但是赛时写拉了,只拿了19分#includeusingnamespacestd
HL0614SC
·
2025-02-24 10:49
算法
c++
暑期集训周报(第一周)
第☝️周
训练
内容个人赛为主,加上题单的练习,主要的算法包括二分,三分,栈,队列,01分数规划等等。
HL0614SC
·
2025-02-24 10:19
算法
蓝桥杯-算法
训练
-无聊的逗c++
问题描述逗志芃在干了很多事情后终于闲下来了,然后就陷入了深深的无聊中。不过他想到了一个游戏来使他更无聊。他拿出n个木棍,然后选出其中一些粘成一根长的,然后再选一些粘成另一个长的,他想知道在两根一样长的情况下长度最长是多少。输入格式第一行一个数n,表示n个棍子。第二行n个数,每个数表示一根棍子的长度。输出格式一个数,最大的长度。样例输入41231样例输出3数据规模和约定n<=15解题思路观察这道题,
懵懂1111
·
2025-02-24 10:48
蓝桥杯
职场和发展
LLM的MoE架构的“动态路由”为什么能
训练
出来?
互联网各领域资料分享专区(不定期更新):Sheet正文大型语言模型(MoE)架构中的“动态路由”之所以能够被有效
训练
,关键在于其设计融合了可微分的路由机制、专家协同优化以及负载均衡约束。
互联网之路.
·
2025-02-24 09:46
知识点
架构
适用于呼叫中心质检的离线ASR模型
优势:预
训练
模型基于AIShell等中文数据集,准确率高。低延迟,适合实时处理(如质检中的实时监控)。支持GPU/CPU部署,提供Python和C++接口。部署
狂爱代码的码农
·
2025-02-24 08:07
VOIP那些事
容器
DeepSeek模型微调的原理和方法
预
训练
模型在大规模通用数据上进行了无监督或有监督的
训练
,学习到了丰富的语言知识、语义表示和通用模式。这些知识和模式具有一定的通用性,可以迁移到其他相关的任务中。
alankuo
·
2025-02-24 07:01
人工智能
垂类大模型微调(二):使用LLaMA-Factory
上一篇博文和大家一起安装了LLaMA-Factory工具,并下载了大模型在上面进行了简单的加载和推理,今天尝试通过LoRa技术对大模型进行微调;一、
训练
集准备1.1介绍
训练
集结构这里演示对Qwen2.5
CITY_OF_MO_GY
·
2025-02-24 07:00
从零到亿大模型微调
llama
Yolov8-pose:从零开始
训练
Yolov8关键点检测模型
/ultralytics#创建预
训练
模型文件夹,并下载关键点检测预
训练
模型mkdirweightscd.
CITY_OF_MO_GY
·
2025-02-24 07:00
YOLO
深度学习
人工智能
RAG+LLM和直接将整理的知识
训练
到模型中去有什么区别,各自有什么优缺点
1.RAG(Retrieval-AugmentedGeneration)+LLM(LargeLanguageModel)概念RAG是将信息检索与生成模型相结合的一种方法。具体来说,RAG会从一个知识库(如数据库、文档库、向量数据库等)中检索相关的信息片段或条目,然后将这些信息与输入的查询一起传递给一个生成模型(如GPT、T5、BERT等)进行回答生成。这个过程通常包括以下步骤:检索:从一个知识库中
MonkeyKing.sun
·
2025-02-24 06:54
RAG+LLM
训练模型
覆盖从供应、生产、销售到运营的全过程,引领行业数智化转型新方向的智慧快消开源了
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心
训练
和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-24 04:39
开源
人工智能
自动化
音视频
能源
GPU与FPGA加速:硬件赋能AI应用
然而,
训练
和部署AI模型需要大量计算资源,这对传统的CPU架构提出了巨大挑战。1.2硬件加速的必要性为满足AI算法对计算能力的巨大需求,硬件加速技术应运而生。专用硬件如GPU(图形
AI天才研究院
·
2025-02-24 01:20
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
LLaMA-Factory|微调大语言模型初探索(3),qlora微调deepseek记录
QLoRA通过反量化到BF16进行
训练
,在保持计算精度的同时,进一步节省显存和提高效率。QLoRA在加载、
训练
、以及权重
闻道且行之
·
2025-02-24 01:49
自然语言处理
语言模型
人工智能
qlora微调
llama
deepseek
手撸 chatgpt 大模型:单词向量化编码和绝对位置编码算法
最初,向量中的各个字段会被初始化为随机数,然后通过大量的数据和深度学习模型来
训练
这些向量。
训练
过程逐步改变向量字段的值,从而使这些字段包含某种“知识”。
coding 迪斯尼
·
2025-02-24 00:11
chatgpt
算法
人工智能
大语言模型
TikTok运营的思路和思维
一是舍不得用好的设备
训练
营里我推荐用苹果7及以上手机,不要用安卓,并用astrill作为上网环境,我自己在用,很O
TIKTOKHEZI
·
2025-02-23 23:37
新媒体运营
产品运营
内容运营
流量运营
用户运营
立体匹配常用数据集整理
文章目录前言一、常用数据集1.SceneFlow数据集2.KITTI数据集3.Middlebury数据集二、关于自己构建数据集
训练
的一些问题前言本文主要对立体匹配算法常用的公开数据集进行整理,包括数据集的简要介绍和下载链接
Scurry﹉
·
2025-02-23 21:18
人工智能
深度学习
计算机视觉
目前(2025年2月)计算机视觉(CV)领域一些表现优异的深度学习模型
PaLI:这是一个多模态模型,结合了40亿参数的视觉Transformer(ViT)和多种大型语言模型(LLM),并在包含100多种语言的100亿图像和文本数据集上进行
训练
。PaLI在图像描述、视
空空转念
·
2025-02-23 20:18
深度学习系列
计算机视觉
深度学习
人工智能
当你给大模型一段输入之后,它是怎么得到答案的
2.动用毕生所学(模型“回想”知识)大模型并不是真有一个“数据库”,而是依靠
训练
时海量的知识联结:(类似人类的经验积累)内在规律:从上学过的教材、论文、百科中记住过“地球自转导致太阳视运动”这个常识。
牛不才
·
2025-02-23 19:37
000-大模型
chatgpt
AIGC
文心一言
gpt
llama
agi
prompt
图像处理:模拟色差的生成
但在实际生产环境中,瓷砖色差检测的数据量较少,无法直接获取足够的数据来
训练
和优化深度学习模型。于是就考虑通过人为生成色差数据的方式来扩充数据集,进行色差的模拟。1.什么是色差?
何以为皇
·
2025-02-23 18:33
图像处理
人工智能
大学生创新
训练
项目经验分享
前几天有同学问我能不能写一个科研竞赛什么的经验贴,给新生们分享一下,正好最近事情不是很多,所以打算写一个关于大创申报的帖子,供有需要的同学参考。本人计算机学院22级的学生,大二下学期的时候申报的大创项目,然后顺利拿到了2024年大创国家级重点立项,(PS:学校共立项481项,其中仅2个国家级重点项目。一、回顾本人的准备过程(仅供参考)大一下学期的时候,了解到有大创这个平台,也希望自己本科阶段,能够
菜就多练@Jade
·
2025-02-23 18:32
创业创新
如何在 Hugging Face 上下载和使用模型—全面指南
无论你是从事学术研究还是在工业中应用NLP技术,HuggingFace都为你提供了丰富的预
训练
模型和工具库,这些资源大大加速了NLP任务的开发和部署。
Hello.Reader
·
2025-02-23 18:01
人工智能
python语言
运维
人工智能
机器学习
ai
谁掌握了体育数据的密码就是胜利者
这种转变不仅改变了球队的
训练
和比赛策略,更深刻地影响着体育产业的发展方向。一、数据采集:竞技体育的数字化基础现代体育数据的采集已经形成了完整的生态系统。在NBA赛场上,每块场地安装的6个追踪摄
翱翔的猪脑花
·
2025-02-23 17:54
服务器
运维
前端
AI如何预测比赛结果:体育预测技术全解析
一、系统架构设计1.整体架构数据采集层数据处理层模型
训练
层预测服务层应用展示层2.技术选型Python3.8+TensorFlow/PyTorchScikit-learnPandas/NumpyFlask
翱翔的猪脑花
·
2025-02-23 17:54
人工智能
Python+Spark地铁客流数据分析与预测系统 地铁大数据 地铁流量预测
本系统基于大数据设计并实现成都地铁客流量分析系统,使用网络爬虫爬取并收集成都地铁客流量数据,运用机器学习和时间序列分析等方法,对客流量数据进行预处理和特征选择,构建客流量预测模型,利用历史数据对模型进行
训练
和优化
qq_79856539
·
2025-02-23 16:16
javaweb
大数据
python
spark
大语言模型
训练
数据集格式
1.SFT(有监督微调)的数据集格式对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落
香菜烤面包
·
2025-02-23 16:13
#
AI
大模型
语言模型
人工智能
深度学习
大模型
训练
&& 微调数据格式
对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。
comli_cn
·
2025-02-23 16:43
大模型笔记
人工智能
大模型
通俗理解Test time Scaling Law、RL Scaling Law和预
训练
Scaling Law
一、ScalingLaw解释1、预
训练
阶段的ScalingLaw(打地基阶段)通俗解释:就像建房子时,地基越大、材料越多、施工时间越长,房子就能盖得越高越稳。
老A的AI实验室
·
2025-02-23 16:12
#
【LLM】
人工智能
chatgpt
深度学习
LLM
agi
算法
RL
Python基础
训练
100题(带答案)
文末有彩蛋!!!Python3100例实例001:数字组合题目有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少?程序分析遍历全部可能,把有重复的剃掉。total=0foriinrange(1,5):forjinrange(1,5):forkinrange(1,5):if((i!=j)and(j!=k)and(k!=i)):print(i,j,k)total+=1pri
乔代码嘚
·
2025-02-23 16:12
python
开发语言
算法
大语言模型:从开发到运行的深度解构
一、LLM开发
训练
的全流程解析1.数据工程的炼金术数据采集:构建涵盖网页文本(CommonCrawl)、书籍、论文、代码等领域的超大规模语料库,典型规模可达数十TB。
nbsaas-boot
·
2025-02-23 15:38
语言模型
人工智能
自然语言处理
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他