E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPT训练
YOLO
训练
指南(以V3为例)
YOLO
训练
指南(以V3为例)前言了解yolo3https://cloud.tencent.com/developer/news/76803https://www.bilibili.com/video/
niuTaylor
·
2025-03-11 16:28
YOLO
目标检测
深度学习
机器学习
深度学习:偏差和方差
高偏差模型的
训练
误差和测试误差可能都较高。解决方法:增加模型复杂度:例如增加多项式的阶数、增加神经网络的层数等。使用更多的
壹十壹
·
2025-03-11 16:25
深度学习
深度学习
人工智能
python
机器学习
《颠覆认知,我用大模型+Redis实现SQL智能补全,开发效率暴涨500%》
一、前言:当SQL补全遇到大模型(插入传统SQL补全工具与Chat
GPT
对比图)你是否还在为这些场景抓狂?
煜bart
·
2025-03-11 15:21
mysql
AI编程
人工智能
redis
《 YOLOv5、YOLOv8、YOLO11
训练
的关键文件:data.yaml文件编写全解》
走进YOLOv5、YOLOv8、YOLO11的data.yaml在计算机视觉领域的广袤星空中,目标检测无疑是一颗璀璨的明星,它广泛应用于自动驾驶、智能安防、工业检测、医疗影像分析等众多关键领域,发挥着不可或缺的作用。而YOLO系列算法,更是以其独特的“一次看全(YouOnlyLookOnce)”理念和卓越的性能,在目标检测领域中独树一帜,成为了众多研究者和开发者的首选工具。从最初的YOLOv1横空
空云风语
·
2025-03-11 15:51
人工智能
YOLO
机器视觉
目标跟踪
人工智能
计算机视觉
YOLO
基于transformer实现机器翻译(日译中)
文章目录一、引言二、使用编码器—解码器和注意力机制来实现机器翻译模型2.0含注意力机制的编码器—解码器2.1读取和预处理数据2.2含注意力机制的编码器—解码器2.3
训练
模型2.4预测不定长的序列2.5评价翻译结果三
小白_laughter
·
2025-03-11 15:46
课程学习
transformer
机器翻译
深度学习
AI大模型零基础金融人如何一周自学大模型,从零基础到入门,看这篇就够了!
如果说2022年Chat
GPT
横空出世把人工智能的发展带上了一个新的台阶,那么2024年末,大模型对工作、生活的全面“侵入”让我们越来越接近库兹韦尔所描述的那个奇点时刻。
冻感糕人~
·
2025-03-11 13:03
人工智能
金融
AI大模型
LLM
大模型技术
大模型学习路线
大模型基础
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language
本文提出SeisMoLLM,这是首个利用跨模态迁移进行地震监测的基础模型,它无需在地震数据集上进行直接预
训练
,就能充分发挥大规模预
训练
大语言模型的强大能力。
UnknownBody
·
2025-03-11 12:29
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
【每日一题 | 2025】3.3 ~ 3.9
个人主页:Guiat归属专栏:每日一题文章目录1.【3.3】10387[蓝桥杯2024省A]
训练
士兵2.【3.4】P8601[蓝桥杯2013省A]剪格子3.【3.5】P9241[蓝桥杯2023省B]飞机降落
Guiat
·
2025-03-11 12:58
每日一题
每日一题
Llama3.1是AI界的Linux?先部署起来再说!
从纸面数据来看,Llama3.1超大杯已经能跟
GPT
-4Omni、Claude3.5Sonnet分庭抗礼了。而中杯和大杯更是将同量级的对手摁在地上摩擦。要知道,Llama的对手可是闭源模型啊工友们!
AI大模型探索者
·
2025-03-11 12:25
人工智能
linux
运维
语言模型
ai
LLama
llama
使用LangChain访问个人数据第一章-简介
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习Chat
GPT
的同学请查看搭建基于Chat
GPT
的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序正文在大数据时代
明志刘明
·
2025-03-11 12:24
大模型学习手册
langchain
使用LangChain访问个人数据第八章-总结
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习Chat
GPT
的同学请查看搭建基于Chat
GPT
的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序本部分前几个章节请查看使用
明志刘明
·
2025-03-11 12:24
大模型学习手册
langchain
人工智能
基于 LangChain 开发应用程序第一章-简介
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习Chat
GPT
的同学请查看搭建基于Chat
GPT
的问答系统本部分章节目录如下:基于LangChain开发应用程序第一章-简介基于LangChain
明志刘明
·
2025-03-11 12:23
大模型学习手册
langchain
人工智能
【Hugging Face】transformers 库中 model 的常用方法和属性
HuggingFacetransformers库中model的常用方法和属性在transformers库中,model代表预
训练
的Transformer模型,可用于文本分类、问答、文本生成等任务。
彬彬侠
·
2025-03-11 11:53
Hugging
Face
model
模型的属性和方法
transformers
Hugging
Face
python
【Hugging Face】transformers 库中 model.generate() 方法:自回归模型的文本生成方法
HuggingFacemodel.generate方法model.generate是transformers库中的文本生成(TextGeneration)方法,适用于自回归模型(如
GPT
-2、T5、BART
彬彬侠
·
2025-03-11 11:52
Hugging
Face
model.generate
transformers
Hugging
Face
文本生成
自回归模型
GPT
LLAMA
知识蒸馏论文精选——《Graph-Free Knowledge Distillation for Graph Neural Networks 》
Graph-FreeKnowledgeDistillationforGraphNeuralNetworks》2021作者是XiangDeng和ZhongfeiZhang,来自纽约州立大学宾汉姆顿分校论文地址见文末摘要知识蒸馏(KnowledgeDistillation,KD)通过强制学生网络模仿在
训练
数据上预
训练
老师网络的输出
宇直不会放弃
·
2025-03-11 11:20
GKD-Output
layer
人工智能
数据挖掘
机器学习
深度学习
神经网络
cnn
pytorch
HarmonyNext实战案例:基于ArkTS的高性能分布式机器学习应用开发
通过分布式机器学习,开发者可以充分利用多设备的计算资源,实现复杂模型的
训练
与推理。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的分布式机器学习应用,涵盖从基础概念到高级技巧的全面讲解。
·
2025-03-11 11:52
harmonyos-next
成功案例丨开发时间从1小时缩短到3分钟:如何利用历史数据
训练
AI模型,预测设计性能?
在其首个AI驱动项目——摩托车把手设计优化中,Hero采用了PhysicsAI™几何深度学习解决方案,利用历史数据
训练
AI模型并预测设计性能。A
Altair澳汰尔
·
2025-03-11 11:45
PhysicsAI
仿真
AI
机器学习
HyperWorks
数据分析
关于两次项目的学习感悟
经过这两次项目,我学到了以下几点:1.模块化与结构化思维:代码展示了如何将深度学习任务分解为多个模块(如数据加载、模型定义、
训练
循环、评估等)。
罗婕斯特
·
2025-03-11 10:43
大数据
QPython双核攻略:从零基础到AI开发,你的手机就是全栈
训练
营
主题一:《编程小白必看!在手机上种下你的第一行代码》✨北京优趣天下信息技术有限公司重磅出品我们比谁都清楚:✔️86%的初学者因环境配置放弃编程✔️72%的上班族只有碎片化学习时间✔️95%的自学者需要即时答疑支持为什么QPython成为2025现象级学习工具?▸全栈开发环境:解释器+编辑器+控制台三合一▸AI导师常驻:集成DeepSeek代码助手(支持中英双语提问)▸极速学习路径:Q派课程7天完成
程之编
·
2025-03-11 09:39
python
开发语言
青少年编程
人工智能
大语言模型原理基础与前沿 双层路由多模态融合、多任务学习和模块化架构
随着
GPT
-3、BERT等模型的出现,大语言模型在各种任务中展现出了惊人的性能。然而,随着模型规模的不断扩大和应用场景的
AI智能涌现深度研究
·
2025-03-11 09:07
AI大语言模型和知识图谱融合
Python入门实战
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
“大语言模型微调”(Fine-tuning)与“大语言模型应用”(LLM Applications)之间的区别
1.概念与定义大语言模型微调微调指的是在一个经过大规模预
训练
的通用语言模型基础上,利用针对性较强的小规模数据集对模型进行进一步
训练
,从而使模型在特定领域或任务上表现得更优秀。
AI Echoes
·
2025-03-11 09:06
人工智能
机器学习
深度学习
大模型
GPT
辅助学习解释代码-HttpSession 监听器
本文主题大模型解释代码。最近在接触旧项目代码是往往没有注释,或者是注释和代码对应不上,这样对于了解业务逻辑,以及后期的改造开发造成了很大的困扰。尽然大模型这么强大,我们尝试下用大模型来解释代码。以下是大模型对项目代码中的HttpSession监听器的代码解释,很高效的方式,可以借鉴。代码解析这段代码定义了WebHttpSessionListener类,它是一个HttpSession监听器,用于监听
ahauedu
·
2025-03-11 09:05
前沿技术与趋势
gpt
Python第十六课:深度学习入门 | 神经网络解密
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的
训练
过程掌握防止过拟合的基础策略一、神经网络基础(大脑的数字化仿生)1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和
程之编
·
2025-03-11 09:03
Python全栈通关秘籍
python
神经网络
青少年编程
【大模型开发】Megatron-LM 深度解析:原理、应用与代码实现
所有内容基于Megatron-LM官方实现(GitHub:NVIDIA/Megatron-LM),并结合大规模模型
训练
的关键理念进行介绍。
云博士的AI课堂
·
2025-03-11 08:27
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型开发
Hugging
Face
大模型生态
机器学习
Megatron-LM
并行训练
大模型加速
【大模型开发】深入解析 DeepSpeed:原理、核心技术与示例代码
深入解析DeepSpeed:原理、核心技术与示例代码DeepSpeed是由微软开源的高性能深度学习
训练
优化引擎,专注于帮助研究人员和工程团队在分布式环境中高效地
训练
超大规模模型。
云博士的AI课堂
·
2025-03-11 08:57
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型开发
大模型微调
deepseek
deepspeed
python
人工智能
pytorch
【大模型开发】大模型背后的基础组件与生态概览
支撑大模型开发与部署的关键组件与生态系统当今大模型(LLM,LargeLanguageModel)在工业与学术界的应用日益广泛,从Chat
GPT
、BERT到DeepSeek等新兴模型,背后离不开一整套成熟的技术生态和工具链支持
云博士的AI课堂
·
2025-03-11 08:56
深度学习
哈佛博后带你玩转机器学习
大模型技术开发与实践
大模型开发
Hugging
Face
DeepSpeed
大模型生态
机器学习
深度学习
大模型技术栈
一学就会的深度学习基础指令及操作步骤(6)迁移学习
文章目录迁移学习模型准备数据增强模型
训练
模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上,以提高新任务的学习效率和性能。
小圆圆666
·
2025-03-11 07:49
深度学习
迁移学习
人工智能
卷积神经网络
领域大模型之微调技术和最佳实践
BERT和
GPT
-3等语言模型针对语言任务进行了预
训练
。微调使它们适应特定领域,如营销、医疗保健、金融。在本指南中,您将了解LLM架构、微调过程以及如何为NLP任务微调自己的预
训练
模型。
程序员莫玛
·
2025-03-11 07:17
人工智能
深度学习
语言模型
金融
学睿德毅育贤才,AI 剪辑绽华彩
“小白AI短视频
训练
营”,恰似一把钥匙,为零基础学员开启AI短视频创作的大门。在这里,学员能够借助AI技术,探索记录生活的全新视角,以独特的剪辑手法展现生活的精彩
互联网之声
·
2025-03-11 06:13
人工智能
AI 技术 引入 RTK(实时动态定位)系统,可以实现智能化管理和自动化运行
通过历史数据
训练
模型,实现快速解算。实例:某无人机公司使用A
小赖同学啊
·
2025-03-11 06:39
人工智能
低空经济
人工智能
自动化
运维
我与DeepSeek的深度实践:重新定义智能编程的边界
引言:从质疑到依赖的认知跃迁在Chat
GPT
掀起AI编程革命之初,我曾对代码生成工具持保留态度。直到2023年接触DeepSeek,这个来自中国的AI编程助手彻底改变了我的开发模式。
一叶孤舟111
·
2025-03-11 05:33
python
人工智能
如何对大模型进行微调?从原理到实战全解析
微调指在预
训练
大模型(如
GPT
-3.5、LLaMA)的基础上,使用特定领域的数据进行二次
训练
,使模型适应新任务或领域需求。
挣扎与觉醒中的技术人
·
2025-03-11 05:32
人工智能
外包转型
集成学习
chatgpt
gpt-3
软件工程
在LangChain中运行Replicate模型的实用指南
##技术背景介绍Replicate是一个平台,可以轻松调用各种预
训练
的AI模型。与传统的模型托管和调用相比,Replicate提供了简单的API接口,使开发者能够快速集成和使用强大的AI模型。
fgayif
·
2025-03-11 04:50
langchain
人工智能
python
《Chat
GPT
Prompt Engineering for Developers》课程-提示词原则
一、环境配置本教程使用OpenAI所开放的Chat
GPT
API,因此你需要首先拥有一个Chat
GPT
的API_KEY(也可以直接访问官方网址在线测试),然后需要安装openai的第三方库首先需要安装
evil-tomato
·
2025-03-11 02:09
LLM
chatgpt
人工智能
python
ai
AI Prompt 提示词工程入门指南:新手小白快速上手
近年来,人工智能(AI)发展迅猛,特别是大语言模型(LLMs)(如Chat
GPT
、Claude、Gemini、Llama等)的广泛应用,让人们可以用自然语言与AI进行互动。
机器学习司猫白
·
2025-03-11 02:37
人工智能
prompt
清华、北大DeepSeek使用手册:8本,698页大合集
链接:https://pan.quark.cn/s/79b8b14e2c56以前看了很多教程,都感觉特别花哨,没啥干货,大部分就是把
GPT
的说明书稍微改改,就拿来用在DeepSeek上了,没啥用。
2501_90850576
·
2025-03-11 01:58
人工智能
pdf
3.10 项目总结
今天的项目是一个使用PyTorch框架构建和
训练
神经网络的实例,旨在实现手写数字识别。以下是项目的总结、内容分析以及优化建议:项目总结1.目标:使用神经网络对MNIST数据集中的手写数字进行分类。
不要不开心了
·
2025-03-11 01:58
pyqt
深度学习
机器学习
数据挖掘
人工智能
点云语义分割:PointNet++在S3DIS数据集上的
训练
点云语义分割:PointNet++在S3DIS数据集上的
训练
点云语义分割是计算机视觉领域的一个重要任务,旨在将点云数据中的每个点分配给其对应的语义类别。
完美代码
·
2025-03-11 00:25
3d
neo4j
点云
windows11家庭版安装ubuntu子系统
训练
深度模型
文章目录环境准备前提条件安装环境安装Hyper-V安装Linux分发版升级WSL内核启用虚拟机功能安装ubuntu24.04安装桌面环境安装远程控制软件xrdp从Windows启动桌面版Ubuntu环境准备前提条件windows机器需要支持虚拟化,并且需要在BIOS中开启虚拟化技术,因为WSL2基于hyper-V,查看是否开启虚拟化:按住Windows+R输入cmd打开命令行,输入systemin
吃水果不削皮
·
2025-03-10 23:16
ubuntu
linux
windows
在Ubuntu系统下部署大语言模型
前言在Ubuntu系统下部署大语言模型,可以使用HuggingFace的Transformers库来加载和使用预
训练
的模型。
脱泥不tony
·
2025-03-10 22:39
ubuntu
语言模型
linux
人工智能
大数据
产品经理
transformer
机器学习算法(2)—— 线性回归算法
82,80],[85,78],[90,90],[86,82],[82,90],[78,80],[92,94]]y=[84.2,80.6,80.1,90,83.2,87.6,79.4,93.4]‘’‘模型
训练
疯狂的石头。
·
2025-03-10 21:35
算法
机器学习
线性回归
vllm多卡部署Qwen2.5-72B-Instruct-
GPT
Q-Int4
双卡v10032G部署结果如下,推理时长16s3卡,tensor_parallel_size=3,tensor并行的数量一定要能被attentionheads整除4卡,tensor_parallel_size=4,推理速度4s
Yanc_L
·
2025-03-10 20:54
人工智能
Compressed Channel Estimation for Intelligent Reflecting Surface-Assisted Millimeter Wave Systems
为了减少
训练
开销,利用了毫米波信
No_one-_-2022
·
2025-03-10 20:21
移动天线优化
算法
学习
Chat
GPT
o1与
GPT
-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro的比较
全新的Chat
GPT
o1模型(代号“Strawberry”)是OpenAI的最新进展,专注于以前的AI模型难以应对的领域:高层次推理、数学和复杂编程。
开发者每周简报
·
2025-03-10 20:18
chatgpt
人工智能
gpt
Voice Translation of Audio Files into Different Languages Using
Gpt
-4o
openai-cookbook/examples/voice_solutions/voice_translation_into_different_languages_using_
GPT
-4o.ipynbatmain
开发者每周简报
·
2025-03-10 20:18
ffmpeg
人工智能
文本向量化-词嵌入方法系列1:静态词嵌入(Word2Vec+GloVe)
静态词嵌入有Word2Vec,Sen2Vec,Doc2Vec,以及GloVe模型;而动态词嵌入有ELMO,Transformer,
GPT
,Bert和XLNet等等。
学习ml的小菜鸡
·
2025-03-10 19:15
nlp
自然语言处理
word2vec
AI产品大模型学习指南:清晰路线,AI产品经理必备知识点一网打尽!_AI产品经理
实际上AI只是一种对传统产品或服务赋能的手段而已,将各种“中间件”(通常是一种
训练
好的模型,当输入一定数据后自动返回一定的输出值)、传感器等不同形式的软件、硬件融入传统产品或服务的使用或体验流程中。
AGI大模型学习
·
2025-03-10 18:38
人工智能
产品经理
LLM
大模型学习
学习
知识图谱
AI产品经理
Training-Free Transformer Architecture Search WithZero-Cost Proxy Guided Evolution(预览版本)
为了提高搜索效率,基于无
训练
代理的方法已在神经架构搜索(NAS)中得到广泛采用。然而,这些代理被发现不足以很好地推广到Transformer搜索空间,这一点已被多项研究和我们自己的实
境心镜
·
2025-03-10 18:05
transformer
深度学习
人工智能
用双色球数据集微调后的大模型
最近用Qwen/Qwen1.5-1.8B-Chat大模型来微调
训练
双色球2003001-2025011的数据集,实验测一下大模型出球的预测情况。
qq_29790801
·
2025-03-10 17:33
人工智能
NLP
深度学习项目十一:mmdetection
训练
自己的数据集
mmdetection
训练
自己的数据集这里写目录标题mmdetection
训练
自己的数据集一:环境搭建二:数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式
小啊磊_Vv
·
2025-03-10 17:02
深度学习和视觉项目实战
目标跟踪
人工智能
计算机视觉
python
深度学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他