E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
socket模型
使用PyTorch搭建Transformer神经网络:入门篇
本教程将指导您使用PyTorch框架从头开始构建一个Transformer
模型
。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。
DASA13
·
2025-03-23 00:21
pytorch
transformer
神经网络
解析大
模型
归一化:提升训练稳定性和性能的关键技术
引言在深度学习领域,特别是在处理大型神经网络
模型
时,归一化(Normalization)是一项至关重要的技术。它可以提高
模型
的训练稳定性和性能,在加速收敛方面发挥了重要作用。
秋声studio
·
2025-03-23 00:19
口语化解析
深度学习
人工智能
大模型归一化
PyTorch数据归一化处理:transforms
torchvision.transforms:常用的图像预处理方法*torchvision.datasets:常用的数据集Dataset实现*torchvision.models:常用的CV(预训练)
模型
实现
2401_87555420
·
2025-03-22 23:48
pytorch
人工智能
python
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践
一、引言:
模型
泛化能力的核心挑战在深度学习
模型
开发中,欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计,工业级深度学习项目中有63%的失败案例与这两个问题直接相关。
古月居GYH
·
2025-03-22 22:43
深度学习
人工智能
OpenManus 架构的详细技术实现
一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层:LLM层
模型
选择与适配:OpenManus允许用户替换底层LLM(如mPLUG-Owl3、Qwen、Llama等),通过统一接口调用
模型
大势下的牛马
·
2025-03-22 22:12
搭建本地gpt
架构
OpenManus
Manus
Agent
WRF移动嵌套结合伏羲
模型
与CFD(PALM)高精度多尺度降尺度分析研究
本文将详细介绍如何使用WRF移动嵌套技术结合伏羲(Fuxi)
模型
,并通过CFD
模型
PALM实现精细化降尺度,以满足城市或区域局地精细化气象预报的需求。
Hardess-god
·
2025-03-22 22:10
WRF
算法
人工智能
深入探讨盘古大
模型
的高精度多尺度能力
随着人工智能技术的快速发展,大
模型
的研究逐渐进入新的阶段。其中,盘古大
模型
以其卓越的高精度和多尺度处理能力成为研究热点。
Hardess-god
·
2025-03-22 22:40
WRF
人工智能
算法
使用Ollama部署开源大
模型
Ollama是一个简明易用的本地大
模型
运行框架,可以一键启动启动并运行Llama3、Mistral、Gemma和其他大型语言
模型
。安装MacOS,Windows用户直接在官网下载页下载安装包即可。
好好学习 666
·
2025-03-22 22:09
开源
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
用上该算法后,Qwen2.5-32B
模型
只经过RL训练,不引入蒸馏等其他技术,在AIME2024基准上拿下50分,优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen,且
·
2025-03-22 22:24
量子位
量子位招聘 | DeepSeek帮我们改的招聘启事
如果你与我们志同道合,对AI大
模型
、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。
·
2025-03-22 22:54
量子位
AI巨浪中的安全之舵:天空卫士助力人工智能落地远航
近期,众多企业纷纷接入DeepSeek大
模型
,迅速推动了大型
模型
应用的广泛铺开。
天空卫士
·
2025-03-22 22:09
人工智能
安全
数据安全
网络安全
大数据
CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读
ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的
模型
适用性在
Laughing-q
·
2025-03-22 22:38
论文阅读
深度学习
人工智能
目标检测
实例分割
transformer
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测,从安装依赖项、准备数据集、配置YOLOv8、训练和评估
模型
以及构建GUI应用程序展示检测
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测,从安装依赖项、准备数据集、配置YOLOv8、训练和评估
模型
以及构建GUI应用程序展示检测文章目录1.安装依赖2.数据准备3.配置YOLOv83.1
计算机C9硕士_算法工程师
·
2025-03-22 22:08
人工智能
YOLO
目标检测
遥感
TCP异步通信_服务端
usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Net;usingSystem.Net.
Socket
s;
DamnF--
·
2025-03-22 21:07
Unity网络开发基础
tcp/ip
网络协议
网络
机器学习结合伏羲
模型
高精度多尺度气象分析与降尺度实现
本文详细探讨如何结合机器学习(ML)和伏羲
模型
进行高精度多尺度气象模拟分析,并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标:结合机器学习
模型
与伏羲气象模式,实现区域和局地高精度降尺度。
Hardess-god
·
2025-03-22 21:07
WRF
算法
人工智能
LLM的工具调用能力(如Function Calling)
LLM的工具调用能力(如FunctionCalling)是增强大
模型
实用性的核心技术,使其能够通过生成结构化指令与外部系统交互。
maxmaxma
·
2025-03-22 21:35
前端
javascript
开发语言
MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导
前文请移步笔者的另一篇博客:大
模型
训练为什么选择交叉熵损失(Cross-EntropyLoss):均方误差(MSE)和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE(均方误差)的梯度特性
阿正的梦工坊
·
2025-03-22 21:34
Machine
Learning
Deep
Learning
分类
人工智能
深度学习
机器学习
使用Python和LangChain构建检索增强生成(RAG)应用的详细指南
使用Python和LangChain构建检索增强生成(RAG)应用的详细指南引言在人工智能和自然语言处理领域,利用大语言
模型
(LLM)构建复杂的问答(Q&A)系统是一个重要应用。
m0_57781768
·
2025-03-22 21:33
python
langchain
搜索引擎
学习111
项目名称项目简介主要功能技术原理GitHub地址browser-use智能浏览器工具,让AI像人类一样操作浏览器,实现网页自动化网页浏览与操作、多标签页管理、视觉识别与内容提取、操作记录与重复执行、自定义动作支持、主流LLM
模型
支持为大语言
模型
服务的创新
麋鹿叔叔
·
2025-03-22 21:31
学习
使用LangChain实现基于LLM和RAG的PDF问答系统
目录前言一.大语言
模型
(LLM)1.什么是LLM?2.LLM的能力与特点二、增强检索生成(RAG)三.什么是LangChain?
张同学吧
·
2025-03-22 20:00
langchain
语言模型
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践
第一章、ChatGPT、DeepSeek大语言
模型
提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大
模型
?
weixin_贾
·
2025-03-22 20:59
防洪评价
风险评估
滑坡
泥石流
地质灾害
AI 赋能应急管理:ChatGPT、DeepSeek、Grok 的应用探索
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能(AI)技术的快速发展,大语言
模型
(LLM)在应急管理领域的应用逐步扩大。
一ge科研小菜菜
·
2025-03-22 20:58
人工智能
人工智能
DeepSeek的崛起:2025新春国产AI
模型
的全球影响力
摘要在2025年新春之际,国产AI
模型
DeepSeek以现象级的姿态迅速崛起,凭借免费、易用及高性能的特点,吸引了全球科技界的广泛关注。
耶耶Norsea
·
2025-03-22 20:27
网络杂烩
人工智能
百度
一文说清楚什么是预训练(Pre-Training)、微调(Fine-Tuning),零基础小白建议收藏!!
前言预训练和微调是现代AI
模型
的核心技术,通过两者的结合,机器能够在处理复杂任务时表现得更为高效和精准。预训练为
模型
提供了广泛的语言能力,而微调则确保了
模型
能够根据特定任务进行细化和优化。
小城哇哇
·
2025-03-22 20:26
人工智能
语言模型
AI大模型
大模型微调
预训练
agi
LLM
每天分析一个开源项目:open_deep_research
它模拟了OpenAI和Gemini的DeepResearch流程,但提供了更强的自定义能力,允许用户配置
模型
、Prompt、报告结构
申非zz
·
2025-03-22 20:56
LLM
github
开源
ONE Deep
模型
:LG AI Research的开源突破
摘要由LGAIResearch开发的ONEDeep系列开源AI
模型
,参数规模覆盖2.4亿至32亿。经评估,2.4B参数规模的ONEDeep
模型
在性能上优于同类其他
模型
,展现出显著优势。
耶耶Norsea
·
2025-03-22 20:26
网络杂烩
自动化
anythingLLM 使用教程
一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言
模型
,它基于先进的深度学习架构构建,旨在为用户提供多样化的自然语言处理服务。
惟贤箬溪
·
2025-03-22 19:24
穷玩Ai
AIGC
人工智能
GitHub项目推荐--基于LLM的开源爬虫项目
以下是一些基于大语言
模型
(LLM,LargeLanguageModel)的开源爬虫项目,它们结合了自然语言处理(NLP)技术与爬虫的功能,能在一定程度上提升爬取的智能化和精度。
惟贤箬溪
·
2025-03-22 19:24
穷玩Ai
github
爬虫
深度解析大
模型
推理框架:原理、应用与实践
在当今数据驱动的时代,大
模型
推理框架已经成为人工智能领域的重要支柱。
百度_开发者中心
·
2025-03-22 19:24
人工智能
大模型
自然语言处理
大
模型
推理框架:从理论到实践的全面解析
然而,深度学习
模型
的训练和推理过程往往涉及大量数据和复杂计算,传统的计算框架难以满足需求。因此,大
模型
推理框架应运而生,成为解决这一问题的关键。
百度_开发者中心
·
2025-03-22 19:23
人工智能
大模型
自然语言处理
毕业论文代码实验(Python\MATLAB)基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测
模型
一、项目背景1.1光伏功率预测意义在能源结构转型背景下(国家能源局2025规划),光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响,光伏出力具有显著波动性,导致:电网调度难度增加(±15%功率波动)电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合:分钟级辐照度变化与小时级天气模式共存非线性映射关系:气象因素与发电功率呈高阶非线性关系数据模态差异:数值天气预报(NWP
清风AI
·
2025-03-22 19:51
毕业设计代码实现
python
lstm
深度学习
神经网络
人工智能
matlab
pytorch
DeepSeek 部署指南 (使用 vLLM 本地部署)
DeepSeek部署指南(使用vLLM本地部署)本文档将指导您如何使用vLLM在本地部署DeepSeek语言
模型
。
AGI大模型资料分享员
·
2025-03-22 19:51
人工智能
语言模型
学习
chatgpt
深度学习
大模型
deepseek
流数据(Streaming Data)处理
在看代码之前,我们应当首先知道流数据与web
Socket
之间的区别(两者不能同一而论),因为存在区别所以在读取数据时使用相对较大的差距下面我将概述我对两者区别的一个总结(若有不对,请斧正)流数据(StreamingData
人间无人事
·
2025-03-22 19:47
javascript
LLM-Agent方法评估与效果分析
1.引言近年来,随着大型语言
模型
(LLM)的快速发展,基于强化学习(RL)对LLM进行微调以使其具备代理(Agent)能力成为研究热点。
·
2025-03-22 18:50
agent人工智能ai开发
大
模型
学习-让其他电脑可访问本地ollama的
模型
并进行流式响应
目录让其他电脑可访问本地ollama流式响应让其他电脑可访问本地ollama默认情况下,其他电脑不能直接访问本地Ollama服务。解决方法:让Ollama监听局域网地址,而不是localhost我们可以让Ollama监听局域网IP,在Ollama服务器上运行:setOLLAMA_HOST=0.0.0.0:11434ollamaserve注意:这种方式只对当前CMD窗口有效,关闭窗口后就会失效。如果
Gratitute_林腾
·
2025-03-22 17:35
大模型学习
学习
语言模型
软件工程简答题整理
软件工程考试简答题整理瀑布
模型
是软件工程中应用最广泛的过程
模型
,试述采用瀑布
模型
进行软件开发的基本过程,该过程有何特点?
~进无止境~
·
2025-03-22 17:03
软件工程
软件工程
简答题
OSI七层
模型
OSI七层
模型
传输过程当你在微信上发送一句“你吃了吗”时,这条消息会经历一个从你的手机到接收者手机的复杂旅程。这个过程涉及到网络通信中的七层
模型
,即OSI(开放系统互连)
模型
。
_洛_神
·
2025-03-22 17:02
网络协议
大规异构集群 混合并行分布式训练系统,解决算力不均衡问题 HETHUB
视频教程在这:3.2大规模异构集群,混合并行分布式系统,解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因:同一种GPU数量有限难以构建大规模集群:训练大规模
模型
依赖于大量的计算资源
爱串门的小马驹
·
2025-03-22 16:29
万卡大规模集群大模型训练
异构集群
大规模集群
分布式
大模型训练
软件工程简答
通用过程
模型
的定义内容通⽤过程框架定义了5种框架活动——沟通、策划、建模、构建以及部署。⼀系列普适性活动——项⽬跟踪控制
Ruannn(努力版)
·
2025-03-22 16:58
软件工程
【架构设计】前置知识
通过Go学习并发
模型
(Gorouti
GIS程序媛—椰子
·
2025-03-22 16:28
架构设计
架构设计
Windows faster whisper GUI-v0.8.5-开源版[AI支持超过100种语言的人声分离/声音转文本字幕]
pwd=vydu#WindowsfasterwhisperGUI-v0.8.5-开源版[AI支持超过100种语言的人声分离/声音转文本字幕]whisperX+faster-whisper+Demucs把
模型
下载
私人珍藏库
·
2025-03-22 16:27
whisper
Windows
faster
whisper
人声分离
声音转文本
LLM 大
模型
技术知识最佳学习路径图发布!
近日,经常有小伙伴私信我,大
模型
知识太多了,有点懵啊,我该如何学习LLM大
模型
?今天我们就来剖析下LLM大
模型
技术知识的学习路径。
AGI-杠哥
·
2025-03-22 15:54
学习
人工智能
语言模型
agi
自然语言处理
Python异步编程:从基础到高级
Python的异步编程
模型
(基于asyncio)为开发者提供了一种高效的方式来处理高并发任务,而无需依赖多线程或多进程。异步编程不仅可以提高程序的性能,还能简化并发代码的复杂性。
CarlowZJ
·
2025-03-22 15:54
python
网络
数据库
基于Linux的多进程并发服务器设计与实现
系统架构该服务器采用主-从进程
模型
(Master-Worker模式):主进程(Master进程):负责监听客户端连接请求,并将连接
名誉寒冰
·
2025-03-22 15:52
服务器
linux
c++
MiniMind:完全从 0 训练自己的大
模型
是B站UP主近在远方的远开源的一个微型语言
模型
,改进自DeepSeek-V2、Llama3结构,项目包含整个数据处理、pretrain、sft、dpo的全部阶段,包含混合专家(MoE)
模型
。
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
探索Python中的集成方法:Stacking
在机器学习领域,Stacking是一种高级的集成学习方法,它通过将多个基本
模型
的预测结果作为新的特征输入到一个元
模型
中,从而提高整体
模型
的性能和鲁棒性。
Echo_Wish
·
2025-03-22 15:19
Python
笔记
Python
算法
python
开发语言
【Python】 Stacking: 强大的集成学习方法
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中,单一
模型
的性能可能会受到其局限性和数据的影响
音乐学家方大刚
·
2025-03-22 15:19
Python
python
集成学习
开发语言
MiniMind:3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练!
概述MiniMind是一个开源的微型语言
模型
,它的设计目标是让个人GPU用户也能够快速推理甚至训练语言
模型
。它的体积仅为26M,大约是GPT3的1/7000,非常适合快速部署和实验。
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
跟着黑马学MySQL基础篇笔记(1)-概述与SQL
03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据
模型
关系型数据库RDBMS05
小杜不吃糖
·
2025-03-22 15:18
mysql
笔记
sql
Stacking算法:集成学习的终极武器
1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基
模型
,并将它们的预测结果作为新
模型
的输入特征,以此来
civilpy
·
2025-03-22 14:16
算法
集成学习
机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他