E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
反射模型
一切皆是映射:实现神经网络的硬件加速技术:GPU、ASIC(专用集成电路)和FPGA(现场可编程门阵列)
核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.2.1GPU加速3.2.2ASIC加速3.2.3FPGA加速3.3算法优缺点GPUASICFPGA3.4算法应用领域4.数学
模型
和公式
AI天才研究院
·
2025-03-23 02:36
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
NLP高频面试题(七)——GPT和Bert的mask有什么区别?
GPT和BERT的Mask机制对比:核心区别与优化策略在NLP领域,GPT和BERT是最具代表性的预训练语言
模型
之一。
Chaos_Wang_
·
2025-03-23 02:35
NLP常见面试题
自然语言处理
gpt
bert
第三十一篇 数据仓库(DW)与商业智能(BI)架构设计与实践指南
目录一、DW/BI架构核心理论与选型策略1.1主流架构模式对比(1)Kimball维度建模架构(2)Inmon企业工厂架构(3)混合架构二、架构设计方法论与实施步骤2.1维度建模实战指南(1)
模型
选择决策树
随缘而动,随遇而安
·
2025-03-23 02:05
数据库
sql
数据仓库
大数据
数据库架构
揭秘Java内存
模型
:那些让人头疼的可见性问题--JVM基础(15)
一、揭秘Java内存
模型
:那些让人头疼的可见性问题在Java的世界里,多线程编程如同一场精彩的魔术表演,但稍有不慎,就可能陷入“内存可见性”这个魔术黑洞。
guangzhi0633
·
2025-03-23 02:04
java
jvm
开发语言
知识图谱中NLP新技术
以下从核心技术突破、应用场景创新及未来趋势三个层面,系统梳理知识图谱中NLP的最新进展:一、核心技术突破基于预训练
模型
的图谱构建与增强预训练语言
模型
与知识嵌入融合:以BERT、KEPLER为代表的
模型
通过联合优化知识嵌入
魔王阿卡纳兹
·
2025-03-23 02:34
知识图谱入门
大数据治理与分析
知识图谱
自然语言处理
人工智能
微软 LIDA 库:基于大
模型
的自动化数据分析与可视化
微软LIDA库:基于大
模型
的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM推理分析目标LLM生成可视化代码结合图像生成
模型
优化原始数据Summarizer模块结构化摘要
窝窝和牛牛
·
2025-03-23 01:01
microsoft
数据分析
CST Microwave Studio助力射频电路多物理场耦合分析
通过解析射频电路中涉及的电磁场、热场、机械场等多物理场耦合现象,详细介绍如何运用CSTMicrowaveStudio构建多物理场联合
模型
,进行全面的仿真分析。
FindEveryone
·
2025-03-23 01:00
课程设计
逐行讲解大
模型
解码超参数大全(temperature、top-k、top-p等所有参数)
目录简介宏观概览解码策略实现逻辑常见的解码超参数temperature温度系数top_ktop_prepetition_penalty重复惩罚不常见的解码超参数min_ptypical解码ϵ采样η采样Classifier-FreeGuidance(CFG)序列偏置干预HammingDiversity编码器重复惩罚n-gram重复惩罚编码器n-gram重复惩罚bad_token惩罚最小长度限制最小新
Gaffey大杂烩
·
2025-03-23 01:56
大模型
机器学习
人工智能
如何用Function Calling解锁OpenAI的「真实世界」交互能力?(附Node.js 实战)
一、FunctionCalling:大
模型
的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能(对应
模型
版本gpt-3.5-turbo-0613
hongkid
·
2025-03-23 00:54
AI编程
简单理解机器学习中top_k、top_p、temperature三个参数的作用
在机器学习中,top_k、top_p和temperature是用于控制生成
模型
(如语言
模型
)输出质量的参数,尤其在文本生成任务中常见。
无级程序员
·
2025-03-23 00:53
机器学习
人工智能
使用PyTorch搭建Transformer神经网络:入门篇
本教程将指导您使用PyTorch框架从头开始构建一个Transformer
模型
。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。
DASA13
·
2025-03-23 00:21
pytorch
transformer
神经网络
解析大
模型
归一化:提升训练稳定性和性能的关键技术
引言在深度学习领域,特别是在处理大型神经网络
模型
时,归一化(Normalization)是一项至关重要的技术。它可以提高
模型
的训练稳定性和性能,在加速收敛方面发挥了重要作用。
秋声studio
·
2025-03-23 00:19
口语化解析
深度学习
人工智能
大模型归一化
PyTorch数据归一化处理:transforms
torchvision.transforms:常用的图像预处理方法*torchvision.datasets:常用的数据集Dataset实现*torchvision.models:常用的CV(预训练)
模型
实现
2401_87555420
·
2025-03-22 23:48
pytorch
人工智能
python
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践
一、引言:
模型
泛化能力的核心挑战在深度学习
模型
开发中,欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计,工业级深度学习项目中有63%的失败案例与这两个问题直接相关。
古月居GYH
·
2025-03-22 22:43
深度学习
人工智能
OpenManus 架构的详细技术实现
一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层:LLM层
模型
选择与适配:OpenManus允许用户替换底层LLM(如mPLUG-Owl3、Qwen、Llama等),通过统一接口调用
模型
大势下的牛马
·
2025-03-22 22:12
搭建本地gpt
架构
OpenManus
Manus
Agent
WRF移动嵌套结合伏羲
模型
与CFD(PALM)高精度多尺度降尺度分析研究
本文将详细介绍如何使用WRF移动嵌套技术结合伏羲(Fuxi)
模型
,并通过CFD
模型
PALM实现精细化降尺度,以满足城市或区域局地精细化气象预报的需求。
Hardess-god
·
2025-03-22 22:10
WRF
算法
人工智能
深入探讨盘古大
模型
的高精度多尺度能力
随着人工智能技术的快速发展,大
模型
的研究逐渐进入新的阶段。其中,盘古大
模型
以其卓越的高精度和多尺度处理能力成为研究热点。
Hardess-god
·
2025-03-22 22:40
WRF
人工智能
算法
使用Ollama部署开源大
模型
Ollama是一个简明易用的本地大
模型
运行框架,可以一键启动启动并运行Llama3、Mistral、Gemma和其他大型语言
模型
。安装MacOS,Windows用户直接在官网下载页下载安装包即可。
好好学习 666
·
2025-03-22 22:09
开源
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
用上该算法后,Qwen2.5-32B
模型
只经过RL训练,不引入蒸馏等其他技术,在AIME2024基准上拿下50分,优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen,且
·
2025-03-22 22:24
量子位
量子位招聘 | DeepSeek帮我们改的招聘启事
如果你与我们志同道合,对AI大
模型
、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。
·
2025-03-22 22:54
量子位
AI巨浪中的安全之舵:天空卫士助力人工智能落地远航
近期,众多企业纷纷接入DeepSeek大
模型
,迅速推动了大型
模型
应用的广泛铺开。
天空卫士
·
2025-03-22 22:09
人工智能
安全
数据安全
网络安全
大数据
CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读
ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的
模型
适用性在
Laughing-q
·
2025-03-22 22:38
论文阅读
深度学习
人工智能
目标检测
实例分割
transformer
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测,从安装依赖项、准备数据集、配置YOLOv8、训练和评估
模型
以及构建GUI应用程序展示检测
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测,从安装依赖项、准备数据集、配置YOLOv8、训练和评估
模型
以及构建GUI应用程序展示检测文章目录1.安装依赖2.数据准备3.配置YOLOv83.1
计算机C9硕士_算法工程师
·
2025-03-22 22:08
人工智能
YOLO
目标检测
遥感
机器学习结合伏羲
模型
高精度多尺度气象分析与降尺度实现
本文详细探讨如何结合机器学习(ML)和伏羲
模型
进行高精度多尺度气象模拟分析,并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标:结合机器学习
模型
与伏羲气象模式,实现区域和局地高精度降尺度。
Hardess-god
·
2025-03-22 21:07
WRF
算法
人工智能
LLM的工具调用能力(如Function Calling)
LLM的工具调用能力(如FunctionCalling)是增强大
模型
实用性的核心技术,使其能够通过生成结构化指令与外部系统交互。
maxmaxma
·
2025-03-22 21:35
前端
javascript
开发语言
MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导
前文请移步笔者的另一篇博客:大
模型
训练为什么选择交叉熵损失(Cross-EntropyLoss):均方误差(MSE)和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE(均方误差)的梯度特性
阿正的梦工坊
·
2025-03-22 21:34
Machine
Learning
Deep
Learning
分类
人工智能
深度学习
机器学习
使用Python和LangChain构建检索增强生成(RAG)应用的详细指南
使用Python和LangChain构建检索增强生成(RAG)应用的详细指南引言在人工智能和自然语言处理领域,利用大语言
模型
(LLM)构建复杂的问答(Q&A)系统是一个重要应用。
m0_57781768
·
2025-03-22 21:33
python
langchain
搜索引擎
学习111
项目名称项目简介主要功能技术原理GitHub地址browser-use智能浏览器工具,让AI像人类一样操作浏览器,实现网页自动化网页浏览与操作、多标签页管理、视觉识别与内容提取、操作记录与重复执行、自定义动作支持、主流LLM
模型
支持为大语言
模型
服务的创新
麋鹿叔叔
·
2025-03-22 21:31
学习
使用LangChain实现基于LLM和RAG的PDF问答系统
目录前言一.大语言
模型
(LLM)1.什么是LLM?2.LLM的能力与特点二、增强检索生成(RAG)三.什么是LangChain?
张同学吧
·
2025-03-22 20:00
langchain
语言模型
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践
第一章、ChatGPT、DeepSeek大语言
模型
提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大
模型
?
weixin_贾
·
2025-03-22 20:59
防洪评价
风险评估
滑坡
泥石流
地质灾害
AI 赋能应急管理:ChatGPT、DeepSeek、Grok 的应用探索
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能(AI)技术的快速发展,大语言
模型
(LLM)在应急管理领域的应用逐步扩大。
一ge科研小菜菜
·
2025-03-22 20:58
人工智能
人工智能
DeepSeek的崛起:2025新春国产AI
模型
的全球影响力
摘要在2025年新春之际,国产AI
模型
DeepSeek以现象级的姿态迅速崛起,凭借免费、易用及高性能的特点,吸引了全球科技界的广泛关注。
耶耶Norsea
·
2025-03-22 20:27
网络杂烩
人工智能
百度
一文说清楚什么是预训练(Pre-Training)、微调(Fine-Tuning),零基础小白建议收藏!!
前言预训练和微调是现代AI
模型
的核心技术,通过两者的结合,机器能够在处理复杂任务时表现得更为高效和精准。预训练为
模型
提供了广泛的语言能力,而微调则确保了
模型
能够根据特定任务进行细化和优化。
小城哇哇
·
2025-03-22 20:26
人工智能
语言模型
AI大模型
大模型微调
预训练
agi
LLM
每天分析一个开源项目:open_deep_research
它模拟了OpenAI和Gemini的DeepResearch流程,但提供了更强的自定义能力,允许用户配置
模型
、Prompt、报告结构
申非zz
·
2025-03-22 20:56
LLM
github
开源
ONE Deep
模型
:LG AI Research的开源突破
摘要由LGAIResearch开发的ONEDeep系列开源AI
模型
,参数规模覆盖2.4亿至32亿。经评估,2.4B参数规模的ONEDeep
模型
在性能上优于同类其他
模型
,展现出显著优势。
耶耶Norsea
·
2025-03-22 20:26
网络杂烩
自动化
anythingLLM 使用教程
一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言
模型
,它基于先进的深度学习架构构建,旨在为用户提供多样化的自然语言处理服务。
惟贤箬溪
·
2025-03-22 19:24
穷玩Ai
AIGC
人工智能
GitHub项目推荐--基于LLM的开源爬虫项目
以下是一些基于大语言
模型
(LLM,LargeLanguageModel)的开源爬虫项目,它们结合了自然语言处理(NLP)技术与爬虫的功能,能在一定程度上提升爬取的智能化和精度。
惟贤箬溪
·
2025-03-22 19:24
穷玩Ai
github
爬虫
深度解析大
模型
推理框架:原理、应用与实践
在当今数据驱动的时代,大
模型
推理框架已经成为人工智能领域的重要支柱。
百度_开发者中心
·
2025-03-22 19:24
人工智能
大模型
自然语言处理
大
模型
推理框架:从理论到实践的全面解析
然而,深度学习
模型
的训练和推理过程往往涉及大量数据和复杂计算,传统的计算框架难以满足需求。因此,大
模型
推理框架应运而生,成为解决这一问题的关键。
百度_开发者中心
·
2025-03-22 19:23
人工智能
大模型
自然语言处理
毕业论文代码实验(Python\MATLAB)基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测
模型
一、项目背景1.1光伏功率预测意义在能源结构转型背景下(国家能源局2025规划),光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响,光伏出力具有显著波动性,导致:电网调度难度增加(±15%功率波动)电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合:分钟级辐照度变化与小时级天气模式共存非线性映射关系:气象因素与发电功率呈高阶非线性关系数据模态差异:数值天气预报(NWP
清风AI
·
2025-03-22 19:51
毕业设计代码实现
python
lstm
深度学习
神经网络
人工智能
matlab
pytorch
DeepSeek 部署指南 (使用 vLLM 本地部署)
DeepSeek部署指南(使用vLLM本地部署)本文档将指导您如何使用vLLM在本地部署DeepSeek语言
模型
。
AGI大模型资料分享员
·
2025-03-22 19:51
人工智能
语言模型
学习
chatgpt
深度学习
大模型
deepseek
LLM-Agent方法评估与效果分析
1.引言近年来,随着大型语言
模型
(LLM)的快速发展,基于强化学习(RL)对LLM进行微调以使其具备代理(Agent)能力成为研究热点。
·
2025-03-22 18:50
agent人工智能ai开发
大
模型
学习-让其他电脑可访问本地ollama的
模型
并进行流式响应
目录让其他电脑可访问本地ollama流式响应让其他电脑可访问本地ollama默认情况下,其他电脑不能直接访问本地Ollama服务。解决方法:让Ollama监听局域网地址,而不是localhost我们可以让Ollama监听局域网IP,在Ollama服务器上运行:setOLLAMA_HOST=0.0.0.0:11434ollamaserve注意:这种方式只对当前CMD窗口有效,关闭窗口后就会失效。如果
Gratitute_林腾
·
2025-03-22 17:35
大模型学习
学习
语言模型
软件工程简答题整理
软件工程考试简答题整理瀑布
模型
是软件工程中应用最广泛的过程
模型
,试述采用瀑布
模型
进行软件开发的基本过程,该过程有何特点?
~进无止境~
·
2025-03-22 17:03
软件工程
软件工程
简答题
OSI七层
模型
OSI七层
模型
传输过程当你在微信上发送一句“你吃了吗”时,这条消息会经历一个从你的手机到接收者手机的复杂旅程。这个过程涉及到网络通信中的七层
模型
,即OSI(开放系统互连)
模型
。
_洛_神
·
2025-03-22 17:02
网络协议
大规异构集群 混合并行分布式训练系统,解决算力不均衡问题 HETHUB
视频教程在这:3.2大规模异构集群,混合并行分布式系统,解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因:同一种GPU数量有限难以构建大规模集群:训练大规模
模型
依赖于大量的计算资源
爱串门的小马驹
·
2025-03-22 16:29
万卡大规模集群大模型训练
异构集群
大规模集群
分布式
大模型训练
软件工程简答
通用过程
模型
的定义内容通⽤过程框架定义了5种框架活动——沟通、策划、建模、构建以及部署。⼀系列普适性活动——项⽬跟踪控制
Ruannn(努力版)
·
2025-03-22 16:58
软件工程
【架构设计】前置知识
通过Go学习并发
模型
(Gorouti
GIS程序媛—椰子
·
2025-03-22 16:28
架构设计
架构设计
Windows faster whisper GUI-v0.8.5-开源版[AI支持超过100种语言的人声分离/声音转文本字幕]
pwd=vydu#WindowsfasterwhisperGUI-v0.8.5-开源版[AI支持超过100种语言的人声分离/声音转文本字幕]whisperX+faster-whisper+Demucs把
模型
下载
私人珍藏库
·
2025-03-22 16:27
whisper
Windows
faster
whisper
人声分离
声音转文本
LLM 大
模型
技术知识最佳学习路径图发布!
近日,经常有小伙伴私信我,大
模型
知识太多了,有点懵啊,我该如何学习LLM大
模型
?今天我们就来剖析下LLM大
模型
技术知识的学习路径。
AGI-杠哥
·
2025-03-22 15:54
学习
人工智能
语言模型
agi
自然语言处理
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他