E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
神经网络语言模型
深度学习-133-LangGraph之应用实例(二)使用面向过程和面向对象的两种编程方式构建带记忆的聊天机器人
文章目录1通用配置1.1大
语言模型
ChatOllama1.2函数trim_messages1.2.1函数概述1.2.2函数参数1.2.3测试应用2面向过程编程2.1不裁剪历史信息2.1.1创建图2.1.2
皮皮冰燃
·
2025-02-26 10:02
深度学习
深度学习
人工智能
LangGraph
【TVM教程】为 NVIDIA GPU 自动调度
神经网络
本文介绍如何使用auto-scheduler为NVIDIAGPU调优整个
神经网络
。为自动调优
神经网络
,需要将网络划分为小的子图并独立调优。每个子图被视为
HyperAI超神经
·
2025-02-26 09:57
TVM
神经网络
人工智能
深度学习
TVM
GPU
NVIDIA
语言模型
从零开始玩转TensorFlow:小明的机器学习故事 4
有一天,小明在学校图书馆翻看杂志时,看到这样一句话:“就像人的大脑有上百亿神经元,
神经网络
能够学习复杂的信息映射,从而取得卓越的表现。”他瞬间来了灵感:“或许我
山海青风
·
2025-02-26 07:42
机器学习
tensorflow
人工智能
Qwen2.5 技术报告
本报告介绍Qwen2.5,这是一系列全面的大
语言模型
(LLM),旨在满足多样化的需求。与之前的迭代相比,Qwen2.5在预训练和后训练阶段都有显著的改进。
三谷秋水
·
2025-02-26 07:11
大模型
机器学习
人工智能
语言模型
机器学习
人工智能
GAN(Generative Adversarial Network)—生成对抗网络
GAN(GenerativeAdversarialNetwork)代表了深度学习中生成建模的尖端方法,通常利用卷积
神经网络
等架构。
算法资料吧!
·
2025-02-26 06:06
深度学习
机器学习
人工智能
【AI论文】S*: 针对代码生成的测试时缩放方法
摘要:在多个领域中,增加大型
语言模型
(LLM)测试时的计算量已展现出广阔前景,但在代码生成方面,尽管数学领域已对此进行了深入研究,该方向仍探索不足。
东临碣石82
·
2025-02-26 05:58
人工智能
【LLM】本地部署LLM大
语言模型
+可视化交互聊天,附常见本地部署硬件要求(以Ollama+OpenWebUI部署DeepSeekR1为例)
【LLM】本地部署LLM大
语言模型
+可视化交互聊天,附常见本地部署硬件要求(以Ollama+OpenWebUI部署DeepSeekR1为例)文章目录1、本地部署LLM(以Ollama为例)2、本地LLM
小哈里
·
2025-02-26 05:25
#
数据开发
语言模型
人工智能
自然语言处理
LLM
deepseek
大模型
在PyTorch中使用插值法来优化卷积
神经网络
(CNN)所需硬件资源
适用场景:在卷积
神经网络
(CNN)中的应用场景中,经常遇到计算资源有限,比如显存不够或者处理速度慢,需要用插值来降低计算量。
mosquito_lover1
·
2025-02-26 03:45
pytorch
cnn
人工智能
使用django调用deepseek api,搭建ai网站
2.技术与模型DeepSeek-V3:这是DeepSeek开发的一个大型
语言模型
,具有超过600B的参数,在多项性能指标上与国际顶尖模
陈王卜
·
2025-02-26 03:42
人工智能
大模型是如何蒸馏像Qwen-7B,Llama-3 这种小模型的?
Llama-3:属于Meta(原Facebook),是Meta开源的Llama系列大
语言模型
的最新版本。
闫哥大数据
·
2025-02-26 03:12
大模型
llama
人工智能
深入探索 llama-cpp-python:在 LangChain 中启用本地 LLM 推理
引言在人工智能的迅猛发展中,大
语言模型
(LLM)扮演着不可或缺的角色。
aehrutktrjk
·
2025-02-26 02:06
llama
python
langchain
python 语音转文本中文——DeepSpeech
语言模型
:对语音识别结果进
drebander
·
2025-02-26 00:51
python
开发语言
DeepSpeech
BP算法的python实现 + 男女生分类器
BP算法是
神经网络
中十分经典的算法之一,要把它解释清楚实在需要很多时间,我只想重点讲一下基于BP算法的男女生分类器python实现,理论方面推荐看知乎大
乐宝不是酒
·
2025-02-26 00:21
机器学习
机器学习
神经网络
算法
Pytorch:以CIFAR-10分类为例,给出了
神经网络
的训练流程
下面给出了
神经网络
的训练流程,包括数据加载与预处理、网络定义、损失函数和优化器定义、网络训练和网络测试。
Xiao_Ya__
·
2025-02-25 23:49
深度学习
pytorch
pytorch
分类
神经网络
梯度累加(结合DDP)梯度检查点
梯度累加目的梯度累积是一种训练
神经网络
的技术,主要用于在内存有限的情况下处理较大的批量大小(batchsize)。
糖葫芦君
·
2025-02-25 23:16
LLM
算法
人工智能
大模型
深度学习
Tensorflow2.x框架-
神经网络
八股扩展-acc曲线与loss曲线
loss/loss可视化,可视化出准确率上升、损失函数下降的过程博主微信公众号(左)、Python+智能大数据+AI学习交流群(右):欢迎关注和加群,大家一起学习交流,共同进步!目录摘要一、acc曲线与loss曲线二、完整代码摘要loss/loss可视化,可视化出准确率上升、损失函数下降的过程一、acc曲线与loss曲线history=model.fit(训练集数据,训练集标签,batch_siz
诗雨时
·
2025-02-25 23:15
OpenAI 助力数据分析中的模式识别与趋势预测
借助OpenAI的强大
语言模型
(如GPT-4),我们可以轻松完成这些任务,无需深厚的编程基础,也能快速上手。
山海青风
·
2025-02-25 23:42
#
Open
AI
数据分析
信息可视化
数据挖掘
卷积
神经网络
八股(一)------20行代码搞定鸢尾花分类
卷积
神经网络
八股(一)------20行代码搞定鸢尾花分类引言用TensorflowAPI:tf.keras实现
神经网络
搭建八股Sequential的用法compile的用法fit的用法(batch是每次喂入
神经网络
的样本数
有幸添砖java
·
2025-02-25 22:11
opencv
深度学习笔记——循环
神经网络
RNN
本文详细介绍面试过程中可能遇到的循环
神经网络
RNN知识点。
好评笔记
·
2025-02-25 22:10
补档
深度学习
rnn
人工智能
机器学习
计算机视觉
神经网络
AIGC
突破性能极限:DeepSeek开源FlashMLA解码内核技术解析
引言:大模型时代的推理加速革命在生成式AI大行其道的今天,如何提升大
语言模型
的推理效率已成为行业焦点。
Shockang
·
2025-02-25 22:09
DeepSeek
DeepSeek
技术前沿
第三讲-
神经网络
八股
一、搭建
神经网络
六部法tf.keras搭建
神经网络
六部法1、import相关模块 2、train,test #训练集、测试集3、model=tf.keras.models.Sequential #逐层搭建网络结构
loveysuxin
·
2025-02-25 22:38
Tensorflow
tensorflow
神经网络
八股(3)
1.什么是梯度消失和梯度爆炸梯度消失是指梯度在反向传播的过程中逐渐变小,最终趋近于零,这会导致靠前层的
神经网络
层权重参数更新缓慢,甚至不更新,学习不到有用的特征。
SylviaW08
·
2025-02-25 22:37
神经网络
人工智能
深度学习
【PyTorch 实战2:UNet 分割模型】10min揭秘 UNet 分割网络如何工作以及pytorch代码实现(详细代码实现)
UNet是一种常用于图像分割的卷积
神经网络
架构,其特点在于其U型结构,包括一个收缩路径
xiaoh_7
·
2025-02-25 22:37
pytorch
网络
图像处理
计算机视觉
困惑度的估计
固定长度模型的困惑度(Perplexity,PPL)困惑度(PPL)是评估
语言模型
性能的常用指标。
转码的小石
·
2025-02-25 22:06
语言模型
【PyTorch项目实战】图像分割 —— U-Net:Semantic segmentation with PyTorch
、环境搭建2.1.1、下载源码2.1.2、下载预训练模型2.1.3、下载训练集2.2、环境配置2.3、代码优化+架构优化2.4、模型预测:predict.pyU-Net是一种用于生物医学图像分割的卷积
神经网络
架构
胖墩会武术
·
2025-02-25 21:04
深度学习
PyTorch项目实战
python
unet
pytorch
Python微调DeepSeek-R1-Distill-Qwen-1.5B模型:使用Transformers和PyTorch进行训练
前言近年来,基于Transformer架构的预训练
语言模型
如GPT、BERT等已经取得了显著的成果,广泛应用于自然语言处理(NLP)的各个领域。
煤炭里de黑猫
·
2025-02-25 21:02
pytorch
python
人工智能
机器学习
学习心得体会:深入探讨大
语言模型
的世界——读《自然语言处理:大模型理论与实践》(预览版)有感
《自然语言处理:大模型理论与实践》(预览版)由赵宇教授编写,是一本深入探讨大
语言模型
世界的专业著作。作为一名正在学习和研究自然语言处理的学生,这本书为我提供了宝贵的理论基础和实践指导。
Nuyoah_610
·
2025-02-25 19:15
自然语言处理
学习
语言模型
为AI聊天工具添加一个知识系统 之122 详细设计之63 实体范畴论和神经元元模型:命名法函子
神经元元模型(三层含义)暨三种
神经网络
构造型既神经元三个功能约束即神经细胞元元模型。”注:第一行是实体的范畴论的三种论法。
一水鉴天
·
2025-02-25 16:59
智能制造
软件智能
人工语言
人工智能
第七个问题 - 什么是AIGC?它和LLM是什么关系?
AIGC(人工智能生成内容)和LLM(大
语言模型
)是当前人工智能领域的两个核心概念,它们既有紧密联系,又有明确区别。以下是详细解析:一、什么是AIGC?
释迦呼呼
·
2025-02-25 15:52
AI一千问
AIGC
人工智能
机器学习
深度学习
自然语言处理
语言模型
论文学习3:深度学习增强的光声成像(PAI)的最新进展(综述)
详细说明代表性DL架构:卷积
神经网络
(CNN)、U-形
神经网络
(U-Net)和
superace7911
·
2025-02-25 15:50
基于机器学习的光声图像处理
机器学习
图像处理
Chatbox AI + grok-beta大模型秒杀GPT4.0(部署属于您自己的本地AI大
语言模型
聊天系统)
文章目录ChatboxAI+grok-beta大模型秒杀GPT4.0(部署属于您自己的本地AI大
语言模型
聊天系统)部署流程1.官网注册账号获取API密钥2.下载ChatboxAI客户端应用3.ChatboxAI
YeatsCode
·
2025-02-25 14:10
人工智能
人工智能
语言模型
自然语言处理
本地部署deepseek
、使用chatbox进行对话1.打开chatboxai.app页面2.使用方式3.设置chatbox4.设置环境变量windows设置:mac设置:一、安装ollamaOllama是一个开源的本地大
语言模型
运行框架
只喜欢赚钱的棉花没有糖
·
2025-02-25 11:19
ai
ai
浏览器自动化库Browser-Use:让大型
语言模型
与网站互动的新工具
最近,一个名为Browser-Use的开源网页自动化库引起了广泛关注,它允许大型
语言模型
(LLM)与网站互动,通过简单的接口实现网页自动化操作。
码农工具百宝箱
·
2025-02-25 11:18
码农小工具
自动化
语言模型
大
语言模型
能否完全替代人类?——技术、能力与未来的思考
随着人工智能技术的迅猛发展,尤其是大
语言模型
(如DeepSeek、GPT系列、Grok等)的出现,人们开始探讨一个引人深思的问题:这些智能系统是否有一天能完全替代人类?
Hello kele
·
2025-02-25 09:07
人工智能
GPT-2源码实现及GPT-3、GPT-3.5、GPT-4及GPT-5内幕解析(二)
NLP_Matrix_Space5.2GPT-2源码实现逐行解析本节讲解GPT-2源码,gpt2.py是一个使用NumPy实现的代码,在代码中实现了GELU激活函数、softmax函数、层归一化、线性层、前馈
神经网络
段智华
·
2025-02-25 09:35
深入理解
ChatGPT
ChatGPT国内
OpenAI
GPT-3
GPT-4
PyTorch实现DARTS:可微分架构搜索指南
DARTS(DifferentiableArchitectureSearch)是一种创新的
神经网络
架构
余伊日Estra
·
2025-02-25 05:07
Ollama Open WebUI
OpenWebUI支持多种
语言模型
运行器(如Ollama和OpenAI兼容API),并内置了用于检索增强生成(RAG)的推理引擎,使其成为强大的AI部署解决方案。
alden_ygq
·
2025-02-25 03:51
#
大模型运维基础工具
人工智能
神经网络
与深度学习入门:理解ANN、CNN和RNN
无论是智能手机的语音助手,还是推荐系统,背后都有一项核心技术在支撑,那就是
神经网络
与深度学习。今天,我们就来聊一聊这个听起来高大上的话题,其实它也没那么难懂!什么是
神经网络
?
shandianfk_com
·
2025-02-25 03:49
ChatGPT
AI
神经网络
深度学习
cnn
Lil‘Log《Extrinsic Hallucinations in LLMs》读后总结
博客《ExtrinsicHallucinationsinLLMs》由LilianWeng撰写,详细探讨了大型
语言模型
(LLMs)中“幻觉”现象的背景、原因、类型、影响及其缓解策略。
心碎小猫p
·
2025-02-25 02:42
人工智能
深度学习与搜索引擎优化的结合:DeepSeek的创新与探索
目录引言1.传统搜索引擎的局限性2.深度学习在搜索引擎中的作用3.DeepSeek实现搜索引擎优化的关键技术3.1
神经网络
与搜索引擎优化3.2自然语言处理与查询理解3.3深度强化学习与搜索结果排序4.DeepSeek
m0_74825634
·
2025-02-25 01:37
面试
学习路线
阿里巴巴
深度学习
搜索引擎
人工智能
深度学习入门篇--来瞻仰卷积
神经网络
的鼻祖LeNet
B站视频讲解:深度学习入门篇:使用pytorch搭建LeNet网络并代码详解实战前言大家在学习
神经网络
的时候肯定会有这样的感受,有很多的文章和视频,有的文章也很好,但是总是不成体系,总是学起来东一榔锤,
智算学术
·
2025-02-25 00:31
深度学习图像分类篇
深度学习
轻量级网络设计原理与代码实战案例讲解
轻量级网络设计原理与代码实战案例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习在各个领域的广泛应用,
神经网络
模型变得越来越庞大和复杂
AI天才研究院
·
2025-02-25 00:00
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
用人类反馈微调大模型,InstructGPT 让 GPT-3 脱胎换骨
用人类反馈微调大模型,InstructGPT让GPT-3脱胎换骨本文展示了一种通过利用人类反馈进行微调,使大
语言模型
在广泛任务中契合用户意图的方法。
·
2025-02-24 23:50
人工智能
YOLOv12:以注意力为中心的物体检测
相比以往的YOLO模型,YOLOv12摒弃了传统基于卷积
神经网络
(CNN)的结构,采用了全新的方法,融合了自注意力机制和高效的网络架构优化,提供了一个高精度、低延迟的实时目标检测模型。
那雨倾城
·
2025-02-24 23:21
PiscTrace
YOLO
机器学习
目标检测
深度学习
图像处理
docker安装Open WebUI详解-遇到的坑OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file
一、OpenWebUI简介OpenWebUI(https://openwebui.com)是一个用户友好的Web界面,专为本地大
语言模型
(LLMs)设计。
坚定信念,勇往无前
·
2025-02-24 22:16
AI
docker
容器
运维
大模型学习完整路径(一站式汇总),从零基础到精通!新手友好级指南
先来一张整体结构图,越是下面部分,越是基础:可以按以下步骤学习:1.理解基础概念需要了解深度学习的基本原理和常见术语,如
神经网络
、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类
Python程序员罗宾
·
2025-02-24 22:45
学习
语言模型
知识图谱
人工智能
数据库
java
能力模型迁移:专业教育从「知识掌握度」转向「提示工程能力」
然而,随着以大型
语言模型
(LLMs)为代表的生成式AI技术的崛起,仅仅掌握知识已经远远不够,提示工程能力逐渐成为更核心、更关键
由数入道
·
2025-02-24 20:05
AI辅助教学
提示词工程
人工智能
DeepSeek-R1秘籍轻松迁移,只需原始数据0.3% | 邱锡鹏团队联合出品
他们提出了MHA2MLA这种数据高效的微调方法,使基于MHA(多头注意力)的大
语言模型
(LLMs)能够顺利转换到MLA架构。以Llama2-7B为例
·
2025-02-24 19:13
量子位
Meta官宣Llama3:迄今为止最强大的开源大模型
此版本具有经过预训练和指令微调的
语言模型
,具有8B(80亿)和70B(700亿)参数,可以支持广泛的用例。Llama3在各种行业基准上展示了最先进的性能,并提供了新功能,包括改进的推理能力。
·
2025-02-24 19:09
人工智能开源
DeepSeek本地部署 | 小白一站式步骤
一、借助Ollama部署(Ollama是一个开源的、易于使用的本地大
语言模型
运行工具,在本地部署大模型过程中发挥着关键作用)1.安装OllamaWindows系统:打开浏览器,访问Ollama官网(https
AI学无止境
·
2025-02-24 18:52
人工智能
python
windows
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他