E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型。
️ 在 Windows WSL 上部署 Ollama 和大
语言模型
的完整指南20241206
️在WindowsWSL上部署Ollama和大
语言模型
的完整指南引言随着大
语言模型
(LLM)和人工智能的飞速发展,越来越多的开发者尝试在本地环境中部署大模型进行实验。
Narutolxy
·
2025-02-03 16:09
技术干货分享
智浪初航
windows
语言模型
人工智能
深度学习:基于MindNLP的RAG应用开发
RAG(Retrieval-AugmentedGeneration,检索增强生成)是一种结合检索(Retrieval)和生成(Generation)的技术,旨在提升大
语言模型
(LLM)生成内容的准确性、
Landy_Jay
·
2025-02-03 13:47
深度学习
人工智能
基于CNN(一维卷积Conv1D)+LSTM+Attention 实现股票多变量时间序列预测(PyTorch版)
运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型
语言模型
和迁移学习
矩阵猫咪
·
2025-02-03 12:42
cnn
lstm
pytorch
注意力机制
卷积神经网络
长短期记忆网络
Attention
大型
语言模型
(LLM)压缩技术:如何让庞然大物更轻巧?
大型
语言模型
(LLM)压缩技术:如何让庞然大物更轻巧?随着大模型在各个领域的广泛应用,我们面临的一个核心问题是——如何让这些庞大的模型在硬件资源有限的环境下运行?
空间机器人
·
2025-02-03 12:09
LLM语言模型学习笔记
语言模型
人工智能
自然语言处理
M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models
M-Ped:大型
语言模型
的多提示集成解码摘要1引言2方法3实验4研究5相关工作6结论摘要随着大型
语言模型
(LLMs)在自然语言处理(NLP)领域的广泛应用,提高其性能已成为研究热点。
UnknownBody
·
2025-02-03 11:36
LLM
Daily
LLM
Prompt
prompt
语言模型
人工智能
SlimGPT: Layer-wise Structured Pruning for Large Language Models
SlimGPT:大型
语言模型
的分层结构化修剪摘要1引言2相关工作3前言4方法5实验6结论摘要大型
语言模型
(LLM)因其在各个领域的卓越能力而受到广泛关注,其巨大的参数规模为实际部署带来了挑战。
UnknownBody
·
2025-02-03 11:35
LLM
Daily
LLM
Pruning
剪枝
语言模型
人工智能
AIGC的底层框架和技术模块
以下是对AIGC底层框架和技术模块的详细解析:底层框架AIGC的底层框架主要基于深度学习的
语言模型
,特别是Transformer模型及其变种,如GPT(GenerativePre-trainedTransformer
五岔路口
·
2025-02-03 07:27
AIGC
什么是MOE架构?哪些大模型使用了MOE?
在人工智能快速发展的今天,大
语言模型
(LLM)的规模越来越大,参数量动辄上千亿甚至万亿。然而,更大的模型往往意味着更高的计算成本和更多的资源消耗。
明哲AI
·
2025-02-03 06:18
AIGC
架构
人工智能
大模型
MOE
『大模型笔记』视觉
语言模型
解释
视觉
语言模型
解释文章目录一.视觉
语言模型
解析1.什么是视觉
语言模型
?
AI大模型前沿研究
·
2025-02-03 05:40
大模型笔记
LLM
VLM
视觉语言模型
语言模型
大模型
人工智能
Github 2025-02-01 开源项目月报 Top20
8TypeScript项目3JupyterNotebook项目2Rust项目2HTML项目2C++项目1Ruby项目1JavaScript项目1Svelte项目1非开发语言项目1Go项目1Ollama:本地大型
语言模型
设置与运行创建周
老孙正经胡说
·
2025-02-03 03:30
github
开源
Github趋势分析
开源项目
Python
Golang
VARGPT:将视觉理解与生成统一在一个模型中,北大推出支持混合模态输入与输出的多模态统一模型
微信公众号|搜一搜:蚝油菜花快速阅读模型简介:VARGPT是北京大学推出的多模态大
语言模型
,专注于视觉理解和生成任务。主要功能:支持混合模态输入输出、高效视觉生成和广泛的多模态任务。
蚝油菜花
·
2025-02-03 02:18
每日
AI
项目与应用实例
人工智能
开源
DeepSeek-V2:强大、经济、高效的专家混合
语言模型
DeepSeek-V2:强大、经济、高效的专家混合
语言模型
DeepSeek-V2项目地址:https://gitcode.com/gh_mirrors/de/DeepSeek-V2项目介绍DeepSeek-V2
乌芬维Maisie
·
2025-02-03 01:12
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
DeepSeek-V3:是混合专家(MoE)
语言模型
,采用Transformer架构。DeepSeek-VL:整体上是decoder-o
fpga和matlab
·
2025-02-03 01:12
前言技术汇集
#
人工智能
大模型
DeepSeek
NotebookLM:Google 最新 AI 笔记助理解析与实战应用
它结合了Google的大
语言模型
(LLM)能力,帮助用户更高效地整理、理解和生成知识内容。本文将全面解析NotebookLM的技术原理、核心功能、应用场景,并提供实际使用指南,帮助
赵大仁
·
2025-02-02 23:56
人工智能
技术
大语言模型
深度学习
人工智能
语言模型
自然语言处理
机器学习
笔记
从零开始大模型开发与微调:汉字拼音数据集处理
随着深度学习技术的飞速发展,大规模
语言模型
(LargeLanguageModel,LLM)在NLP领域取得了显著的成果。
AGI大模型与大数据研究院
·
2025-02-02 22:43
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI大模型部署:Ollama与vLLM部署对比:哪个更合适?
前言近年来,大
语言模型
(LLM)的应用日益广泛,而高效的部署方案至关重要。Ollama和vLLM作为两种流行的LLM部署工具,各有优劣。
大模型部署
·
2025-02-02 21:11
langchain
人工智能
docker
llama
LLM
程序员
Ollama
OpenAI 实战进阶教程 - 第1节:OpenAI API 架构与基础调用
OpenAIAPI是一种工具,允许开发者通过编程方式与OpenAI的强大
语言模型
(例如gpt-3.5-turbo和gpt-4)进行交互。
山海青风
·
2025-02-02 21:37
人工智能
人工智能
python
prompt
根据每月流量和市场份额排名前20 的AI工具列表
ChatGPT:由OpenAI研发,是一款对话式大型
语言模型
。它能够理解自然语言输入,生成连贯且符合逻辑的回复。
开心的AI频道
·
2025-02-02 19:54
人工智能
什么是LLM?看这一篇就够了!
本文主要介绍大
语言模型
(LargeLanguageModel,简称LLM)。
Python程序员罗宾
·
2025-02-02 14:50
人工智能
语言模型
AIGC
自然语言处理
【llm对话系统】大模型 Llama 源码分析之并行训练方案
1.引言训练大型
语言模型
(LLM)需要巨大的计算资源和内存。为了高效地训练这些模型,我们需要采用各种并行策略,将计算和数据分布到多个GPU或设备上。
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm对话系统】大模型 Llama 源码分析之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型
语言模型
(LLM)在自然语言处理(NLP)领域取得了巨大的成功。
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
使用Elasticsearch和SelfQueryRetriever实现智能电影检索
在这篇文章中,我们将结合Elasticsearch和SelfQueryRetriever,展示如何通过
语言模型
实现智能电影查询。
hgSdaegva
·
2025-02-02 13:43
elasticsearch
jenkins
大数据
python
使用 ChatPremAI 和 LangChain 构建高级聊天模型功能
##使用ChatPremAI和LangChain构建高级聊天模型功能###技术背景介绍随着生成式AI的快速发展,诸如ChatGPT等大型
语言模型
逐渐成为开发智能应用的核心组件。
hgSdaegva
·
2025-02-02 13:42
python
llama.cpp LLM_CHAT_TEMPLATE_DEEPSEEK_3
`LLM_CHAT_TEMPLATE_DEEPSEEK_3`References不宜吹捧中国大
语言模型
的同时,又去贬低美国大
语言模型
。水是人体的主要化学成分,约占体
Yongqiang Cheng
·
2025-02-02 12:10
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK_3
【自然语言处理(NLP)】基于Transformer架构的预训练
语言模型
:BERT 训练之数据集处理、训练代码实现
文章目录介绍BERT训练之数据集处理BERT原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽
语言模型
任务的数据从token中获取mlm数据将文本转换为预训练数据集创建
道友老李
·
2025-02-02 12:04
自然语言处理(NLP)
自然语言处理
transformer
向量语义(Vector Semantics)与表征学习(Representation Learning)详解
传统的NLP方法(如基于规则的
语言模型
)需要人为定义单词的语义规则,而向量语义方法则通过分析单词在大量文本中的使用模式来学习其语义。
苏西月
·
2025-02-02 07:54
学习
人工智能
【llm对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比
1.引言近年来,大型
语言模型
(LLM)取得了令人瞩目的进展,其中Llama、Qwen和ChatGLM是三个备受关注的开源模型。
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
LLM的实时性:迈向毫秒级响应的AI
LargeLanguageModel(LLM),实时性,响应时间,微服务架构,并行处理,知识图谱,优化算法,延迟最小化1.背景介绍大型
语言模型
(LLM)在自然语言处理领域取得了令人瞩目的成就,展现出强大的文本生成
AI大模型应用之禅
·
2025-02-02 06:47
AI大模型与大数据
java
python
javascript
kotlin
golang
架构
人工智能
Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术
微信公众号|搜一搜:蚝油菜花快速阅读技术背景:Aligner是北京大学团队提出的大
语言模型
对齐技术,通过学习对齐答案与未对齐答案之间的修正残差来提升模型性能。
蚝油菜花
·
2025-02-02 01:22
每日
AI
项目与应用实例
人工智能
人工智能开源
大
语言模型
丨ChatGPT-4o深度科研应用、论文与项目撰写、数据分析、机器学习、深度学习及AI绘图(BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等)
目录第一章、2024大
语言模型
最新进展与ChatGPT各模型第二章、ChatGPT-4o提示词使用方法与高级技巧(最新加入思维链及逆向工程及GPTs)第三章、ChatGPT4-4o助力日常生活、学习与工作第四章
赵钰老师
·
2025-02-02 01:50
ChatGPT
python
人工智能
语言模型
深度学习
数据分析
chatgpt
机器学习
随机森林
揭秘大
语言模型
:什么是LLM大模型?
前言自从去年chatgpt横空出世以来,它火爆也让大
语言模型
这个词变的很流行,到底什么是大
语言模型
,今天从初学者的角度介绍一下大
语言模型
的基本概念、组成部分和基本工作流程等。
AGI-杠哥
·
2025-02-01 23:11
程序人生
兼职副业
web安全
语言模型
人工智能
自然语言处理
【AI知识点】三种不同架构的大
语言模型
(LLMs)的区别
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】在自然语言处理(NLP)中,预训练
语言模型
(LLMs,LargeLanguageModels)通常基于不同的架构,如仅编码器的模型(Encoder-only
AI完全体
·
2025-02-01 23:09
AI知识点
人工智能
语言模型
自然语言处理
机器学习
深度学习
注意力机制
自注意力机制
大模型开发流程及架构
一、主要内容●以大
语言模型
为功能核心●利用大
语言模型
的强大理解能力和生成能力●结合特殊的数据或业务逻辑来提供独特功能的应用二、明确目标●大模型作为一个调用工具,不需要知道太多的原理,不需要优化模型能力●
寒夜灬星辰
·
2025-02-01 20:12
人工智能
语言模型
大模型开发流程及项目实战
一、大模型开发整理流程1.1、什么是大模型开发我们将开发以大
语言模型
为功能核心、通过大
语言模型
的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。
辣椒种子
·
2025-02-01 19:38
机器学习
人工智能
Meta首席科学家Yann LeCun预言:5年内AI架构将颠覆,当前大模型的4大核心缺陷
✨引言:一场颠覆AI行业的预言在2025冬季达沃斯“技术辩论”现场,Meta首席AI科学家、图灵奖得主杨立昆(YannLeCun)抛出一个震撼观点:“当前的大
语言模型
(LLM)范式将在3-5年内被淘汰。
机器小乙
·
2025-02-01 18:30
人工智能
【AI人工智能】DeepSeek R1:你需要知道的一切
的所有你需要知道的一切内容,请坚持认真读完,必有收获:DeepSeekR1简要概述主要特点与能力开源与可访问性模型架构强化学习训练变体与精简模型使用案例与应用从专有模型迁移到开源模型1.DeepSeekR1简要概述大
语言模型
大名顶顶
·
2025-02-01 17:22
人工智能
人工智能
AI
DeepSeek
程序员
计算机
编程
开源
深入探索Llama.cpp:在LangChain中使用llama-cpp-python
深入探索Llama.cpp:在LangChain中使用llama-cpp-python随着大
语言模型
(LLMs)的普及,开发者需要更有效的方法来部署和使用这些模型。
dfvcbipanjr
·
2025-02-01 16:10
python
llama
langchain
DeepSeek R1 简易指南:架构、培训、本地部署和硬件要求
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大
语言模型
推理能力方面的创新实践。
·
2025-02-01 16:49
前端javascript
使用Ollama本地化部署DeepSeek
1、Ollama简介Ollama是一个开源的本地化大模型部署工具,旨在简化大型
语言模型
(LLM)的安装、运行和管理。
·
2025-02-01 16:48
大模型llm人工智能
LLM-预训练:深入理解 Megatron-LM(2)原理介绍
最近在基于Megatron-LM的代码来训练大
语言模型
,本人觉得Megatron的代码很具有学习意义,于是大量参考了网上很多对Megatron代码的解读文章和NVIDAMegatron团队公开发布的2篇论文
u013250861
·
2025-02-01 15:05
#
LLM/训练
人工智能
如何在本地电脑上安装和使用 DeepSeek R-1
简介似乎每个人都在谈论DeepSeekR-1是中国人工智能公司DeepSeek开发的全新开源人工智能
语言模型
。一些用户声称,其推理能力与OpenAI的o1相当,甚至更好。
知识大胖
·
2025-02-01 15:33
NVIDIA
GPU和大语言模型开发教程
电脑
玩转大
语言模型
——使用GraphRAG+Ollama本地构建知识图谱(完全本地化,不依赖OpenAI)
系列文章目录玩转大
语言模型
——使用langchain和Ollama本地部署大
语言模型
玩转大
语言模型
——ollama导入huggingface下载的模型玩转大
语言模型
——langchain调用ollama
艾醒(AiXing-w)
·
2025-02-01 15:31
玩转大语言模型
语言模型
知识图谱
人工智能
深度解读大
语言模型
中的Transformer架构
一、Transformer的诞生背景传统的循环神经网络(RNN)和长短期记忆网络(LSTM)在处理自然语言时存在诸多局限性。RNN由于其递归的结构,在处理长序列时容易出现梯度消失和梯度爆炸的问题。这导致模型难以捕捉长距离的依赖关系,对于复杂的自然语言文本,无法有效地学习到上下文的关键信息。LSTM虽然在一定程度上缓解了梯度消失的问题,但依然存在梯度不稳定的情况。而且,RNN和LSTM在计算过程中,
老三不说话、
·
2025-02-01 05:16
transformer
LLM应用架构实战:基于LangChain的企业级最佳实践
前言随着ChatGPT等大
语言模型
的广泛应用,越来越多的企业开始将LLM整合到其业务系统中。然而,从概念验证(PoC)到生产环境的转换过程中,往往会遇到诸多技术挑战。
LLM教程
·
2025-02-01 05:44
langchain
大模型
人工智能
本地化部署
Agent
程序员
LLM
构建高效LLM应用开发架构的关键策略
其中,大型
语言模型
(LLM)的应用开发尤为引人注目。LLM通过处理和理解自然语言,为各种场景提供了强大的智能解决方案,从智能客服到内容生成,再到教育应用,都有着广泛的应用前景。
AI天才研究院
·
2025-02-01 05:12
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
通过命令行工作流提升工作效率的实战教程(持续更新)
本文主要介绍了通过命令行工作流提升工作效率的实战教程,希望对使用大
语言模型
的同学们有所
herosunly
·
2025-02-01 05:37
大模型
工作流
实战教程
表格化数据处理中大
语言模型
的微调优化策略研究
ResearchonFine-TuningOptimizationStrategiesforLargeLanguageModelsinTabularDataProcessing论文主要内容这篇论文的主要内容是研究大型
语言模型
C7211BA
·
2025-01-31 23:25
人工智能
自然语言处理
大语言模型
使用大
语言模型
在表格化网络安全数据中进行高效异常检测
论文链接Efficientanomalydetectionintabularcybersecuritydatausinglargelanguagemodels论文主要内容这篇论文介绍了一种基于大
语言模型
C7211BA
·
2025-01-31 23:54
语言模型
web安全
人工智能
探索未来AI:飞桨大模型套件PaddleFleetX引领技术新高度
探索未来AI:飞桨大模型套件PaddleFleetX引领技术新高度PaddleFleetX飞桨大模型开发套件,提供大
语言模型
、跨模态大模型、生物计算大模型等领域的全流程开发工具链。
窦育培
·
2025-01-31 22:14
DeepSeek-V3 技术报告
1概述本文介绍了DeepSeek-V3,一个强大的混合专家(MoE)
语言模型
,总参数量为6710亿,每个token激活的参数量为370亿。
mingo_敏
·
2025-01-31 20:01
LLM
深度学习
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他