E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
闻达语言模型
人工智能:从基础到前沿
无监督学习3.4强化学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络(CNN)4.4循环神经网络(RNN)5.自然语言处理(NLP)5.1NLP概述5.2文本预处理5.3词嵌入5.4
语言模型
顾漂亮
·
2025-02-23 12:15
人工智能
深度学习
windows
Grok-3:人工智能领域的新突破
近日,xAI公司推出的最新AI模型——Grok-3,在ChatbotArena中一举夺魁,以破纪录的1402分傲视群雄,不仅刷新了大型
语言模型
(LLMs)的评分上限,更标志着AI技术的一次重大飞跃。
大模型之路
·
2025-02-23 10:59
大模型(LLM)
人工智能
Grok-3
llm
大
语言模型
架构:从基础到进阶,如何理解和演变
今天,我们将用简单的语言,逐步介绍大
语言模型
的架构,并且展示这些架构是如何随着时间演变的。
运维小子
·
2025-02-23 08:44
语言模型
人工智能
python
使用 ChatGPT 构建 YouTube 下载器的分步指南
只需按照本教程中的步骤操作......ChatGPT是OpenAI训练的大型
语言模型
,可以根据自然语言输入生成代码。
pxr007
·
2025-02-23 07:37
chatgpt
python
开发语言
科普:大模型使用中的temperature 与 top-k及其它
在大
语言模型
(如通过Ollama运行的llama2模型)中,temperature和top-k是两个用于控制文本生成过程的重要参数,它们在功能上相互独立,但又共同影响着模型生成文本的随机性和多样性。
人工干智能
·
2025-02-22 23:35
大模型编程
人工智能
大模型
DeepSeek新作-Native Sparse Attention
NSA概述长文本建模的重要性与挑战长文本建模的重要性:长文本建模对于下一代
语言模型
至关重要。
数据分析能量站
·
2025-02-22 21:21
机器学习
人工智能
Github 2024-04-29 开源项目周报 Top15
根据开发语言中项目的数量,汇总情况如下:开发语言项目数量Python项目11TypeScript项目3Go项目1Svelte项目1JupyterNotebook项目1Swift项目1Ollama:本地大型
语言模型
设置与运行创建周期
老孙正经胡说
·
2025-02-22 21:15
github
开源
Github趋势分析
开源项目
Python
Golang
用示例提升大
语言模型
的查询分析能力!
引言随着查询分析的复杂性增加,大
语言模型
(LLM)在理解如何响应某些场景时可能会面临挑战。为了提高性能,我们可以在提示中添加示例,以便更好地引导模型。
llzwxh888
·
2025-02-22 19:31
语言模型
windows
人工智能
python
如何创建自定义Retriever来增强LLM应用程序
引言在许多大
语言模型
(LLM)应用中,我们需要从外部数据源中检索信息,以便生成更准确和相关的响应。这些信息往往通过Retriever模块检索,然后用于生成提示,供LLM进行处理和响应。
llzwxh888
·
2025-02-22 19:00
服务器
运维
python
第十节:通过Debug解析ChatGLMModel的数据流,理解视觉与
语言模型
结合架构
文章目录前言一、forward的参数解读二、图像编码token数量值方法解读三、input_ids的embedding方法解读1、embedding编码方法2、Embedding源码四、视觉编码方法解读五、inputs_embeds与position_ids编码加工方法解读1、inputs_embeds与position_ids编码方法2、图示解读编码方法3、inputs_embeds与posit
tangjunjun-owen
·
2025-02-22 17:43
语言模型
人工智能
自然语言处理
GLM-4v-9B
多模态大模型教程
ChatGLMModel
LLM之提示词工程
1.提示与提示工程提示工程作为一门新兴的学科,专注于开发和优化提示技术,旨在提升
语言模型
(LMs)在各种应用与研究主题中的效能。
樱花的浪漫
·
2025-02-22 16:11
大模型与智能体
人工智能
自然语言处理
知识图谱
神经网络
agent
大模型
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step
LLaVACoT:让视觉
语言模型
逐步推理摘要1引言2相关工作3提出的方法4后训练性能5推理时间缩放6最新VLMs的比较7结论摘要大型
语言模型
在推理能力方面取得了长足的进步,特别是通过推理时间缩放,如OpenAI
UnknownBody
·
2025-02-22 16:08
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
用 Python + LLM 实现一个智能对话
大型
语言模型
LLM最近比较火,所以我也来用LLM写个智能对话玩玩。简介大
语言模型
LLM全称是LargeLanguageModels。LLM是指具有巨大参数量和极高语言理解能力的神经网络模型。
AGI大模型学习
·
2025-02-22 15:04
python
开发语言
langchain
prompt
大模型
AI大模型
大
语言模型
基础
AI大模型主要分为三类:大
语言模型
、CV大模型和多模态大模型,我将分别介绍它们的背景知识、关键技术、演进路线和挑战。什么是大
语言模型
大
语言模型
(LargeLanguageModel,LL
MatrixSparse
·
2025-02-22 15:27
大模型
人工智能
语言模型
自然语言处理
人工智能
无缝融入,即刻智能[4]:MaxKB知识库问答系统[进一步深度开发调试,完成基于API对话,基于ollama大模型本地部署等]
无缝融入,即刻智能[4]:MaxKB知识库问答系统[进一步深度开发调试,完成基于API对话,基于ollama大模型本地部署等]1.简介MaxKB(MaxKnowledgeBase)是一款基于LLM大
语言模型
的开源知识库问答系统
汀、人工智能
·
2025-02-22 13:14
AI
Agent
LLM工业级落地实践
人工智能
AI
Agent
多智能体协作
知识问答
智能问答
RAG
AI编排流
2023-arXiv-FinGPT: 开源金融大
语言模型
|https://github.com/AI4Finance-Foundation/FinGPT&https://github.com/AI4Finance-Foundation/FinNLP摘要:大
语言模型
量仔搞靓化
·
2025-02-22 12:41
金融大语言模型
金融
语言模型
人工智能
基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写
第一章2024大
语言模型
最新进展与ChatGPT各模型讲解1、2024AIGC技术最新进展介绍(生成式人工智能的基本概念与原理、最新前沿技术和发展趋势简介)2、国内外大
语言模型
(ChatGPT4O、Gemini
AAIshangyanxiu
·
2025-02-22 10:26
chatgpt
python
机器学习
深度学习
【有啥问啥】DeepSeek NSA(Native Sparse Attention):开启高效推理与降本增效的新篇章
DeepSeekNSA(NativeSparseAttention):开启高效推理与降本增效的新篇章在人工智能领域,尤其是自然语言处理(NLP)和大
语言模型
(LLM)的浪潮中,性能与效率一直是研究者和开发者关注的焦点
有啥问啥
·
2025-02-22 09:46
大模型
人工智能
算法
推理模型时代:大
语言模型
如何从对话走向深度思考?
一、对话模型和推理模型的区别概述对话模型是专门用于问答交互的
语言模型
,符合人类的聊天方式,返回的内容可能仅仅只是一个简短的答案,一般模型名称后面会带有「chat」字样。
深度学习机器
·
2025-02-22 07:56
优质项目
RAG
大语言模型
语言模型
人工智能
开源
哪种LLM量化方法最适合您?:GGUF、GPTQ 还是 AWQ
它是一种专为大型
语言模型
设计的量化方法。它允许用户在CPU上运行LLM,同时通过提供速度改进将一些层卸载到GPU。GGUF对于那些在CPU或Apple设备上运行模型的用户特别有用。在GGUF上
GordonJK
·
2025-02-22 05:38
人工智能
机器学习
深度学习
大模型应用开发的框架
一、大
语言模型
的几个框架1、python的版本langchainLangChain英文官方地址:https://www.langchain.com/LangChain中文官网:https://www.langchain.com.cn
红豆和绿豆
·
2025-02-22 00:23
大模型
大模型
告别 AI 幻觉:LangChain + 知识图谱 + 大模型,打造可靠的智能应用
总结与展望后记1.前言:知识图谱在AI中的地位在当今的人工智能领域,各类
语言模型
(如GPT系列、BERT等)已经深刻地影
海棠AI实验室
·
2025-02-22 00:20
AI
Agent学习进阶实战
人工智能
langchain
知识图谱
Agent
有哪些好用的AI工具?(你想要的AI工具都在这)
https://chat.deepseek.com/豆包字节跳动开发的智能
语言模型
,基于深度学习技术,支持多种自然语言处理任务。
·
2025-02-21 23:25
c++
避坑指南:chatgpt账号购买成品号- chatgpt 4.0 plus成品号购买手册!
购买ChatGPT账号的注意事项及指南✨在当前人工智能技术快速发展的背景下,ChatGPT作为一种强大的
语言模型
工具️,受到了广泛关注。
·
2025-02-21 23:25
chatgpt
AI 模型的优化与应用:大模型本体、蒸馏、量化 与 GGUF
引言近年来,大型
语言模型
(LLM)在人工智能领域取得了突破性的进展,但其计算需求高昂,训练和推理成本巨大。因此,如何优化大模型,使其在不同设备和应用场景下更高效地运行,成为了AI研究的重要课题。
CCSBRIDGE
·
2025-02-21 23:15
人工智能
人工智能
有哪些好用的AI工具?(你想要的AI工具都在这)
https://chat.deepseek.com/豆包字节跳动开发的智能
语言模型
,基于深度学习技术,支持多种自然语言处理任务。
·
2025-02-21 23:21
c++
小型字符级
语言模型
的改进方向和策略
小型字符级
语言模型
的改进方向和策略一、回顾小型字符级
语言模型
的处理流程前文我们已经从零开始构建了一个小型字符级
语言模型
,那么如何改进和完善我们的模型呢?有哪些改进的方向?
搏博
·
2025-02-21 15:31
语言模型
人工智能
自然语言处理
python
深度学习
谷歌:缓存增强优化冻结LLM的推理性能
标题:DeliberationinLatentSpaceviaDifferentiableCacheAugmentation来源:arXiv,2412.17747摘要通过生成和处理中间推理步骤,使大型
语言模型
大模型任我行
·
2025-02-21 14:22
大模型-推理优化
人工智能
自然语言处理
语言模型
论文笔记
【AI-32】浅显易懂地说一下LangChain
一句话理解LangChainLangChain是一个帮你快速搭建AI应用的工具箱,它把大型
语言模型
(如GPT)和外部数据、计算工具、业务流程连接起来,让开发AI应用像搭积木一样简单。
W Y
·
2025-02-21 06:55
人工智能
langchain
使用BREEBS平台提升AI知识库
这些Breebs可供任何大
语言模型
(LLM)或聊天机器人使用,以提升其专业知识,减少幻觉,并提供访问来源的途径。Breebs背后实现了多种增强生成(RAG)模型,以在每次迭代中无缝提供有用的上下文。
dgay_hua
·
2025-02-21 05:11
人工智能
python
langchain系列(二)- 提示词模板以及消息
Python3.12.3langchain0.3背景:前期忙碌的开发阶段结束,需要沉淀自己的应用知识,过一遍LangChain时间:20250212说明:技术梳理提示词模板理论说明提示模板将用户输入和参数转换为
语言模型
的指令
码--到成功
·
2025-02-21 02:56
大语言模型
langchain
Ollama部署大模型,本地调用
Ollama简单介绍Ollama是一个强大的大型
语言模型
平台,它允许用户轻松地下载、安装和运行各种大型
语言模型
。
居7然
·
2025-02-21 01:53
android
人工智能
chatgpt
爬虫
开发语言
AI编程
Windows本地部署Ollama+qwen本地大
语言模型
Web交互界面并实现公网访问
要在Windows系统上部署Ollama和qwen本地大
语言模型
的Web交互界面,并实现公网访问,你需要按照以下步骤进行操作:安装Ollama:前往Ollama的GitHub仓库下载源代码或预编译的可执行文件
叨叨爱码字
·
2025-02-21 01:17
语言模型
人工智能
自然语言处理
企业级RAG开源项目分享:Quivr、MaxKB、Dify、FastGPT、RagFlow
RAG技术能够有效地将大型
语言模型
(LLM)与企业私域知识库连接,在保证数据安全和模型可控性的前提下,释放LLM的强大能力。本文将深入探讨GitHub上五个备受瞩目的开源企业级RAG项目:Q
Ainnle
·
2025-02-21 00:16
开源
人工智能
ChatGPT和DeepSeek打造科研与办公的高效引擎
一、2024大
语言模型
最新进展与ChatGPT各模型讲解1、2024AIGC技术最新进展介绍(生成式人工智能的基本概念与原理、最新前沿技术和发展趋势简介)2、国内外大
语言模型
(ChatGPT4O、Gemini
AAIshangyanxiu
·
2025-02-20 23:05
编程算法统计语言
农林生态遥感
chatgpt
【大
语言模型
_3】ollama本地加载deepseek模型后回答混乱问题解决
背景:本地下载了DeepSeek-R1-Distill-Qwen-7B模型后,通过ollamacreateDeepSeek-R1-Distill-Qwen-7B-fds7b.mf加载模型启动后回答混乱,无法使用。解决方法重新下载模型,选择了DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf重新编写ds7b.mf文件,文件内容如下:FROM/root/zml/DeepSe
没枕头我咋睡觉
·
2025-02-20 21:54
大语言模型
语言模型
人工智能
自然语言处理
国外7个最佳大
语言模型
(LLM) API推荐
大型
语言模型
(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下,LLMAPI提供了前所未有的自然语言理解能力。
·
2025-02-20 21:26
程序员后端
GPT (Generative Pre-trained Transformer)
GPT(GenerativePre-trainedTransformer)是由OpenAI提出的一个基于Transformer架构的自回归
语言模型
。
彬彬侠
·
2025-02-20 19:07
自然语言处理
gpt
transformer
预训练
NLP
自然语言处理
数学推理中在推理规模化下检查假阳性解
语言模型
的最新进展已带来各种基准测试中数学推理能力的显著提升。然而,大多数基准测试依赖于自动评估方法,这些方法仅使用启发式方法比较最终答案,而不验证底层推理步骤。
硅谷秋水
·
2025-02-20 17:18
大模型
机器学习
人工智能
语言模型
深度学习
机器学习
人工智能
AI 大模型:Intelligent Agent—— 开启智能新纪元
从软件工程的角度,智能体是一种基于大
语言模型
的,具备规划思考能力、记忆能力、使用工具函数的能力,能自主完成给定任务的计算机程序。
AI-入门
·
2025-02-20 16:36
人工智能
学习
产品经理
面试
agi
Docker Compose部署大
语言模型
LLaMa3+可视化UI界面Open WebUI
一、介绍Ollama:部署+运行大
语言模型
的软件LLaMa3:史上最强开源AI大模型—Meta公司新发布的大
语言模型
OpenWebUI:AI用户界面,可通过浏览器访问二、Docker部署docker-compose.yml
m0_74824877
·
2025-02-20 14:44
docker
语言模型
ui
DeepSeek原理介绍以及对网络安全行业的影响
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大
语言模型
微调、量化、私域部署。
AI拉呱
·
2025-02-20 13:08
Deepseek
人工智能
大模型(含deepseek r1)本地部署利器ollama的API操作指南
ollama介绍:Ollama是一个开源的大型
语言模型
(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型
语言模型
进行交互。
·
2025-02-20 13:41
人工智能llm
LLM的分布式部署:AI的云端革命
《LLM的分布式部署:AI的云端革命》关键词分布式部署
语言模型
云端计算资源管理性能优化安全性摘要本文将深入探讨大型
语言模型
(LLM)的分布式部署,分析其技术背景、架构设计、资源管理、性能优化以及安全性等方面
AI天才研究院
·
2025-02-20 12:01
AI大模型企业级应用开发实战
Python实战
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
DeepSeek与ChatGPT:AI
语言模型
的全面对决
DeepSeek(深度求索)与ChatGPT作为当前备受关注的两大AI
语言模型
,在技术架构、应用场景和性能表现上各有特色。
金枝玉叶9
·
2025-02-20 12:01
程序员知识储备1
程序员知识储备2
程序员知识储备3
chatgpt
人工智能
语言模型
auto-gptq安装以及不适配软硬件环境可能出现的问题及解决方式
它的主要目标是通过量化技术(Quantization)将大型
语言模型
(LLM)等深度学习模型的大小和计算复
IT修炼家
·
2025-02-20 12:00
大模型部署
大模型
auto-gptq
cuda
LLM与知识图谱融合:智能运维知识库构建
其中,大
语言模型
(LLM)和知识图谱是两个重要的技术方向。LLM能够理解和生成自然语言,可以用于构建智能
AI天才研究院
·
2025-02-20 11:45
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用Yuan 2.0与LangChain构建智能聊天应用:完整指南
技术背景介绍Yuan2.0是IEIT系统开发的新一代基础大
语言模型
,包括Yuan2.0-102B、Yuan2.0-51B和Yuan2.0-2B三种版本。
scaFHIO
·
2025-02-20 05:33
langchain
python
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention
不让任何上下文掉队:无限关注的高效无限上下文Transformer摘要1引言2方法3实验4相关工作5结论摘要这项工作介绍了一种将基于Transformer的大型
语言模型
(LLM)扩展到具有有限内存和计算的无限
UnknownBody
·
2025-02-20 05:00
LLM
Daily
LLM
context
语言模型
人工智能
KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大
语言模型
的推理速度?
KTransformers通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大
语言模型
的推理速度,具体体现在以下几个方面:内核级优化:KTransformers采用了高效的内核级优化技术,包括对
魔王阿卡纳兹
·
2025-02-20 04:53
大模型知识札记
语言模型
人工智能
自然语言处理
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他