E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
探索 Dify:开源
LLM
应用开发平台
探索Dify:开源
LLM
应用开发平台介绍在快速发展的AI和机器学习领域,开发人员不断寻求高效的工具,以无缝地从原型过渡到生产。Dify正是在这样的背景下应运而生的。
weixin_40941102
·
2025-02-12 15:38
开源
从语言模型获取结构化数据输出的高级技巧
标题:从语言模型获取结构化数据输出的高级技巧内容:从语言模型获取结构化数据输出的高级技巧引言在使用大型语言模型(
LLM
)时,我们经常需要模型返回特定格式的结构化数据,而不仅仅是自由格式的文本。
stjklkjhgffxw
·
2025-02-12 14:29
语言模型
服务器
人工智能
TAG,一种用于复杂问题解答的统一模型
TAG,一种用于复杂问题解答的统一模型阅读时长:19分钟发布时间:2025-02-12近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎
·
2025-02-12 13:13
人工智能
Langchain Agents
LangchainAgents文档位置:https://js.langchain.com/docs/modules/agents/Agents某些应用程序需要根据用户输入对
LLM
和其他工具进行灵活的调用链
sin(38.1727063)
·
2025-02-12 13:25
langchain
java
数据库
【Python】科研代码学习:十七 模型参数合并,safetensors / bin
知识点:save_pretrained还会新增的文件知识点:在保存模型参数时,大小发生了成倍的变化前言众所周知,
LLM
的模型参数一般保存在.safetensors或者.bin结尾的大文件但是通过一个RLHF
溢流眼泪
·
2025-02-12 10:08
【科研代码】
python
学习
开发语言
让
LLM
来评判 | 选择
LLM
评估模型
基础概念这是让
LLM
来评判系列文章的第一篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型?
·
2025-02-12 09:39
人工智能llm
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(
LLM
)。
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
让
LLM
来评判 | 基础概念
基础概念这是让
LLM
来评判系列文章的第一篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型?
·
2025-02-12 01:31
llm人工智能
自动评估基准 | 一些评估测试集
需要注意的是:大部分数据集有些“过时”,因为它们是在
LLM
出现之前构建的,当时是为了评估语言文本的某个特定属性(如翻译、摘要),但是可能已经不适合现在的
LLM
评估方法了(现在的
·
2025-02-12 01:00
人工智能
通用辅助生成: 使用任意辅助模型加速解码
太长不看版:许多
LLM
(如gemma-2-9b、Mixtral-8x22B-Instruct-v0.1等)苦于缺乏对应小模型,而无法适用辅助生成方案。
·
2025-02-12 01:25
llm
让
LLM
来评判 | 评估你的评估结果
评估你的评估结果这是让
LLM
来评判系列文章的第三篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示在生产中或大规模使用
LLM
评估模型之前
·
2025-02-12 00:20
人工智能llm
大语言模型多代理协作(MACNET)
研究发现了小世界协作现象和协作缩放定律,为
LLM
系统资源预测和优化提供了思路。研究背景与动机:大语言模型(LLMs)因神经缩放定律展现出强大能力,
ZhangJiQun&MXP
·
2025-02-12 00:51
2021
AI
python
教学
2021
论文
语言模型
人工智能
自然语言处理
新手必备!深入解析:如何使用 Ollama 下载与使用本地大语言模型
在当今数字化时代,大语言模型(
LLM
)的应用越来越广泛,从自然语言处理到文本生成,从代码辅助到智能问答,它们都展现出了强大的能力。然而,使用云端大语言模型往往面临着成本高昂、隐私泄露等问题。
大懒猫软件
·
2025-02-11 16:22
语言模型
人工智能
自然语言处理
python
llama
LLM
推理优化——PagedAttention初识篇(vLLM初识(二))
LLM
推理优化——PagedAttention初识篇(vLLM初识(二))前言在
LLM
推理优化——KVCache篇(百倍提速)中,我们已经介绍了KVCache技术的原理,从中我们可以知道,KVCache
荼荼灰
·
2025-02-11 15:44
神经网络
transformer
深度学习
5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ
HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模语言模型(
LLM
engchina
·
2025-02-11 14:41
LINUX
llama
linux
人工智能
VLLM
deepseek-r1
动手学大语言模型
LLM
-02
文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp
阿苏拉则_妫
·
2025-02-11 12:28
LLM
语言模型
人工智能
自然语言处理
如何在 VSCode 中使用通义灵码(Tongyi Lingma)智能编程助手
与GitHubCopilot类似,通义灵码基于大语言模型(
LLM
),可以提供代码补全、智能纠错、代码生成等功能,极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码,
全栈探索者chen
·
2025-02-11 06:09
知识分享
vscode
ide
编辑器
开发语言
AI编程
通灵
人工智能
【AI学习】
LLM
的发展方向
Scalinglaw,以前主要集中在
LLM
的预训练方面。一段时间有个说法,
bylander
·
2025-02-11 03:47
AI学习
人工智能
学习
gpt
SEO友好架构提升
LLM
应用的可发现性
《SEO友好架构提升
LLM
应用的可发现性》文章关键词SEO友好架构语言模型(
LLM
)搜索引擎优化(SEO)可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO
AI天才研究院
·
2025-02-10 17:00
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
【Neo4j 】学习笔记:GraphRAG 宣言:为 GenAI 添加知识
我们即将意识到,要想用GenAI做任何有意义的事情,你不能只依赖自回归
LLM
来做决定。我知道你在想什么:“RAG就是答案。”或者微调,或者GPT-5。是的。基于向量的RAG和微调等技术可以提供帮助。
等风来不如迎风去
·
2025-02-10 16:53
AI入门与实战
neo4j
AI系列:大语言模型的function calling(下)- 使用LangChain
LangChainTool/Functioncalling1.Tool/function加强功能LangChain的tool装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(
LLM
liyane
·
2025-02-10 05:38
AI人工智能
人工智能
语言模型
langchain
LLM
中的 vocabulary 和 embedding vector
vocabulary将自然语言转换为tokenid是根据模型使用的词汇表(vocabulary)进行的。这个过程通常分为两个步骤:分词(Tokenization)将输入的自然语言文本按照某种规则分割成一系列的token,可以是单词、子词或者字符等。分词的规则需要事先定义好,通常使用诸如基于词典、基于规则、基于统计等方法。查表(Lookup)将分词得到的每个token在词汇表中查找对应的数值id。词
Overman..
·
2025-02-10 04:33
LLM
embedding
人工智能
LLM
大模型
GraphRAG如何使用ollama提供的
llm
model 和Embedding model服务构建本地知识库
使用GraphRAG踩坑无数在GraphRAG的使用过程中将需要踩的坑都踩了一遍(不得不吐槽下,官方代码有很多遗留问题,他们自己也承认工作重心在算法的优化而不是各种模型和框架的兼容性适配性上),经过了大量的查阅各种资料以及debug过程(Indexing的过程有点费机器),最终成功运行了GraphRAG项目。先后测试了两种方式,都成功了:使用ollama提供本地llmmodel和Embedding
m0_74824865
·
2025-02-10 03:58
面试
学习路线
阿里巴巴
embedding
flask
python
TC-LLaVA论文笔记
RoPE介绍理解
LLM
位置编码:RoPE|LinsightMotivation在基于视频的multimodallargelanguagemodel中,更好地利用视频提供的时序信息。
0yumiwawa0
·
2025-02-10 03:27
计算机视觉
论文阅读
大模型学习笔记 -
LLM
对齐优化算法 DPO
LLM
-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习,语料库内容混杂,训练的目标是语言模型损失,任务是nexttokenprediction
JL_Jessie
·
2025-02-10 03:54
学习
笔记
算法
LLM
AI学习专题(一)
LLM
技术路线
阶段1:AI及大模型基础(1-2个月)数学基础线性代数(矩阵、特征值分解、SVD)概率论与统计(贝叶斯定理、极大似然估计)最优化方法(梯度下降、拉格朗日乘子法)编程&框架Python(NumPy、Pandas、Matplotlib)PyTorch&TensorFlow基础HuggingFaceTransformers入门深度学习基础机器学习基础(监督/无监督学习、正则化、过拟合)反向传播、优化器(
王钧石的技术博客
·
2025-02-10 01:39
大模型
人工智能
学习
ai
使用 llama-cpp-python 在 LangChain 中运行
LLM
模型
使用llama-cpp-python在LangChain中运行
LLM
模型引言在人工智能和自然语言处理领域,大型语言模型(LLMs)的应用越来越广泛。
qq_37836323
·
2025-02-10 01:37
llama
python
langchain
机器学习回归评估指标全解析:如何衡量模型的准确性?回归评估指标-MSE、MAE、RMSE、R²分数
阅读时长:25分钟发布时间:2025-02-09近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文
·
2025-02-09 22:18
人工智能
为什么要学习AI/机器学习
考虑到当前技术发展趋势和未来潜力,我建议重点学习AI/机器学习相关技术,特别是大语言模型(
LLM
)相关的技术栈。原因如下:1.为什么选择AI/
LLM
?
数字沉思
·
2025-02-09 21:09
人工智能
人工智能
学习
机器学习
重拾二进制之魂:大语言模型与逆向工程的奇幻旅程
逆向工程,这门解构编译产物、还原软件真貌的神秘艺术,正迎来了一场革命性的变革——由大语言模型赋能的
LLM
4Decompile系统。
步子哥
·
2025-02-09 18:50
AGI通用人工智能
语言模型
人工智能
自然语言处理
微软 LayoutLM:文档理解的强大工具
深入了解LayoutLM:文档理解的强大工具阅读时长:15分钟发布时间:2025-02-09近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
·
2025-02-09 18:35
人工智能
探秘检索增强生成:上下文检索、混合搜索与密集检索全解析
探秘检索增强生成:上下文检索、混合搜索与密集检索全解析阅读时长:15分钟发布时间:2025-02-09近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
·
2025-02-09 18:33
人工智能
从零开始构建一个大语言模型-第六章第一节
6.8将大语言模型用作垃圾邮件分类器本章内容涵盖介绍不同的大语言模型微调方法为文本分类准备数据集修改预训练大语言模型以进行微调使用微调后的大语言模型对新数据进行分类到目前为止,我们已经编写了大语言模型(
LLM
释迦呼呼
·
2025-02-09 18:17
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
python
大模型 RAG 知识总结
在
LLM
已经具备了较强能力的基础上,仍然存在以下问题:幻觉问题:
LLM
文本生成的底层原理是基于概率的tokenbytoken的形式,因此会不可避免地产生“一本正经的胡说八道”的情况;时效性问题:
LLM
的规模越大
da pai ge
·
2025-02-09 16:38
解决方法
prometheus
kubernetes
llama.cpp的C语言API使用
它的源代码直接在github上下载即可:GitHub-ggerganov/llama.cpp:
LLM
怎么这么多名字都被占了
·
2025-02-09 13:43
llama
c语言
人工智能
服务网格(Service Mesh)在
LLM
应用架构中的应用
文章关键词服务网格、
LLM
应用架构、微服务通信、控制平面、数据平面、性能优化、安全性摘要本文深入探讨了服务网格在大型语言模型(
LLM
)应用架构中的关键作用。
AI天才研究院
·
2025-02-09 11:32
ChatGPT
计算
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
走进
LLM
世界之
LLM
历史与发展
1.
LLM
的起源1.1NLP的早期研究自然语言处理(NLP)的历史可以追溯到20世纪50年代,当时科学家们开始尝试让计算机理解和生成人类语言。
我就是全世界
·
2025-02-09 11:26
大模型技术与应用
人工智能
DeepSeek-V3 Technical Report
本文是
LLM
系列文章,针对《DeepSeek-V3TechnicalReport》的翻译。
UnknownBody
·
2025-02-09 08:35
LLM
Daily
Technical
Report
人工智能
语言模型
自然语言处理
14.4K+ Star!GPT Researcher:一个基于AI的智能研究助手
GPTResearcher简介GPTResearcher[1]是一个基于大型语言模型(
LLM
)的自动化智能体,目标是对任何给定主题进行在线全面研究。
鱼满满记
·
2025-02-09 07:00
AI应用
Github项目
python
人工智能
ai
Langchain运行报错踩坑记录
fromlangchain_openaiimportChatOpenAIimportos#加载.env到环境变量fromdotenvimportload_dotenv,find_dotenv_=load_dotenv(find_dotenv())
llm
pumpkin84514
·
2025-02-09 04:36
AI相关学习
langchain
Deepseek成功启示:从 TRPO 到 GRPO训练
LLM
DeepSeek(DeepSeek-V3深度剖析:下一代AI模型的全面解读)最近在AI社区引起了不小的轰动,这要归功于它以相对较低的成本提供令人印象深刻的性能。这是深入了解大型语言模型LLMs如何训练的绝佳机会。本文将深入探讨LLMs的训练过程,特别是强化学习(ReinforcementLearning,RL)(深度解析DeepSeekR1:强化学习与知识蒸馏的协同力量)在这一领域的应用,从TRP
大模型之路
·
2025-02-08 20:03
强化学习
大模型(LLM)
人工智能
LLM
强化学习
deepseek
GRPO
TRPO
【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析
一、引言与背景在人工智能领域,大型语言模型(
LLM
)如DeepSeek以其卓越的自然语言理解和生成能力,推动了众多应用场景的发展。
后端研发Marion
·
2025-02-08 14:24
AI大模型技术
机器学习
人工智能
深度学习
deepseek
本地部署
大语言模型应用指南:Gemini简介
1.背景介绍1.1大型语言模型的兴起近年来,随着计算能力的提升和数据量的爆炸式增长,大型语言模型(
LLM
)逐渐成为人工智能领域的研究热点。
AI天才研究院
·
2025-02-08 11:03
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大语言模型多token预测技术
近年来,大语言模型(
LLM
)在自然语言处理领域取得了突破性进展,凭借其强大的语言理解和生成能力,在各种NLP任务中展现出惊人的性能。
deepdata_cn
·
2025-02-08 09:21
NLP
语言模型
人工智能
自然语言处理
【RAG知识库】本地搭建chatgpt知识库
实现原理如下图所示,过程包括加载文件->读取文本->文本分割->文本向量化->问句向量化->在文本向量中匹配出与问句向量最相似的topk个->匹配出的文本作为上下文和问题一起添加到prompt中->提交给
LLM
LLM教程
·
2025-02-08 06:23
人工智能
本地化部署
深度学习
私有化部署
大模型
LLM
知识库
【Ollama+Deepseek】本地化部署运行Deepseek模型
它专注于简化
LLM
的本地运行流程,无需复杂的配置即可在个人设备(如
·
2025-02-08 06:32
DeepSeek-R1深度报告:基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享
DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念(DeepSeek-R1大模型+强化学习(RL)+推理能力)一、前言与背景铺垫在当今人工智能与大语言模型(LargeLanguageModel,
LLM
快撑死的鱼
·
2025-02-08 05:19
算法工程师面试宝典(面试必备)
python
搜索引擎
开发语言
【Ollama+Deepseek】本地化部署运行Deepseek模型
它专注于简化
LLM
的本地运行流程,无需复杂的配置即可在个人设备(如
·
2025-02-08 02:59
Chapter4.1 Coding an
LLM
architecture
4ImplementingaGPTmodelfromScratchToGenerateText4.1CodinganLLMarchitecture4ImplementingaGPTmodelfromScratchToGenerateText本章节包含编写一个类似于GPT的大型语言模型(
LLM
亲持红叶
·
2025-02-08 01:53
构建大语言模型(从头开始)
gpt
python
人工智能
自然语言处理
transformer
大模型(
LLM
)微调并不复杂,数据才是关键:3个实例详解数据准备
今天咱们聊聊一个听起来很高大上的词——微调(Fine-Tuning)。听说过吗?别担心,今天我们不打算深挖那些复杂的技术细节,而是要告诉你们一个简单的事实:微调其实一点都不复杂,真正的关键在于——数据!前排提示,文末有大模型AGI-CSDN独家资料包哦!在这篇文章里,我们不仅会深入浅出地介绍什么是微调,还会通过三个具体的实例,教你们如何准备高质量的数据集,让你们的模型表现出色。准备好了吗?让我们一
程序员二飞
·
2025-02-08 01:21
深度学习
机器学习
人工智能
金融
学习
chatgpt
大数据
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他