E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLMs
【大模型】【DeepSeek】DeepSeek-R1:Incentivizing Reasoning Capability in
LLMs
via Reinforcement Learning
DeepSeek-R1:通过强化学习激励大语言模型的推理能力0.论文摘要我们推出了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习(RL)训练而成的模型,没有经过监督微调(SFT)作为初步步骤,展现了卓越的推理能力。通过RL,DeepSeek-R1-Zero自然涌现出许多强大且有趣的推理行为。然而,它也面临诸如可读性差
量子-Alex
·
2025-06-08 18:51
LLM大模型
人工智能
语言模型
LLM2Vec:开启大型语言模型的文本编码新纪元
LLM2Vec:开启大型语言模型的文本编码新纪元项目地址:https://gitcode.com/gh_mirrors/ll/llm2vec在当今的AI领域,如何高效利用大型语言模型(
LLMs
)进行文本表示
殷巧或
·
2025-06-08 06:25
LLM基础1_语言模型如何处理文本
基于GitHub项目:https://github.com/datawhalechina/
llms
-from-scratch-cn工具介绍tiktoken:OpenAI开发的专业"分词器"torch:Facebook
激进小猪1002
·
2025-06-08 05:54
语言模型
人工智能
自然语言处理
LLM基础2_语言模型如何文本编码
基于GitHub项目:https://github.com/datawhalechina/
llms
-from-scratch-cn字节对编码(BPE)上一篇博文说到为什么GPT模型不需要[PAD]和[UNK
激进小猪1002
·
2025-06-08 05:53
java
服务器
前端
Model Context Protocol (MCP) 介绍
ModelContextProtocol(MCP)介绍概述ModelContextProtocol(MCP)是一个开放协议,用于标准化应用程序如何为大型语言模型(
LLMs
)提供上下文。
未来创世纪
·
2025-06-08 03:38
AIGC
github
人工智能
【AI】大语言模型引擎全解析:Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama,最佳选择?
近年来,大语言模型(
LLMs
)如GPT、LLaMA、BERT等已经成为人工智能领域的核心驱动力。然而,如何高效地运行和优化这些模型,成为了开发者和研究者面临的重要挑战。
厦门德仔
·
2025-06-07 12:02
AI
人工智能
语言模型
llama
unsloth微调Qwen3模型实战
一、前言Unsloth是一个专注于优化大型语言模型(
LLMs
)微调效率的开源框架,旨在显著提升训练速度并降低显存占用,使得在资源有限的硬件(如单张消费级GPU)上高效微调大模型成为可能。
韭菜盖饭
·
2025-06-06 22:19
大模型
语言模型
LLM
unsloth
微调大模型
人工智能
本地部署AI大模型应用私有化部署deepseek本地部署与应用解决方案
随着人工智能技术的飞速发展,大模型(
LLMs
)已成为推动企业数字化转型的核心动力,而数据作为企业的重要资产,其价值的挖掘离不开大模型的强大赋能。
公众号:数据化运营圈
·
2025-06-06 10:02
AI
AI中台
人工智能
人工智能
大数据
ai
LoRA:大模型高效微调的低秩之道——原理解析与技术实现
LoRA:大模型高效微调的低秩之道——原理解析与技术实现大型语言模型(
LLMs
)的全参数微调如同驾驶油轮转弯——资源消耗巨大且响应迟缓。
摘取一颗天上星️
·
2025-06-05 22:43
人工智能
python
llama
矩阵
线性代数
【学习笔记6】论文SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy
随着GPT-3.5和GPT-4等大型语言模型(
LLMs
)的兴起,这一领域得到了极大的推动,提供了更好的自然语言理解能力和生成细致入微的SQL语句的能力。
||Φ|(|T|Д|T|)|Φ||/
·
2025-06-05 07:59
sql
冷启动推荐:系统性综述
原论文链接:Cold-StartRecommendationtowardstheEraofLargeLanguageModels(
LLMs
):AComprehensiveSurveyandRoadmapCONTENTFEATURES
jony0917
·
2025-06-05 05:41
人工智能
你真的会用AI吗?浅谈输出格式对大语言模型推理能力的影响
今天,我们将深入探讨一个引人注目的AI研究发现:输出格式如何影响大语言模型(
LLMs
)的推理能力。这个话题不仅关乎AI技术的发展,更直接影响到我们如何更好地利用这些强大的工具。
蒜鸭
·
2025-06-04 04:23
人工智能
机器学习
深度学习
腾讯混元2025CVPR论文全解读:6篇论文速通大模型前沿
ExploringLong-ChainVisualReasoningwithMultimodalLargeLanguageModels(Insight-V:大语言模型中的长思维链视觉推理探索)大语言模型(
LLMs
zhangjiaofa
·
2025-06-03 05:40
DeepSeek
R1&
AI人工智能大模型
大语言模型
3D生成模型
视频生成模型
多模态Agent AI(MAA)系统
这类系统结合了大型语言模型(
LLMs
)和视觉语言模型(VLMs),以增强其在物理或虚拟世界中的感知和生成能力。MAA系统的研究领域广泛,包括游戏(VR/AR/MR)、机器人技术和医疗保健等。
百态老人
·
2025-06-02 23:31
人工智能
LLM推理相关指标
(1)TimeToFirstToken(TTFT)生成第一个token的时间,衡量的是在用户输入问题或者查询后,
LLMs
开始响应的速度,关系到实时交互。
m0_46521579
·
2025-06-01 06:03
cuda
transformer
大模型核心技术及架构解析
大模型核心技术及架构解析大语言模型(LargeLanguageModels,
LLMs
)已成为当前AI领域最重要的技术突破之一。
阿湯哥
·
2025-06-01 05:28
架构
关于大语言模型的问答?
1.Whyisprompt(提示词)engineeringnecessarywhenworkingwithlargelanguagemodels(
LLMs
)?
白光白光
·
2025-06-01 00:29
语言模型
人工智能
自然语言处理
构建有状态的多智能体应用:深入解析 Python 的 LangGraph 库
一、引言随着大型语言模型(
LLMs
)的快速发展,构建复杂的AI应用程序变得越来越可行。然而,如何有效地管理多个智能体之间的交互、状态和工作流程,仍然是一个挑战。
萧鼎
·
2025-05-31 09:36
python基础到进阶教程
python
microsoft
开发语言
LangChain4J Spring Boot 集成
LLMs
LangChain4JSpringBoot集成LLMsLangChain4j提供了用于以下目的的SpringBoot启动器:流行的集成声明式AIServicesSpringBoot启动器SpringBoot启动器帮助通过属性创建和配置语言模型、嵌入模型、嵌入存储以及其他核心LangChain4j组件。要使用其中一个SpringBoot启动器,请导入相应的依赖项。SpringBoot启动器依赖项的命
Five_B
·
2025-05-31 03:51
LangChain4J
解读
spring
boot
java
论文翻译:Automatic Lesson Plan Generation via Large Language Models with Self-critique Prompting
AutomaticLessonPlanGenerationviaLargeLanguageModelswithSelf-critiquePromptinghttps://link.springer.com/chapter/10.1007/978-3-031-64315-6_13通过自我批评提示的大型语言模型自动生成课程计划摘要在本文中,我们利用大型语言模型(
LLMs
CSPhD-winston-杨帆
·
2025-05-30 18:17
论文翻译
智慧教育
语言模型
人工智能
自然语言处理
Healthy
LLMs
? Benchmarking LLM Knowledge of UK Government Public Health Information
一、文章主要内容总结本文聚焦于评估大型语言模型(
LLMs
)对英国政府公共卫生信息的掌握情况,核心内容如下:背景与目标随着
LLMs
的普及,其在公共卫生领域的信息准确性至关重要,但目前缺乏针对英国政府公共卫生指南的评估
UnknownBody
·
2025-05-30 09:42
LLM
Daily
人工智能
语言模型
Large-Scale Language Models: In-Depth Principles and Pioneering Innovations
大规模语言模型(Large-ScaleLanguageModels,
LLMs
)是人工智能领域的璀璨明珠,深刻重塑了自然语言处理(NLP)并推动多模态应用的蓬勃发展。
Kelaru
·
2025-05-28 06:33
AI大模型
python
ai
语言模型
大数据
SpringBoot LangChain4j 集成deepseek大模型
一、LangChain4j介绍LangChain4j是一个给大语言模型(
LLMs
)用的Java开发框架。它诞生在2023年初ChatGPT掀起的大模型热潮里。
奋斗的狍子007
·
2025-05-27 23:07
AI大模型
spring
boot
后端
java
deepseek
深度学习
AI“高情商”奥秘,LLM多轮情感对话新突破!
然而,当前的大语言模型(
LLMs
)在处理这类对话时,往往侧重于单轮回复的即时效果,缺乏对多轮对话的长期
Python_金钱豹
·
2025-05-25 06:23
人工智能
chatgpt
知识图谱
语言模型
ui
机器学习
多样本上下文学习:开拓大模型的新领域
大模型(
LLMs
)在少量样本上下文学习(ICL)中展现出了卓越的能力,即通过在推理过程中提供少量输入输出示例来学习,而无需更新权重。
人工智能大模型讲师培训咨询叶梓
·
2025-05-25 01:55
人工智能
学习
人工智能
深度学习
多样本
上下文学习
推理
语言模型
AI与.NET技术实操系列(七):使用Emgu CV进行计算机视觉操作
技术实操系列(9)1.AI与.NET技术实操系列(一):开篇03-032.AI与.NET技术实操系列(二):开始使用ML.NET03-043.AI与.NET技术实操系列(三):在.NET中使用大语言模型(
LLMs
八小一
·
2025-05-24 23:11
人工智能
谷歌medgemma-27b-text-it医疗大模型论文速读:多语言大型语言模型医学问答基准测试MedExpQA
《MedExpQA:多语言大型语言模型医学问答基准测试》论文解析一、引言论文开篇指出大型语言模型(
LLMs
)在医学领域的巨大潜力,尤其是在医学问答(QA)方面。
Open-source-AI
·
2025-05-24 03:21
前沿
语言模型
人工智能
深度学习
自然语言处理
大模型
开源
大语言模型 vs NLTK/SpaCy:NLP工具的代际跃迁与互补之道
大语言模型vsNLTK/SpaCy:NLP工具的代际跃迁与互补之道技术代际差异:从「工具包」到「智能体」的进化如果说NLTK和SpaCy是「文本处理的瑞士军刀」,那么大语言模型(
LLMs
)就是「会思考的
赛卡
·
2025-05-24 02:48
自然语言处理
语言模型
人工智能
张 12种心理咨询主题与治疗方式
数字孪生心理咨询师框架(PsyDT):1.数字孪生心理咨询师框架(PsyDT)核心目标:利用大语言模型(
LLMs
)构建具有个性化咨询风格的心理咨询师数字孪生,解决现有心理健康
LLMs
忽视咨询师个体风格差异的问题
ZhangJiQun&MXP
·
2025-05-23 13:44
教学
2024大模型以及算力
2021
AI
python
人工智能
机器学习
python
prompt
算法
基于Llamaindex的本地向量与大模型RAG搭建流程
工程化必须解决的全本地路径:本地embedding和
LLMs
(如Ollama)。Qwen指导文档给出了基于HF或者其他使用APIKey大模型的示例,场景不符。
1024点线面
·
2025-05-23 03:10
AIGC
python
开发语言
ollama
RAG
llamaindex
向量模型
大模型
【AI论文】PRIMA.CPP:在低资源日常家用集群上加速700亿参数级大型语言模型推理
摘要:DeepSeekR1和QwQ32B的出现突破了在家用设备上运行前沿大型语言模型(
LLMs
)的性能障碍。
东临碣石82
·
2025-05-22 04:15
人工智能
语言模型
自然语言处理
幻觉的迷宫:DeCo算法与大型语言模型的真相之旅
无论是多模态大型语言模型(MLLMs),还是单模态的
LLMs
,这一问题都如影随形。尤其在医疗、法律等高风险领域,幻觉不仅仅是“说错话”那么简单,甚至可能引发灾难性的后果。
步子哥
·
2025-05-21 15:45
智能涌现
AGI通用人工智能
算法
语言模型
人工智能
如何用好“对话式编程”?牢记这十二条策略
编者按:如何有效利用大语言模型(
LLMs
)生成高质量代码?这是当下开发者们比较关心的一个问题。在生成代码的过程中,提示词的设计是否精确,直接决定了模型输出的质量。
·
2025-05-21 11:47
Ai学习之LangChain框架
一、什么是LangChainLangChain是一个用于开发由大型语言模型(
LLMs
)驱动的应用程序的开源框架。
MClink
·
2025-05-21 08:28
Ai学习之旅
人工智能
学习
langchain
一文搞懂DeepSeek - DeepSeek-R1-Zero和DeepSeek-R1
DeepSeek推出了第一代推理模型——DeepSeek-R1-Zero和DeepSeek-R1,通过强化学习激励大型语言模型(
LLMs
)的推理能力。1、什么是DeepSeek-R1?
大模型本地部署
·
2025-05-20 12:27
人工智能
chatgpt
langchain
大数据
数据库
大模型
deepseek
一文看懂:多模态大模型(LMMs)与大语言模型(
LLMs
)的比较
大家好,我是大F,深耕AI算法十余年,互联网大厂技术岗。知行合一,不写水文,喜欢可关注,分享AI算法干货、技术心得。更多文章见《大模型理论和实战》、《DeepSeek技术解析和实战》,一起探索技术的无限可能!【数据集篇】更多阅读:大语言模型常见任务及评测数据集汇总(一):70余个数据集!https://blog.csdn.net/zengzizi/article/details/137251140
大F的智能小课
·
2025-05-20 08:33
大模型理论和实战
DeepSeek技术解析和实战
语言模型
人工智能
自然语言处理
论文翻译:ACL-2024.Yiming Huang.Competition-Level Problems are Effective LLM Evaluators
aclanthology.org/2024.findings-acl.803.pdf《竞赛级问题作为有效的LLM评估者》文章目录《竞赛级问题作为有效的LLM评估者》摘要1引言6结论局限性摘要大型语言模型(
LLMs
CSPhD-winston-杨帆
·
2025-05-20 03:57
论文翻译
LLMs-数据污染
人工智能
大语言模型应用指南:大语言模型的安全技术
大语言模型的安全技术作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着大语言模型(LargeLanguageModels,
LLMs
AI天才研究院
·
2025-05-20 02:20
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-25
2024-09-251.PromSec:PromptOptimizationforSecureGenerationofFunctionalSourceCodewithLargeLanguageModels(
LLMs
sp_fyf_2024
·
2025-05-19 22:19
人工智能前沿技术
大语言模型
深度学习
人工智能
算法
语言模型
自然语言处理
深度学习
LlamaIndex 第七篇 结构化数据提取
大型语言模型(
LLMs
)在数据理解方面表现出色,这也促成了它们最重要的应用场景之一:能够将常规的人类语言(我们称之为非结构化数据)转化为特定的、规范的、可被计算机程序处理的格式。
王学政2
·
2025-05-19 01:03
LlamaIndex
人工智能
python
LlamaIndex第二篇 使用
LLMs
和Embeddings向量模型
LlamaIndex为各类大语言模型(LLM)提供了统一接口,使用起来非常简单——只需安装对应的集成包即可: pipinstallllama-index-
llms
-openai-ihttps://mirrors.aliyun.com
王学政2
·
2025-05-19 01:32
LlamaIndex
人工智能
python
llama
英伟达推理模型论文速读:OpenCodeReasoning-Nemotron-32B
OpenCodeReasoning:AdvancingDataDistillationforCompetitiveCoding1.研究背景与动机自基于推理的大型语言模型(
LLMs
)出现以来,在代码任务中将推理能力蒸馏到学生模型中的技术取得了显著进展
Open-source-AI
·
2025-05-18 19:47
前沿
人工智能
算法
深度学习
大模型
源2.0-M32大模型适配AutoGPTQ工具及量化&推理教程
AutoGTPQ简介AutoGPTQ是一个开源工具包,专注于简化大规模语言模型(
LLMs
)的量化过程。
源大模型
·
2025-05-18 09:11
人工智能
语言模型
开源
A Survey on Multimodal Large Language Models论文解读
MultimodalLargeLanguageModel(MLLM)representedbyGPT-4Vhasbeenanewrisingresearchhotspot,whichusespowerfulLargeLanguageModels(
LLMs
call me by ur name
·
2025-05-18 06:43
large
model
语言模型
人工智能
自然语言处理
论文阅读:A Survey on Evaluation of Large Language Models
ASurveyonEvaluationofLargeLanguageModels这篇论文是由YupengChang等人撰写的关于大型语言模型(
LLMs
)评估的综述,题为《ASurveyonEvaluationofLargeLanguageModels
CSPhD-winston-杨帆
·
2025-05-18 05:10
论文阅读
论文阅读
语言模型
人工智能
给MCP加上RAG,工具准确率提升200%,起飞~
Datawhale分享作者:TiantianGan、QiyaoSun编辑:PaperAgent大型语言模型(
LLMs
)在有效利用越来越多的外部工具(如模型上下文协议(MCP)所定义的工具)方面存在困难,
Datawhale
·
2025-05-18 00:39
ReTool: Reinforcement Learning for Strategic Tool Use in
LLMs
主要内容研究背景:强化学习(RL)虽能提升大语言模型(
LLMs
)文本推理能力,但在数值计算和符号操作任务中仍存在局限,计算工具如代码解释器(CI)可弥补这一不足。
UnknownBody
·
2025-05-15 10:43
LLM
Daily
LLM
RL
人工智能
机器学习
深度学习
思维链(Chain-of-Thought, CoT)
大语言模型(
LLMs
)在复杂推理任务(如数学、逻辑、常识推理)中,单步输出答案的准确性有限。
爱看烟花的码农
·
2025-05-14 01:34
AIGC
AIGC
CoT
思维链
大语言模型
尤雨溪宣布:Vue 生态正式引入 AI
尤雨溪近日宣布,Vue、Vite和Rolldown的文档网站均已添加了
llms
.txt文件,这一举措旨在让大型语言模型(LLM)更方便地理解这些前端技术。
xiangzhihong8
·
2025-05-13 22:41
前端
杂文
前端框架
大语言模型应用指南:Prompt高效微调
Prompt高效微调关键词:大语言模型,Prompt,微调,参数高效,自然语言处理(NLP),对话系统,知识图谱,数据增强1.背景介绍1.1问题由来近年来,大语言模型(LargeLanguageModels,
LLMs
AI大模型应用实战
·
2025-05-13 16:36
java
python
javascript
kotlin
golang
架构
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他