E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
llms
Title: Empowering Social Network Intelligence with AI Agents
AIagents,poweredbyadvancementsinlargelanguagemodels(
LLMs
)andmultimodalAItechnologies,arerevolutionizingsocialnetworksbyofferingdeeperinsightsintouserinteractions
诗远小一
·
2025-02-26 14:28
人工智能
大数据
Lil‘Log《Extrinsic Hallucinations in
LLMs
》读后总结
博客《ExtrinsicHallucinationsinLLMs》由LilianWeng撰写,详细探讨了大型语言模型(
LLMs
)中“幻觉”现象的背景、原因、类型、影响及其缓解策略。
心碎小猫p
·
2025-02-25 02:42
人工智能
docker安装Open WebUI详解-遇到的坑OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file
一、OpenWebUI简介OpenWebUI(https://openwebui.com)是一个用户友好的Web界面,专为本地大语言模型(
LLMs
)设计。
坚定信念,勇往无前
·
2025-02-24 22:16
AI
docker
容器
运维
能力模型迁移:专业教育从「知识掌握度」转向「提示工程能力」
然而,随着以大型语言模型(
LLMs
)为代表的生成式AI技术的崛起,仅仅掌握知识已经远远不够,提示工程能力逐渐成为更核心、更关键
由数入道
·
2025-02-24 20:05
AI辅助教学
提示词工程
人工智能
DeepSeek-R1秘籍轻松迁移,只需原始数据0.3% | 邱锡鹏团队联合出品
他们提出了MHA2MLA这种数据高效的微调方法,使基于MHA(多头注意力)的大语言模型(
LLMs
)能够顺利转换到MLA架构。以Llama2-7B为例
·
2025-02-24 19:13
量子位
对抗性提示(adversarial prompts)
对抗性提示对抗性提示是提示工程中的一个重要主题,它可以帮助我们了解
LLMs
所涉及的风险和安全问题。对抗性提示也是一个重要的学科,可以识别这些风险并设计技术来解决这些问题。
u013250861
·
2025-02-23 16:18
LLM
LLM
Grok-3:人工智能领域的新突破
近日,xAI公司推出的最新AI模型——Grok-3,在ChatbotArena中一举夺魁,以破纪录的1402分傲视群雄,不仅刷新了大型语言模型(
LLMs
)的评分上限,更标志着AI技术的一次重大飞跃。
大模型之路
·
2025-02-23 10:59
大模型(LLM)
人工智能
Grok-3
llm
LLM之提示词工程
掌握提示工程技能对于深入理解大型语言模型(
LLMs
)的潜力与局限至关重要。研究人员借助提示工程,致力于增强LLM在广泛且复杂的任务(如问答系统与算术推理)中的表现。
樱花的浪漫
·
2025-02-22 16:11
大模型与智能体
人工智能
自然语言处理
知识图谱
神经网络
agent
大模型
2023-arXiv-FinGPT: 开源金融大语言模型
https://github.com/AI4Finance-Foundation/FinGPT&https://github.com/AI4Finance-Foundation/FinNLP摘要:大语言模型(
LLMs
量仔搞靓化
·
2025-02-22 12:41
金融大语言模型
金融
语言模型
人工智能
AnythingLLM 项目安装与配置指南
AnythingLLM项目安装与配置指南anything-llm为开源和闭源的大型语言模型(
LLMs
)、嵌入器和向量数据库提供开源的ChatGPT体验。
龙聪山Diane
·
2025-02-20 02:04
Ollama部署大模型并安装WebUi
Ollama用于在本地运行和部署大型语言模型(
LLMs
)的工具,可以非常方便的部署本地大模型安装Linuxcurl-fsSLhttps://ollama.com/install.sh|sh我是ubuntu
m0_74823611
·
2025-02-20 01:29
java
[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化
id=DoGmh8A39OChiWang1,SusanXueqingLiu2,AhmedH.Awadallah11微软研究院,雷德蒙德2史蒂文斯理工学院摘要大型语言模型(
LLMs
)因其生成能力引发了广泛关注
心心喵
·
2025-02-19 02:45
论文笔记
论文阅读
语言模型
人工智能
大语言模型(LLM)如何实现上下文的长期记忆?
引言大语言模型(LargeLanguageModels,
LLMs
),如GPT-4、Claude和LLaMA等,已经在自然语言处理领域展现出卓越的能力。
·
2025-02-18 00:06
使用多模态大语言模型进行深度学习的图像、文本和语音数据增强
在过去的五年里,研究方向已从传统的机器学习(ML)和深度学习(DL)方法转向利用大语言模型(
LLMs
),包括多模态方法,用于数据增强,以提高泛化能力,并在训练深度卷积神经网络时防止过拟合。
数行天下
·
2025-02-17 12:42
人工智能
语言模型
深度学习
人工智能
自然语言处理
深度剖析DeepSeek本地部署:技术、实践与优化策略
其中,大语言模型(
LLMs
)作为人工智能领域的关键技术,在自然语言处理、智能客服、内容创作等众多领域展现出了强大的应用潜力,引发了学术界和产业界的广泛关注。
Abossss
·
2025-02-17 05:11
AI
论文
python
ai
人工智能
大模型会替代哪些工作岗位?
引言本文主要探讨了大模型(
LLMs
)对就业市场的影响。包括了介绍那些已经受到大模型影响的行业,对大模型将要产生的影响,以及如何更好的监管大模型应用进行了讨论。
中年猿人
·
2025-02-15 12:30
人工智能
ai
学习
【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in
LLMs
via Reinforcement Learning
DeepSeek-R1论文解析1.论文基本信息标题:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者:DeepSeek-AI团队(联系邮箱:
[email protected]
)发表时间与出处:2024年,AIME2024(人工智能与数学教育国际会议)关键词:ReinforcementLe
大表哥汽车人
·
2025-02-15 02:40
人工智能
大语言模型学习笔记
论文阅读
人工智能
deepseek
大语言模型原理基础与前沿 通过稀疏MoE扩展视觉语言模型
大语言模型(LargeLanguageModels,
LLMs
)如GPT-3、BERT等,已经在自然语言处理(NLP)任务中取得了显著的成果。
AI天才研究院
·
2025-02-14 12:52
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【AI论文】使用大型推理模型进行竞技编程
摘要:我们的研究表明,将强化学习应用于大型语言模型(
LLMs
)能显著提升复杂编码和推理任务的性能。
东临碣石82
·
2025-02-13 23:06
人工智能
多模态大模型(LMMs)与大语言模型(
LLMs
)的比较
前言现在的大模型分为两大类:大语言模型(LargeLanguageModels,简称
LLMs
)和多模态大模型(LargeMultimodalModels,简称LMMs)。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
如何训练
LLMs
进行“思考”(如o1和DeepSeek-R1)
如何训练
LLMs
进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-13 16:07
人工智能
使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型
在这篇技术文章中,我们将探讨如何使用llama-cpp-python(llama.cpp的Python绑定)在本地运行大语言模型(
LLMs
)。
hgSdaegva
·
2025-02-12 20:16
llama
python
开发语言
llama3简介与国内最快体验方式
Meta公司研发并推出了MetaLlama3系列大型语言模型(
LLMs
),该系列包括8B和70B参数量的预训练及指令调优生成文本模型。
weixin_40941102
·
2025-02-12 15:08
python
Java程序员Python一小时速成
背景由于最近要开发一些AILLM(LargeLanguageModel大语言模型)应用程序,然后又想使用LangChain(LangChain是一个用于构建和操作大语言模型(
LLMs
)的框架,旨在帮助开发者更方便地集成和使用各种
BossFriday
·
2025-02-12 15:04
AI
&
LLM
java
python
开发语言
大语言模型多代理协作(MACNET)
研究背景与动机:大语言模型(
LLMs
)因神经缩放定律展现出强大能力,
ZhangJiQun&MXP
·
2025-02-12 00:51
2021
AI
python
教学
2021
论文
语言模型
人工智能
自然语言处理
【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团(附面题)
博客主页:[青松]目录【NLP百面百过】大模型算法高频面题(全面整理ʘ‿ʘ)一、大模型(
LLMs
)基础面大模型(
LLMs
)架构篇注意力机制(Attention)篇Transformer理论篇二、大模型微调面有监督微调
青松ᵃⁱ
·
2025-02-11 13:37
NLP
百面百过
AI面试
NLP面试
算法面试
人工智能
《大语言模型:原理与工程实践》书籍推荐及详细说明
随着人工智能技术的发展,尤其是深度学习技术的进步,大规模语言模型(LargeLanguageModels,
LLMs
)已成为自然语言处理领域的研究热点。
大模型入门教程
·
2025-02-11 01:57
语言模型
人工智能
自然语言处理
llama
大模型
代码星辰:探索 benchmark 构建的奥秘之旅
而在这片“代码星海”中,如何评估大语言模型(
LLMs
)在编程任务上的表现,就像天文学家借助望远镜探索宇宙奥秘一般关键。近日,一篇题为《HowShouldIBuildABenchmark?
步子哥
·
2025-02-10 07:56
AGI通用人工智能
人工智能
使用 llama-cpp-python 在 LangChain 中运行 LLM 模型
使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域,大型语言模型(
LLMs
)的应用越来越广泛。
qq_37836323
·
2025-02-10 01:37
llama
python
langchain
DeepSeek-R1: Incentivizing Reasoning Capability in
LLMs
via Reinforcement Learning论文解读
文章目录前言一、摘要二、引言三、贡献1.贡献后训练:基础模型的大规模强化学习蒸馏:较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2.DeepSeek-R1-Zero:ReinforcementLearningontheBaseModelReinforcementLearningAlgorithm(GRPO重点)Rewar
tangjunjun-owen
·
2025-02-09 23:54
paper解读
DeepSeek
R1
DeepSeek
zero
大语言模型
大模型 RAG 知识总结
RAG(Retrieval-AugmentedGeneration)面一、
LLMs
已经具备了较强能力了,存在哪些不足点?
da pai ge
·
2025-02-09 16:38
解决方法
prometheus
kubernetes
DeLLMa框架:优化复杂决策的新路径
标题:DeLLMa框架:优化复杂决策的新路径文章信息摘要:DeLLMa框架通过整合大型语言模型(
LLMs
)和结构化数据,优化了在不确定性条件下的决策过程,特别是在处理复杂决策问题时,能够增强决策的严谨性和精确性
XianxinMao
·
2025-02-09 16:07
人工智能
蒸馏:让DeepSeek用“移魂大法”增强你的小模型
蒸馏:让DeepSeek用“移魂大法”增强你的小模型原创格知致能寒武纪人工智能2025年02月06日00:48北京前言在大型语言模型(
LLMs
)时代,知识蒸馏成为一种重要方法,用于将能力强大的、参数规模庞大的
AI生成曾小健
·
2025-02-09 11:58
Deepseek原理与使用
人工智能
Deepseek成功启示:从 TRPO 到 GRPO训练LLM
这是深入了解大型语言模型
LLMs
如何训练的绝佳机会。
大模型之路
·
2025-02-08 20:03
强化学习
大模型(LLM)
人工智能
LLM
强化学习
deepseek
GRPO
TRPO
【Ollama+Deepseek】本地化部署运行Deepseek模型
二、Ollama下载安装Ollama是一个开源工具,用于在本地计算机上快速部署和运行大型语言模型(
LLMs
)。它专注于简化LLM的本地运行流程,无需复杂的配置即可在个人设备(如
·
2025-02-08 06:32
AI大语言模型的全面解读
大语言模型(LargeLanguageModels,
LLMs
)无疑是近年来最耀眼的星辰之一。
草莓屁屁我不吃
·
2025-02-08 05:48
人工智能
语言模型
自然语言处理
chatgpt
【Ollama+Deepseek】本地化部署运行Deepseek模型
二、Ollama下载安装Ollama是一个开源工具,用于在本地计算机上快速部署和运行大型语言模型(
LLMs
)。它专注于简化LLM的本地运行流程,无需复杂的配置即可在个人设备(如
·
2025-02-08 02:59
【论文阅读】DeepSeek-R1:通过强化学习激励
LLMs
的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in
LLMs
via RL
DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearningDeepSeek-R1:通过强化学习激励
LLMs
的推理能力
AI天才研究院
·
2025-02-07 22:05
DeepSeek
R1
&
大数据AI人工智能大模型
DeepSeek
计算
论文阅读
deepseek
agi
ai
llm
agent
cot
大语言模型原理基础与前沿 高效的MoE架构
大语言模型原理基础与前沿高效的MoE架构关键词:大语言模型,MoE架构,参数高效微调,分布式训练,模型压缩,推理加速1.背景介绍1.1问题的由来随着深度学习技术的飞速发展,大语言模型(LargeLanguageModels,
LLMs
AI架构设计之禅
·
2025-02-07 13:39
DeepSeek
R1
&
大数据AI人工智能
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
LLM速览篇【91-120】
概述文档:基于LLM的最新研究方向归纳这30篇内容可以发现当前
LLMs
在各个领域展现了强大的适应性和创新潜力,从医疗、教育、视觉任务到机器人控制、法律与政策、生成式AI、隐私保护和系统优化,
LLMs
的应用范围正在不断扩大
hjzhang75
·
2025-02-07 13:03
人工智能
nlp
产品经理的人工智能课 02 - 自然语言处理
2一个NLP算法的例子——n-gram模型3预处理与重要概念3.1分词Token3.2词向量化表示与Word2Vec4与大语言模型的交互过程参考链接大语言模型(LargeLanguageModels,
LLMs
平头某
·
2025-02-07 05:12
人工智能
产品经理
自然语言处理
专为RAG和AGENT而生的PDF解析新工具:PymuPDF4LLM
为此,就出现了一个专为大语言模型(
LLMs
,LargeLanguageModels)设计的PDF解析的大杀器:PymuPDF4llm。
CS创新实验室
·
2025-02-07 03:56
AIGC
pdf
AIGC
Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM
论文信息标题:UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap作者:ShiruiPan摘要
LLMs
,例如chatGPT和GPT4,由于其涌现能力和泛化性
笨cc
·
2025-02-06 22:23
KG读论文
语言模型
知识图谱
笔记
[论文笔记] Deepseek技术报告
1.总体概述背景与目标报告聚焦于利用强化学习(RL)提升大型语言模型(
LLMs
)的推理能力,旨在探索在不依赖大规模监督微调(SFT)的情况下,模型如何自我进化并形成强大的推理能力。
心心喵
·
2025-02-06 22:53
论文笔记
论文阅读
人工智能
Python用langchain、OpenAI大语言模型LLM情感分析AAPL股票新闻数据及提示工程优化应用
p=39614本文主要探讨了如何利用大语言模型(
LLMs
)进行股票分析。
·
2025-02-06 17:10
数据挖掘深度学习机器学习
大模型面试必看!超详细面经指南+答案,轻松拿Offer!2025大模型上岸就靠它了!
目录[x]大模型(
LLMs
)基础面[x]1.目前主流的开源模型体系有哪些?[x]2.prefixLM和causalLM区别是什么?[x]3.涌现能力是啥原因?[x]4.大模型LLM的架构介绍?
AI大模型-大飞
·
2025-02-06 16:47
大模型
AI大模型
大模型教程
人工智能
学习
LLM
Deepseek
DeepSeek-R1:通过强化学习提升大型语言模型推理能力的探索
DeepSeek-R1:通过强化学习提升大型语言模型推理能力的探索在人工智能领域,大型语言模型(
LLMs
)的发展日新月异,其在自然语言处理和生成任务中的表现逐渐接近人类水平。
kaichu2
·
2025-02-06 03:07
论文翻译
DeepSeek
什么是大模型框架?常用的大模型框架盘点对比
什么是大模型框架大模型框架是指用于训练、推理和部署大型语言模型(
LLMs
)的软件工具和库。
AI产品经理
·
2025-02-05 21:25
学习
人工智能
大数据
深度学习
语言模型
关于大模型 AGI 应知应会_生在AI发展的时代
一、大模型的核心概念与特点(一)什么是大模型大模型(LargeLanguageModels,
LLMs
)是指具有大规模参数和复杂计算结构的深度学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数
森焱森
·
2025-02-05 10:38
机器人
人工智能
算法
总结
科技
【memgpt】letta 课程1/2:从头实现一个自我编辑、记忆和多步骤推理的代理
llms
-as-operating-systems-agent-memoryllms-as-operating-systems-agent-memory内存操作系统的内存管理
等风来不如迎风去
·
2025-02-03 23:06
AI入门与实战
java
android
数据库
letta
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他