E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM九层妖塔
【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models
本文提出Layout-Prompter,利用大型语言模型(
llm
)通过上下文学习来解决上述问题。LayoutPr
进击的乔洋
·
2025-03-09 16:40
论文阅读
语言模型
人工智能
大规模语言模型构建流程
大规模语言模型1.大语言模型大规模语言模型(LargeLanguageModels,
LLM
),也称大语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,通常使用自监督学习方法通过大量无标注文本进行训练
人工智能技术笔记
·
2025-03-09 15:34
语言模型
人工智能
自然语言处理
LLM
时代的小模型思考:《What is the Role of Small Models in the
LLM
Era: A Survey》论文笔记
ImperialCollegeLondonAbstract问题:扩大模型大小会导致计算成本和能耗呈指数级增长,这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型(SMs)经常用于实际环境中,引发了关于小模型在
LLM
FrancisQiu
·
2025-03-09 14:02
learning
nlp
paper
reading
论文阅读
OpenManus:快速复刻Manus项目的技术路径与实施策略
这种设计使得复刻项目时能够快速剥离非必要模块,例如:模块替换:通过修改config.toml的
llm
配置段,可在1小时内完成从GPT-4到Claude3的模型切换功能裁剪:删除vision模块相关代码及配置项即可实现
花生糖@
·
2025-03-09 12:15
manus
openmanus
AI
开源
人工智能
【快速入门】本地知识库部署:FastGPT与Dify轻松上手全指南!
本文主要内容本地部署Dify、FastGPT、OllamaDify、FastGPT对接一些目前免费的
LLM
大语言AI模型Dify、FastGPT对接Ollama本地模型大家好,我是一名喜欢在家折腾本地部署的开发者
大模型老炮
·
2025-03-09 11:33
大模型入门
大模型
人工智能
产品经理
大模型学习
知识库部署
AI
LLM
大模型安全概述
引言2022年底以来,以ChatGPT为代表的大模型飞速发展,正在成为#驱动新质生产力发展#的新动能、人类探索未知的新工具.在显著提升人工智能(artificialintelligence,AI)模型通用理解和生成能力的同时,也带来了前所未有的安全风险.大模型的能力与风险生成式大模型因其强大的智能能力和巨大的应用潜力吸引了众多研究者和企业的关注.从智能能力的角度来看,研究人员观测到:当训练数据和参
LLM教程
·
2025-03-09 06:06
安全
人工智能
chatgpt
embedding
langchain
llama
在 VSCode 中本地运行 DeepSeek,打造强大的私人 AI
步骤1:在VSCode中安装Ollama和CodeGPT要在本地运行DeepSeek,我们首先需要安装Ollama,它允许我们在我们的机器上运行
LLM
,以及CodeGPT,它是集成这些模型以提供编码辅助的
csdn_aspnet
·
2025-03-08 23:19
DeepSeek
Visual
Studio
vscode
DeepSeek
大模型RAG入门到实战基础教程(非常详细),大模型RAG入门到精通,收藏这一篇就够了!
写在前面大模型(LargeLanguageModel,
LLM
)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分域时,通用大模型就会面临专业知识不足的问题。
AI程序猿人
·
2025-03-08 18:56
人工智能
AI大模型
AI
RAG
LLM
大语言模型
大模型入门
研究发现,
LLM
基于数据的内在含义进行表示,并以其主导语言推理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://rengongzhineng.io/【本周AI新闻:Deepseek崛起背后:AI智能代理时代正式到来?】https://w
新加坡内哥谈技术
·
2025-03-08 16:21
人工智能
自然语言处理
语言模型
深度学习
copilot
解锁 Hugging Face 的 smolagents:AI 代理的革命性突破!
AI代理的崛起随着大型语言模型(
LLM
)推理能力的增强,AI代理成为了当前最热门的话题。这些代理不仅能够独立做出决策,还能根据用户输入执行任务。
真智AI
·
2025-03-08 13:27
人工智能
python
开发语言
机器学习
pandas
Ollama:让大型语言模型触手可及
Ollama:让大型语言模型触手可及导语:近年来,大型语言模型(
LLM
)发展迅猛,但对于普通用户而言,搭建和使用
LLM
仍有一定门槛。
步子哥
·
2025-03-08 12:15
AGI通用人工智能
语言模型
人工智能
自然语言处理
DeepSeek掘金——vLLM和ollama综合对比
欢迎来到我们深入研究
LLM
推理框架的最后一部分!在第一部分和第二部分中,我们分别探讨了Ollama和vLLM,了解了它们的架构、功能和基本性能特征。
不二人生
·
2025-03-08 10:12
DeepSeek掘金指南
大模型
DeepSeek
人工智能
项目管理发展史 --转
项目管理通常被认为是第二次世界大战的产物(如美国研制原子弹的曼哈顿计划),事实上,项目管理历史源远流长,其发展大致经历了以下阶段:(1)古代其代表作如我国的长城、埃及的金字
塔
、古罗马的供水渠这样不朽的伟大工程
hongzhen1114
·
2025-03-08 08:46
项目管理
教育
工作
任务
活动
internet
打卡代码随想录第17天:LeetCode654.最大二叉树 、 617.合并二叉树、 700.二叉搜索树中的搜索、98.验证二叉搜索树
学习资料:代码随想录文中含
LLM
生成内容,不一定对654.最大二叉树力扣题目地址思路:不断寻找该部分的最大值去切割数组,不断递归,到在左闭右开区间不成立时,返回空节点。
jingjingjing1111
·
2025-03-08 07:26
算法
数据结构
打卡代码随想录第15天:LeetCode 110.平衡二叉树 257. 二叉树的所有路径 404.左叶子之和
学习资料:代码随想录文中含
LLM
生成内容110.平衡二叉树力扣题目链接思路:逐层返回当前节点的最大高度,比较各节点的左右孩子高度后续方法遍历,因为‘中’是比较环节,要在左右之后/***Definitionforabinarytreenode
jingjingjing1111
·
2025-03-08 07:24
leetcode
打卡代码随想录算法训练营第11天: 150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素
代码随想录文中含
LLM
回答内容150.逆波兰表达式求值力扣题目链接思路K:先理解逆波兰表达式是啥,是把运算符放在了两个要运算的数字的后边,又叫后缀表达式。
jingjingjing1111
·
2025-03-08 07:51
leetcode
山海鲸接入DeepSeek~赋予AI 3D感知“超能力”
山海鲸震撼升级,一键直连DeepSeek、通义千问等主流大模型,融合前沿3D-
LLM
算法,赋予AI3D感知“超能力”,让数字孪生生产力全面爆发,开启无限可能!
山海鲸可视化
·
2025-03-08 06:03
数字孪生
数字孪生
AI
DeepSeek
通义千问
3D
NL2SQL技术方案系列(5):金融领域NL2SQL技术方案以及行业案例实战讲解3--非
LLM
技术方案
NL2SQL技术方案系列(5):金融领域NL2SQL技术方案以及行业案例实战讲解3NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及
LLM
大模型(SpidervsBIRD)全面对比优劣分析[Text2SQL
汀、人工智能
·
2025-03-08 03:00
LLM工业级落地实践
prompt
人工智能
大语言模型
NL2SQL
Text2SQL
NL2SQL技术方案系列(1):NL2API、NL2SQL技术路径选择;
LLM
选型与Prompt工程技巧,揭秘项目落地优化之道
NL2SQL技术方案系列(1):NL2API、NL2SQL技术路径选择;
LLM
选型与Prompt工程技巧,揭秘项目落地优化之道NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及
LLM
大模型(SpidervsBIRD
汀、人工智能
·
2025-03-08 03:59
LLM工业级落地实践
prompt
人工智能
大语言模型
NL2SQL
Text2SQL
AI大模型
自然语言处理
NL2SQL进阶系列(2):DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]
NL2SQL进阶系列(2):DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及
LLM
大模型(SpidervsBIRD)全面对比优劣分析
汀、人工智能
·
2025-03-08 03:58
LLM工业级落地实践
gpt
人工智能
深度学习
大语言模型
sql
NL2SQL
Text2SQL
Spring AI简单使用
Java大模型应用开发,微服务整合DeepSeek,LangChain大型语言模型
LLM
实战-尚硅谷文
NaughtyBo
·
2025-03-08 01:40
记录
spring
象牙
塔
中的“智者”:DeepSeek R1 引领高校问答智体新纪元
目录高校问答智体的“前世今生”:痛点与机遇DeepSeekR1:开启推理大模型的新篇章“DeepSeekR1+高校”:场景、架构与实践3.1场景一:智能学术助手3.2场景二:个性化学习导航3.3场景三:科研数据分析3.4系统架构设计3.5实践案例分享技术进阶:让问答智体更“聪明”4.1知识图谱融合4.2持续学习与反馈4.3多模态融合挑战与展望:迈向更广阔的未来1.高校问答智体的“前世今生”:痛点与
海棠AI实验室
·
2025-03-08 00:50
“智教之光“
-
探索AI教育新范式
人工智能
RAG
DeepSeek
CentOS 7中安装Dify
Dify是一个开源的
LLM
应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。
laolitou_1024
·
2025-03-07 22:04
CentOS
Docker
AI
centos
运维
人工智能
2024年图灵奖公布:两位AI先锋因强化学习获奖
萨顿现在担任阿尔伯
塔
大学教授,他也是前DeepMind研究科学家。两人将分享图灵奖的100万美元奖金。图灵奖设立于1966年,常被称为“计算
吴脑的键客
·
2025-03-07 13:15
人工智能
人工智能
chatgpt
Agentic Security:开源
LLM
漏洞扫描器
AgenticSecurity:开源
LLM
漏洞扫描器项目地址:https://gitcode.com/gh_mirrors/ag/agentic_security项目介绍AgenticSecurity是一款开源的大型语言模型
袁立春Spencer
·
2025-03-07 13:06
《代码巫师启示录:当人类开始用机器思考》
新物种"##⌨️第一重身份:他们是用键盘施法的现代萨满凌晨三点的IDE(代码编辑器)泛着幽幽蓝光,程序员正进行着这个时代最神秘的仪式——把咖啡因转化为函数,用注释书写咒语,在GitHub上建造数字巴别
塔
。
·
2025-03-07 11:32
人工智能
YOLOv10改进之MHAF(多分支辅助特征金字
塔
)
YOLOv10架构YOLOv10的架构主要由主干网络、特征金字
塔
和预测头三部分组成。主干网络采用改进的Darknet结构,增强特征提取能力。
清风AI
·
2025-03-07 11:20
深度学习算法详解及代码复现
人工智能
计算机视觉
深度学习
算法
机器学习
LLM
辅助编程:代码自动生成与优化
LLM
,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化,程序员面临着越来越高的开发压力和效率要求。
AI智能涌现深度研究
·
2025-03-07 05:54
计算机软件编程原理与应用实践
DeepSeek
R1
&
大数据AI人工智能
java
python
javascript
kotlin
golang
架构
人工智能
【大模型技术】LlamaFactory 的原理解析与应用
LlamaFactory是一个基于LLaMA系列模型(如LLaMA、LLaMA2、Vicuna等)的开源框架,旨在帮助开发者和研究人员快速实现大语言模型(
LLM
,LargeLanguageModel)的微调
大数据追光猿
·
2025-03-07 00:32
大模型
transformer
人工智能
语言模型
python
github
docker
机器学习
开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡(五)
二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(
LLM
)。
开源技术探险家
·
2025-03-06 23:26
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
揭秘AWS GPU实例:以极致AI算力与成本优化,重塑企业智能竞争力
面对动辄千亿参数的
LLM
大模型训练、实时高并发的AI推理场景,如何兼顾超强算力与极致成本?本文将深度解析AWSGPU实例的颠覆性技术方案,带您解锁AI时代的核心生产力。
AWS官方合作商
·
2025-03-06 23:55
人工智能
aws
云计算
gpu算力
【大模型系列篇】Vanna-ai基于检索增强(RAG)的sql生成框架
简介Vanna是基于检索增强(RAG)的sql生成框架Vanna使用一种称为
LLM
(大型语言模型)的生成式人工智能。
木亦汐丫
·
2025-03-06 23:54
大模型
语言模型
sql
agi
ai
数据库
人工智能
embedding
数学希腊符号
Ααalpha/a:lf/阿尔法2、Ββbeta/bet/贝塔3、Γγgamma/ga:m/伽马4、Δδdelta/delt/德尔塔5、Εεepsilon/ep`silon/伊普西龙6、Ζζzeta/zat/截
塔
7
Humingway
·
2025-03-06 22:46
考研
数学
Mac 基于 Ollama 安装 DeepSeek-R1(蒸馏版本)、AnythingLLM 及使用体验
简介下载与安装Ollama下载并运行DeepSeek-R11.在终端运行(建议从8B开始)2.本地模型存储路径3.终端测试4.查询服务状态5.退出服务下载并运行AnythingLLM1.下载与安装2.设置
LLM
窝窝和牛牛
·
2025-03-06 21:12
人工智能
【AI爬虫干货】Crawl4AI+DeepSeek:从安装配置到 DeepSeek 集成,掌握 AI 爬虫核心技术「喂饭教程」
爬虫核心技术「喂饭教程」Crawl4AI简介一、安装二、异步爬取网页内容三、批量抓取四、保存结果到文件五、与DeepSeek模型结合使用总结Crawl4AI简介Crawl4AI是一个开源的、专为大型语言模型(
LLM
blues_C
·
2025-03-06 18:10
AI测试:从入门到进阶
Python爬虫实战
人工智能
爬虫
deepseek
python
AI爬虫
AstrBot:多平台
LLM
聊天机器人框架,让 AI 触手可及!
产品概述AstrBot是一款多平台大型语言模型(
LLM
)聊天机器人及开发框架,提供松耦合、异步的AI机器人解决方案。
Hello server
·
2025-03-06 14:06
机器人
人工智能
成为
LLM
大师的必读书籍:这几本大模型书籍,详细到让你一篇文章就收藏足够
以下是几本关于大模型和人工智能领域的经典书籍,它们各自具有独特的特点和适用人群:《深度学习》(DeepLearning)作者:伊恩·古德费洛(IanGoodfellow)、约书亚·本吉奥(YoshuaBengio)、亚伦·库维尔(AaronCourville)简介:《深度学习》是深度学习领域的经典之作,全面介绍了深度学习的基础知识、主要模型及其应用。书中详细讲解了神经网络、卷积神经网络、循环神经网
AGI大模型老王
·
2025-03-06 13:58
产品经理
大模型教程
学习
大模型
人工智能
LLM
大模型书籍
8.1 从28GB到7GB!大模型显存暴降4倍的量化实战指南
大模型显存暴降4倍的量化实战指南8.1模型显存占用与量化技术简介8.1.1大模型显存占用分析在部署和训练大语言模型(
LLM
)时,显存占用是开发者面临的核心挑战。
少林码僧
·
2025-03-06 11:42
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
语言模型
人工智能
gpt
【AI大模型应用开发】【LangChain系列】5. 实战LangChain的智能体Agents模块
在我前面的MetaGPT系列文章中,已经对智能体有了一个认知,重温一下:智能体=
LLM
+观察+思考+行动+记忆将大语言模型作为一个推理引擎。
同学小张
·
2025-03-06 10:03
大模型
人工智能
langchain
python
笔记
agi
gpt
AI-native
给没有登录认证的web应用添加登录认证(openresty lua实现)
我也折腾了下本地部署,ollama、vllm、llama.cpp都弄了下,webui也用了几个,发现nextjs-ollama-
llm
-ui小巧方便,挺适合个人使用的。
dgiij
·
2025-03-06 08:47
前端
openresty
lua
大语言模型中的 Token:它们是什么,如何工作?
大语言模型(
LLM
,LargeLanguageModel)并不是直接处理整个句子或文章,而是拆分成一个个Token(标记)来进行计算。那么,什么是Token?它们在大语言模型中起到什么作用?
运维小子
·
2025-03-06 07:33
语言模型
人工智能
自然语言处理
结构化思考和金字
塔
结构之:信息检索与知识获取
作者:禅与计算机程序设计艺术文章目录1.简介2.1概念定义2.2检索阶段2.3提取阶段3.1信息检索和文本信息处理的组成3.2技术总体架构3.3信息检索的关键技术3.3.1倒排索引和TF-IDF权值3.3.1.1倒排索引3.3.1.2TF-IDF权值3.3.2文档集合模型3.3.3语言模型3.3.3.1词袋模型3.3.3.2n-gram模型3.3.4PageRank算法3.3.5信息熵的实体抽取3
AI天才研究院
·
2025-03-06 06:31
架构师必知必会系列
编程实践
大数据
人工智能
语言模型
Java
Python
架构设计
大模型(
LLM
)的若干科普之问(七):如何隔离
LLM
微调结果?
一、微调大模型
LLM
的微调是指在预训练好的大型语言模型基础上,通过特定任务的数据进行进一步训练,以提升模型在该任务上的性能。
人工干智能
·
2025-03-06 04:12
大模型编程
Python的高级知识
LLM
深度学习突破:LLaMA-MoE模型的高效训练策略
在人工智能领域,大模型(
LLM
)的崛起带来了前所未有的进步,但随之而来的是巨大的计算资源需求。
人工智能大模型讲师培训咨询叶梓
·
2025-03-06 01:44
深度学习
llama
人工智能
Llama-Moe
大模型
语言模型
2万字长文,九篇论文读懂大语言模型的前世今生
如果感兴趣的话,感谢关注,点赞转发在看收藏,五键四连,谢谢~更多
LLM
架构文章:
LLM
架构专栏近日热文:1.全网最全的神经网络数学原理(代码和公式)直观解释2.大模型进化史:从Transformer到DeepSeek-R1
·
2025-03-06 00:32
人工智能
大语言模型技术发展
LLM
技术呈现出大型模型和小型模型并行发展的趋势,同时,多模态功能和长上下文能力成为顶级模型的标准配置。MoE架构的出现推动了模型参数量向万亿级别迈进。
联蔚盘云
·
2025-03-06 00:43
经验分享
大模型中的Token究竟是什么?从原理到作用深度解析
引言在人工智能领域,大型语言模型(
LLM
)如GPT-4、Claude等系统性地改变了人机交互方式。这些模型处理文本的核心单元被称为"Token",这个看似简单的概念实则蕴含复杂的工程设计和语言学原理。
·
2025-03-05 16:48
自然语言处理算法人工智能
零基础也能看懂的ChatGPT等大模型入门解析!大模型入门到精通,看这篇就够了!
近两年,大语言模型
LLM
(LargeLanguageModel)越来越受到各行各业的广泛应用及关注。对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。
大模型微调实战
·
2025-03-05 12:27
chatgpt
百度
人工智能
大数据
wps
学习
大模型
信奥赛CSP-J复赛集训(DP专题)(13):P2800 又上锁
妖
塔
信奥赛CSP-J复赛集训(DP专题)(13):P2800又上锁
妖
塔
题目描述小A在玩《剑仙》,他遇到了一个锁
妖
塔
,想从外面爬上去。锁
妖
塔
共有nnn层,第i
王老师青少年编程
·
2025-03-05 12:52
csp
信奥赛
c++
算法
数据结构
dp
gesp
大模型研究:DeepSeek版本比较说明
截至2024年11月,DeepSeek已发布了多个版本的大模型,主要包括DeepSeek-Coder、DeepSeek-
LLM
等,各版本在不同方面各有优劣:各版本简介及对比1.DeepSeek-Coder
程序猿学长
·
2025-03-05 09:33
语言模型
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他