E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大规模语言模型
大模型模型架构
第7章模型架构7.1大模型之模型概括
语言模型
的一开始就可以被看做是一个黑箱,当前
大规模
语言模型
的能力在于给定一个基于自身需求的prompt就可以生成符合需求的结果。
.whl
·
2025-03-27 01:50
深度学习专栏
人工智能学习专栏
大模型
施尧耘:量子计算终将实现;段路明:
大规模
量子计算还任重道远
【新智元导读】上周六,清华大学“人工智能前沿与产业趋势”系列讲座的第四讲开讲。本讲将由阿里云量子技术首席量子科学家施尧耘亲临现场,与清华大学海峡研究院大数据AI中心专家委员、百度七剑客之一、酷我音乐创始人雷鸣老师、清华大学姚期智讲座教授段路明教授、昆仲资本创始管理合伙人王钧老师共同参与,深度探讨人工智能时代量子计算的技术产业和投资的趋势与机遇。雷鸣首先讲了AI的基础设施(硬件和平台技术)。雷鸣(天
lyuharvey
·
2025-03-26 22:54
人工智能
大数据
嵌入式
Unsloth 库和Hugging Face Transformers 库对比使用
Unsloth库:Unsloth是一个专注于加速大
语言模型
(LLM)微调的开源工具。它通过优化计算步骤和GPU内核,显著提升训练速度并减少内存使用。
背太阳的牧羊人
·
2025-03-26 21:17
模型微调
模型加载
语言模型
手把手带你在Windows中搭建本地知识库(基于ollama本地部署大模型+客户端安装版AnythingLLM)非docker环境部署
一、Ollama安装Ollama是一个专注于本地运行大型
语言模型
(LLM)的框架,它使得用户能够在自己的计算机上轻松地部署和使用大型
语言模型
,而无需依赖昂贵的GPU资源。
慕慕涵雪月光白
·
2025-03-26 18:24
llama
知识图谱
Linux安装AnythingLLM
它能够将任何文档、资源或内容片段转化为大
语言模型
(LLM)在聊天中可以利用的相关上下文。AnythingLLM支持多种文档类型(PDF、TXT、DOCX等),具有对话和查询两种聊天模式。
neter.asia
·
2025-03-26 18:52
运维
python
如何准确获取 MySQL 主从延迟时间?
不久前,在一套采用MySQL5.7作为部署版本的生产环境中,由于业务执行了
大规模
事务,进而引发了MySQL主从复制的延迟,最终暴露出数据一致性方面的严重问题。
·
2025-03-26 16:07
mysql
大模型微调方法解析
1.为什么要进行模型微调适配特定任务需求:专业领域任务:预训练模型通常在
大规模
通用数据上进行训练,虽然具备广泛的知识,但在特定专业领域的表现可能不尽如人意。例如在医疗领域,疾病
西木风落
·
2025-03-26 15:03
AI大模型
大模型微调
LoRA微调
提示词微调
大规模
文档处理利器:Amazon Textract 参考架构
大规模
文档处理利器:AmazonTextract参考架构amazon-textract-serverless-large-scale-document-processingProcessdocumentsatscaleusingAmazonTextract
裘珑鹏Island
·
2025-03-26 15:32
走进吴恩达:揭秘Prompt Engineering 提示词工程
PromptEngineering概览何为Prompt在自然语言处理领域,尤其是与大型
语言模型
(LLM)互动时,Prompt起着至关重要的作用。
AI大模型教程
·
2025-03-26 14:55
prompt
人工智能
大模型
langchain
提示词工程
LLM
RAG
【DeepSeek大
语言模型
】AI智能体开发与大
语言模型
的本地化部署、优化技术
智能体是一种能够自主行动、感知环境、做出决策并与环境交互的智能应用或实体。特性自主性:智能体能够根据自身的感知和内部状态,独立做出决策,无需人类直接干预。反应性:能对环境的变化做出实时反应,及时调整自身行为以适应环境的动态变化。目的性:具有明确的目标或任务,其行为是为了实现这些目标,会根据目标来规划和执行行动。学习能力:能够从经验中学习,通过处理新信息和积累经验来改进其未来的行为,不断提升自身性能
赵钰老师
·
2025-03-26 12:15
ChatGPT
机器学习
DeepSeek
人工智能
语言模型
自然语言处理
数据分析
DeepSeek底层揭秘——deepEP
(1)定义deepEP(DeepSeekEndPoint)是DeepSeek开源的一款高性能、低延迟的分布式通信库,专为
大规模
深度学习训练和推理场景设计。
9命怪猫
·
2025-03-26 12:45
AI
人工智能
大模型
ai
ChatGPT、DeepSeek、Grok:AI
语言模型
的技术演进与未来趋势
1.引言人工智能(AI)技术的快速发展,使得大
语言模型
(LLM)成为众多行业的重要工具。ChatGPT、DeepSeek和Grok作为当今主流的AI
语言模型
,各自承载着不同的技术愿景和应用方向。
慌ZHANG
·
2025-03-26 09:52
AI模型
人工智能
chatgpt
AI 大模型的技术架构与应用解析
1.引言人工智能(AI)大模型正在重塑全球科技生态,以ChatGPT、DeepSeek、Grok为代表的AI
语言模型
在自然语言处理(NLP)、智能对话、内容生成等领域展现了卓越的能力。
慌ZHANG
·
2025-03-26 09:52
AI模型
人工智能
H100赋能生成式AI算力革新
其核心突破在于第四代TensorCore与Transformer引擎的协同设计,通过动态稀疏计算与混合精度支持,将
大规模
矩阵运算效率提升至新高度。
智能计算研究中心
·
2025-03-26 04:13
其他
探索AI的无限可能,体验智能对话的未来,大模型 API 演示
AI的无限可能,体验智能对话的未来,大模型API演示效果展示:项目概述这是一个基于Vue3+TypeScript+Vite构建的VistaAI演示项目,旨在提供一个简洁易用的界面来展示VistaAI大
语言模型
的能力
Southern Wind
·
2025-03-26 04:41
AI
Vue3
TS
人工智能
typescript
vue
前端
解读目前AI就业岗位——大
语言模型
(LLM)应用工程师学习路线、就业前景及岗位全解析
文章目录前言什么是大
语言模型
(LLM)应用工程师?岗位职责就业前景如何?
AI敲代码的手套
·
2025-03-26 04:38
AI岗位介绍
人工智能
语言模型
学习
深入理解Aider sends a repo map
Aider是一个AI编程辅助工具,主要通过与大
语言模型
(如GPT或Claude)协作来帮助开发者编辑代码。RepoMap是它提供给LLM的上下文机制,用于提升模型对代码库的理解能力。
超级小龙虾
·
2025-03-26 04:37
python
Python实现deepseek接口的调用
简介:DeepSeek是一个强大的大
语言模型
,提供API接口供开发者调用。
才华是浅浅的耐心
·
2025-03-26 02:54
python
数据库
java
在光速的边缘:MiniMax-01的算法实现与细节解析
在当今人工智能的快速发展中,
语言模型
和视觉
语言模型
的进步引起了广泛关注。
步子哥
·
2025-03-26 02:23
AGI通用人工智能
算法
人工智能
国产670亿参数的DeepSeek:超越Llama2,全面开源
模型概述DeepSeek,一款国产大型
语言模型
(LLM),凭借其670亿参数的规模,正引领着人工智能领域的新浪潮。
努力犯错
·
2025-03-26 02:51
microsoft
llama
自然语言处理
人工智能
语言模型
LMDrive: 基于大
语言模型
的闭环端到端自动驾驶
0.资源链接论文:LMDrive:Closed-LoopEnd-to-EndDrivingwithLargeLanguageModels项目:https://hao-shao.com/projects/lmdrive.html1.背景动机现有的自动驾驶方法存在以下问题:适用场景局限:对常见的简单场景有效,但在长尾事件和城市复杂场景时存在挑战,易导致严重事故交互理解局限:依赖于有限格式的输入(如传感
AI-Seeker
·
2025-03-26 02:21
语言模型
人工智能
自动驾驶
【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别
1.什么是智能体将大
语言模型
作为一个推理引擎。给定一个任务,智能体自动生成完成任务所需步骤,执行相应动作(例如选择并调用工具),直到任务完成。
星星点点洲
·
2025-03-26 01:47
LangChain开发过程
langchain
Ray 源码分析(16)—Ray Serve
它具有多项用于服务大
语言模型
的特性和性能优化,例如响应流、动态请求批处理、多节点/多GPU服务等。据说OpenAI背后用
Jim.Li
·
2025-03-26 01:15
AI
Infra
c++
ai
分布式
人工智能
架构
第一章 计算机系统概述
第一章计算机系统概述计算机的发展软件:系统软件应用软件硬件的发展世界第一台电子计算机:冯诺依曼计算机电子管时代->晶体管时代->中小规模集成电路->
大规模
,超
大规模
集成电路–>微处理器发展机器字长:计算机一次整数运算所能够处理的二进制位数贝尔实验室发明晶体管仙童半导体发明集成电路摩尔等人离开仙童创立
Run303
·
2025-03-25 23:02
计算机组成原理
笔记
曦智科技全球首发新一代光电混合计算卡
我们坚信,光电混合将会为人工智能、大
语言模型
、智能制造等领域带来算力革新。”天枢是一款深度融合光芯片与电芯片各自优势特点,并采用了3D先进封装技术的可编程光电混
·
2025-03-25 23:39
量子位
最大连续子序列和(动态规划 -- 经典Kadane算法)
如果采用暴力枚举,面对
大规模
数据会暴雷!
Vaiey22
·
2025-03-25 20:42
动态规划
算法
kadane算法
python
Java后端开发中的任务调度:使用Spring Batch实现批处理
在现代企业应用中,批处理是处理
大规模
数据的重要方式。SpringBatch为我们提供了强大的工具来实现批处理任务。本文将详细介绍如何使用SpringBatch进行任务调度,并实现批处理的完整流程。
weixin_836869520
·
2025-03-25 20:40
java
spring
batch
使用 ByteDance 的 UI-TARS Desktop 探索 AI 驱动的 GUI 自动化新前沿
ByteDance近期推出的UI-TARSDesktop(基于其强大的UI-TARS视觉-
语言模型
)为我们展示了一种全新的可能性:通过自然语言控制计算机,实现图形用户界面(GUI)的智能化自动化。
码事漫谈
·
2025-03-25 18:26
AI
ui
人工智能
自动化
人工智能 - SpatialLM:三维空间理解的开源大
语言模型
项目概述SpatialLM是由杭州群核科技(“杭州六小龙”之一)于GTC2025大会上开源的三维空间理解大
语言模型
。
天机️灵韵
·
2025-03-25 18:25
人工智能
#
VLA
具身智能
语言模型
人工智能
自然语言处理
使用LangChain和中文羊驼2.0搭建离线版的ChatPDF
本文的目标是搭建一个离线版本的ChatPDF(支持中英文),让你随心地与你想要阅读的PDF对话,借助大
语言模型
提升获取知识的效率。除此之外,你还可以:了解使用LangChain完整的流程。
大模型常客
·
2025-03-25 18:49
langchain
人工智能
ai
agi
经验分享
笔记
NLP高频面试题(十三)——什么是大模型幻觉,如何解决大模型幻觉
大模型幻觉(Hallucination)是指大型
语言模型
在生成文本时,
Chaos_Wang_
·
2025-03-25 17:47
NLP常见面试题
自然语言处理
人工智能
大规模
语言模型
在自动软件需求分析与验证中的应用
大规模
语言模型
在自动软件需求分析与验证中的应用关键词:
大规模
语言模型
、软件需求分析、需求验证、自然语言处理、软件工程摘要:本文深入探讨了
大规模
语言模型
在自动软件需求分析与验证中的应用。
杭州大厂Java程序媛
·
2025-03-25 16:40
DeepSeek
R1
&
AI人工智能与大数据
语言模型
需求分析
人工智能
ai
Java 中调用
语言模型
(如 OpenAI、阿里云通义千问、Hugging Face 等)API 的详细步骤和示例代码,涵盖常见场景及注意事项
以下是Java中调用
语言模型
(如OpenAI、阿里云通义千问、HuggingFace等)API的详细步骤和示例代码,涵盖常见场景及注意事项:1.常见
语言模型
API选择(1)OpenAIAPI特点:支持GPT
爱的叹息
·
2025-03-25 15:04
Java
基础整理
java
语言模型
阿里云
生成式AI驱动的高分子材料研发与应用
近年来,生成式人工智能(如大
语言模型
)在材料科学领域掀起革命性浪潮,其核心能力(从海量数据中挖掘构效关系、实现分子逆向设计)正在颠覆传统材料研发模式。
keyan_889
·
2025-03-25 15:29
材料
人工智能
材料科学
高分子化学
AI
航空航天
电力工业
硕博研究生
LangChain4j 与 LLM 代理(Agent)机制的深度结合
LangChain4j与LLM代理(Agent)机制的深度结合在大
语言模型
(LLM)的应用开发中,Agent(代理)是一个强大的概念,它可以使LLM不仅仅是一个简单的对话模型,而是能够动态决策、调用工具
小张学Ai
·
2025-03-25 09:18
langchain4j学习
langchain
后端
如何在多个GPU中训练非常大的模型?
目录一、并行训练策略1.数据并行2.模型并行3.混合并行:4.上下文并行二、内存优化技术三、总结在多个GPU上训练超
大规模
模型(如千亿参数级
语言模型
)需要结合并行策略、内存优化技术、分布式框架。
Mr终游
·
2025-03-25 07:00
大模型
人工智能
模型量化的原因和方法
优化模型参数以适应有限内存环境为了使具有大量参数(例如Llama3.1的4050亿个参数)的大型
语言模型
在合理内存的设备上高效运行,需要对模型进行一系列优化。
潇湘馆记
·
2025-03-25 06:27
人工智能
算法
群核科技开源空间理解生成模型SpatialLM, 构建具身智能训练基座
SpatialLM是一种3D大
语言模型
,旨在处理3D点云数据并生成结构化的3D场景
·
2025-03-25 04:10
机器学习人工智能数据挖掘
轻量级AI革命:无需GPU就能运算的DeepSeek-R1-1.5B模型及其低配推荐
随着人工智能技术的快速发展,大
语言模型
已成为推动产业智能化的重要工具。在这一领域,DeepSeek系列模型凭借其创新的架构和高效的性能,成为众多开发者和企业关注的焦点。
·
2025-03-25 04:09
使用 AI 技术实现智能问答系统
本文将介绍如何利用OpenAI的大
语言模型
API来实现一个简单的智能问答系统,并会演示如何通过中转API地址http://api.wlai.vip调用大模型。
llzwxh888
·
2025-03-25 04:13
人工智能
php
开发语言
python
SFT和RLHF是什么意思?
是什么意思解决方案:SFT(SupervisedFine-Tuning,监督微调)和RLHF(ReinforcementLearningfromHumanFeedback,基于人类反馈的强化学习)是两种用于改进大型
语言模型
玩人工智能的辣条哥
·
2025-03-25 00:15
人工智能
人工智能
深度学习
机器学习
万字长文总结多模态大模型后训练
万字长文总结多模态大模型后训练作者:yearn原文:https://zhuanlan.zhihu.com/p/31278114666本文介绍下我们对多模态alignment近期一系列进展的整理和总结大
语言模型
强化学习曾小健
·
2025-03-24 21:49
人工智能
大模型的应用与微调:如何调用 LLM?从 OpenAI API 到本地部署
本篇文章将详细介绍如何调用大
语言模型
(LLM),涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式,并探讨如何在本地部署LLM进行推理。
晴天彩虹雨
·
2025-03-24 19:02
AI
大模型
ai
语言模型
gpt
人工智能
基于人工智能的扫阅卷和数据分析服务需求文档
基于人工智能的扫阅卷和数据分析服务需求文档一、项目背景在教育领域,传统的人工阅卷方式效率低下、主观性强且易出错,难以满足
大规模
考试及频繁测评的需求。
YiWait
·
2025-03-24 19:59
人工智能
人工智能
数据分析
数据挖掘
当细致剪裁遇上大
语言模型
:从数据匹配到卓越性能的奇幻之旅
在浩如烟海的人工智能技术中,构建和调教大
语言模型
(LLMs)的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据,让模型在知识的海洋中游刃有余。
步子哥
·
2025-03-24 18:24
AGI通用人工智能
语言模型
人工智能
自然语言处理
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
01什么是大模型推理引擎大模型推理引擎是生成式
语言模型
运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-03-24 15:38
百度云大模型gpu
AI算力要变天了?一文搞懂ASIC和GPU
从早期的简单模型训练到如今的
大规模
语言模型
如ChatGPT等的出现,对算力的需求呈爆发式增长。01那什么是ASIC和GPU?ASIC:定制化
·
2025-03-24 15:08
asicgpuai芯片
R.E.D.算法:革新文本分类的半监督学习新范式
随着大型
语言模型
(LLMs)在解决问题方面的应用进入新时代,只有少数问题仍然存在不尽如人意的解决方案。
真智AI
·
2025-03-24 13:43
算法
r语言
分类
人工智能
学习
文档处理控件Aspose.Words 教程:.NET版中增强的 AI 文档摘要功能
在25.2版中,我们通过使用Anthropic生成
语言模型
进行摘要扩展了此功能。本篇内容将对此做讨论的。Aspose.wordsfor.Net最新版下载文档摘要有何新
CodeCraft Studio
·
2025-03-24 12:07
控件
文档管理
人工智能
excel
word
pdf
大模型提示词工程师的自我修养-应用二(RAG数据合成与数据多样性问题的解决) -(专题4)
1.生成数据大型
语言模型
(LLMs)具有生成连贯文本的强大能力。通过有效的提示策略,可以引导模型生成更好、一致且更有事实依据的响应。LLMs也特别适用于生成数据,这对于进行各种实验和评估非常有用。
AI专题精讲
·
2025-03-24 11:28
大模型专题系列
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他