E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bert语言模型
【NLP-04】tranformers库保姆级使用教程---以
BERT
模型为例
安装要安装一个非常轻量级的Transformers库,您可以执行以下步骤:1、打开终端或命令提示符。2、运行以下命令来安装Transformers库:pipinstalltransformers这将使用pip工具从PythonPackageIndex(PyPI)下载并安装Transformers库。请确保您的计算机上已经安装了pip。然后,您可以在Python代码中导入Transformers库:
云天徽上
·
2025-02-19 03:28
NLP
bert
人工智能
深度学习
自然语言处理
机器学习
numpy
信息可视化
[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型
语言模型
生成推理超参优化
成本效益高的大型
语言模型
生成推理的超参数优化https://openreview.net/pdf?
心心喵
·
2025-02-19 02:45
论文笔记
论文阅读
语言模型
人工智能
DeepSeek大模型的发展的十问十答
DeepSeek大模型是由杭州深度求索人工智能基础技术研究有限公司开发的一款基于Transformer架构的大型
语言模型
,具体介绍如下:1.架构基础Transformer架构:DeepSeek大模型基于
科技互联人生
·
2025-02-19 00:25
人工智能
AIGC
Deepseek
深入解析LangChain4j中的ChatLanguageModel API:从基础到高级应用
聊天与
语言模型
|LangChain4j注意本页描述的是低级别的LLMAPI。有关高级LLMAPI,请参见AIServices。
泰山AI
·
2025-02-18 23:41
精品专栏
microsoft
langchain4j
java
ai
LangChain大模型应用开发:工作流编排
简单来说,LangChain工作流编排就是将多个与自然语言处理相关的组件,像提示模板、大
语言模型
、各种实用工具等巧妙地组合在一起,形成一个有条理、可执行的流程。
梦丶晓羽
·
2025-02-18 22:37
langchain
python
自然语言处理
人工智能
大模型应用层的创业挑战
大模型的应用从
语言模型
扩展到图像、视频和音频领域,为各行各业带来了颠覆性的创新。然而,构建和部署大模型的成本高昂,对计算资源和数据的需求也日益增加。本文将探讨大模型应用层面的创业挑战,并提供
AGI大模型与大数据研究院
·
2025-02-18 22:34
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
【大模型】数据集构造方式
1.Alpaca数据格式Alpaca数据格式最早由StanfordAlpaca项目提出,目的是用来微调大
语言模型
(LLM),特别是用于InstructionTuning(指令微调)。
油泼辣子多加
·
2025-02-18 22:02
深度学习
人工智能
chatgpt
ChatGPT for Bot在QQ、微信等平台实现直接和deepseek对话的AI聊天程序包!支持DeepSeek、Claude、Ollama等主流模型,提供人物调整,虚拟朋友、语音对话
一、软件介绍文末提供安装包和源码下载ChatGPTforBot一款支持在QQ、微信等聊天平台直接跟DeepSeek
语言模型
聊天的程序!真正的AI聊天!
struggle2025
·
2025-02-18 21:59
人工智能
chatgpt
机器人
AI日报 - 2025年02月16日 - 推特版
今日概览(60秒速览)▎AGI突破|阿里巴巴发布Qwen2.5-VL视觉
语言模型
,支持多模态交互新模型评测榜性能提升30%▎商业动向|NVIDIABlackwell超级芯片网络研讨会将聚焦生成式AI创新预计推动算力市场增长
訾博ZiBo
·
2025-02-18 21:27
AI日报
人工智能
基于GPT一键完成数据分析全流程的AI Agent: Streamline Analyst
大型
语言模型
(LLM)的兴起不仅为获取知识和解决问题开辟了新的可能性,而且催生了一些新型智能系统,例如旨在辅助用户完成特定任务的AICopilot以及旨在自动化和自主执行复杂任务的AIAgent,使得编程
Wilson_ZheLIN
·
2025-02-18 21:54
gpt4
ai
agent
llms
数据分析
DeepSeek模型实战:从理论到应用的深度探索
一、引言在人工智能快速发展的当下,大型
语言模型
已成为自然语言处理领域的核心力量。DeepSeek模型作为其中的佼佼者,凭借其先进的架构和强大的性能,吸引了众多开发者和研究人员的关注。
CodeJourney.
·
2025-02-18 19:06
人工智能
算法
数据库
【有啥问啥】DeepSeek 技术原理详解
DeepSeek技术原理详解DeepSeek是一款具有突破性技术的大型
语言模型
,其背后的技术原理涵盖了多个方面,以下是对其主要技术原理的详细介绍:架构创新多头潜在注意力机制(MLA)传送门链接:DeepSeekV3
有啥问啥
·
2025-02-18 19:34
大模型
深度学习
Decoder-Only、Encoder-Only、Encoder-Decoder 区别
应用:通常用于生成任务,如
语言模型
和对话系统。代表模型:GPT(GenerativePre-trainedTransformer)特点:自回归生成:模型通过
会喘气的粽子丶
·
2025-02-18 18:44
nlp
人工智能
【带你 langchain 双排系列教程】1. langchian 基本架构与环境配置(siliconFlow Deepseek接入)
LangChain是一个用于构建和部署大模型应用的框架,涵盖了从
语言模型
(LLM)到检索增强生成(RAG)、OpenAI集成以及智能体(Agent)的全套工具链。
夜里慢慢行456
·
2025-02-18 17:35
langchain
使用OpenAI LLM与Neo4j数据库进行自然语言交互
本篇文章将介绍如何使用OpenAI的
语言模型
将自然语言问题转换成Cypher查询,并通过Neo4j数据库执行该查询,并给出自然语言的响应。
bBADAS
·
2025-02-18 16:53
neo4j
数据库
交互
python
LLM 参数解析:使用 OpenAI API 在 Python 中的实用指南(含示例)
当你使用大
语言模型
(LLM)时,可能会注意到,即使提交相同的请求,多次运行后仍然会得到不同的回应。这是因为LLM具有概率性,它们的输出基于所学到的模式和概率,而不是固定规则。
真智AI
·
2025-02-18 14:09
python
人工智能
chatgpt
Windows Docker Desktop部署MaxKB详细教程
MaxKB(MaxKnowledgeBase)是一款基于大
语言模型
(LLM)和检索增强生成(RAG)技术的开源知识库问答系统,旨在帮助企业、教育机构及研究组织高效管理知识并提供智能问答服务。
Roc-xb
·
2025-02-18 13:28
docker
容器
运维
MaxKB
AI 编程工具崛起,程序员的未来是否岌岌可危?
再者,深度学习技术的突破,尤其是大
语言模型
在代码理解与生成方面的显著进展,为AI编程提供了坚实的技术基础。最后,随着软件开发需求的不断增加,传统开发
·
2025-02-18 13:26
【目标检测】多模态航空目标检测:A SIMPLE AERIAL DETECTION BASELINE OF MULTIMODAL LANGUAGE MODELS
阅读并理解一篇论文:ASIMPLEAERIALDETECTIONBASELINEOFMULTIMODALLANGUAGEMODELS该文首次提出了一种将多模态
语言模型
应用于航空检测的简单基线方法,名为LMMRotate
慕容紫英问情
·
2025-02-18 12:46
目标检测
目标检测
人工智能
计算机视觉
《DeepSeek训练算法:开启高效学习的新大门》
在人工智能的浪潮中,大
语言模型
的发展日新月异。DeepSeek作为其中的佼佼者,凭借其独特的训练算法和高效的学习能力,吸引了众多目光。
·
2025-02-18 04:41
人工智能深度学习
使用Python中的LangChain库优化消息长度:从聊天历史到模型性能的全面指南
使用Python中的LangChain库优化消息长度:从聊天历史到模型性能的全面指南在现代人工智能应用中,大
语言模型
(LLM)扮演着越来越重要的角色,尤其是在对话系统、智能助理和其他自然语言处理任务中。
m0_57781768
·
2025-02-18 03:10
python
langchain
easyui
【LLM】大模型基础--大规模预训练
语言模型
的开源教程笔记
1.引言本文以DataWhale大模型开源教程为学习路线,进行一整个大模型的入门操作什么是
语言模型
语言模型
是一种对词元序列(token)的概率分布,可以用于评估文本序列的合理性并生成新的文本。
Langchain
·
2025-02-18 02:00
笔记
人工智能
langchain
llama
大模型
产品经理
大模型基础
书籍-《掌握Transformer:从
BERT
到大模型和Stable Diffusion(第二版)》
书籍:MasteringTransformers:TheJourneyfrom
BERT
toLargeLanguageModelsandStableDiffusion,2ndEdition作者:SavaşYıldırım
·
2025-02-18 00:36
大
语言模型
(LLM)如何实现上下文的长期记忆?
引言大
语言模型
(LargeLanguageModels,LLMs),如GPT-4、Claude和LLaMA等,已经在自然语言处理领域展现出卓越的能力。
·
2025-02-18 00:06
DeepSeek与ChatGPT:AI
语言模型
的全面对决
DeepSeek与ChatGPT:AI
语言模型
的全面对决引言:AI
语言模型
的时代浪潮一、认识DeepSeek与ChatGPT(一)DeepSeek:国产新星的崛起(二)ChatGPT:AI界的开拓者二、
四念处茫茫
·
2025-02-17 23:21
AI
人工智能
chatgpt
语言模型
DeepSeek的崛起之路:从技术突破到行业变革
一、DeepSeek的进化历程初创与奠基(2023-2024)作为幻方量化子公司,DeepSeek于2023年在杭州成立,专注于大
语言模型
研发。
诚信爱国敬业友善
·
2025-02-17 18:05
心得
人工智能
ai
DeepSeek
红 - 黑树和 B+树?
红黑树是一种自平衡二叉查找树,由RudolfBayer发明,在1978年被LeoJ.Guibas和Ro
bert
Sedgewick改称为“红黑树”。
百态老人
·
2025-02-17 16:43
笔记
边缘AI架构提升LLM应用的响应速度
边缘AI架构提升LLM应用的响应速度关键词边缘计算、边缘AI、LLM、响应速度、模型压缩、分布式计算摘要本文探讨了如何通过边缘AI架构提升大型
语言模型
(LLM)应用的响应速度。
AI天才研究院
·
2025-02-17 15:08
计算
ChatGPT
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
如何在不依赖函数调用功能的情况下结合工具与大型
语言模型
当大型
语言模型
(LLM)原生不支持函数调用功能时,如何实现智能工具调度?本文通过自然语言解析+结构化输出控制的方法来实现。
Jason9510
·
2025-02-17 15:01
语言模型
人工智能
Lua 5.1 参考手册
Lua5.1参考手册byRo
bert
oIerusalimschy,LuizHenriquedeFigueiredo,WaldemarCeles云风译www.codingnow.comCopyright©
weixin_30822451
·
2025-02-17 14:51
DeepSeek 混合专家(MoE)架构技术原理剖析
DeepSeek混合专家(MoE)架构技术原理剖析在人工智能快速发展的当下,大规模
语言模型
不断突破创新,DeepSeek混合专家(MoE)架构脱颖而出,成为业内关注焦点。
计算机学长
·
2025-02-17 13:15
通用大语言模型
人工智能
架构
使用多模态大
语言模型
进行深度学习的图像、文本和语音数据增强
在过去的五年里,研究方向已从传统的机器学习(ML)和深度学习(DL)方法转向利用大
语言模型
(LLMs),包括多模态方法,用于数据增强,以提高泛化能力,并在训练深度卷积神经网络时防止过拟合。
数行天下
·
2025-02-17 12:42
人工智能
语言模型
深度学习
人工智能
自然语言处理
本地部署 DeepSeek:环境准备 + 详细步骤 + 高级部署方案 + 可视化工具集成 + 故障排除手册 + 性能优化建议
前言随着人工智能技术的迅猛发展,大
语言模型
(LLM)在多个行业中的应用日益广泛,从自然语言处理、内容生成到智能客服、医疗诊断等领域,AI正在深刻改变传统的工作方式和业务流程。
Katie。
·
2025-02-17 12:08
人工智能
技术发展
ai
deepseek
人工智能
人工智能大模型
基于DeepSeek-R1的高效推理优化实战:从API封装到动态批处理
引言在LLM(大
语言模型
)应用中,推理延迟和计算资源消耗是核心痛点。
竹木有心
·
2025-02-17 11:29
人工智能
CAP与BASE:分布式系统设计的灵魂与妥协
2000年,由加州大学伯克利分校的EricBrewer教授在分布式计算原理研讨会(PODC)上提出,因此CAP定理又被称作布鲁尔定理(Brewer’stheorem)2年后,麻省理工学院的SethGil
bert
·
2025-02-17 11:37
后端java分布式
知识图谱大模型系列之 11什么是 Neo4j LLM 知识图谱构建器?
推荐文章《使用ChatGPT从视频脚本创建知识图谱,使用GPT-4作为领域专家来帮助您从视频转录中提取知识(教程含完整源码)》权重2,知识图谱类《赋能知识图谱形成:利用
BERT
opic、DataMapPlo
知识大胖
·
2025-02-17 07:53
NVIDIA
GPU和大语言模型开发教程
知识图谱
neo4j
人工智能
llm
大数据知识图谱之深度学习——基于
BERT
+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_
bert
+lstm
文章目录大数据知识图谱之深度学习——基于
BERT
+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介
2301_76348014
·
2025-02-17 06:49
程序员
深度学习
大数据
知识图谱
深度剖析DeepSeek本地部署:技术、实践与优化策略
其中,大
语言模型
(LLMs)作为人工智能领域的关键技术,在自然语言处理、智能客服、内容创作等众多领域展现出了强大的应用潜力,引发了学术界和产业界的广泛关注。
Abossss
·
2025-02-17 05:11
AI
论文
python
ai
人工智能
DeepSeek R1 与 OpenAI O1:机器学习模型的巅峰对决
点赞收藏❤一、引言在机器学习的广袤天地中,大型
语言模型
(LLM)无疑是最为璀璨的明珠。它们凭借卓越的语言理解与生成能力,正以前所未有的方式重塑着我们与信息交互的模式。
学无止尽5
·
2025-02-17 04:59
机器学习
人工智能
Python自学攻略:AI时代的高效学习法 —— 如何用大模型快速上手编程
借助大
语言模型
(如Deepseek、GPT、Claude、Kimi、豆包等),学习效率可以提升数倍。本文将结合实操路径、工具链和避坑指南,为你提供一套AI时代的Python速成方案。
优化小秦
·
2025-02-17 02:19
人工智能
《AI对话秘籍:5个Prompt Engineering核心技巧让DeepSeek输出质量翻倍》
然而,如何高效地与这些
语言模型
进行交互,获得准确、相关且高质量的回复,成为了应用中的一个关键挑战。这时,PromptEngineering(提示词工程)便成为了一项必不可少的技能。
Athena-H
·
2025-02-17 02:44
Prompt
Engineering
人工智能
prompt
chatgpt
gpt
ai
95%人都不知道的,或许是最全DeepSeek 提示词合集、使用技巧与代码实现全攻略【建议收藏】
一、引言DeepSeek作为一款强大的AI大
语言模型
工具,凭借其高效、灵活的特点,受到了众多开发者和用户的青睐。
大F的智能小课
·
2025-02-16 23:26
python
开发语言
人工智能
算法
【vLLM 学习】安装
vLLM是一款专为大
语言模型
推理加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
·
2025-02-16 23:25
基于 LLM 的智能运维 Agent 系统设计与实现
摘要本文详细介绍了一个基于大
语言模型
(LLM)的智能运维Agent系统的设计与实现。该系统采用多Agent协同的架构,通过事件驱动的方式实现了自动化运维流程。
LLM教程
·
2025-02-16 22:51
人工智能
embedding
LLM
python
大模型
Agent
智能体
【AI论文】随机鹦鹉在大型
语言模型
(LLM)之肩:物理概念理解的总结性评估
摘要:我们以系统的方式探讨了一个被广泛提及的问题:大型
语言模型
(LLM)真的理解它们所说的话吗?这与人们更为熟悉的术语“随机鹦鹉”息息相关。
东临碣石82
·
2025-02-16 21:16
人工智能
语言模型
自然语言处理
LLaMA3大模型技术全网最全解析——模型架构与训练方法(收录于GPT-4/ChatGPT技术与产业分析)
Meta在周四(4月18日)发布了其最新大型
语言模型
LLaMA3。该模型将被集成到其虚拟助手MetaAI中。
chenweiPhD
·
2025-02-16 21:15
人工智能
深度学习
语言模型
架构
理论一、大模型—概念
大模型全称是大型
语言模型
(LLM,LargeLanguageModel),这个“大”主要指模型结构容量大,结构中的参数多,用于预训练大模型的数据量大。一个大模型可以
伯牙碎琴
·
2025-02-16 20:31
大模型
自然语言处理
ai
一、大模型微调的前沿技术与应用
大模型微调的前沿技术与应用随着大规模预训练模型(如GPT、
BERT
、T5等)的广泛应用,大模型微调(Fine-Tuning,FT)成为了提升模型在特定任务中性能的关键技术。
伯牙碎琴
·
2025-02-16 20:31
大模型微调
人工智能
大模型
微调
Deepseek
Forrester发布2024年五大网络安全新威胁
大选年的叙事(舆论)操控攻击二、深度伪造引发身份安全危机三、生成式人工智能数据泄露四、人工智能软件供应链攻击五、太空成为安全战略高点数据泄露平均成本高达218万美元前言人工智能正重塑网络安全格局,武器化大
语言模型
正成为首选攻击工具
岛屿旅人
·
2025-02-16 18:18
网络安全
web安全
网络
安全
网络安全
DeepSeek正重构具身大模型和人形机器人赛道!
2024年1月20日,公司发布全球首个完全通过强化学习训练的专注于推理任务的高性能
语言模型
DeepSeek-R1
Robot251
·
2025-02-16 17:12
重构
机器人
人工智能
科技
自动驾驶
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他