E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
自然语言推理
【2025版】最新AI大模型NLP全面解析,零基础入门到精通,收藏这篇就够了
AI大模型,作为一类具备庞大参数规模与卓越学习能力的神经网络模型,如BERT、GPT等,已在
自然语言
处理、计算机视觉等多个领域展现出卓越成效,极大地推动了相关领域的技术进步。
程序员二飞
·
2025-02-12 11:15
人工智能
自然语言处理
服务器
学习
知识图谱
pytorch深度学习模型
推理
和部署、pytorch&ONNX&tensorRT模型转换以及python和C++版本部署
目录1.采用pytorch进行
推理
2.采用onnx进行
推理
2.1pytorch转换为onnx2.2onnx
推理
3.采用tensorrt进行
推理
(python环境)3.1onnx转engine文件3.2tensorrt
机械心
·
2025-02-12 10:40
深度学习
python
pytorch
OpenAI重磅更新:发布目前最强
推理
模型ChatGPT-o1,新鲜测试出炉,草莓快要成熟了
这次更新标志着OpenAI在人工智能
推理
能力上的重大突破,推出了其最新的大语言模型——o1-preview和o1-mini。这一更新揭开了已经预热接近一年的“Q*/草莓项目”的神秘面纱。
机械心
·
2025-02-12 10:39
人工智能
chatgpt
人工智能
DeepSeek 与 Transformer 架构的深度关联
DeepSeek作为其中的杰出代表,凭借其卓越的性能和独特的技术架构,在
自然语言
处理领域引发了广泛关注。
JoveZou
·
2025-02-12 10:08
科技咨询与闲谈
transformer
深度学习
人工智能
ai
chatgpt
架构
昇腾,Ascend,NPU,mindie,镜像,部署vllm:第4篇,尝试多模态大模型部署(Qwen2-vl)
(当然是在昇腾环境下)提示:需要把这篇文章先看一遍昇腾,mindie,镜像,部署vllm:第2篇,启动mindieservice_daemon服务,支持对Qwen2.5的7B版本的
推理
提示:本文章的撰写思路是
几道之旅
·
2025-02-12 10:36
Dify:智能体(Agent)
工作流
知识库
全搞定
Agent)
人工智能
AI大模型开发必读书籍从入门到精通:三本关键的AI大模型书籍推荐
随着大模型在
自然语言
处理、图像识别、自动化决策等方面展现出强大的能力,越来越多的企业和研究机构将其视为未来发展的核心技术。对于程序员来说,这是一个前所未有的契机,不仅可以通过掌握大模型开发的技能
程序员辣条
·
2025-02-12 09:30
人工智能
大模型入门
大模型
大模型教程
大模型学习
学习
AI大模型
四、
自然语言
处理_08Transformer翻译任务案例
0、前言在Seq2Seq模型的学习过程中,做过一个文本翻译任务案例,多轮训练后,效果还算能看Transformer作为NLP领域的扛把子,对于此类任务的处理会更为强大,下面将以基于Transformer模型来重新处理此任务,看看效果如何1、需求概述现有一个《data.txt》文件,里面存放了很多组翻译对(即:英文句子-中文句子的组合)要求针对此《data.txt》文件,使用Seq2Seq模型构建一
学不会lostfound
·
2025-02-12 08:53
AI
自然语言处理
人工智能
深度学习
transformer
encode-decode
计算机毕业设计——Spring Boot垃圾分类网站功能说明
近年来,琛哥更是将触角延伸至AI领域,对于机器学习、
自然语言
处理、智能推荐等前沿技术都有独到的见解和实践经验。博客亮点:琛哥坚信“授人以渔胜于授人以鱼”,因此我的博客中,你不仅可以找到关于技术的深入解
琛哥的程序
·
2025-02-12 07:47
课程设计
毕业设计
java
策略泛化的无动作
推理
25年2月来自斯坦福的论文“Action-FreeReasoningforPolicyGeneralization”。端到端模仿学习为训练机器人策略提供一种有前途的方法。然而,泛化到新环境(例如未见过的场景、任务和目标实例)仍然是一项重大挑战。尽管大规模机器人演示数据集已显示出诱导泛化的潜力,但它们的规模化需要大量资源。相比之下,人类视频数据丰富多样,提供一种有吸引力的替代方案。然而,这些人类视频
硅谷秋水
·
2025-02-12 07:44
智能体
大模型
计算机视觉
人工智能
深度学习
机器学习
计算机视觉
语言模型
deepSeek的API接口开发介绍
无论是
自然语言
处理、数据分析还是智能推荐,DeepSeek的API都经过精心设计,确保开发者能够轻松调用,满足多样化的业务需求。入口在上图右上角位置。
陈老师还在写代码
·
2025-02-12 06:39
人工智能
【通往通用人工智能AGI之路】第8章: 认知架构
AGI系统架构需要综合考虑认知、学习、
推理
、规划等多个方面,设计灵活、可扩展、鲁棒的系统框架;AGI系统实现需要针对不同的任务和场景,开发高效、可靠、可解释的算法和模型。
AI天才研究院
·
2025-02-12 06:04
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
手把手教学,DeepSeek-R1微调全流程拆解
手把手教学,DeepSeek-R1微调全流程拆解原创极客见识GeekSavvy2025年02月09日09:02广东DeepSeek通过发布其开源
推理
模型DeepSeek-R1颠覆了AI格局,该模型使用创新的强化学习技术
AI生成曾小健
·
2025-02-12 05:01
windows
优化GPT API接口链接的方法
随着人工智能技术的飞速发展,GPT模型在
自然语言
处理领域中的应用越来越广泛。无论是在智能客服、自动化写作,还是在知识图谱的构建中,GPTAPI接口的高效调用和响应能力都成为了应用成功与否的关键。
IPdodo全球网络服务
·
2025-02-12 04:56
gpt
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
是一种有效的自适应策略,它不会引入额外的
推理
延迟,并在保持模型质量的同时显着减少下游任务的可训练参数数量。2.2.参数高效微调(PEF
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
对DeepSeek-R1通过强化学习提升大型语言模型
推理
能力的技术原理解析
•关键要素:包括环境(模型所处的
推理
任务场景)、状态(模型在
推理
过程中的当前情况,如已有的
推理
步骤、已知信息等)、动作(模型在当前状态下做出的
推理
决策,如选择何种
推理
方法、如何组织语言等)、奖励(根据模型的动作和结果给予的反馈
一只贴代码君
·
2025-02-12 02:12
语言模型
人工智能
自然语言处理
学习
AI编程
开发语言
使用 DeepSeek 进行图像描述:多模态 AI 技术实践
技术原理多模态AI模型(如DeepSeek)能够同时处理图像和文本输入,通过深度学习算法理解图像内容,并生成准确、生动的
自然语言
描述。环境配置(.env)#SiliconFl
老大白菜
·
2025-02-12 01:35
人工智能
python
人工智能
深入了解Text2SQL开源项目(Chat2DB、SQL Chat 、Wren AI 、Vanna)
深入了解Text2SQL开源项目(Chat2DB、SQLChat、WrenAI、Vanna)前言1.Chat2DB2.SQLChat3.WrenAI4.Vanna前言在数据驱动决策的时代,将
自然语言
查询转化为结构化查询语言
m0_74824483
·
2025-02-12 00:20
面试
学习路线
阿里巴巴
开源
sql
人工智能
模型轻量化
影响神经网络
推理
速度主要有4个因素:FLOPs、MAC、计算并行度、硬件平台架构与特性(算力、GPU内存带宽)模型压缩工业界主流的模型压缩方法有:知识蒸馏(KnowledgeDistillation,KD
莱茶荼菜
·
2025-02-11 22:10
人工智能
学习
深度学习中模型轻量化及具体方案应用
模型轻量化的核心目标是提高
推理
速度、降低功耗、减少内存占用,以便在边缘设备上实现实时性或低延迟的响应。
码上就位
·
2025-02-11 22:36
深度学习
人工智能
一步步:在 VSCode 中本地运行 DeepSeek,打造强大的私人 AI 副驾驶
推荐文章《本地构建AI智能分析助手之01快速安装,使用PandasAI和Ollama进行数据分析,用
自然语言
向你公司的数据提问为决策者提供即时的、数据驱动的见解,提高生产(教程代码含详细安装步骤)》权重
知识大胖
·
2025-02-11 22:06
NVIDIA
GPU和大语言模型开发教程
vscode
人工智能
ide
deepseek
Deepseek V3 + Cline 实现AI编程,这款插件真香
比如,Cursor,Windsurf,Devin,以及即将问世的MGX(beta内测中,多智能体
自然语言
编程产品,对标devin)。
AI生成曾小健
·
2025-02-11 21:58
LLM大语言模型
Agent智能体
AI编程
大模型
推理
服务全景图
作者:望宸随着DeepSeekR1和Qwen2.5-Max的发布,国内大模型
推理
需求激增,性能提升的主战场将从训练转移到
推理
。由于无论是训练还是
推理
,如何提升性能都是业内讨论最多的话题之一。
·
2025-02-11 21:12
云原生阿里云
预训练语言模型:从BERT到GPT,NLP的新纪元
自然语言
处理(NLP)在过去几年中经历了翻天覆地的变化,而这一变化的催化剂无疑是预训练语言模型(Pre-trainedLanguageModels,PLMs)的崛起。
Evaporator Core
·
2025-02-11 20:23
自然语言处理
人工智能
Python开发经验
自然语言处理
语言模型
bert
LTP/pyltp安装和使用教程
下载可以到官网的下载专区:https://ltp.ai/download.html语言技术平台(LanguageTechnologyPlatform,LTP):是哈工大社会计算与信息检索研究中心历时十年研制的一整套开放中文
自然语言
处理系统
Cachel wood
·
2025-02-11 19:16
自然语言处理nlp
easyui
前端
javascript
pyltp
ltp
人工智能
nlp
换平台对比
推理
能力:DeepSeekR1强于Gemini2.0Flash
和Gemini2.0Flash(不是Gemini2.0FlashThinkingExperimental),仍然是之前一道小学数学应用题的解答和
推理
能力。
stereohomology
·
2025-02-11 19:43
大语言模型对比
Gemini 2.0 FlashThinking Experimental答对这个问题只需要提示一次
目前来说,这两个模型的
推理
能力的确最好。其它的
推理
能力都还是垃圾。
stereohomology
·
2025-02-11 19:13
人工智能
pyltp安装教程——保姆级
本教程专为想要集成哈尔滨工业大学
自然语言
处理库**pyltp**到其Python项目的开发者设计项目地址:https://gitcode.com/Resource-Bundle-Collection/2d7ca
牧滨铭Guinevere
·
2025-02-11 18:41
PromptSource官方文档翻译
使用详解基本用法子数据集处理批量操作提示创建流程Web界面操作手动下载数据集处理技术背景项目起源核心论文常见问题处理macOS环境问题连接错误文档核心价值应用场景示例研究人员开发者教育领域PromptSource是一个用于创建、共享和使用
自然语言
提示的工具包近期研究表明
张3蜂
·
2025-02-11 18:38
神经网络
人工智能
开源
人工智能
开源
机器人
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如Llama2、GPT-3)的高训练与
推理
成本问题
热爱分享的博士僧
·
2025-02-11 18:36
架构
大语言模型原理与工程实践:初探大语言模型
大语言模型原理与工程实践:初探大语言模型作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:大语言模型,机器学习,
自然语言
处理,深度学习,工程实践1.
AI天才研究院
·
2025-02-11 17:04
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
新手必备!深入解析:如何使用 Ollama 下载与使用本地大语言模型
在当今数字化时代,大语言模型(LLM)的应用越来越广泛,从
自然语言
处理到文本生成,从代码辅助到智能问答,它们都展现出了强大的能力。然而,使用云端大语言模型往往面临着成本高昂、隐私泄露等问题。
大懒猫软件
·
2025-02-11 16:22
语言模型
人工智能
自然语言处理
python
llama
Mermaid绘图大师:大模型让图表创作变得触手可及
它是一款基于AppBuilderAgent应用框架开发的智能工具,专为将
自然语言
转换为Mer
·
2025-02-11 16:56
基于Ernie-Bot打造语音对话功能
大模型场景实战培训,提示词效果调优,大模型应用定制开发,点击咨询GPT-4的语音对话功能前段时间在网上火了一把,许多人被其强大的
自然语言
处理能力和流畅的语音交互所吸引。
·
2025-02-11 16:25
人工智能llm语音
2025年2月第一周国内外科技资讯精选(软件工程与Python领域)
一、AI与Python工具链的深度整合OpenAI与谷歌的模型竞赛OpenAI推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其擅长生成符合物理定律的代码(如动态Shader、游戏逻辑
虫洞没有虫
·
2025-02-11 15:48
科技资讯\好文分享
科技
python
开发语言
AI行业的隐形杀手:压力与Felix Hill的悲剧
FelixHill,一位在
自然语言
处理和人工智能领
·
2025-02-11 15:21
前端
LLM
推理
优化——PagedAttention初识篇(vLLM初识(二))
LLM
推理
优化——PagedAttention初识篇(vLLM初识(二))前言在LLM
推理
优化——KVCache篇(百倍提速)中,我们已经介绍了KVCache技术的原理,从中我们可以知道,KVCache
荼荼灰
·
2025-02-11 15:44
神经网络
transformer
深度学习
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型
推理
能力方面的创新实践。该研究突破性地采用强化学习(Reinfo
·
2025-02-11 12:49
deepseek
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型
推理
引擎极限优化 TPS
01什么是大模型
推理
引擎大模型
推理
引擎是生成式语言模型运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-02-11 11:44
百度云大模型gpu
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
为了实现高效的
推理
和成本效益的训练,DeepSeek-V3采用了MLA(Multi-headLatentAttention)和DeepSeekMoE架构。
·
2025-02-11 11:44
向量数据库之Milvus
它常用于机器学习、人工智能、推荐系统、图像搜索、
自然语言
处理等领域,特别适合处理需要高效相似性搜索的应用场景。Milvus由Zilliz开发,具有高性能、可扩展性和易用性。
james二次元
·
2025-02-11 11:24
数据库
向量数据库
milvus
向量数据库
数据库
图像搜索
自然语言处理
DeepSeek-V3/R1上线背后的超低
推理
成本技术揭秘
百度智能云针对此次模型上线提供了行业领先的超低
推理
价格,低至DeepSeek官方刊例价3-5折,当前还可享受限时免费服务。
·
2025-02-11 11:33
百度算法
deepseek学习笔记
原计划是基于BERT或者GPT做一些
自然语言
处理的应用研究,deepseek出来之后,决定使用deepseek来做,相信能够获得更好的效果。
wsnzou
·
2025-02-11 10:40
学习
笔记
DeepSeek Coder 填空任务在代码生成和补全中具体是如何实现的?
以下是具体实现细节:数据准备:DeepSeekCoder使用了大规模的训练数据集,包含2万亿个token,其中87%为代码数据,13%为
自然语言
数据,支持英语和中文。
百态老人
·
2025-02-11 10:09
人工智能
大数据
笔记
『大模型笔记』国外大神对DeepSeek R1的科普!
时间线
推理
与Agent
推理
模型≠Agent
推理
为什么重要
推理
需要变得廉价R1的重要意义AI的发展走势预训练规模扩张的路走不通了
推理
阶段的规模定律缩小模型体量(新的规模定律?)强化学习(新的规模定律?)
AI大模型前沿研究
·
2025-02-11 09:02
大模型笔记
笔记
Deepseek
deepseek
R1
Deepseek
v3
GPT
O1
GPT
O3
2025年Python领域最新国际动态与技术趋势解析(截至2025年2月)
一、AI与Python的深度融合:从模型部署到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其在Python生态中,开发者可通过
虫洞没有虫
·
2025-02-11 08:57
Python资讯
python
开发语言
从零开始:用Python手写神经网络
从图像识别到
自然语言
处理,再到强化学习,神经网络的身影无处不在。然而,对于许多初学者来说,神经网络似乎是一个神秘而复杂的黑盒子。
WHCIS
·
2025-02-11 08:27
python
神经网络
开发语言
人工智能
深度学习
算法
2025最新主流深度学习算法全解析
从语音助手到自动驾驶,从图像识别到
自然语言
处理,深度学习的应用无处不在,深刻地改变着
lucky_syq
·
2025-02-11 08:25
AI
深度学习
算法
人工智能
StripedHyena 模型介绍
发明背景(1)Transformer的局限性Transformer模型因其自注意力机制(Self-Attention)在
自然语言
处理(
qq_27390023
·
2025-02-11 08:51
深度学习
python
机器学习
pytorch
生物信息学
人工智能(Artificial Intelligence,简称AI)
这些任务包括学习、
推理
、问题解决、感知、语言理解等。人
Kingdom_Garden
·
2025-02-11 07:50
人工智能
Ada语言的人工智能
这一领域涵盖了机器学习、
自然语言
处理、计算机视觉等多个方面,而在这些技术的背后,一种历史悠久且极具实用性的编程语言——Ada,正逐渐引起人们的关注。
赵旖琅
·
2025-02-11 07:45
包罗万象
golang
开发语言
后端
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他