自然语言推理第15页

自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用

在前面的学习中，我们已经了解了如何使用一些经典的方法和模型来处理自然语言任务，如文本分类、命名实体识别等。但当我们需要更强的语言生成能力时，往往会求助于更先进的预训练语言模型。

山海青风·2025-03-02 05:29

DeepSeek R1 详解：思维链、强化学习和蒸馏

Deepseek的基准在推理任务（数学、编码和科学）

前网易架构师-高司机·2025-03-02 05:58

DeepSeek怎么用，DeepSeek使用指南最全合集（保姆级教程）

作为国产AI模型的代表，DeepSeek不仅在自然语言处理（NLP）领域表现出色，还在多个应用场景中展现了强大的能力。

xiecoding.cn·2025-03-02 02:37

硅基流动：免费领取2000万Token，畅享AI大模型盛宴！

其核心团队来自清华大学、MIT等顶尖高校，致力于为企业和开发者提供高性能的AI模型推理和训练解决方案。

·2025-03-02 01:05

ACL2024最佳论文揭榜，中国本科生破译3000年前的甲骨文密码

作为计算语言学和自然语言处理领域的顶级会议，ACL是学者们展示最新成果、交流思想的重要平台。它被CCF

会议之眼·2025-03-01 23:50

如何更加优雅提问：浅谈提示词

ISO/IEC23894人工智能系统工程标准第一步：理论基础构建目标：通过结构化分析与实践验证，提升提示词设计的精准度、可控性与生成效率一、提示词设计的核心方法论分阶目标拆解基础层：明确任务类型（生成、推理

愚戏师·2025-03-01 23:42

J-LangChain，用Java实现LangChain编排！轻松加载PDF、切分文档、向量化存储，再到智能问答

在自然语言处理（NLP）的浪潮中，LangChain作为一种强大的模型编排框架，已经在Python社区中广受欢迎。然而，对于Java开发者来说，能否有一个同样高效、灵活的工具来实现类似功能？

花千树-010·2025-03-01 22:42

LangChain教程 - RAG - PDF问答

系列文章索引LangChain教程-系列文章在现代自然语言处理（NLP）中，基于文档内容的问答系统变得愈发重要，尤其是当我们需要从大量文档中提取信息时。

花千树-010·2025-03-01 22:38

基于问答对的实体识别和意图识别的知识图谱问答推理

问答对数据questionanswer省直医保的参保范围是什么?中央直属、省直属在哈尔滨的机关、事业单位、社会团体及其职工和退休人员。参加省直医保的单位缴费基数如何确定和缴纳?在职职工(以下简称职工)个人月缴费基数按本人上年度月平均工资确定，由单位代扣代缴，用人单位月缴费基数按本单位参保职工个人月缴费基数之和确定。缴费费率：用人单位8%(含生育0.5%)、职工个人2%。缴费方式：用人单位、职工按月

风清扬【coder】·2025-03-01 21:04

基于 BERT 的自定义中文命名实体识别实现

基于BERT的自定义中文命名实体识别实现在自然语言处理中，命名实体识别（NamedEntityRecognition，NER）是一项重要的任务，旨在识别文本中的特定实体，如人名、地名、组织机构名等。

风清扬【coder】·2025-03-01 21:04

英特尔开发板试用：结合OAK深度相机进行评测

最近英特尔官方发布了一篇文章：主要介绍了如何将英特尔开发板（小挪吒）与OAK深度相机结合使用，并通过OpenVINO™工具套件进行开发和性能评测OAK相机：作为深度数据采集的核心设备，其深度测距功能与OpenVINO™推理相结合

OAK中国_官方·2025-03-01 20:56

第十五个问题-什么是CoT？

Chain-of-Thought(CoT)思维链技术详解一、核心概念Chain-of-Thought（思维链）是一种通过引导大语言模型展示逐步推理过程来提升复杂问题解决能力的技术。

释迦呼呼·2025-03-01 20:53

MeanShift聚类分割算法

下面详细介绍该算法的数学原理和每一步的推理公式。1.密度估计MeanShift算法通过核密度估计（

点云学习·2025-03-01 19:18

深度学习开源数据集大全：从入门到前沿

本文整理了当前最常用且高质量的开源数据集，涵盖图像、视频、自然语言处理（NLP）、语音与音频等方向，帮助研究者和开发者快速定位所需资源。

念九_ysl·2025-03-01 19:48

计算机毕业设计 ——jspssm507Springboot 的论坛管理系统

近年来，花花更是将触角延伸至AI领域，对于机器学习、自然语言处理、智能推荐等前沿技术都有独到的见解和实践经验。

奔强的程序·2025-03-01 18:45

DeepSeek突袭公布成本利润率：545%

就在刚刚，DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。

·2025-03-01 18:29

揭开人工智能中 Tokens 的神秘面纱

揭开人工智能中Tokens的神秘面纱在人工智能，尤其是自然语言处理（NLP）领域，"tokens"是一个频繁出现且至关重要的概念。对于理解语言模型如何处理和理解人类语言，tokens起着基础性的作用。

东锋1.3·2025-03-01 16:34

自然语言处理NLP入门 -- 第十节简单的聊天机器人

同时，聊天机器人也是了解自然语言处理（NLP）最好的实战项目之一。

山海青风·2025-03-01 16:33

自然语言处理NLP入门 -- 第一节基础概念

1.什么是自然语言处理（NLP）1.1NLP的定义自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个子领域，专注于让计算机理解、解释和生成人类语言。

山海青风·2025-03-01 16:33

“下一代推理王者”能否再掀AI浪潮？

“下一代推理王者”能否再掀AI浪潮？最近，AI圈内最火的话题，莫过于DeepSeek即将推出的R2模型了。

that's boy·2025-03-01 16:02

【大模型】大模型分类

大模型（LargeModels）通常指参数量巨大、计算能力强大的机器学习模型，尤其在自然语言处理（NLP）、计算机视觉（CV）等领域表现突出。

IT古董·2025-03-01 16:29

本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)

该系统建立以后，我们不需要掌握专业的SQL技能，可以用自然语言询问有关数据库中数据的问题并返回答案。使大语言模型(LLM)查询结构化数据与非结构化文本数据有所不同。

火云牌神·2025-03-01 14:47

【vLLM 学习】使用 Neuron 安装

vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。

HyperAI超神经·2025-03-01 14:47

AI大模型-提示工程学习笔记21-图提示 (Graph Prompting)

1.图提示的核心思想(1)传统提示的局限性(2)GraphPrompting的解决方案2.GraphPrompting的工作流程(1)图构建(2)图选择/子图提取(3)图编码(4)提示构建(5)LLM推理与生成

9命怪猫·2025-03-01 12:30

笔记：大模型Tokens是啥？为啥大模型按Tokens收费？

一、Token的定义与示例1.核心概念Token是自然语言处理中的最小文本单位，代表模型处理文本时的一次计算单元。英文场景：1个token≈1个单词或标点符号。示例：句子"Hello,world!"

瞬间动力·2025-03-01 09:08

全方位解析：大语言模型评测方法的综合指南

自2017年Transformer模型提出以来，自然语言处理研究逐步转向基于该框架的预训练模型，如BERT、GPT、BART和T5等。这些预训练模型与下游任务适配后，持续刷新最优结果。

大模型玩家·2025-03-01 08:28

大语言模型原理与工程实践：手把手教你训练 7B 大语言模型自动化训练框架

大语言模型原理与工程实践：手把手教你训练7B大语言模型自动化训练框架关键词：大语言模型、7B模型、自动化训练、深度学习、神经网络、自然语言处理、分布式计算文章目录大语言模型原理与工程实践：手把手教你训练

AI天才研究院·2025-03-01 07:24

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）

垂直领域大模型Agent和指令微调等训练框架开源指令，预训练，rlhf，对话，agent训练数据梳理AIGC相关应用prompt写作指南和5星博客等资源梳理Prompt和LLM论文细分方向梳理Prompt是在自然语言处理

代码讲故事·2025-03-01 07:54

Transformer 代码剖析1 - 数据处理（pytorch实现）

引言Transformer架构自《AttentionIsAllYouNeed》论文发表以来，在自然语言处理领域引起了巨大的变革。

lczdyx·2025-03-01 06:18

BERT模型深入理解——自然语言处理的里程碑

1BERT的诞生背景2018年谷歌团队发布了BERT（BidirectionalEncoderRepresentationsfromTransformers）模型，在自然语言处理领域引领了技术性的革命。

cufewxy2018·2025-03-01 06:47

Amazon SageMaker 批量转换中的 JSON 处理技巧

背景介绍AmazonSageMaker提供了强大的批量转换功能，允许我们对大量数据进行推理。这在处理大规模数据集时非常有用。然而，当我们尝试将批量策略从SingleRecord切换到MultiRec

t0_54coder·2025-03-01 03:50

如何使用Anyscale平台运行、微调和扩展大语言模型(LLMs)

技术背景介绍在处理大规模的自然语言处理任务时，我们常常需要一个可靠且经济高效的解决方案来运行和管理LLMs。Anyscale提供了一个强大的接口，能够简化这一过程。结合LangChain，我们

eahba·2025-03-01 03:49

计算机毕业设计 ——jspssm508Springboot 的旅游管理

近年来，花花更是将触角延伸至AI领域，对于机器学习、自然语言处理、智能推荐等前沿技术都有独到的见解和实践经验。

奔强的程序·2025-03-01 03:17

人类驾驶的人脑两种判断模式（反射和预判）--＞自动驾驶两种AI模式

另一种模式是物理时空图式推理模式，判断是基于预判预测，人脑把物理世界的物理动态时空规则（规律）图像已经编码为脑内符号（语言或图式）系统，通过预判预测的思维链推理过程（语言符号或物理时空图式的推理运算，映射推理出了物理世界的后续时空图像

liron71·2025-03-01 02:14

利用OllamaLLM模型实现多模态文本生成

在自然语言处理领域，结合图像和文本的多模态模型越来越受到关注。O

bavDHAUO·2025-03-01 02:42

DeepSeek技术全景解析：架构创新与行业差异化竞争力

深度优化的MoE架构：结合256个路由专家与1个共享专家，实现稀疏激活机制（每个Token仅激活8个专家），在代码生成任务中推理速度提升40%。混合模态支持：支持文本、代码、数学符号

二进制coder·2025-03-01 01:40

DeepSeek入门：安装与配置

，以下是不同版本的硬件要求：DeepSeek-R1-1.5B：CPU：最低4核（推荐Intel/AMD多核处理器）内存：8GB+硬盘：3GB+存储空间（模型文件约1.5-2GB）显卡：非必需（纯CPU推理

梦落青云·2025-03-01 01:08

大模型研究：DeepSeek三个版本（初级中级高级）资源要求说明

DeepSeek-LLM6.7B三个版本模型所需硬件资源的介绍：DeepSeek-LLM6.7B最小最基础版本1.内存（RAM）非量化运行时，由于模型参数数量相对较少，大约需要13GB-14GB的系统内存来加载模型和进行基本推理

程序猿学长·2025-03-01 01:08

DeepSeek 最新发布 DeepEP：一款用于 MoE 模型训练和推理的开源 EP 通信库

采用Mixture-of-Experts（MoE）架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而，这种方法也引入了一些挑战，尤其是在GPU之间的通信方面。在MoE模型中，对于任何给定的token，只有一部分专家是活跃的，因此在设备之间高效地交换数据至关重要。传统的全对全（all-to-all）通信方法可能会造成瓶颈，增加延迟，并导致GPU资源利用不足。在对延迟敏感的场景中，

强哥之神·2025-03-01 01:37

一文了解：部署 Deepseek 各版本的硬件要求

我们先看一下DeepSeek的部分通用版本（如下图），然后再介绍一下最近火热的R1推理版本的各规格的硬件要求。最后，会给出R1的各主流版本的资源参考列表（文末）。模型名参数大小文件格式标签公司

强哥之神·2025-03-01 00:04

继清华大学DeepSeek资料后，北京大学也出了内容主攻提示词和应用场景

以下是文件的主要内容摘要：1.DeepSeek-R1模型详解技术特性：DeepSeek-R1是一款专注于复杂推理任务的推理模型，擅长数学、编程和自然语言推理任务。

心灵宝贝·2025-03-01 00:04

谁说消费级硬件不能玩 DeepSeek - R1 微调？手把手教你进阶AI玩家

一、大规模人工智能模型的微调DeepSeek最新的R1模型在推理性能方面树立了新的标杆，在保持开源的同时，可与专有模型相媲美。DeepSeek-R1的蒸

硅基创想家·2025-02-28 22:51

DeepSeek五天开源5大杀器实测：训练成本砍半+推理速度起飞，算法圈已疯（附删库跑路教程）

FlashMLA让推理速度飙升40%，DeepEP根治MoE通信癌，FP8核弹库DeepGEMM暴力提效，DualPipe+EPLB把GPU榨到一滴不剩，3FS化身数据闪电侠！

AI仙人掌·2025-02-28 22:18

一文看懂 Claude 3.7 Sonnet，为什么是第一个融合推理模式的 AI 模型

Claude3.7Sonnet是Anthropic最新发布的AI模型，发布过程中，最突出最吸引眼球的特点是首个“融合推理”模型。什么是融合推理模型？

董董灿是个攻城狮·2025-02-28 22:45

Bedrock Claude Chat: 基于AWS Bedrock和Claude的智能聊天机器人

BedrockClaudeChat:智能聊天的新选择在人工智能和自然语言处理技术飞速发展的今天，智能聊天机器人正在各行各业得到广泛应用。

2401_87458778·2025-02-28 21:14

用DeepSeek-API构建智能工作流的5大范式革新

DeepSeek-API发现，可以为工作流引擎提供以下前沿实践方案：范式一：动态决策路由系统▍理念革新传统局限：固定审批路径无法应对复杂业务场景，人工判断耗时且标准不统一智能突破：基于DeepSeek-API的自然语言理解能力

·2025-02-28 21:09

DeepSeek开源周Day1：FlashMLA引爆AI推理性能革命！

项目地址：GitHub-deepseek-ai/FlashMLA开源日历：2025-02-24起每日9AM(北京时间)更新，持续五天！一、开源周震撼启幕继上周预告后，DeepSeek于北京时间今晨9点准时开源「FlashMLA」，打响开源周五连发第一枪！作为专为Hopper架构GPU（H800/H100）优化的高效解码内核，该项目一经发布便引爆社区：上线45分钟斩获400+Star，3小时突破2.

歌刎·2025-02-28 18:48

【AI论文】SongGen：用于文本到歌曲生成的单阶段自回归Transformer模型

现有方法通常采用多阶段生成流程，导致训练和推理过程繁琐。在本文中，我们提出了SongGen，一个完全开源的单阶段自回归Transformer模型，专为可控歌曲生成而设计。

东临碣石82·2025-02-28 15:58

饿了么算法工程师-AIGC岗内推

飞300·2025-02-28 15:26

自然语言处理入门：从基础概念到实战项目

自然语言处理入门：从基础概念到实战项目一、引言自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能的重要分支，旨在让计算机能够理解、生成和处理人类语言。

范范0825·2025-02-28 14:22

推荐频道

自然语言推理