大规模语言模型对话第19页

全方位解析：大语言模型评测方法的综合指南

自2017年Transformer模型提出以来，自然语言处理研究逐步转向基于该框架的预训练模型，如BERT、GPT、BART和T5等。这些预训练模型与下游任务适配后，持续刷新最优结果。然而，现有评测方法存在广度和深度不足、数据偏差、忽视模型其他能力或属性评估等问题。因此，需要全面评测和深入研究模型的各项能力、属性、应用局限性、潜在风险及其可控性等。本文回顾了自然语言处理中的评测基准与指标，将大语言

大模型玩家·2025-03-01 08:28

大语言模型原理与工程实践：手把手教你训练 7B 大语言模型自动化训练框架

大语言模型原理与工程实践：手把手教你训练7B大语言模型自动化训练框架关键词：大语言模型、7B模型、自动化训练、深度学习、神经网络、自然语言处理、分布式计算文章目录大语言模型原理与工程实践：手把手教你训练

AI天才研究院·2025-03-01 07:24

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）目录顺序如下国内外，垂直领域大模型Agent和指令微调等训练框架开源指令，预训练，rlhf，对话，agent训练数据梳理

代码讲故事·2025-03-01 07:54

【八股】非关系型数据库篇（Redis+ES）

关系型和非关系型数据库特性关系型数据库(RDBMS)非关系型数据库(NoSQL)数据模型表格（行和列）文档、键值、列族、图等多样化模型模式固定（Schema）灵活的，无需预定义结构扩展性纵向扩展为主，横向扩展困难横向扩展容易，适合大规模分布式系统事务支持完全支持

林子漾·2025-03-01 07:52

[LangChain 学习资源大集合]

在构建语言模型应用（LLM）时，LangChain是当前备受关注的框架之一。无论是初学者还是进阶用户，丰富的学习资源可以帮助我们高效掌握LangChain的核心概念、工具和最佳实践。

qahaj·2025-03-01 06:39

删除数据库表中重复数据的方法

删除数据库表中重复数据的方法数据库中重复数据的识别与分析手动删除重复记录的基本步骤利用SQL高级功能高效清理重复数据自动化脚本实现大规模重复数据清除数据库设计阶段预防重复数据策略使用数据库内置工具或插件辅助去重工作处理过程中数据完整性和一致性维护针对特定场景下的重复数据处理案例解析数据库中重复数据的识别与分析重复数据指的是在数据库表中出现多次相同的数据记录

master_chenchengg·2025-03-01 06:09

MCP模型上下文协议集锦

MCP模型上下文协议简介MCP模型上下文协议（Model-Context-Protocol，MCP），能够实现大型语言模型（LLM）应用程序与本地或远程资源之间的安全、可控的交互。

galileo2016·2025-03-01 06:09

计算机网络 - HTTP 协议和万维网

基本概念万维网(WorldWideWeb,WWW)定义：一个大规模的分布式信息系统，由全球范围内无数个网络站点和网页组成特点：基于超文本技术，支持多媒体内容的展示和交互URL(UniformResourceLocator

Loop Lee·2025-03-01 05:03

大语言模型LLM原理篇_图解大模型从用户输入prompt到llm输出答案的流程原理

大模型席卷全球，彷佛得模型者得天下。对于IT行业来说，以后可能没有各种软件了，只有各种各样的智体（Agent）调用各种各样的API。在这种大势下，笔者也阅读了很多大模型相关的资料，和很多新手一样，开始脑子里都是一团乱麻，随着相关文章越读越多，再进行内容梳理，终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的，因为毕竟对大模型的研究有限，缺乏深度。但是，还是觉得有必要记录一下学习理解心得，

喝不喝奶茶丫·2025-03-01 05:01

开发基于提示工程的大语言模型（LLM）应用——学习笔记

学习通过提示工程与大语言模型进行程序化的交互。将从最基本的开始，比如使用哪些模型，以及如何向它们发送提示词并查看响应。

ricky_fan·2025-03-01 05:31

项目经验之LZO压缩？思维导图代码示例（java 架构)

在Hadoop生态系统中，使用LZO压缩可以显著减少存储空间，并且由于其快速的解压速度，对于大规模数据处理任务来说是非常有利的。以下是关于LZO压缩的项目经验总结、思维导图描述以及Java代码示例。

用心去追梦·2025-03-01 05:31

《AI大模型开发笔记》——提示词工程

提示工程帮助用户控制语言模型输出，生成适合的特定需求。提示调整提供了对模型行为的直观控制，但对提示的确切措辞和设计敏感，因此需要精心制定的准则以实现期望的结果。

Richard Chijq·2025-03-01 04:27

浅谈MMORPG任务编辑器的设计与实现

马冬亮(凝霜Loki)一个人的战争(http://blog.csdn.net/MDL13412)定义MMORPG任务编辑器用于配置人物与地图NPC、怪物、玩家、场景等相关的任务交互操作，处理诸如与NPC对话

凝霜·2025-03-01 04:25

GitHub每日最火火火项目（2.28）

olmocr项目介绍：olmocr是由allenai开发的一款用于将PDF文件线性化，以适配大语言模型（LLM）数据集和训练的工具包。在大语言模型的训练过程中，数据的格式和预处理极为关键。

FutureUniant·2025-03-01 03:50

Amazon SageMaker 批量转换中的 JSON 处理技巧

这在处理大规模数据集时非常有用。然而，当我们尝试将批量策略从SingleRecord切换到MultiRec

t0_54coder·2025-03-01 03:50

如何使用Anyscale平台运行、微调和扩展大语言模型(LLMs)

Anyscale是一个功能强大的平台，主要用于运行、微调和扩展大语言模型(LLMs)，并且通过生产就绪的API提供成本效益的调用服务。

eahba·2025-03-01 03:49

数据整合平台Airbyte中的Shopify连接器使用指南

其拥有最大规模的ELT连接器目录，支持众多的数据仓库和数据库。本文将介绍如何使用Airbyte的Shopify连接器加载Shopify对象作为文档。

bavDHAUO·2025-03-01 03:49

手机秒变AI办公神器！腾讯元宝+DeepSeek满血版，5分钟搞定PPT和项目汇报——你的效率翻倍指南

支持联网搜索、文件解析、多模态交互，手机端操作更丝滑一、快速上手指南1.下载安装（3秒完成）应用商店搜索“腾讯元宝”→下载安装→选择微信/QQ/手机号登录2.切换至DeepSeek模式（1步到位）进入对话界面

a小胡哦·2025-03-01 02:43

DeepSeek 最新发布 DeepEP：一款用于 MoE 模型训练和推理的开源 EP 通信库

采用Mixture-of-Experts（MoE）架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而，这种方法也引入了一些挑战，尤其是在GPU之间的通信方面。

强哥之神·2025-03-01 01:37

阿里云PAI大模型RAG对话系统最佳实践

去年4月至9月，阿里云人工智能平台PAI团队与大数据基础工程技术团队合作，构建了基于知识库检索增强的大模型答疑对话机器人，并在阿里云官方答疑链路、研发小蜜、钉钉大数据技术服务助手等多个线上场景上线，显著提升答疑效率

阿里云云栖号·2025-03-01 00:04

火山方舟引擎免费注册送3675万DeepSeek R1满血版tokens

注册打开火山引擎首页，注册，点立即体验选择模型-直接对话，如下图API火山方舟也提供兼容Openai的API接口，点击右上角的API接入，如下图：第一步创建key，第二部选择模型-开通选择的模型，然后会给出实例代码

无痕melody·2025-03-01 00:01

使用 Python 调用 Ollama API 并调用 deepseek-r1:8b 模型

使用Python调用OllamaAPI并调用deepseek-r1:8b模型准备工作调用OllamaAPI使用generate实现多轮对话并保留对话的记忆ollama是一个强大的本地大语言模型工具，支持多种开源模型

眸笑丶·2025-02-28 23:26

Milvus高性能向量数据库与大模型结合

Milvus是一种高性能、高扩展性的向量数据库，可在从笔记本电脑到大规模分布式系统等各种环境中高效运行。它既可以开源软件的形式提供，也可以云服务的形式提供。Milvus是LFAI&Data

山塘小鱼儿·2025-02-28 23:25

谁说消费级硬件不能玩 DeepSeek - R1 微调？手把手教你进阶AI玩家

微调像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源，但借助正确的工具，在消费级硬件上进行高效训练是可行的。

硅基创想家·2025-02-28 22:51

谈谈DeepSeek-v3在算力约束下的出色工作

加完班挤点时间读个论文吧.Deepseek-v3仅用了2048块H800GPU就超越了Llama3405B模型,要知道Meta训练Llama3可是用了16384块H100,而DSv3的训练成本非常低在所有人追求更大规模集群的时候

强化学习曾小健·2025-02-28 22:19

deepseek 的离线部署-AI大模型

官方网址官方地址：OllamaOllama目前支持以下大语言模型：libraryOllama下载地址：https://ollama.com/download/ollama-linux-amd64.tgz

passion_flower_·2025-02-28 22:17

一文看懂 Claude 3.7 Sonnet，为什么是第一个融合推理模式的 AI 模型

传统的大语言模型（LLM）通常有两种工作方式

董董灿是个攻城狮·2025-02-28 22:45

通过Bedrock Access Gateway解决方案快速访问Amazon Bedrock的多种大语言模型

其中，Anthropic公司的Claude3是在AmazonBedrock新上线的大型语言模型（LargeLa

国外VPS测评·2025-02-28 21:14

Bedrock Claude Chat: 基于AWS Bedrock和Claude的智能聊天机器人

AWS推出的BedrockClaudeChat项目为开发者提供了一个强大而灵活的聊天机器人解决方案，让构建智能对话系统变得前所未有的简单。

2401_87458778·2025-02-28 21:14

【llm对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention

在大型语言模型（LLM）中，注意力机制（AttentionMechanism）是核心组成部分。

kakaZhui·2025-02-28 20:03

electron 的原理，使用场景，简单用法

主进程与渲染进程：主进程：应用程序的入口，管理窗口生命周期和原生API（如菜单、对话框）。渲染进程：每个窗口对应一个渲染进程，运行前端代码，通过preload脚本安全地桥接Node.js功能。

学会了没·2025-02-28 19:29

第九章 Spring AI API中文版 - Ollama Embeddings API

Ollama嵌入通过Ollama，您可以在本地运行各种大型语言模型（LLMs），并从中生成嵌入。SpringAI通过OllamaEmbeddingClient支持Ollama文本嵌入。

明爷们儿·2025-02-28 18:52

WPS接入DeepSeek模型免费版本

辣香牛肉面·2025-02-28 18:18

【AI测试学习】AnythingLLM+Ollama+DeepSeek部署私人知识库

1.搭建DeepSeek大语言模型1.1Ollama大预言模型部署Ollama简化了大型语言模型的运行，让每个人都能在本地轻松体验AI的强大，打开浏览器-下载Ollama-输入命令-搞定，这是本地部署大语言模型的全新方式

艳Yansky·2025-02-28 16:37

传奇服务器遭遇袭击，广大玩家需密切关注

受此影响，多台传奇服务器遭遇大规模拒绝服务攻击（DDoS），导致大量玩家无法正常登录游戏。目前

·2025-02-28 16:54

低代码革命：基于DeepSeek微调模型实现前端代码自动生成与私有JS API调用的实战指南

摘要本文探讨如何微调DeepSeek平台的大语言模型，以实现前端代码的智能生成与自建JavaScriptAPI库的无缝调用。

Light60·2025-02-28 15:58

饿了么算法工程师-AIGC岗内推

2、基于大型语言模型开展文本生成、自然语言理解以及智能对话系统的研发，提出新颖的算法/模型，并进行实际开发和应用。3、探索多模态数据的结合，包括图像、文本、语音等，以丰富智能系统的理解和交互能力。

飞300·2025-02-28 15:26

2025年，值得关注的LLM大趋势

随着人工智能技术不断进步，大语言模型正在改变各行各业的运作方式。从代码生成到语言学习应用，GenAI已经渗透到我们日常生活的方方面面。

AI小白熊·2025-02-28 15:25

阿里架构师推荐的消息中间件万字文档：RocketMQ+RabbitMQ+KafKa

RocketMQRocketMQ是阿里开源的消息中间件，目前也已经孵化为Apache顶级项目，它是纯Java开发，具有高吞吐量、高可用性、适合大规模分布式系统应用的特点。

xiaohao718·2025-02-28 14:53

氢储技术难点分析及未来展望

氢储能作为长时储能和跨季节储能的重要技术路径，具有能量密度高、可大规模存储和灵活应用等优势，但其技术难点仍集中在制氢、储运、应用效率及系统整合等环节，以下是具体分析：一、制氢环节的技术难点电解水制氢效率与成本效率低

DOMINICHZL·2025-02-28 12:36

大模型调优方法：提示工程、RAGs 与微调对比

前言每一个搭建大语言模型应用的AI工程师都会面临一个难题，如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。

AI大模型探索者·2025-02-28 11:03

Hive 面试题

Hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

昨夜为你摘星·2025-02-28 11:59

讯飞星火 VS 文心一言：谁是中文大语言模型的TOP1？

本篇博客就测评一下这两个在中文圈最受好评的大语言模型，顺便辅以ChatGPT为参考。大家一起来看看到底谁是中文大语言模型的TOP1？

沉迷单车的追风少年·2025-02-28 09:44

【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核

深入了解FlashMLA：HopperGPU的高效MLA解码内核简介在人工智能(AI)领域，特别是大型语言模型(LLM)领域，对计算效率和速度的需求持续增长。

有啥问啥·2025-02-28 09:12

C++ 游戏开发入门

C++能够直接操作内存，在处理复杂的游戏逻辑、大规模数据运算（如物理模拟、图形渲染中的大量计算）以及优化游戏性能方面有着卓越的表现。同时，丰富的类库

安年CJ·2025-02-28 08:05

MFC的用户界面线程

中将线程分为用户界面线程和工作线程,两者最大的区别是前者是和界面相关联的,而后者是进行后台的一些操作.二.如何创建MFC中的线程大多继承自CWinThread,而相关联的界面可以继承自CFrameWnd,也可以继承自对话框之类的

CodingLife99·2025-02-28 07:54

Geo3D城市引擎大规模建筑植被渲染

import*asGeo3Dfrom"../src";importInitHelperfrom"./InitHelper";//3D场景初始化constsceneControl=InitHelper.init3D();constcontainer=document.querySelector("#map")asHTMLElement;container&&sceneControl.render(c

苹果园dog·2025-02-28 07:22

多线程3：MFC中用户界面线程的相关操作

文章目录前言一、工作线程与界面线程的区别1.在子线程中创建模态对话框2.在子线程中创建非模态对话框二、界面线程1.界面线程的创建总结前言多线程3：MFC中用户界面线程的相关操作。

智能与优化·2025-02-28 07:52

DeepSeek R1 简单指南：架构、训练、本地部署和硬件要求

DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法，通过强化学习（RL）提升大型语言模型（LLM）的推理能力。

爱喝白开水a·2025-02-28 07:52

Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路

让大语言模型（LLMs）既能说会道，又能逻辑严谨，是AI发展的下一座高峰。”开篇：语言模型的“逻辑盲区”近年来，大语言模型（LLMs）在自然语言处理（NLP）任务中取得了令人瞩目的成就。

步子哥·2025-02-28 07:19

推荐频道

大规模语言模型对话