蛋白质语言模型第3页

DeepSeek-Ollama实现本地化无烦恼

我们需要用到：Ollama:启动并运行大型语言模型。star125KOpenWebUI:一个可扩展、功能丰富且用户友好的自托管AI平台，旨在完全离线运行。

c_zyer·2025-02-12 20:11

最通俗易懂的方式，由浅入深地讲讲DeepSeek（深度求索）

它最核心的产品是大语言模型（你可以理解为"超级聊天机器人"），比如DeepSeek-R1、DeepSeek-MoE等。

Jing_saveSlave·2025-02-12 19:07

提升语言模型性能的关键策略

标题：提升语言模型性能的关键策略文章信息摘要：提升语言模型性能的关键在于预训练数据的规模和质量、模型架构的优化以及模型与数据的平衡。单纯增加模型参数规模并不能持续带来性能提升，性能提升会逐渐趋于平缓。

XianxinMao·2025-02-12 18:25

云原生周刊：DeepSeek 颠覆人工智能

KubeSphere 云原生·2025-02-12 18:54

生物制药企业选择谷歌云的理由有哪些？

AI发展的这一年，科学家也紧随其后，透过AI拓展更多微观层面的生物学奥义，包括蛋白质折叠等。生物制药公司也加大了在药物研发领域的投入，其中一方面就是搭载云平台。

·2025-02-12 18:53

普惠AI 如何在 Anolis OS 8 上部署生产可用的 DeepSeek 推理服务

DeepSeek-R1-Distill-Qwen则是通过DeepSeek-R1的输出，基于Qwen大语言模型，经过模型蒸馏的小模型，其中32B和70B模型在多项能力上实现了对标OpenAIo

·2025-02-12 17:52

AI基础 -- AI学习路径图

人工智能从数学到大语言模型构建教程第一部分：AI基础与数学准备1.绪论：人工智能的过去、现在与未来人工智能的定义与发展简史从符号主义到统计学习、再到深度学习与大模型的变迁本书内容概览与学习路径指引2.线性代数与矩阵运算向量与矩阵的基本概念矩阵分解

sz66cm·2025-02-12 16:40

大语言模型在专业领域的应用——教育场景下的大语言模型

什么都不太懂的程序员·2025-02-12 15:09

探索 Dify：开源 LLM 应用开发平台

这是一个开源平台，专为大语言模型（LLM）应用开发设计。凭借其直观的界面、全面的功能和强大的后端支持，Dify将彻底改变开发人员创建和部署AI应用程序的方式。

weixin_40941102·2025-02-12 15:38

llama3简介与国内最快体验方式

Meta公司研发并推出了MetaLlama3系列大型语言模型（LLMs），该系列包括8B和70B参数量的预训练及指令调优生成文本模型。

weixin_40941102·2025-02-12 15:08

Java程序员Python一小时速成

背景由于最近要开发一些AILLM（LargeLanguageModel大语言模型）应用程序，然后又想使用LangChain（LangChain是一个用于构建和操作大语言模型（LLMs）的框架，旨在帮助开发者更方便地集成和使用各种

BossFriday·2025-02-12 15:04

从语言模型获取结构化数据输出的高级技巧

标题:从语言模型获取结构化数据输出的高级技巧内容:从语言模型获取结构化数据输出的高级技巧引言在使用大型语言模型(LLM)时,我们经常需要模型返回特定格式的结构化数据,而不仅仅是自由格式的文本。

stjklkjhgffxw·2025-02-12 14:29

TAG，一种用于复杂问题解答的统一模型

强大的语言模型（LM）的出现为以更自然、更直观的方式查询和分析信息开

·2025-02-12 13:13

AI提示工程实战：从零开始利用提示工程学习应用大语言模型【附PDF】

大语言模型是人工智能领域的重要成果，在自然语言处理和生成任务中发挥着重要的作用。读者通过深入了解和应用提示工程，能充分挖掘和利用大语言模型的潜力，提升效率、促进创新，并解决实际问题。

程序员丸子·2025-02-12 12:49

DeepSeek-V3：模型与权重全面解析

DeepSeek-V3是一款开创性的混合专家（Mixture-of-Experts,MoE）语言模型，以其创新的架构设计、高效的训练方法和卓越的性能，成为开源大语言模型领域的标杆。

步子哥·2025-02-12 11:13

OpenAI重磅更新：发布目前最强推理模型ChatGPT-o1，新鲜测试出炉，草莓快要成熟了

这次更新标志着OpenAI在人工智能推理能力上的重大突破，推出了其最新的大语言模型——o1-preview和o1-mini。这一更新揭开了已经预热接近一年的“Q*/草莓项目”的神秘面纱。

机械心·2025-02-12 10:39

DeepSeek 与 Transformer 架构的深度关联

在人工智能蓬勃发展的当下，大语言模型正以惊人的速度迭代更新，持续重塑着人们对智能技术的认知。DeepSeek作为其中的杰出代表，凭借其卓越的性能和独特的技术架构，在自然语言处理领域引发了广泛关注。

JoveZou·2025-02-12 10:08

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡（十五）

二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。

开源技术探险家·2025-02-12 04:50

揭幕 DeepSeek-V2.5-1210：革新人工智能能力

这一尖端语言模型在各个领域都取得了巨大进步，巩固了其作为人工智能领域开拓者的地位。

吴脑的键客·2025-02-12 03:16

对DeepSeek-R1通过强化学习提升大型语言模型推理能力的技术原理解析

强化学习基础•基本概念：强化学习是一种机器学习方法，智能体（模型）通过与环境进行交互，根据环境反馈的奖励信号来学习最优的行为策略。•关键要素：包括环境（模型所处的推理任务场景）、状态（模型在推理过程中的当前情况，如已有的推理步骤、已知信息等）、动作（模型在当前状态下做出的推理决策，如选择何种推理方法、如何组织语言等）、奖励（根据模型的动作和结果给予的反馈，如推理正确给予正奖励，错误给予负奖励或无奖

一只贴代码君·2025-02-12 02:12

大语言模型多代理协作（MACNET）

大语言模型多代理协作（MACNET）ScalingLarge-Language-Model-basedMulti-AgentCollaboration提出多智能体协作网络（MACNET），以探究多智能体协作中增加智能体数量是否存在类似神经缩放定律的规律

ZhangJiQun&MXP·2025-02-12 00:51

预训练语言模型：从BERT到GPT，NLP的新纪元

自然语言处理（NLP）在过去几年中经历了翻天覆地的变化，而这一变化的催化剂无疑是预训练语言模型（Pre-trainedLanguageModels,PLMs）的崛起。

Evaporator Core·2025-02-11 20:23

【大模型部署及其应用】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat

Ollama是一种用于运行大语言模型（如LLaMA）的平台，适合本地化部署和运行。

源代码杀手·2025-02-11 18:34

大语言模型原理与工程实践：初探大语言模型

大语言模型原理与工程实践：初探大语言模型作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：大语言模型，机器学习，自然语言处理，深度学习，工程实践1.

AI天才研究院·2025-02-11 17:04

三步本地部署deepseekr1，支持macOs，ubuntu，Windows

一、ollama安装：ollama官网：OllamaOllama是一款支持在Windows、macOS和Linux上本地运行大型语言模型的工具。

dingdongkk·2025-02-11 17:28

AI代码生成器安全隐患：Grok泄露系统提示词事件警示

最近，一个名为Grok的大型语言模型泄露了其系统提示词，引发了业内对AI写代码工具安全性和透明度问题的广泛关注。

·2025-02-11 16:04

深入解析：如何使用 Ollama 下载与使用本地大语言模型

在当今数字化时代，大语言模型（LLM）的应用越来越广泛，从自然语言处理到文本生成，从代码辅助到智能问答，它们都展现出了强大的能力。然而，使用云端大语言模型往往面临着成本高昂、隐私泄露等问题。

大懒猫软件·2025-02-11 16:22

AI代码生成器安全隐患：Grok泄露系统提示词事件警示

最近，一个名为Grok的大型语言模型泄露了其系统提示词，引发了业内对AI写代码工具安全性和透明度问题的广泛关注。

·2025-02-11 15:22

以创新测评赋能未来：CSDN开源与智能技术创新研究院发布大模型综合榜单

随着人工智能的持续演进，大语言模型在越来越多的领域中发挥着关键作用。对中小企业或个人用户而言，如何选择适合自身需求、具有高性价比且能够快速落地的大语言模型，成为技术应用的核心关切。

CSDN资讯·2025-02-11 15:17

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

及依赖库模型下载安装HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模语言模型

engchina·2025-02-11 14:41

动手学大语言模型LLM-02

文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp

阿苏拉则_妫·2025-02-11 12:28

DeepSeek R1 简易指南：架构、本地部署和硬件要求

DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。该研究突破性地采用强化学习（Reinfo

·2025-02-11 12:49

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

01什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入prompt和生成返回response的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。

·2025-02-11 11:44

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

DeepSeek-V3模型简介DeepSeek-V3是DeepSeek发布的MoE（Mixture-of-Experts）大语言模型，总参数量为6710亿，每个token激活的参数量为370亿。

·2025-02-11 11:44

DeepSeek与ChatGPT对比：技术、应用与未来趋势

在人工智能飞速发展的时代，大语言模型成为了推动技术革新和产业变革的核心力量。DeepSeek和ChatGPT作为其中的典型代表，各自凭借独特的技术架构、训练方式和应用优势，在不同领域展现出卓越的性能。

CodeJourney.·2025-02-11 11:49

AF3 drmsd函数解读

drmsd（distanceRootMeanSquareDeviation，距离均方根偏差）函数在AlphaFold3的src.utils.validation_metrics模块中定义，用于计算两个蛋白质结构

qq_27390023·2025-02-11 08:51

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

与GitHubCopilot类似，通义灵码基于大语言模型（LLM），可以提供代码补全、智能纠错、代码生成等功能，极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码，

全栈探索者chen·2025-02-11 06:09

《大语言模型：原理与工程实践》书籍推荐及详细说明

随着人工智能技术的发展，尤其是深度学习技术的进步，大规模语言模型（LargeLanguageModels,LLMs）已成为自然语言处理领域的研究热点。

大模型入门教程·2025-02-11 01:57

大模型入门（六）—— RLHF微调大模型

一、RLHF微调三阶段参考：https://huggingface.co/blog/rlhf1）使用监督数据微调语言模型，和fine-tuning一致。

LLM.·2025-02-10 23:17

SEO友好架构提升LLM应用的可发现性

《SEO友好架构提升LLM应用的可发现性》文章关键词SEO友好架构语言模型（LLM）搜索引擎优化（SEO）可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO

AI天才研究院·2025-02-10 17:00

【AI论文】LIMO：推理中少即是多

摘要：我们提出了一项重大发现，这一发现挑战了我们对大型语言模型中复杂推理能力涌现方式的理解。传统观点认为，复杂的推理任务需要大量的训练数据（超过10万例）。

东临碣石82·2025-02-10 16:55

2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用

随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。

梦想的初衷~·2025-02-10 16:53

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

以下是关于这一事件的详细介绍：DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型，具备强大的自然语言处理能力、逻辑推理能力和上下文理解能

2501_90444774·2025-02-10 14:10

《具身智能时代：机器人具身抓取技术的前沿探索与应用综述》

自2022年GPT等大模型的爆发以来，人工智能领域以语言模型为代表的预训练模型在多个领域掀起了创新浪潮。

笑傲江湖2023·2025-02-10 13:53

ChatGPT vs. DeepSeek：大模型赛道的差异化竞争

ChatGPTvs.DeepSeek：大模型赛道的差异化竞争人工智能语言模型的快速发展正在重塑人机交互的边界，在这场技术浪潮中，ChatGPT与DeepSeek作为两类典型代表，展现出截然不同的技术路线与市场定位

TKang8912·2025-02-10 12:49

谈大语言模型动态思维流编排

尽管大语言模型已经呈现出了强大的威力，但是如何让它完美地完成一个大的问题，仍然是一个巨大的挑战。需要精心地给予大模型许多的提示（Prompt）。

姚家湾·2025-02-10 10:31

代码星辰：探索 benchmark 构建的奥秘之旅

而在这片“代码星海”中，如何评估大语言模型（LLMs）在编程任务上的表现，就像天文学家借助望远镜探索宇宙奥秘一般关键。近日，一篇题为《HowShouldIBuildABenchmark?

步子哥·2025-02-10 07:56

AI系列：大语言模型的function calling（下）- 使用LangChain

装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(LLM)4.functioncalling处理流程LangChain版代码与原生LLM调用的比较参考前言在AI系列：大语言模型的

liyane·2025-02-10 05:38

AI大模型系列之七：Transformer架构讲解

前馈神经网络编码器（Encoder）解码器（Decoder）：基于卷积神经网络（CNN）的编码器-解码器结构基于Transformer架构的主流语言模型有哪

m0_74823683·2025-02-10 03:58

大模型学习笔记 - LLM 对齐优化算法 DPO

LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习，语料库内容混杂，训练的目标是语言模型损失，任务是nexttokenprediction

JL_Jessie·2025-02-10 03:54

推荐频道

蛋白质语言模型

DeepSeek-Ollama实现本地化无烦恼

最通俗易懂的方式，由浅入深地讲讲DeepSeek（深度求索）

提升语言模型性能的关键策略

云原生周刊：DeepSeek 颠覆人工智能

生物制药企业选择谷歌云的理由有哪些？

普惠AI 如何在 Anolis OS 8 上部署生产可用的 DeepSeek 推理服务

AI基础 -- AI学习路径图

大语言模型在专业领域的应用——教育场景下的大语言模型

探索 Dify：开源 LLM 应用开发平台

llama3简介与国内最快体验方式

Java程序员Python一小时速成

从语言模型获取结构化数据输出的高级技巧

TAG，一种用于复杂问题解答的统一模型

AI提示工程实战：从零开始利用提示工程学习应用大语言模型【附PDF】

DeepSeek-V3：模型与权重全面解析

OpenAI重磅更新：发布目前最强推理模型ChatGPT-o1，新鲜测试出炉，草莓快要成熟了

DeepSeek 与 Transformer 架构的深度关联

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡（十五）

揭幕 DeepSeek-V2.5-1210：革新人工智能能力

对DeepSeek-R1通过强化学习提升大型语言模型推理能力的技术原理解析

大语言模型多代理协作（MACNET）

预训练语言模型：从BERT到GPT，NLP的新纪元

【大模型部署及其应用 】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat

大语言模型原理与工程实践：初探大语言模型

三步本地部署deepseekr1，支持macOs，ubuntu，Windows

AI代码生成器安全隐患：Grok泄露系统提示词事件警示

深入解析：如何使用 Ollama 下载与使用本地大语言模型

AI代码生成器安全隐患：Grok泄露系统提示词事件警示

以创新测评赋能未来：CSDN开源与智能技术创新研究院发布大模型综合榜单

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

动手学大语言模型LLM-02

DeepSeek R1 简易指南：架构、本地部署和硬件要求

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

DeepSeek与ChatGPT对比：技术、应用与未来趋势

AF3 drmsd函数解读

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

《大语言模型：原理与工程实践》书籍推荐及详细说明

大模型入门（六）—— RLHF微调大模型

SEO友好架构提升LLM应用的可发现性

【AI论文】LIMO：推理中少即是多

2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

《具身智能时代：机器人具身抓取技术的前沿探索与应用综述》

ChatGPT vs. DeepSeek：大模型赛道的差异化竞争

谈大语言模型动态思维流编排

代码星辰：探索 benchmark 构建的奥秘之旅

AI系列：大语言模型的function calling（下）- 使用LangChain

AI大模型系列之七：Transformer架构讲解

大模型学习笔记 - LLM 对齐优化算法 DPO

【大模型部署及其应用】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat