发呆的比目鱼

2022-LCLR-DIFFDOCK: DIFFUSION STEPS, TWISTS, AND TURNS FOR MOLECULAR DOCKING

Paper: https://arxiv.org/abs/2210.01776
Code: https://github.com/gcorso/DiffDock

预测小分子配体与蛋白质的结合结构(称为分子对接)是药物设计的关键。最近的深度学习方法将对接视为一个回归问题，与传统的基于搜索的方法相比，它减少了运行时间，但在准确性方面还没有得到实质性的改进。相反，将分子对接构建为生成建模问题，并开发了DIFFDOCK，这是配体姿态的非欧几里得流形上的扩散生成模型。为此，将此流形映射到涉及对接的自由度(平移、旋转和扭转)的积空间，并在此空间上开发有效的扩散过程。举例来说，DIFFDOCK在PDB- Bind上获得了38%的top-1成功率(RMSD<2 a)，显著优于之前最先进的传统对接(23%)和深度学习(20%)方法。此外，DIFFDOCK具有快速推断时间和提供高选择精度的置信度估计。

蛋白质的生物学功能可以通过与之结合的小分子配体(如药物)来调节。因此，计算药物设计中的一个关键任务是分子对接，预测配体与目标蛋白结合时的位置、方向和构象，从而推断配体的作用(如果有的话)。传统的对接方法[Trott & Olson, 2010;Halgren等人，2004]依赖于估计所提议结构或姿态正确性的评分函数，以及搜索评分函数的全局最大值的优化算法。然而，由于搜索空间很大，评分函数的范围很广，这些方法往往太慢，而且不准确，特别是对于高通量工作流。

近期作品[St ark et al.， 2022;Lu等人，2022]开发了深度学习模型，一次性预测绑定姿势，将对接视为回归问题。虽然这些方法比传统的基于搜索的方法快得多，但它们还没有证明在准确性方面有显著提高。，这可能是因为基于回归的范式与分子对接的目标不完全对应，这反映在这样一个事实中，即标准精度指标类似于预测模型下数据的可能性，而不是回归损失。因此，将分子对接构建为给定配体和目标蛋白结构的生成建模问题，学习配体姿势的分布。

因此，作者开发了一种用于分子对接的配体空间上的扩散生成模型(DIFFDOCK)。定义了一个涉及到对接的自由度的扩散过程:配体相对于蛋白质的位置(定位结合袋)，它在口袋中的方向，以及描述其构象的扭转角。DIFFDOCK样品姿态通过运行学习到的(反向)扩散过程，该过程迭代地将配体姿态上未知的、有噪声的先验分布转换为学习到的模型分布， r如下图所示
直观地说，这个过程可以被看作是通过更新它们的平移、旋转和扭转角度来逐步优化随机姿势。

虽然DGMs已经应用于分子机器学习中的其他问题，但现有的方法不适用于分子对接，其中配体的空间是一个(m+6)维的子流形 $\in R^{3n}$ ，其中n和M分别是原子数和扭转角。为了开发DIFFDOCK，对接自由度将M定义为通过一组允许的配体位姿转换可访问的位姿空间。使用这种思想将M中的元素映射到与这些转换相对应的组的积空间，在其中可以有效地开发和训练DGMs。由于对接模型的应用通常只需要固定数量的预测和这些预测的置信度分数，训练一个置信度模型，为从DGM中采样的姿态提供置信度估计，并挑选出最有可能的样本。
这个两步过程可以被视为蛮力搜索和一次性预测之间的一种中间方法:保留了考虑和比较多个姿势的能力，而不会遇到高维搜索的困难。

根据经验，在标准盲对接基准PDBBind上，在配体均方根距离(RMSD)低于2 A的情况下，DIFFDOCK实现了38%的top-1预测，几乎是之前最先进的深度学习模型(20%)的两倍。DIFFDOCK的性能甚至超过了最先进的基于搜索的方法(23%)，同时在GPU上仍然快3到12倍。此外，它提供了其预测的准确置信度评分，在其最自信的三分之一之前未见的复合体上获得83% RMSD<2 A。

综上所述，本工作的主要贡献是：

将分子对接任务构建为一个生成问题，并强调了之前深度学习方法的问题。
提出了一个新的扩散过程的配体姿态对应的自由度涉及分子对接
在PDBBind盲对接基准上， $RMS D < 2 A$ ，实现了最新的38%的top-1预测，大大超过了之前最好的基于搜索的方法(23%)和深度学习方法(20%)。

Molecular docking. 分子对接任务通常分为已知口袋对接和盲对接。已知口袋对接算法将分子在蛋白质上结合的位置(结合口袋)作为输入，只需要找到正确的方向和构型。由于大多数情况下蛋白质的相对刚性，对接方法通常假设已知结合的蛋白质结构，将遵循这一假设。方法通常通过命中百分比或近似正确的预测来评估，通常认为配体RMSD误差低于2 A [Alhossary等人，2015;哈桑等人，2017;麦克纳特等人，2021年]。

Search-based docking methods. 传统对接方法[Trott & Olson, 2010;Halgren等人，2004年;Thomsen和Christensen, 2006]由一个参数化的基于物理的评分函数和一个搜索算法组成。评分函数采用3D结构并返回给定姿态的可能性估计值，而搜索则随机修改配体姿态(位置、方向和扭转角)，目标是找到评分函数的全局最优值。这些基于搜索的方法在对接到一个已知的口袋时提供了相对的改进，但运行起来通常计算成本非常高，而且必须努力解决盲对接所特有的非常大的搜索空间。

Machine learning for blind docking. 最近，EquiBind [St ark et al.， 2022]试图通过直接预测配体和蛋白质上的口袋关键点并对准它们来解决盲对接任务。TANKBind [Lu等人，2022]通过独立预测每个可能的口袋的对接姿势(以原子间距离矩阵的形式)，然后对它们进行排序，改进了这一点。虽然这些基于单次或少次回归的预测方法速度快了几个数量级，但其性能还没有达到传统的基于搜索的方法。

Diffusion generative models. 设数据分布为连续扩散过程的初始分布 $p_0(x)$ ，描述为 $d x = f (x, t) d t + g (t) d w$ ，其中 $w$ 为Wiener过程。扩散生成模型(DGMs)对扩散数据分布的score $\bigtriangledown x log p_t(x)$ 进行建模，以便通过反向扩散生成数据 $dx = [f (x,t) g(t)2 x log p_t(x)] + g(t) dw$ [Song等人，2021]。在这里，总是令 $f (x, t) = 0$ 。已经为分子机器学习任务开发了几种DGMs，包括分子生成[Hoogeboom等人，2022]、构象生成[Xu等人，2021]和蛋白质设计[Trippe等人，2022]。然而，这些方法学习了在整个欧氏空间 $R^{3n}$ 上的分布，每个原子有3个坐标，这使得它们不适用于自由度受到更大限制的分子对接。

model

尽管EquiBind和其他ML方法通过避免昂贵的配体姿态优化过程提供了强大的运行时改进，但它们的性能还没有达到基于搜索的方法。正如下面的分析所指出的，这可能是由模型的不确定性和目标函数的优化所引起的，该目标函数与分子对接在实践中如何使用和评估并不对应。

Molecular docking objective 分子对接在药物发现中起着至关重要的作用，因为预测结合蛋白配体复合物的3D结构可以进一步对结合相互作用的强度和性质进行计算和人类专家分析。因此，对接预测只有在其与真实结构的偏差不显著影响此类分析的输出时才有用。因此，停靠预测只有在其与真实结构的偏差不显著影响此类分析的输出时才有用。因此，在该领域中使用的标准评价度量一直是配体RMSD(晶体配体位姿)低于某个值 $\epsilon$ 的预测的百分比。

然而，在某些容忍范围内，最大化RMSD预测的比例的目标是不可微的，不能用于随机梯度下降的训练。然而，在某些容差 $\epsilon$ 内最大化RMSD预测的比例的目标是不可微的，不能用于随机梯度下降的训练。相反，当RMSD < $\epsilon$ 时，最大化预测的预期比例对应于在模型的输出分布下，在 $\epsilon$ 趋于0的极限下，最大化真实结构的可能性。这一观察促使训练生成模型，以最小化模型分布下所观察结构的负对数似然的上界。因此，将分子对接视为在蛋白质结构上学习分布的问题，并在该空间上开发了扩散生成模型（第4节）

Confidence model 使用训练过的扩散模型，可以根据模型从后验分布中采样任意数量的配体位姿。然而，研究人员通常只对一个或少量的预测姿态感兴趣，并对下游分析的相关置信度进行测量。因此，在扩散模型采样的姿势上训练一个置信度模型，并根据它们在容错范围内的置信度对它们进行排序。然后将排名第一的配体姿态和相关置信度作为DIFFDOCK的排名第一的预测和置信度得分.

**Problem with regression-based methods. **. 开发用于分子对接的深度学习模型的难点在于姿态的数据固有(任意)不确定性(多个姿态可能是正确的)，以及与有限的模型容量和可用数据相比任务的复杂性(认知不确定性)。因此，考虑到现有的协变量信息(只有蛋白质结构和配体身份)，任何方法都将在许多可行的替代方案中对正确的结合姿势表现出不确定性。任何回归风格的方法，被迫选择一个单一的配置，使期望的平方误差最小化，将学会预测(加权)这些替代的平均值。相比之下，具有相同协变量信息的生成模型将旨在捕获备选方案的分布，填充大多数重要模式，即使同样无法区分正确的目标。如下图所示，这种行为导致基于回归的模型比作者的方法产生明显更多的物理上不可信的姿势。

特别是，观察到频繁的空间冲突(例如，在EquiBind的预测中占26%)以及EquiBind和TANKBind的预测中的自交叉(图5和图9)。

在DIFFDOCK的预测中没有发现交集。这些现象的可视化和定量证据见附录E.1。

配体位姿是 $R^3$ 中原子位置的分配，因此原则上，可以将位姿x视为 $R^{3n}$ 中的一个元素，其中n是原子数。然而，这包含了比分子对接相关的更多自由度。特别是，配体中的键长、角度和小环基本上是刚性的，因此配体的灵活性几乎完全取决于可旋转键的扭转角度。传统的对接方法，以及大多数的ML方法，都以隔离配体的种子构象 $\in R^{3n}$ 作为输入，仅改变最终束缚构象的相对位置和扭转自由度。因此，与 $c$ 一致的配体位姿空间是一个 $(m + 6)$ 维子流 $M c R 3 n$ ，其中 $m$ 是可旋转键的数量，另外六个自由度来自于相对于固定蛋白质的旋转平移。遵循这样的范式，将种子构象 $c$ 作为输入，并将分子对接制定为学习基于蛋白质结构 $y$ 的歧管 $M_c$ 上的概率分布 $p_c(x |y)$ 。

De Bortoli等人[2022]通过将环境空间中的扩散投影到子流形上，制定了子流形上的 $D GM s$ 。然而，这种扩散的核 $p(x_t | x_0)$ 不能以封闭形式获得，必须用测地线随机游走进行数值采样，这使得训练效率非常低。相反，定义了一个一对一映射到另一个更好的流形，其中扩散核可以直接采样，并在该流形中开发一个 $D GM$ 。首先，重申最后一段中的讨论如下:

这可以看作是流形 $M_c$ 的非正式定义。同时，给出了一个连续的与 $m + 6$ 自由度相对应的配体位姿变换族，可以将 $M_c$ 上的一个分布提升为相应群的积空间上的一个分布，这个分布本身就是一个流形。然后，将展示如何在这个积空间上对扩散核进行采样，并在上面训练 $D GM$ 。

定义 $SO(2)^m$ 元素的操作，使其对结构造成最小扰动(RMSD意义上)

这些属性可以更正式地表述如下(证明在附录A中)

接下来展示如何使用积空间来学习 $M_c$ 中配体位姿上的DGM。理论结果(证明在附录a中)。

SO(3)上的扩散核由IGSO(3)分布给出[Nikolayev & Savyolov, 1970;Leach等人，2022]，可以在轴-角参数化中通过采样单位矢量 $\hat{ω} \in so(3)$ 均匀7和随机角度 $\in [0，π]$ 根据进行采样

Diffusion model. 为评分模型提供完整的3D结构，而不是产品空间的抽象元素，使其能够使用SE(3)等变模型推理物理相互作用，而不依赖于扭转角的任意定义，并更好地推广到未见的复合体。

Confidence model. 为了收集置信度模型d(x,y)的训练数据，运行训练过的扩散模型，为每个训练示例获得一组候选姿态，并通过测试每个姿态的RMSD是否低于2A来生成标签。

实验

Docking accuracy. DIFFDOCK显著优于之前的所有方法(表1)。特别是，在采样40个姿势时，DIFFDOCK获得了令人印象深刻的38.2%的top-1成功率(即RMSD <2 A8的预测百分比)，而在采样10个姿势时，则获得了35.0%。这一性能大大超过了最先进的商业软件，如GLIDE（21.8%）和先前最先进的深度学习方法TANKBind（20.4%）。基于ML的口袋预测与基于搜索的对接方法相结合的使用提高了基线性能，但即使是其中最好的（P2Rank+GNNA）也仅达到28.8%的成功率。

Inference runtime. DIFFDOCK拥有其卓越的准确性，(在GPU上)比最好的基于搜索的方法GNINA快3到12倍(表1)。这种高速度对于应用至关重要，例如对候选药物的高通量虚拟筛选或对蛋白质靶点的反向筛选，在这些应用中，人们经常搜索大量的复合物。

Selective accuracy of confidence score. 正如前1的结果所示，DIFFDOCK的置信度模型在对给定复合体的采样姿势进行排名并选择最佳姿势时非常准确。通过评估DIFFDOCK仅在置信度高于某一阈值(称为选择性预测)时进行预测，来研究不同复合物的置信度模型的选择准确性。在图4中，绘所做预测的复合体的百分比时的成功率，即增加置信度阈值。

微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

2022-LCLR-DIFFDOCK: DIFFUSION STEPS, TWISTS, AND TURNS FOR MOLECULAR DOCKING

2022-LCLR-DIFFDOCK: DIFFUSION STEPS, TWISTS, AND TURNS FOR MOLECULAR DOCKING

model

实验

你可能感兴趣的:(DrugAi,人工智能,深度学习)