yumuing blog

蛋白质界的 ChatGPT：AlphaFold1 论文必备知识，不会有人还不知道吧

你知道 AlphaFold2 吗？它真正解决了蛋白质三维结构预测的算法困境，堪称蛋白质界的 chat-GPT4，甚至它的意义不是 chat-GPT4 所能够匹敌的。它为世界疾病治疗药物开发以及探究生物生命之谜提供了通向天神的一条道路，未来是生物的世纪！AlphaFold2再登Nature，从业者都懵了：人类98.5%的蛋白质，全都被预测了一遍，现在，它已经公开了超两亿个蛋白质预测的三维结构，免费无偿提供，让我们感谢这一开源精神。当然，我们也可以先了解AF1，从最开始，到后来的改变！

Alphafold 论文目录结构

1-3：介绍 Alphafold 的完成背景与其他模型的优势，以及取得的成就

4-5：介绍 Alphafold 的基本思路，预测核心部件（卷积神经网络）以及梯度程序的思路

6-10：介绍 Alphafold 第一阶段的输出——残基距离分布图，以及第二阶段梯度下降程序效果

11-14：说明了核心部件对应的卷积神经网络的输入特征说明，以及选择一些输入因素的原因

15-23：搭建蛋白质可微几何模型以及梯度下降处理的思路及其效果

23-27：Alphafold 对 T0986s2 蛋白质的预测，达到 TM 分数 0.8，展示了神经网络的输入如何影响最终的预测

残差

残差，是指实际观察值与回归估计值的差。残差分析就是通过残差所提供的信息，分析出数据的可靠性、周期性或其它干扰。残差图的分布趋势可以帮助判明所拟合的线性模型是否满足有关假设。残差有多种形式，上述为普通残差。为了更深入地研究某一自变量与因变量的关系，人们还引进了偏残差。以某种残差为纵坐标，其它变量为横坐标作散点图，即残差图，它是残差分析的重要方法之一。需分析具体情况，探索合适的校正方案，如非线性处理，引入新自变量，或考察误差是否有自相关性。

蛋白质相似性度量

蛋白质结构相似性通常通过RMSD（均方根偏差）分数、GDT（全局距离测试）分数和模板建模分数（TM-score）来衡量。

参考：蛋白质结构相似性与TM评分= 0.5有多显著？ |生物信息学 |牛津学术 (oup.com)

RMSD

两种蛋白质结构的最佳叠加后所有等效原子对的均方根偏差（RMSD），然而，由于结构中的所有原子在计算中的权重相等，RMSD的主要缺点之一是，当RMSD值很大时，它对局部结构偏差比对全局拓扑更敏感。例如，即使核心部分的全局拓扑相同，如果尾部或某些环具有不同的方向，则两种蛋白质结构的RMSD可能很高;仅根据 RMSD 值，这无法与两个结构具有完全不同的拓扑的情况区分开来。很少使用到。

越高越不相似

TM-scores

TM评分是评估蛋白质结构拓扑相似性的指标。它使用Levitt-Gerstein权重计算所有残基对。TM 分数对全局拓扑比局部变化更敏感。此外，由于它采用蛋白质大小依赖性量表来归一化残基距离，因此随机蛋白质对的TM评分的大小与蛋白质大小无关

其中L是目标蛋白的长度，Lali是两种蛋白质中等效残基的数量。d i 是两个结构之间等效残基的第 i 对的距离，取决于叠加矩阵;“max”表示确定使公式（1）中的总和最大化的最佳叠加矩阵的过程。规模定义为标准化 TM 评分，即随机蛋白质对的平均 TM 评分的大小与蛋白质的大小无关。

TM 分数保持在（0， 1) 中，值越高表示相似性越强。

GDT 分数

GDT 分数被广泛用于社区范围的CASP和CAFASP实验，以评估蛋白质结构预测的建模准确性，随机结构对的GDT和MaxSub评分的大小与蛋白质长度具有幂律依赖性（Zhang和Skolnick，[2004](javascript:），这使得分数的绝对值意义不大。它还有一个缺点，即相关蛋白质的相似性在很大程度上取决于它们的长度

在大约 90 分的情况下，我们就可以认为从一串氨基酸序列转发成蛋白质折叠出的三维结构问题大部分已经得到解决，在 2020 年前的相关比赛中，从来没有超过 90，甚至是 60。GDT 分数意味着实际三维结构和生成的三维结构的全局距离分数。也可以说是预测结构和真实蛋白质结构相似度的度量值，如下：

而使用 Alpha fold 测试 2018 年的数据，可以达到将近 60。

越高越相似。

lDDT分数(局部距离差测试)

基于刚体叠加的GDT评分无法解释多结构域蛋白中相对结构域取向的变化，需要分别比较每个结构域。

氨基酸缩写表

同源序列的共变异可推断哪些氨基酸残基是接触

同源序列（homologous sequences）

同源序列可以用**相似性（similarity）**来度量。注意，**同一性（identity）**指两条序列完全相同。

残基（Residue）：

氨基酸之间的氨基和羧基脱水成键，氨基酸由于其部分基团参与了肽键的形成，剩余的结构部分则称氨基酸残基。也就是说在下图中，虚线框外的部分就是残基。

PDB 数据库

Protein Data Bank（以下简称,PDB，https://www1.rcsb.org/）是当今全世界最具公信力的蛋白质数据库之一，每一条蛋白质都有唯一标识，称为PDBID（类似每个人都有自己的身份证号，唯一标识），比如PDBID为1F88的蛋白质在PDB中如下:

蛋白质结构

一级结构

蛋白质的1级结构指的是其氨基酸序列。在PDB中可以下到蛋白质的序列文件，如1F88的序列文件rcsb_pdb_1F88.fasta如下：
第一行记录了该蛋白的信息
第二行开始记录了该条蛋白质的序列，由一个个氨基酸构成。以这个1F88为例，序列中包含了348个氨基酸，说明1F88由348个氨基酸构成，所以1F88的长度为348。

3级结构就是空间结构。空间中每一个氨基酸集团由若干个原子构成。每一个原子都会有自己的唯一确定的三维坐标由（x，y，z）表示。

二级结构

蛋白质分子的二级结构（secondarystructure）通常是指蛋白质多肽链沿主链骨架方向的空间走向、规则性循环式排列，或某一段肽链的局部空间结构，即蛋白质的二级结构为肽链主链或一段肽链主链骨架原子的相对空间盘绕、折叠位置，它并不涉及氨基酸残基侧链的构象。

三级结构

蛋白质的三维结构

以1F88蛋白质为例，1F88的3级结构用文件1F88.pdb来描述。可在 pdb 数据库查看：

在知道了每个原子的三维坐标后，我们可以在坐标系中，把每一个原子都标记出来，这样就得到了蛋白质的三维结构的空间图，如1F88序列经过PDB文件的坐标解析后，用Pymol软件打开可以看到他的结构如下：

蛋白质残基接触

空间中2个氨基酸集团的Ca原子（一般用Ca原子来计算接触）的空间距离小于8Å（Å是距离单位）的时候，我们认定这两个氨基酸是处于接触contact状态。简单讲，就是通过距离来判断是否接触，推断是否能够发生反应。

怎么计算两个氨基酸是否存在接触，以 1f88 为例：

将pdb坐标文件中2个氨基酸集团中的CA原子分别取出来，然后用空间距离计算公式，计算一下结果便可以得知结果。

MET_Ca的坐标为(x1,y1,z1)=44.718，-5.054，-26.911。ASN_Ca的坐标为(x2,y2,z2)=44.449，-4.763，-23.103。
代入空间中两点距离公式求这俩坐标之间的距离d。

得出结果为 d = 70.417122Å ，远远大于8Å的距离阈值要求。所以这俩氨基酸在空间中不接触。

CASP是二年一次的蛋白质结构预测竞赛，在CASP竞赛中，有专门的的一项就是接触预测竞赛。那么接触的意义是什么？通俗的说，接触就是一种约束，有了约束，会决定蛋白质在空间中的空间结构（为什么蛋白质的螺旋往左边倾斜，不往右边倾，就是有一种约束在其中作用），而空间结构决定了蛋白质的功能。有了功能能为药物开发等提供研究基础等。所以对接触进行研究是极具意义的。

蛋白质接触矩阵

在知道什么是接触、接触如何计算之后，我们可以用矩阵的形式，来将一条蛋白质的接触信息展示出来。这个形式就是接触矩阵，或成接触图。

在接触矩阵M中，假设一条蛋白质序列的长度为L。那么这个接触矩阵的维度就是L*L，接触矩阵M是一个沿主对角线对称的矩阵。

矩阵中每一个元素的值要么是0要么是1。0表示不接触，1表示接触。我们可以用i和j来标识。

比如一条长度为10的蛋白质，他的接触矩阵M的维度就是10*10。
如那么第三行第六列为1。就表示该序列的第3个氨基酸与第6个氨基酸他们是接触的。

MSA：多序列对比

使用原因：

蛋白质的生成与 DNA 息息相关，而目前地球上绝大多数都是由同一个祖先进化而来的，特定功能的蛋白质在不同物种间也具有极大的结构相关性。而这种特定功能下的蛋白质序列的结构相似性，正是 MSA 多序列对比能够对蛋白质结构预测起一定作用的原因。当然，单序列直接预测蛋白质结构很美好，但存在很大的难度，那这样的话，为什么不利用各种数据库存储的序列信息与对应蛋白质结构关系的宝贵信息，将这个难度大大减低。

原理：

假设存在两个蛋白质，它们之间的作用对于生物极其重要，我们知道，两个蛋白质之间存在化学上的相互作用，意味着存在一定的结构维持这种作用，一旦其中一个蛋白质出现突变，为了维持这种作用，另外一个蛋白质也必须做出配合的突变，否则，生物就将面临死亡。并且，现存的所有生物都是来自于同一个祖先，在这样的情况下，依据统计学概率，提取特征，我们就可以判断相同某些氨基酸是否存在接触的可能。

如下图：我们可以预测位于黑球位置的氨基酸 S 与氨基酸 H 存在接触的可能，氨基酸 F 与氨基酸 W 存在接触的可能。

其中，每一行氨基酸序列都是来自不同的生物。

Alphafol 从每个残基对的多序列对比中提取出了 484 个特征，还有部分能够明确表现出在 MSA 中缺失部分的特征：

1-hot amino acid type (21D)
Profiles: PSI-BLAST (21D)
HH280 blits profile (22D)
non-gapped profile (21D)
HHblits bias, HMM profile (30D)
Potts model bias (22D)
Deletion probability (1D)
Frobe285 nius norm (1D)
Gap matrix (1D)

这些特征作为预测残基距离的深度卷积神经网络的输入之一。

Alphaflod 思路

第一步：

基于目标氨基酸序列，在所有的数据库进行爬取，匹配出类似的在动物界中的相关物种的进化方向，再将这个 MSA 信息和一些额外的输入特征相结合，经过处理并重塑为二维数组并输入到深度残差卷积网络中。进而输出一个预测的蛋白质残基距离分布图。实际预测的不是蛋白质的残基距离分布，而是，每对残基之间的距离。

第二步：

结合不同残基间的扭转角度利用梯度下降法得出能够满足这样的残基距离的（不考虑物理力影响的）蛋白质的 3d 结构图。

第三步

结合残基之间的物理力（范德华力）得出一个较为合理的蛋白质三维结构。

思路流程图如下：

特征提取阶段（MSA 提取）用黄色表示，结构预测神经网络（蛋白质残基距离分布图）用绿色表示，潜在构造（基本骨架）用红色表示，结构实现用蓝色表示

蛋白质残基距离分布图

蛋白质每对残基之间的距离只是一个二维数组，里面每个数值都代表一个蛋白质 3d 结构中不同氨基酸之间的距离，比如在 i 行和 j 列的数字代表氨基酸 i 和氨基酸 j 的之间的距离。把这里的距离数字转换为颜色，即每个格子颜色深浅代表两个氨基酸距离。如下图：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bBT4EC0S-1682786250119)(null)]

其中，SQET······代表氨基酸缩写字母。由于 i 到 j 与 j 到 i 的距离相等，所以蛋白质分布图会以主对角线为中心的对称矩阵。之所以使用蛋白质分布图来进行预测，正是因为无论蛋白质如何旋转、平移都不会改变蛋白质距离分布图。也就是说不同视角下的同一个蛋白质的残基距离分布图一致。从而，我们不用为了预测准确去把蛋白质以某个姿态进行对齐位置。

实际距离与预测距离的残差分布图

其中：

横轴是残基之间的距离值，竖轴是实际值与预测值的残差
绿色代表残基呈现接触状态的残差图，网格分布趋向于向右，红线在黑线左侧
蓝色代表残基呈现非接触状态的残差图，网格分布趋向于向左，红线在黑线右侧
黑色竖线代表 8 Å 距离的残基对，表示接不接触的距离，大于不接触，小于接触。
红色表示真实距离

以下为残基距离分布图中的第二十九位残基与其他残基的的残差分布图，可看出，第七副图和第八幅图的效果并不是很好，偏向中间。其中，最高置信度分布会最小变化，集中在红线附近，如第27、28、30、31幅图。距离应该也是在这个附近。

从下面这个图，我们可以看出模型预测的距离和实际距离很接近

预测标准差平均值十分接近于 0 ，标准差越高，模型预测越不确定。

扭转角度的梯度计算法

利用残基距离预测分布图与偏移角度进行梯度下降法即可获得能够满足这样的残基距离的（不考虑物理力影响的）蛋白质的 3d 结构图。获得 3 d 结构图的方法为梯度下降法对这些变量进行处理。实际就是把每两个残基之间的 phi 和 psi 角度参数化，方法如下：

不同残基间的扭转角度（phi 和 psi 角度，也就是二级结构的基本构成）构建一个可微分的蛋白质几何模型，该几何模型输出结果为 $x = G (φ, ψ)$ ，进而获得 $d _{ij}= |x_i − x_j|$ 再与与预测出来的残基距离进行相减的绝对值结果为损失函数，即 $L = ∣ x - x^{'} ∣$ ，由于可微，可得， $\over {dψ}$ ，通过改变角度，减低损失函数值，也就是梯度下降算法计算出残基之间的距离。

其中：

φ, ψ 为 phi 和 psi 角度
i、j 为氨基酸 i 和氨基酸 j

随着，梯度下降的一步步进行，到了 1200 步，就已经有不错的效果了。TM 分数在上升，RMSD 分数在下降。

并且，随着步数的增加，蛋白质间的螺旋结构与非落选结构的残差分布也越来越合理，当然，这里的螺旋与否的判别是通过某种启发式学习得到的。拥有橙色那个图是扭转角度的变化的残差分布图

残基扭转角

φ（phi）表示一个肽单位中α碳左边C-N键的旋转角度， ψ（psi）表示α碳右边C-C键的旋转角度。

注：蓝色是 N 原子，白色是 C 原子

《DeepSeek-V3：动态温度调节算法，开启推理新境界！》人工智能深度学习
在人工智能领域不断探索的征程中，DeepSeek-V3以其卓越的创新技术，尤其是动态温度调节算法，成为了备受瞩目的焦点。这项算法犹如一把神奇的钥匙，巧妙地开启了推理速度与精度动态平衡的大门，为大语言模型的发展开辟了新的道路。温度，在大语言模型的世界里，是一个极为关键的参数，它掌控着模型输出的随机性。这一概念，脱胎于热力学，却在人工智能的领域中被赋予了全新的使命。当温度较低时，模型倾向于选择高概率词
核函数及其常见类型 Shockang 机器学习数学通关指南机器学习人工智能数学线性代数概率统计
前言本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见《机器学习数学通关指南》正文核心概念核函数（KernelFunction）是机器学习中处理非线性可分数据的关键工具。它的核心思想是隐式映射：通过将数据从原始低维空间映射到高维空间，使得在高维空间中线性可分，从而无需显式计算高维映射，仅需在低维空间高效计算
C语言基础系列【20】内存管理程序喵大人 C语言基础系列 c语言开发语言 c++后端面试
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列C++大佬养成攻略在C++编程中，内存管理是一个至关重要的概念。要深入理解内存管理，我们肯定要
2024年最新PyTorch深度学习项目实战100例数据集_python 深度学习项目演练 2401_84585440 程序员深度学习 python pytorch
前言最近很多订阅了《PyTorch深度学习项目实战100例》的用户私信咨询有些数据集下载不了以及一些文章中没有给出数据集链接，为了解决这个问题，专门开设了本篇文章，提供数据集下载链接，打包100例的所有数据集。本专栏适用人群：深度学习初学者，刚刚接触PyTorch的用户群体，专栏将具体讲解如何快速搭建深度学习模型用自己的数据集实现深度学习小项目，快速让新手小白能够对基于深度学习方法有个基本的框架认
PyTorch 学习路线 gorgor在码农 #python入门基础 python pytorch
学习PyTorch需要结合理论理解和实践编码，逐步掌握其核心功能和实际应用。以下是分阶段的学习路径和资源推荐，适合从入门到进阶：1.基础知识准备前提条件Python基础：熟悉Python语法（变量、函数、类、模块等）。数学基础：了解线性代数、微积分、概率论（深度学习的基础）。机器学习基础：理解神经网络、损失函数、优化器（如梯度下降）等概念。学习资源Python入门：Python官方教程机器学习基础
七成月活过亿 APP 已接入人工智能自不量力的A同学人工智能
2025年3月4日，第三方数据机构QuestMobile发布的《2024中国移动互联网年度大报告》显示，截至2024年12月，月活用户过亿的APP中，有超过七成已接入AI123。相关具体情况如下2：整体背景：2024年全网月活用户已达12.57亿，一线、新一线、二线城市用户接近五成，其中一线城市用户同比增长了1.2%。用户对互联网的使用程度加深，整体月人均使用时长达到171.7小时，短视频、即时通
Imagen原理与代码实例讲解 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Imagen原理与代码实例讲解1.背景介绍在人工智能领域中,图像生成一直是一个具有挑战性的任务。传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。随着深度学习技术的不断发展,生成式对抗网络(GenerativeAdversarialNetworks,GAN)等新型模型逐渐展现出了令人惊叹的图像生成能力。谷歌的Imagen就是一种基于大型视觉语言模型的全新图
大数据分析服务器硬件配置如何选择 elva428204358 服务器服务器
大数据，现如今已被人工智能替代。我们先不讨论人工智能，就大数据而言，我们都是在强调他的技术，而我们在用大数据时候，经常用它的来神话它的影响。例如，广告投放精准化，社会安全管理有序，医药行业智能化等。一、建立大数据分析服务器的五个基本方面1、可视化分析：大数据分析的使用者有大数据分析专家，同时还有普通用户，但是他们二者对于大数据分析最基本的要求就是可视化分析，因为可视化分析能够直观的呈现大数据特点，
机器学习篇——决策树基础巷955 机器学习算法决策树
引言：决策树是一种常见的机器学习算法，广泛应用于分类和回归任务。它通过树状结构表示决策过程，每个内部节点代表一个特征测试，每个分支代表一个可能的测试结果，而每个叶节点则代表一个类别或回归值。本文将详细介绍决策树的原理、构建过程、优缺点以及实际应用。1.决策树的基本概念1.1什么是决策树？决策树是一种监督学习算法，主要用于分类和回归任务。它通过递归地将数据集划分为更小的子集，最终生成一棵树状结构。决
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法带上一无所知的我智能体的自我修炼：强化学习指南深度学习算法人工智能 DQN
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法“好的代码如同山水画，既要工笔细描，又要留白写意”——一个在终端前顿悟的开发者DQN是Q-Learning算法与深度神经网络的结合体，通过神经网络近似Q值函数，解决传统Q-Learning在高维状态空间下的"维度灾难"问题。引言：代码与禅的碰撞♂️在某个调试代码到凌晨三点的夜晚，我突然意识到：强化学习的过程，竟与佛家修行惊人地相似。智能体在环境中探索
无监督AI训练:机遇与挑战并存 AI天才研究院计算 ChatGPT DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
无监督AI训练：机遇与挑战并存关键词：无监督学习、AI训练、机器学习、聚类算法、降维技术、深度学习摘要：本文深入探讨无监督AI训练这一新兴领域，首先介绍了其基本概念与原理，然后详细解析了无监督AI训练的核心技术，如聚类算法和降维技术，以及无监督深度学习。接着，本文通过实际项目案例分析，展示了无监督AI训练的应用实践。最后，本文分析了无监督AI训练面临的挑战，并展望了其未来发展趋势。通过本文的阅读，
提高客户体验：人类计算在营销中的应用 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
人类计算与营销：开启个性化时代的未来人类计算与营销：开启个性化时代的未来关键词：人工智能、个性化营销、客户体验、数据驱动、客户关系管理摘要：本文探讨了人类计算在营销中的应用，包括语音识别、人脸识别、自然语言处理等技术，以及如何通过这些技术实现个性化营销、客户关系管理和用户体验优化。文章分析了当前技术的发展趋势和面临的挑战，并提出了未来发展的方向。引言随着人工智能技术的飞速发展，人类计算在各个领域中
《DeepSeek+Langchain落地实操:RAG知识增强检索和智能体实战开发》 AI周红伟 langchain
大数据与人工智能实战专家—周红伟老师法国科学院数据算法博士/曾任阿里人工智能专家/曾任马上消费金融风控负责人课程背景LangChain是一项旨在赋能开发人员利用语言模型构建端到端应用程序的强大框架。它的设计理念在于简化和加速利用大型语言模型（LLM）和对话模型构建应用程序的过程。这个框架提供了一套全面的工具、组件和接口，旨在简化基于大型语言模型和对话模型的应用程序开发过程。LangChain本质上
PyTorch：Python深度学习框架使用详解零度° python python 深度学习 pytorch
PyTorch是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理领域。它由Facebook的AI研究团队开发，因其动态计算图、易用性以及与Python的紧密集成而受到开发者的青睐。PyTorch的主要特点动态计算图：PyTorch的计算图在运行时构建，使得模型的修改和调试更加灵活。自动微分：自动计算梯度，简化了机器学习模型的训练过程。丰富的API：提供了丰富的神经网络层、函数和损失函数。跨平
大模型时代，什么是tokens？人工智能
大模型时代，什么是tokens？前言在当今大模型主导的人工智能浪潮中，我们见证了诸多令人惊叹的应用。从精准流畅的语言翻译，到能够根据简单提示创作出富有创意故事的文本生成工具，大模型展现出了强大的能力。然而，在这些复杂且神奇的模型背后，有一个基础而关键的概念——tokens，它犹如大模型世界的基石，支撑着整个模型的运行与发展。理解tokens，对于我们深入认识大模型如何处理信息、优化性能以及合理应用
AI时代的多模态输入与理解：挑战与局限性智享食事人工智能
随着人工智能技术的快速发展，以及AI的普及，AI系统逐渐在各个领域展现出强大的潜力，一种感觉AI已经无所不能，已经很快就要取代我们人类，甚至代替我们工作。然而，现实情况并没有这么乐观，现实中AI要实现与人类相似的感知和理解，仍然面临着许多技术和应用上的难题。本文将从几个方面探讨当前AI在多模态输入与理解中的局限性，特别是在教育、心理咨询、医疗诊断等领域的应用挑战。一、多模态输入的现状与不完善所谓多
Python3 与 VSCode：深度对比分析 lly202406 开发语言
Python3与VSCode：深度对比分析引言Python3和VisualStudioCode（VSCode）在软件开发领域扮演着举足轻重的角色。Python3作为一门强大的编程语言，拥有丰富的库和框架，广泛应用于数据科学、人工智能、网络开发等多个领域。而VSCode作为一款轻量级且功能强大的代码编辑器，以其出色的性能和丰富的插件支持，受到了广大开发者的喜爱。本文将对Python3和VSCode进
python | flower，一个强大的 Python 库！双木的木 python拓展学习 python库 python 开发语言计算机视觉人工智能算法联邦学习深度学习
本文来源公众号“python”，仅用于学术分享，侵权删，干货满满。原文链接：flower，一个强大的Python库！大家好，今天为大家分享一个强大的Python库-flower。Github地址：https://github.com/mher/flower随着机器学习模型应用的增长，联邦学习（FederatedLearning，FL）逐渐成为一个重要方向。联邦学习允许多个客户端在不共享原始数据的情
关于自然语言处理（三）深度学习中的文字序列数据的分词操作 MatrixSparse 大模型人工智能自然语言处理深度学习人工智能
深度学习中的文字序列数据二维文字序列在文字数据中，样本与样本之间的联系是语义的联系，语义的联系即是词与词之间、字与字之间的联系，因此在文字序列中每个样本是一个单词或一个字（对英文来说大部分时候是一个单词，偶尔也可以是更小的语言单位，如字母或半词），故而在中文文字数据中，一张二维表往往是一个句子或一段话，而单个样本则表示单词或字。此时，不能够打乱顺序的维度是vocab_size，它代表了一个句子/一
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
基于CNN-BIGRU-Attention模型的功率预测（模型详解及代码复现）清风AI 深度学习算法详解及代码复现深度学习人工智能算法机器学习计算机视觉 cnn 神经网络
整体架构基于CNN-BiGRU-Attention模型的功率预测模型是一种融合了卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(Attention)的深度学习架构。这种混合模型旨在充分利用CNN的局部特征提取能力、BiGRU的长序列处理能力以及Attention机制的关键特征突出能力，从而提高功率预测的准确性和可靠性。模型的整体架构主要包括以下几个关键组件：输入层：设计的输入特
文生图图生视频文生视频人工智能AI工具节选行思理 AI 人工智能文生图文生视频图生视频数字人
1、MidjourneyAI图像和插画生成工具，官网地址：Midjourney中文站,MJ中文站-专业AI绘图网站2、StableDiffusion一种基于扩散技术的深度学习文本转图像模型，演示地址：StabilityAI3、通义万相阿里云通义大模型旗下的AI创意作画与视频生成平台，官网地址：通义万相_AI创意作画_AI绘画_人工智能-阿里云4、PhotoStudioAI模特AI商品图及视频一键生
ChatGPT-4o引领医学革命：临床科研创新与效率的新纪元小艳加油教程语言类人工智能数据分析 ChatGPT-4o 临床医学
2024年5月12日，更强版本的ChatGPT-4o上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。因此，帮助广大临床医学相关的医院管理人员、医生、学生、科研人员更加熟练地掌握ChatGPT-4o在临床医学日常生活、工作与学习、课题申报、论文选题、实验方案设计、实验数据统计分析与可视化等方面的强大功能，同时更加系统地学习人工智能（包括传统机器学习、深度学习等）的基础理
Manus：通用型Agent的技术革新与多元应用场景蚂蚁质量其他 python 深度学习
一、Manus前沿洞察Manus，作为Monica团队匠心打造的全球首款通用型Agent产品，名称源于拉丁文“mensetmanus”，意即“手”，深刻寓意着知识与行动的深度融合。其核心理念独树一帜，旨在为大语言模型（LLM）赋予“手”的能力，使其借助工具调用与任务执行，将抽象知识转化为切实可行的实际操作，开启人工智能应用的崭新时代。二、精巧技术架构Manus的技术架构兼具高度灵活性与卓越扩展性，
AIGC从入门到实战：ChatGPT+Midjourney，绘出中国古风意境之美杭州大厂Java程序媛 DeepSeek R1 &AI人工智能与大数据 java python javascript kotlin golang 架构人工智能
AIGC从入门到实战：ChatGPT+Midjourney，绘出中国古风意境之美关键词：AI生成内容(AIGC),ChatGPT,Midjourney,中国古风,创意设计,艺术表达1.背景介绍1.1问题由来人工智能生成内容（ArtificialIntelligenceGeneratedContent,AIGC）作为AI技术的重要分支，近年来在视觉、音乐、文本等多个领域取得了显著进展，引领了内容创作
人工智能引领技术革命：ChatGPT与深度学习的突破性进展撒旦骑路西法，大战吕布国内外安全资讯人工智能
在全球科技快速发展的今天，人工智能（AI）正以前所未有的速度渗透到各个行业，成为推动社会变革的重要力量。特别是在自然语言处理（NLP）领域，OpenAI的ChatGPT凭借深度学习技术的持续突破，展现了AI在理解、推理、对话生成等方面的惊人进步。本文将深入探讨ChatGPT及深度学习的最新突破，以及它对不同行业的深远影响。1.ChatGPT：AI语言模型的革新者1.1什么是ChatGPT？Chat
《即梦牵手DeepSeek，AI创作领域的变革与未来》空云风语人工智能人工智能
《即梦牵手DeepSeek，AI创作领域的变革与未来》开篇：科技融合，梦想启航在当今科技飞速发展的时代，人工智能（AI）无疑是最为耀眼的领域之一。新的技术和创新不断涌现，推动着AI行业的边界持续拓展。近期，AI领域又迎来了一个令人瞩目的大事件：即梦正式接入DeepSeek，这一强强联合的举措，犹如一颗投入湖面的巨石，激起千层浪，在整个AI行业引发了广泛关注和热烈讨论。即梦，作为字节跳动旗下极具创新
大模型与Java的深度融合：现状、实践、挑战与未来软件职业规划 java 开发语言
一、引言：大模型与Java的交汇近年来，大模型技术在人工智能领域迅速崛起，成为推动智能应用发展的核心力量。与此同时，Java作为一种历史悠久且广泛应用于企业级开发的编程语言，凭借其强大的生态系统、跨平台特性和稳定性，一直是软件开发领域的中流砥柱。随着大模型技术的普及，Java与大模型的结合成为了一个备受关注的热点话题。这种结合不仅为Java开发者带来了新的机遇，也为大模型的落地应用提供了更广阔的场
深入探索Deeplearning4j（DL4J）：Java深度学习的全面指南软件职业规划 java 深度学习开发语言
一、DL4J框架概述Deeplearning4j（DL4J）是一个开源的深度学习框架，专为Java和Scala设计，运行在Java虚拟机（JVM）上。它由Skymind公司开发并维护，旨在将深度学习技术应用于大规模商业应用。DL4J支持多种深度学习模型，包括卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等。自2014年首次发布以来，DL4J已经成为Java深度学习领域的
电机的声音数据进行AI分析鹿屿二向箔人工智能
对电机的声音数据进行分析，尤其是当数据来源于加速度传感器时，涉及到的不仅仅是声音分析，还包含了振动分析。这类问题通常可以归类于机械故障诊断或预测性维护领域。以下是一些适合处理这种类型数据的人工智能模型和方法：1.特征工程+传统机器学习模型在直接应用深度学习之前，通常首先会进行特征提取。对于振动信号（即使通过加速度传感器采集），常用的方法包括计算频域特征（如傅里叶变换后的频谱）、时域特征（如均方根值
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p