人工智能前沿讲习

【独家解读】Nature论文AlphaFold：AI推动科学发现

“独家解读，听听他人的声音”，聆听他人的学术成长经历，对科研问题独到的见解，了解产业界的最新进展，相互学习、相互借鉴、集思广益、共同进步。为此，我们特别开辟“独家解读”专栏，让你在科研道路上与时俱进，打开新世界的大门，敬请关注。

人工智能前沿讲习编译

原标题：AlphaFold: Using AI for scientific discovery

作者：Andrew Senior，John Jumper，Demis Hassabis，Pushmeet Kohli

原链接：https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery

在近期发表于Nature杂志上的研究中，我们展示了人工智能的研究如何驱动和加速新的科学发现。我们已经建立了一个专门的跨学科团队，希望利用AI来推动基础研究的发展：召集结构生物学，物理学和机器学习领域的专家，共同运用前沿技术来实现仅根据遗传序列预测蛋白质的3D结构。

我们的系统AlphaFold是多年工作的结晶，它建立在数十年来使用大型基因组数据集预测蛋白质结构的研究的基础上。AlphaFold生成的蛋白质3D模型比以前的任何一种都要精确得多，这标志着生物学的一项核心挑战取得了重大进展。Github上提供了CASP13上使用的AlphaFold代码¹，供有兴趣了解更多信息或复现我们的结果的任何人使用。这项工作已经启发了其他独立的实现，包括我们的论文²中所描述的模型，以及社区构建的开源实现³（详见此处²），我们也为此感到兴奋。

What is the protein folding problem?

蛋白质是生命中必不可少的大而复杂的分子。人体执行的每一项功能（收缩肌肉，感知光线或将食物转化为能量）几乎都取决于蛋白质以及蛋白质的移动和变化方式。任何给定的蛋白质可以做什么取决于其独特的3D结构。例如，我们的免疫系统利用的抗体蛋白为“ Y形”，并形成独特的钩状。通过锁定病毒和细菌，这些抗体蛋白能够检测并标记引起疾病的微生物以进行消除。胶原蛋白的形状像绳索，可以在软骨，韧带，骨骼和皮肤之间传递张力。其他类型的蛋白质包括Cas9，Cas9以CRISPR序列为指导，像剪刀一样剪切和粘贴DNA片段。还有抗冻蛋白，其3D结构使它们能够与冰晶结合并防止生物冻结。而核糖体的作用类似于程序化的装配线，有助于自身构建蛋白质。

这些蛋白质的配方（称为基因）在我们的DNA中编码。基因配方的错误可能会导致蛋白质畸形，从而可能导致生物体疾病或死亡。因此，许多疾病从根本上与蛋白质有关。但是，仅仅知道蛋白质的基因配方并不意味着能够自动知道其形状。蛋白质由氨基酸链组成（也称为氨基酸残基）。但是，DNA只包含有关氨基酸序列的信息，而没有它们如何折叠形成对应蛋白质形状的信息。蛋白质越大，建模越困难，因为要考虑氨基酸之间存在更多的相互作用。正如Levinthal的悖论^注所证明的那样，在达到真正的3D结构之前，随机枚举典型蛋白质的所有可能构型所花费的时间要比已知宇宙的时间长，而蛋白质本身却在几毫秒内自发折叠。预测这些链将如何折叠成复杂的蛋白质3D结构就是所谓的“蛋白质折叠问题”，这是数十年来科学家一直在努力的挑战。这个尚未解决的问题，已经激发了无数的科学发展，从激励IBM在超级计算方面的努力（BlueGene）到新颖的公民科学工作（Folding @ Home和FoldIt）到新的工程领域，例如合理的蛋白质设计。

^译者注：利文索尔佯谬是一个思想实验，也是蛋白质折叠理论中的一个自指。在1969年，美国分子生物学家Cyrus Levinthal指出，由于在未折叠的多肽链中的非常大量的自由度，该分子具有天文数量的可能构象。如果蛋白质通过连续采样所有可能的构象而获得其正确折叠的构型，则需要比宇宙的年龄更长的时间以达到其正确的天然构象。即使以纳秒或皮秒级速率采样构象，这也是真的。“悖论”是大多数小蛋白质在毫秒或甚至微秒时间尺度上同时折叠。这种悖论的解决方案已经通过蛋白质结构预测的计算方法建立。此佯谬表明蛋白质折叠遵循特异性途径，或者其过程中只尝试有限数目的构象。

Why is protein folding important?

I think that we shall be able to get a more thorough understanding of the nature of disease in general by investigating the molecules that make up the human body, including the abnormal molecules, and that this understanding will permit...the problem of disease to be attacked in a more straightforward manner such that new methods of therapy will be developed.

--Linus Pauling, 1960

长期以来，科学家一直对确定蛋白质的结构感兴趣，因为人们认为蛋白质的形式决定了其功能。一旦了解了蛋白质的形状，就可以猜测其在细胞中的作用，科学家可以开发出与蛋白质的独特形状有关的药物。

在过去的五十年中，研究人员已经能够使用诸如冷冻电子显微镜，核磁共振和X射线晶体学这样的实验技术在实验室中确定蛋白质的形状，但是每种方法都取决于大量的试验和错误，这可能需要花费多年的时间，并且每个蛋白质结构的成本高达数万或数十万美元。这就是为什么生物学家想利用AI方法来替代这一艰难而艰苦的蛋白质过程的原因。不通过昂贵的实验来确定蛋白质，仅凭其遗传密码即可预测蛋白质形状的能力，可以帮助加速研究。

图1：一串氨基酸的复杂3D形状

How can AI make a difference?

幸运的是，由于基因测序成本的快速降低，基因组学领域的数据非常丰富。因此，在最近几年中，依赖于基因组数据的用于预测问题的深度学习方法变得越来越流行。为了促进研究和衡量最新方法以提高预测的准确性，1994年成立了两年一度的全球竞赛，名为CASP (Critical Assessment of protein Structure Prediction)⁴，它已成为评估预测技术的金标准。我们要感谢CASP组织者几十年来的工作，以及成千上万的实验人员，他们的结构能够进行这种评估。

DeepMind在此问题上的工作产生了AlphaFold，我们将其提交给CASP13。我们很荣幸能成为CASP组织者所说的“预测蛋白质结构的计算方法能力的前所未有的进步”的一员，在进入的团队中排名第一⁵（我们的条目是A7D）。

我们的团队专注于从头开始对目标形状建模的问题，而无需使用先前解决的蛋白质作为模板。当预测蛋白质结构的物理特性时，我们获得了很高的准确性，然后使用两种不同的方法来构建完整蛋白质结构的预测。

Using neural networks to predict physical properties

这两种方法均依赖于经过训练的深层神经网络，可以根据其遗传序列预测蛋白质的特性。我们的网络预测的特性是：（a）氨基酸对之间的距离和（b）连接这些氨基酸的化学键之间的角度。第一个发展是在估计氨基酸对是否彼此接近的常用技术方面的进步。

我们训练了一个神经网络来预测蛋白质中每对残基之间的距离分布（如图2所示）。然后将这些概率合并成一个分数，该分数可估计候选蛋白质结构的准确性。我们还训练了一个单独的神经网络，该网络使用所有距离合计来估计候选结构与正确答案的接近程度。

图2：两种可视化Alphafold预测的准确性的方法。上图具有三种蛋白质的距离矩阵。每个像素的亮度代表着蛋白质序列中氨基酸之间的距离。在顶部行中显示的是实际确定的距离，而在底部行中显示的是Alphafold的预期距离分布的平均值。重要的是，在全局和局部范围上都非常匹配。底部子图使用3D模型表示相同的比较，其中具有 AlphaFold 预测（蓝色）与相同三种蛋白质的真实数据（绿色）。

使用这些评分功能，我们能够搜索蛋白质结构以找到与我们的预测相符的结构。我们的第一种方法以结构生物学中常用的技术为基础，并用新的蛋白质片段反复替换蛋白质结构的片段。我们训练了一个生成神经网络来产生新的片段，这些片段被用来不断提高提出的蛋白质结构的分数。

图3：从蛋白质序列预测结构的Alphafold系统的架构示意图

第二种方法通过梯度下降来优化得分，梯度下降是机器学习中常用的一种技术，用于进行较小的增量改进，从而得到了高度准确的结构。这项技术应用于整个蛋白质链，而不是应用于组装成较大结构之前必须分开折叠的片段，以简化预测过程。

该代码可在Github¹上找到，以供有兴趣了解更多信息或复现我们蛋白质折叠结果的人士使用。

What happens next?

尽管我们对蛋白质折叠模型的成功感到欣慰，但在蛋白质生物学领域仍有许多工作要做，我们很高兴继续在这一领域做出努力。我们致力于建立AI可以为基础科学发现做出贡献的方式，希望能对现实世界产生影响。这种方法可能最终有助于增进我们对身体及其运作方式的了解，从而使科学家能够更有效地针对和设计新的有效治疗方法。科学家仅绘制了人类细胞产生的所有蛋白质中大约一半的结构图。一些罕见疾病涉及单个基因的突变，导致蛋白质畸形，可能对整个有机体的健康产生深远影响。像AlphaFold这样的工具可能会帮助罕见病研究人员快速，经济地预测目标蛋白质的形状。随着科学家获得更多有关蛋白质形状以及它们如何通过模拟和模型进行操作的知识，这种方法最终可以帮助我们为有效的药物发现做出贡献，同时降低与实验相关的成本。我们希望AI可以用于疾病研究，并最终改善世界各地数百万患者的生活质量。

但是潜在的好处并不仅限于健康，理解蛋白质折叠将有助于蛋白质设计，还可以释放出巨大的益处。例如，可以通过蛋白质设计实现的可生物降解酶的进步，帮助我们处理塑料和石油等污染物，以对环境更友好的方式分解废物。实际上，研究人员已经开始对细菌进行工程改造，通过分泌蛋白质使废物可生物降解，并且更易于处理。

我们首次尝试蛋白质折叠的成功标志着机器学习系统如何整合各种信息源，帮助科学家迅速提出解决复杂问题的创新解决方案。正如我们已经看到AI如何通过AlphaGo和AlphaZero这样的系统来帮助人们掌握复杂的游戏一样，我们同样希望有一天，AI的突破能够成为一个有助于进一步加深我们对基本科学问题理解的平台。

看到这些蛋白质折叠进展的早期迹象令人兴奋，证明了AI在科学发现中的实用性。即使在我们能够对治疗疾病，管理废物等产生可量化影响之前还有很多工作要做，但是我们知道这项工作的潜力是巨大的。我们拥有一支致力于研究机器学习如何推动科学世界发展的专业团队，我们期待着看到我们的技术得以应用的无限可能。

外链地址：

[1] https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13

[2] https://www.biorxiv.org/content/10.1101/846279v1.full.pdf

[3] https://github.com/dellacortelab/prospr

[4] https://predictioncenter.org/

[5] https://predictioncenter.org/casp13/zscores_final.cgi?formula=assessors

‍

直播预告

“独家解读”历史文章

谷歌会议app背景模糊和替换技术解析
孙裕道：基于优化的对抗攻击：CW攻击的原理详解与代码解读
李永露：PaStaNet：Toward Human Activity Knowledge Engine
孙裕道：ExprGAN：基于强度可控的表情编辑
杨传广：高效设计图像分类模型：混合连通性的门限卷积神经网络【附PPT与视频资料】
朱时超：图平滑样条神经网络【附PPT与视频资料】
孙裕道：矩阵视角下的BP算法
孙裕道：Capsule Network深度解读
孙裕道：Fisher信息度量下的对抗攻击
曾仙芳：通过自监督解耦身份和姿态特征实现人脸再扮演任务【附PPT与视频资料】
“九歌”来了，清华九歌诗词生成系统工具、数据集和论文大合辑
张杰：针对图像处理网络的模型水印【附PPT与视频资料】
牛广林：规则引导的知识图谱组合式表示学习【附PPT与视频资料】
王井东：物体上下文引导的表征学习在语义分割中的应用
薛广涛：智慧城市中的异构服务协同共性关键技术研究

请点击文章底部“阅读原文”查看

分享、点赞、在看，给个三连击呗！

不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
人民日报报道，华为云赋能智能制造助力图扑软件构造数字孪生场景智慧园区华为人工智能物联网
2021年12月22日，《人民日报》头版头条刊登了《华为云赋能智能制造，助力图扑软件构造数字孪生场景》一文，聚焦数据可视化建设发展。报道指出，数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神;高效便捷管控的背后，是云端平台各大企业的互助共赢;高质精准2D、3D数据可视图的背后，是专注于数据可视化Web组态开发的厦门图扑软件科技有限公司。并对厦门图扑软件科技有限公司进
华为云赋能智能制造，助力图扑软件构造数字孪生场景 36Kr网科技华为云制造 big data
出行手机查看交通方案、物业管理的智能可视勘察管控、疫情地图提前预知危害……这些曾经存在于科幻片中的高科技场景一一在现代生活得到了应用与普及，其背后的数据可视化应用，正贯穿于当今大数据时代的各行各业，成为人们洞察数据内涵的有力工具，推动数字经济发展驶入“快车道”。数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神；高效便捷管控的背后，是云端平台各大企业的互助共赢；高质精
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

【独家解读】Nature论文AlphaFold：AI推动科学发现

谷歌会议app背景模糊和替换技术解析

孙裕道：基于优化的对抗攻击：CW攻击的原理详解与代码解读

李永露：PaStaNet：Toward Human Activity Knowledge Engine

孙裕道：ExprGAN：基于强度可控的表情编辑

杨传广：高效设计图像分类模型：混合连通性的门限卷积神经网络【附PPT与视频资料】

朱时超：图平滑样条神经网络【附PPT与视频资料】

孙裕道：矩阵视角下的BP算法

孙裕道：Capsule Network深度解读

孙裕道：Fisher信息度量下的对抗攻击

曾仙芳：通过自监督解耦身份和姿态特征实现人脸再扮演任务【附PPT与视频资料】

“九歌”来了，清华九歌诗词生成系统工具、数据集和论文大合辑

张杰：针对图像处理网络的模型水印【附PPT与视频资料】

牛广林：规则引导的知识图谱组合式表示学习【附PPT与视频资料】

王井东：物体上下文引导的表征学习在语义分割中的应用

薛广涛：智慧城市中的异构服务协同共性关键技术研究

更多独家解读专栏文章

请点击文章底部“阅读原文”查看

你可能感兴趣的:(神经网络,大数据,机器学习,人工智能,深度学习)

【独家解读】Nature论文AlphaFold：AI推动科学发现

谷歌会议app背景模糊和替换技术解析

孙裕道：基于优化的对抗攻击：CW攻击的原理详解与代码解读

李永露：PaStaNet：Toward Human Activity Knowledge Engine

孙裕道：ExprGAN：基于强度可控的表情编辑

杨传广：高效设计图像分类模型：混合连通性的门限卷积神经网络【附PPT与视频资料】

朱时超：图平滑样条神经网络【附PPT与视频资料】

孙裕道：矩阵视角下的BP算法

孙裕道：Capsule Network深度解读

孙裕道：Fisher信息度量下的对抗攻击

曾仙芳：通过自监督解耦身份和姿态特征实现人脸再扮演任务【附PPT与视频资料】

“九歌”来了， 清华九歌诗词生成系统工具、数据集和论文大合辑

张杰：针对图像处理网络的模型水印【附PPT与视频资料】

牛广林：规则引导的知识图谱组合式表示学习【附PPT与视频资料】

王井东：物体上下文引导的表征学习在语义分割中的应用

薛广涛：智慧城市中的异构服务协同共性关键技术研究

更多独家解读专栏文章

请点击文章底部“阅读原文”查看

你可能感兴趣的:(神经网络,大数据,机器学习,人工智能,深度学习)

“九歌”来了，清华九歌诗词生成系统工具、数据集和论文大合辑