亚马逊云开发者

一键构建云上高可用蛋白质结构预测平台

简介

Deepmind团队于2021年7月公开了Alphafold2算法源代码和相关论文，这一方案被认为可解决困扰生物学长达半个世纪的蛋白质折叠结构预测难题，其准确度高达92.4(百分制)。Alphafold2基于新颖的机器学习方法，以原子精度预测蛋白质结构，在大部分情况下表现出与实验相媲美的准确性，且大大优于其他方法。但截至目前，其官方的单机部署方式需要人工下载数据集并解压、处理输入输出数据以及执行任务脚本，无法实现弹性按需使用，不适用于大规模的蛋白质结构预测。

在本文的案例中，我们首先设计了基于API+HPC的任务调度逻辑，由Amazon Lambda作为无服务器后端，处理用户提交的任务请求并通过Amazon SQS消息队列服务对其进行解耦；然后将任务请求提交到Amazon Batch调用GPU计算实例，并分析Alphafold2算法的源代码结构进行分析，并将其优化为Amazon Batch可使用的容器镜像格式，存储于Amazon ECR托管容器存储库中；Alphafold2算法所使用的蛋白质数据库文件均位于Amazon Fsx for Lustre高性能分布式文件系统中；用户提交的任务过程信息使用Amazon Dynamodb作为NoSQL数据库存储，所有输入的氨基酸序列文件和输出的蛋白质结构预测文件均使用Amazon S3对象存储；算法科学家可使用基于NICE DCV的高性能远程桌面，通过goofys协议挂载Amazon S3目录，直接在云上可视化分析Alphafold2生成的蛋白质结构预测文件。最后，针对以上部署过程，通过Amazon CDK打包实现基础设施即代码化，方便客户一键部署。

注：本文所用代码目前托管于：

https://github.com/wttat/alphafold

https://github.com/wttat/af2-batch-cdk

整体架构

亚马逊云科技服务需求

Amazon API Gateway，可以帮助开发人员轻松创建、发布、维护、监控和保护任意规模的 API。

Amazon Lambda，几乎可以为任何类型的应用程序或后端服务运行代码，而且完全无需管理。

Amazon S3，对象存储服务，提供行业领先的可扩展性、数据可用性、安全性和性能。

Amazon SQS，消息队列服务，可以帮助分离和扩展微服务、分布式系统和无服务器应用程序。

Amazon DynamoDB，快速、灵活的 NoSQL 数据库服务，可在任何规模下实现个位数毫秒级的性能。

Amazon Batch，任意规模完全受管的批处理调度系统，让开发人员、科学家和工程师能够轻松高效地运行成千上万个批处理计算作业。

Amazon ECR，完全托管的容器注册表，在任何地方轻松存储、管理、共享和部署容器映像和构件。

Amazon SNS，完全托管的发布/订阅消息收发、SMS、电子邮件和移动推送通知。

Amazon EventBridge，大规模构建事件驱动型应用程序，涵盖亚马逊云科技、现有系统或 SaaS 应用程序

架构说明

API 的设计

为向算法科学家屏蔽底层GPU算力调度过程，提供一个统一易用的Alphafold2任务调度入口，我们使用API Gateway创建RESTful API，对外暴露单一URL接口，实现对Alphafold2服务的应用级封装。API Gateway为云原生托管API管理工具，对用户提交的任务查询或调度请求鉴权，通过后将其按照配置的路由发送到不同的Amazon Lambda后端。Amazon Lambda函数对请求进行解析，将任务信息写入数据库，并将任务参数投递到HPC集群。共有四个Amazon Lambda函数与API Gateway直接或间接相关联，包括身份鉴权函数、查询请求处理函数、调度请求处理函数以及HPC集群调度函数，此处我们将调度请求处理函数与HPC集群调度函数通过SQS消息队列服务进行解耦，从而提高了API架构的可用性。

API参数的所有接口如下，算法科学家可直接通过API的形式对Alphafold2任务进行操作。

GET / ：查询所有任务信息。
GET /{id} ：查询单条任务详细信息，包含最近的Cloudwatch log日志。
POST / ：投递任务，任务信息包含在HTTP的body中。
DELETE /：删除所有已完成或失败的任务信息及其对应的Amazon S3资源（如有）。
DELETE /{id}：删除单条所有已完成或失败的任务信息及其对应的S3资源（如有）。
CANCEL /：取消所有正在运行的任务。
CANCEL /{id}：取消单条正在运行的任务。

注：ANY方法对应CANCEL方法。

云上 HPC 批处理平台

本次方案的云上HPC批处理平台共由四部分组成：

Amazon S3作为云原生的对象存储服务，拥有11个9的高持久性以及完善的安全和合规机制，因此我们使用Amazon S3持久化存储Alphafold2任务的输入输出文件，保障所有数据文件在云上的安全。在Amazon S3桶中，共有input和output两个文件夹，分别用于存放要预测的氨基酸序列文件和2.Alphafold2预测产生的蛋白质结构文件。用户可通过多种方式方便的检索、下载上述文件，同时可以选择Amazon S3中的多种存储类，降低云上存储成本。
为实现对Alphafold2优化镜像的统一托管，我们使用Amazon ECR作为容器镜像存储仓库，免去了用户自建容器镜像仓库的繁琐流程。我们对Alphafold2代码做了一定的优化，使其能够接受Amazon Batch作业的参数和环境变量输入，并且使其能够使用Amazon S3作为文件存储，并重新打包为Docker镜像，Amazon ECR支持与Amazon Batch无缝集成，将打包后Docker镜像上传至Amazon ECR后，即可以直接在Batch的作业定义中指定存储在Amazon ECR中的Alphafold2容器镜像地址进行拉取。
Alphafold2每次预测蛋白质结构均需要通过Multiple Sequence Alignment (多重序列比对, MSA)，对已知蛋白质结构数据库进行扫描，目前数据集总容量约为2.2T。为了实现数据集的高性能共享访问，我们将其存储在FSx for Lustre上，使其能够被所有任务所同时访问并高速读取。Fsx for Lustre可提供百兆级别吞吐、百万级别IOPS以及稳定的亚豪秒延迟，从而满足Alphafold2在内的HPC计算工作负载。
为实现计算资源的弹性扩展、降低整体计算和运维成本，我们使用Amazon Batch搭建蛋白质结构预测HPC批处理集群，由Batch内置的调度器根据用户提交的蛋白质结构预测任务和资源需求自动化预置所需要的GPU计算资源。我们目前针对亚马逊云科技可提供的GPU实例类型，选择了p3.2xlarge、p3.8xlarge、p3.16xlarge以及p4d.24xlarge四种机型作为计算环境，用户可根据单条预测任务使用的GPU数量、任务并行度和成本综合考虑选择投递任务的作业队列，而无需关心其底层实例的部署以及环境的搭建。所有计算环境均可配置为在任务结束后即自动关闭所有计算实例节约成本。

任务信息数据存储

Amazon DynamoDB作为云原生的无服务器NoSQL数据库，无需预置服务器，按使用量付费，同时拥有一致性的毫秒级访问性能以及近乎无限的吞吐量和存储空间。本次方案使用DynamoDB存储Alphafold2过程中产生的任务信息，满足用户并发提交或查询任务时的性能需求，同时优化成本，简化数据库配置流程。在处理任务提交的Amazon Lambda函数中，使用了UUID算法随机生成每条任务的id，作为DynamoDB分区键，提高任务查询效率。

消息与结果通知

单机部署Alphafold2时，其运行过程的所有日志均位于Docker中，如果运行环节中出现任何问题，均需要手动登陆实例后，通过docker log等命令进行查看；同时任务完成后缺乏相关通知推送，无法及时获取其运行状态，造成计算资源的浪费。

我们使用Amazon S3的事件通知机制以及Amazon EventBridge服务，自动获取Amazon S3中压缩文件的上传文件事件以及Amazon Batch任务失败事件——分别对应Alphafold2任务的成功和报错，自动触发不同的Amazon Lambda函数处理相关事件，更新任务信息数据库，最后通过Amazon SNS——即亚马逊云科技云上托管的消息收发服务，通过邮箱或者短信等方式向算法科学家推送相关信息，实现Alphafold2作业信息的即时通知。消息通知中包含任务信息、所需时间、下载链接以及Amazon CLI命令。算法科学家无需登陆亚马逊云科技控制台，即可直接获取Alphafold2任务结果的下载方式。

便捷可视化终端

为满足算法科学家远程分析蛋白质结构的需求，我们使用NICE DCV远程桌面作为蛋白质结构便捷可视化终端，启动后可以直接通过浏览器或NICE DCV客户端，使用图形化界面远程访问。NICE DCV基于优化的NICE DCV协议，根据网络情况自适应调整传输带宽，同时可利用预装了NVIDIA T4显卡的Amazon G4实例，提高图形密集性软件的渲染性能，从而使算法科学家远程通过如Pymol或VMD等蛋白质三维结构可视化软件进行分析。

部署方法

初始化 Amazon CDK 环境

cdk bootstrap aws://{ACCOUNTID}/{REGION}

通过 Amazon CDK生成

Amazon CloudFormation 模板

cdk synth

一键部署所有资源

cdk deploy –all

需要手动确认，输入y回车即可，中间会输出一些过程信息，并且在邮箱中点击确认SNS订阅。

部署完成

约需要四个小时将所有数据下载并解压到FSx for Lustre，解压完成后，会收到电子邮件通知，此时即可根据使用说明，开始投递Alphafold2任务

算法科学家使用过程

完成上述方案构建后，算法科学家即可开始使用Alphafold2算法预测蛋白质结构。

总共可分别四个步骤：

1.上传氨基酸序列文件

通过Amazon CLI或者控制台将氨基酸序列文件上传到Amazon S3存储桶的input文件夹。

2.提交任务或查询任务进度

通过终端或者HTTP调试软件操作任务。本文以Postman调试软件为例，演示如何基于API提交、查询任务。取消和删除任务操作类似，可参考API Gateway中的路由设置进行提交。

首先编辑任务请求JSON文件，例：

可以参考:

https://github.com/wttat/af2-batch-cdk/blob/main/command.json

其中，

fasta 为本次预测的蛋白质名称，由用户自定义，必选；

file_name为氨基酸序列名称，必须与S3存储桶中的文件名称对应，必选；model_names为所使用的Alphafold2模型，共有model1-model5五个可选，缺省值为五个模型全部使用；

preset为使用的预设配置，full对应完整数据集，reduced对应压缩数据集，CASP14对应deepmind团队参赛时所使用的配置，缺省值为full；

max_template_date为扫描已知数据库中蛋白质结构文件的截止日期，缺省值为2020-05-14；

que为batch使用的作业队列，low对应batch的计算环境为p3.2xlarge实例，mid对应计算环境为p3.8xlarge实例，high对应计算环境为p3.16xlarge实例，p4对应计算环境为p4d.24xlarge实例，必选；

comment为用户自定义的注释语句，可选，缺省值为空；

gpu为使用GPU数量，并且成比例对应vCPU和内存，可选，缺省值为1。例：p3.8xlarge实例中共有4块NVIDIA Tesla V100显卡，32vCPU和244G内存，默认情况下，即gpu为1时，每个任务分配8vCPU、61G内存和一块V100显卡，可同时运行四个任务，如果gpu设置为2时，该任务分配到16vCPU、122G内存和两块V100显卡，此时p3.8xlarge实例剩下两块显卡，可分配给两个gpu为1的任务或者一个gpu为2的任务。

首先配置Headers，键为Authorization，值为用户自己定义的密钥。

（1）提交任务

将HTTP方法设置为post，URL填入API Gateway的URL，Body选择raw，格式为JSON，粘贴任务请求JSON文件，点击Send即可提交任务，后台即会根据选择的作业队列自动拉起对应的计算资源运行预测任务。API Gateway会返回每个预测任务对应的ID。

（2）查询任务

将方法修改为GET，即可查询所有任务信息。

若想查询单条任务详细信息，则在URL后面加上对应任务的ID，可通过查询所有任务信息得到，也可以在提交任务后直接复制返回的ID。

其中job info为任务相关参数，job status为任务当前状态，若有日志产生，则会自动抓取最新的Amazon CloudWatch日志并返回。

3.Email自动化发送任务结果

任务完成后，会收到邮件通知提醒，告知其对应预测任务已完成。邮件正文中，包括完成预测所需时间，即可根据使用的机器类型计算成本，以及所有文件的下载链接HTML文件，同时提供了Amazon cli命令行，用户可自行选择下载方式。

打开下载链接HTML后，即可根据需求自行选择下载整体压缩包或者pdb文件进行分析。

4.可视化分析

以pymol为例，连接到NICE DCV上后，安装并运行pymol：

wget https://pymol.org/installers/PyMOL-2.5.2_293-Linux-x86_64-py37.tar.bz2
tar -jxf PyMOL-2.5.2_293-Linux-x86_64-py37.tar.bz2
./pymol/pymol

*左滑查看更多

打开桌面上Amazon S3文件夹，找到需要分析的蛋白质文件夹，将pdb文件拖拽到pymol中打开即可直接在云上分析蛋白质结构。

也可以自行安装VMD进行分析。

成本估算

（仅供参考）

我们基于P3实例和P4实例，测试了不同序列长度的氨基酸序列，经过Alphafold2算法预测其蛋白质结构所需时间，并且根据对应区域GPU实例单价，按比例换算为每条任务所需成本。可以看到：随着序列长度的增加，所需时间快速增加，主要是由于GPU推理时间占比显著增加；在序列长度超过1000时，一块V100会提示显存不足的问题，需要两块V100显卡才能跑完完整任务；在序列长度越长的情况下，P4实例挂载的A100显卡带来的性能提升越明显。

中国宁夏区域(cn-northwest-1)：

美国弗吉尼亚北部区域(us-east-1)：

注：FSx for Lustre费用未考虑在内，需要按月收取。

优化方向

目前Alphafold2官方源代码还在不断优化迭代之中，还存在许多可以性能提升的方向。如：

前期扫描数据集的MSA过程只消耗CPU资源，并不占用GPU，因此可以据此将CPU和GPU运算过程接耦，拆分为两个子任务，降低成本；
通常情况下，我们只需要评分最好的模型，而Alphafold2算法目前的机制默认为完整推理五个模型，可以将其修改为只预测评分最高的模型。
MSA中多个模块可以CPU并行运行，提升扫描速度。

用户可以根据自己的需要，对其进行二次开发，自行修改并构建Alaphfold2镜像，只需将Amazon Batch作业定义中的容器镜像地址替换为用户指定的镜像地址即可。

总结

我们首先基于Amazon Batch的作业需求，容器化改造了Alphafold2镜像，使其能够接受来自Amazon Batch标准化的输入参数，并且将输出文件直接上传到Amazon S3上。接下来，使用根据负载可弹性扩展的GPU计算集群和高性能共享存储，可满足大规模高并发的预测需求。并且，基于Amazon Batch提供完善的集群资源调度机制，降低计算资源成本以及IT部门运维复杂度，实现秒级的成本监控。算法科学家基于Amazon API GW提交/查询/删除任务，无需接触亚马逊云科技资源，同于由于所有操作均基于API实现，因此可方便集成至现有工作流中。其次，基于Amazon SNS提供作业状态提醒机制，针对任务的成功和失败均有邮件提醒，并在任务成功的通知邮件集成了蛋白质结构文件的下载地址。基于Amazon CDK实现方案的灵活快速部署，用户可在半小时内将完整架构部署于自己的亚马逊云科技资源中，四个小时内预测服务即可上线使用。

参考

Amazon API Gateway官方文档：

https://docs.aws.amazon.com/zh_cn/apigateway/?id=docs_gateway

Amazon Lambda官方文档：

https://docs.aws.amazon.com/zh_cn/lambda/?id=docs_gateway

Amazon S3官方文档：

https://docs.aws.amazon.com/zh_cn/s3/?id=docs_gateway

Amazon SQS官方文档：

https://docs.aws.amazon.com/zh_cn/sqs/?id=docs_gateway

Amazon DynamoDB官方文档：

https://docs.aws.amazon.com/zh_cn/dynamodb/?id=docs_gateway

Amazon Batch官方文档：

https://docs.aws.amazon.com/zh_cn/batch/?id=docs_gateway

Amazon ECR官方文档：

https://docs.aws.amazon.com/zh_cn/ecr/?id=docs_gateway

Amazon SNS官方文档：

https://docs.aws.amazon.com/zh_cn/sns/?id=docs_gateway

AlphaFold官方代码：

https://github.com/deepmind/alphafold

本篇作者

吴桐

亚马逊云科技解决方案架构师

负责基于亚马逊云科技云计算方案的架构咨询和设计实现，目前在亚马逊云科技 Public Sector服务生命科学和医疗健康相关行业客户，具有丰富的解决客户实际问题的经验。

张强

亚马逊云科技解决方案架构师

在加入亚马逊云科技之前，拥有多年生物信息开发经验，熟悉传统工作流与HPC环境迁移至云原生技术的技术实现，目前服务于生命科学和医疗健康相关行业客户，如医学影像、基因组学、药物研发等，致力于提供有关HPC、无服务器、数据安全等各类云计算解决方案的咨询与架构设计。

听说，点完下面4个按钮

就不会碰到bug了！

工具篇：（八）MacOS 上使用 Docker 容器化 Node.js 应用的完整指南全栈探索者chen 工具 macos docker macos docker node.js 程序人生容器
MacOS上使用Docker容器化Node.js应用的完整指南在现代应用开发中，Docker已成为一种流行的工具，它使得开发、测试和部署应用程序变得更加高效和灵活。本文将详细介绍如何在MacOS上安装Docker，并演示如何将Node.js应用容器化、构建Docker镜像以及管理容器。一、安装Docker下载DockerDesktop前往Docker官方网站下载适用于MacOS的DockerDes
【MySQL】性能优化实战指南：释放数据库潜能的艺术
文章目录MySQL性能优化实战指南：释放数据库潜能的艺术引言为什么需要MySQL性能优化？性能优化基础知识MySQL性能瓶颈分析1.硬件资源瓶颈2.MySQL内部瓶颈优化配置策略大全内存配置优化InnoDB缓冲池配置查询缓存配置连接和线程配置磁盘I/O优化InnoDB存储引擎配置临时表配置独特优化创意配置创意1：分层存储优化创意2：动态配置自适应创意3：负载感知配置高级优化技巧并行处理优化索引和查
空指针异常是Java中很常见的异常，如何避免？破碎的天堂鸟 Java学习 java 数据库 jvm
在Java编程中，空指针异常（NullPointerException）是一种常见的运行时异常，通常发生在尝试访问一个空对象的属性或调用其方法时。为了避免这种异常，可以采取以下几种方法：在使用对象之前，先判断该对象是否为null。例如：if(obj!=null){//对obj进行操作}这种方法是最直接且最常用的方法。Java8引入了Optional类，它提供了一种更优雅的方式来处理可能为空的对象。
Java:实现朴素模式匹配算法（附带源码） Katie。 Java算法完整教程算法 java python
1.项目背景详细介绍在文本处理、信息检索和生物序列分析等领域，“字符串模式匹配”是最基础也是最核心的操作之一。朴素模式匹配（NaiveStringMatching）算法，作为最直观的实现方式，通过逐个字符对比，查找模式串在目标文本中出现的位置。虽然现代应用中普遍采用更高效的KMP、Boyer–Moore、Sunday算法等，但理解并掌握朴素算法有助于：打牢基础：从最简单的实现入手，帮助初学者理解匹
毕业设计基于python + flask +mysql + Layui新闻系统项目源码 love0everything flask python 课程设计
毕业设计基于python+flask+mysql+Layui新闻系统项目源码介绍该项目采用Flask框架开发，数据库采用mysql。这是一个作业项目。该项目采用Flask框架开发的一个新闻、论坛、博客系统。。前端采用的是layui框架，后端模板是X-admin下载地址：毕业设计基于python+flask+mysql+Layui新闻系统项目源码模块版本PyMysql1.0.2Flask1.1.2M
在Java中String类为什么不可以修改？
目录一、语言设计与实现层面的原因二、设计目标与优势三、如何绕过限制？（异常情况）四、替代方案：可变字符串总结在Java中，String类的不可变性（Immutable）是其核心设计之一，这种设计源于多方面的技术考量和实际需求。以下从多个角度解析String为什么不可以修改：一、语言设计与实现层面的原因final修饰类：String类被声明为final，意味着它不能被继承。这避免了子类通过重写方法或
java并发编程LockSupport之park/unpark jmysql java java
【尚学堂】Java300集零基础适合初学者视频教程_Java300集零基础教程_Java初学入门视频基础巩固教程_Java语言入门到精通_哔哩哔哩_bilibili一、简介1.1主要方法Park/UnPark方法是LockSupport当中的方法。其常用方法有如下：park()：暂停当前线程。park(Objectblocker)：暂停当前线程，并指定负责此线程停放的同步对像。parkNanos(
PHP MySQL 读取数据 froginwe11 开发语言
PHPMySQL读取数据引言在Web开发中，PHP和MySQL是两个常用的技术栈。PHP作为服务器端脚本语言，而MySQL作为关系型数据库管理系统，两者结合能够构建强大的动态网站。本文将详细介绍如何使用PHP从MySQL数据库中读取数据，包括连接数据库、执行查询、处理结果等关键步骤。连接MySQL数据库在PHP中，首先需要连接到MySQL数据库。以下是一个示例代码，展示了如何使用mysqli扩展连
Java反射获取Class的三种方式喵星人ZC
packagecom.sou.reflection.classpkg;importorg.junit.Test;importjava.lang.reflect.Method;/***反射获取Class的三种方式*1）Class.forName()*2)obj.getClass*3)class.class*/publicclassReflectionApp{//Class.forName()@Tes
时序数据库选型全指南：为什么越来越多企业选择IoTDB？ Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
>在工业物联网爆发式增长的今天，一台风力发电机每秒产生200+数据点，一座智慧工厂每天新增10亿级数据记录——传统数据库已无法承受时序数据的洪流。###时序数据：数字时代的脉搏时序数据（Time-SeriesData）是以时间戳为索引的连续数据流，广泛存在于物联网设备监控、金融交易记录、应用性能监测等场景。这类数据具有三大特性：-**海量性**：单个设备每秒可产生多条数据-**时效性**：新数据价
大数据时代下的时序数据库选型指南：基于工业场景的IoTDB技术优势与适用性研究 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在宝钢集团的智能工厂里，5万多个传感器每秒产生150万+数据点，传统数据库系统每天积压3TB未处理数据——这揭示了工业4.0时代的核心矛盾：**海量时序数据处理能力已成为智能制造的关键瓶颈**。###工业时序数据的四大特殊性工业场景下的时序数据与传统互联网数据存在本质差异：1.**高精度时间要求**-数控机床振动监测需微秒级时间戳-电网故障定位要求时间同步精度≤1μs2.**多源异构性**```
Mysql基本语法到表设计吴鹰飞侠 mysql 数据库
由于笔者之前了解过sql所以此篇仅作复习使用。1.MySQL基本语法1.1创建数据库createdatabaselogin_demo;1.2使用数据库uselogin_demo;1.3创建表CREATETABLEusers(idintprimarykeyauto_increment,usernamevarchar(50)notnull,passwordvarchar(255)notnull,ema
linux安装Node.js 环境，Docker 环境，Ruby 环境，MongoDB 环境，PostgreSQL 数据库，Go 开发环境，Python 虚拟环境 2401_87017622 数据库 linux node.js
在Linux上安装其他常见的开发环境可以根据具体需求而定，以下是一些常见的安装步骤：1.Node.js环境Node.js是一个基于ChromeV8引擎的JavaScript运行环境，适用于服务器端开发。安装Node.js：通过包管理器安装：sudoyuminstall-ygcc-c++makecurl-sLhttps://rpm.nodesource.com/setup_14.x|sudo-Eba
详解NIO Channel类沧澜sincerely Java 高并发 nio
目录什么是NIOChannel？为什么要学习NIOChannel？FileChannelSocketChannelDatagramChannel本篇文章内容的前置知识为NIOBuffer类，如果不了解，可点击链接学习详解NIOBuffer类及其属性和方法-CSDN博客什么是NIOChannel？在JavaNIO中，Channel（通道）是一种广义的I/O抽象，用于表示与数据源或数据目的地之间的连接
如何使用 Docker 部署一个简单的 Node.js 应用 iOS开发届的一个人 node.js
如何使用Docker部署一个简单的Node.js应用在现代的软件开发中，容器化技术已经成为了提高开发效率和简化部署流程的重要工具。Docker是最流行的容器化工具之一，它可以帮助开发者打包应用程序以及其所有的依赖，使其在任何环境下都能一致地运行。本篇博客将向大家展示如何使用Docker来部署一个简单的Node.js应用。1.环境准备在开始之前，我们需要确保系统已经安装了以下工具：Docker：如果
常用的折叠展开过渡动画效果css
如何实现优雅的折叠展开动画效果在现代Web设计中，折叠展开动画是一种常见且实用的交互方式，它可以帮助用户在保持界面简洁的同时，灵活控制内容的显示与隐藏。本文将分享如何使用HTML、CSS和JavaScript实现一个平滑流畅的折叠展开动画效果。基本原理折叠展开动画的核心原理是通过CSS过渡(transition)来控制元素的高度、内边距和其他样式属性的变化。当用户点击触发按钮时，JavaScrip
Redux架构解析：状态管理的核心原理止观止架构前端 react.js redux
Redux作为JavaScript应用的状态管理库，其技术架构与核心原理围绕可预测的状态管理设计，通过严格的单向数据流和函数式编程理念实现复杂应用的状态控制。以下从设计理念、核心架构、工作流程、源码实现等角度进行系统性剖析：一、设计理念与原则单一数据源（SingleSourceofTruth）整个应用的状态存储在一个全局Store对象中，形成唯一的状态树（StateTree）。优势：简化状态共享和
Flink双流实时对账
在电商、金融、银行、支付等涉及到金钱相关的领域，为了安全起见，一般都有对账的需求。比如，对于订单支付事件，用户通过某宝付款，虽然用户支付成功，但是用户支付完成后并不算成功，我们得确认平台账户上是否到账了。针对上述的场景，我们可以采用批处理，或离线计算等技术手段，通过定时任务，每天结束后，扫描数据库中的数据，核对当天的支付数据和交易数据，进行对账。想要达到实时对账的效果，比如有的用户支付成功但是并没
一天学会超级玛丽小游戏_手把手教学_Java小游戏 62f5ecb72f71
超级玛丽是任天堂制作的一款小游戏,在的童年里一起玩这个游戏,大胡子,背带裤的马里奥,每关以马里奥在走到重点的前提下尽可能地收集金币。他在闯关过程中，会遇到怪物，可以通过踩死或者跳过。也会遇到深坑。给游戏增加了一定的难度。今天带大家用java制作制作这款小游戏,下面是课程介绍.课程介绍：在你的童年记忆里，是否有一个会蹦跳，会吃蘑菇的小人？超级玛丽是一款经典并且流行的小游戏，通过键盘来控制马里奥的移动
java LockSupport park() unpark() 的用法&和wait() notify()的区别
javaLockSupportpark()unpark()的用法ockSupport类是Java并发包中的一个工具类，提供了一些基本的线程阻塞和唤醒操作。其中，unpark(Threadthread)方法是用来唤醒指定线程的关键方法。下面详细解释一下unpark方法：unpark方法的作用：唤醒线程：unpark方法可以解除指定线程的阻塞状态，使其有机会继续执行。如果线程在调用park()之前被u
3步搞定Java漏洞修复？别再让黑客当“家”！
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣Java城堡的“裂缝”与程序员的救赎想象一下：你的Java应用是一座巍峨的城堡，而安全漏洞就是那些悄悄蔓延的裂缝。SQL注入：像是小偷从窗户溜进来，偷偷改写数据库的账本。XSS攻击：像在城堡里偷偷放了一张带毒的地毯，路过的人会被“刺”伤。SSRF漏洞：像让城堡
5大核心技术+3大交互革命！Java如何让虚拟世界‘活过来’？——附代码实战+防坑指南！墨瑾轩 Java乐园交互 java 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣从“木头人”到“交互大师”的Java魔法之旅一、Java的“五大核心技术”——虚拟世界的“五感开关”1.1核心技术1：JOGL渲染引擎——“视觉中枢”作用：用OpenGL实现3D场景渲染代码示例：//JOGL渲染循环：画一个旋转的立方体importjavax.
Ubuntu 22.04.5 LTS上部署Docker及相关优化 ChironW Linux运维 Docker ubuntu docker 容器
以下是在Ubuntu22.04.5LTS上部署Docker及相关优化的步骤：安装Docker更新系统：在安装Docker之前，先确保系统是最新的，执行以下命令：sudoaptupdatesudoaptupgrade-y安装依赖包：安装一些必要的依赖包，用于支持Docker的运行，命令如下：sudoaptinstall-yapt-transport-httpsca-certificatescurls
Java多线程、锁、线程池详解
Java多线程、锁、线程池详解在现代软件开发中，多线程编程是提高程序性能和响应能力的重要手段。Java提供了丰富的多线程支持，包括线程的创建、同步、通信以及线程池管理等。本文将深入探讨Java中的多线程、锁机制、线程池的原理和应用，并涵盖成员方法、并行、调度、同步、死锁、睡眠、唤醒以及线程状态等知识。一、多线程基础1.多线程的概念多线程允许程序同时执行多个任务，从而提高程序的执行效率。2.多线程的
A*算法详解
A*算法详解一、A*算法基础概念1.1算法定位1.2核心评估函数1.3关键数据结构二、A*算法的核心步骤三、启发函数设计3.1网格地图中的启发函数3.2启发函数的选择原则三、Java代码实现四、启发函数的设计与优化4.1启发函数的可采纳性4.2启发函数的效率影响4.3常见启发函数对比五、A*算法的应用场景与拓展5.1典型应用5.2算法拓展六、A*算法的优缺点优点缺点从游戏中的角色寻路到机器人导航，
分层图最短路径算法详解 GG不是gg 数据结构与算法分析 #算法分析与设计图搜索算法
分层图最短路径算法详解一、分层图算法的核心思想1.1问题引入：带约束的最短路径1.2分层图的核心思路二、分层图的构建方法2.1分层图的结构定义2.2构建步骤（以“最多k次边权改为0”为例）三、分层图最短路径的求解3.1算法步骤3.2Java代码实现（以Dijkstra为例）四、分层图算法的关键细节4.1状态表示与空间优化4.2边的处理4.3复杂度分析五、典型应用场景5.1带次数约束的路径优化5.2
MySQL 锁详解：从原理到实战的并发控制指南一切皆有迹可循 mysql mysql 数据库后端 java sql
前言在高并发场景下，锁是MySQL保证数据一致性的核心机制。正确理解锁的类型、行为及适用场景，能有效避免数据竞争、死锁等问题，是构建可靠数据库应用的关键。本文从锁的分类、存储引擎差异到实战优化，结合代码示例，系统解析MySQL锁机制的核心原理与最佳实践。一、锁分类：按粒度与功能划分1.按锁粒度划分（1）全局锁（GlobalLock）作用范围：锁定整个数据库实例典型场景：全库逻辑备份（FLUSHTA
Tomcat生命周期原理深度剖析
Tomcat生命周期原理深度剖析本文围绕Tomcat生命周期机制，结合架构图、源码精讲、设计思想、实际案例、调优技巧等全方位解读，帮助读者系统掌握Tomcat生命周期的本质与应用。一、Tomcat生命周期概述Tomcat作为JavaWeb服务器的代表，其架构中每个核心组件（如Server、Service、Engine、Host、Context、Wrapper等）都拥有独立的生命周期。Tomcat通
容器中敏感信息泄露路径排查与修复机制：构建、运行与发布全链条实战指南观熵 Docker Docker 安全
容器中敏感信息泄露路径排查与修复机制：构建、运行与发布全链条实战指南关键词：容器安全、敏感信息泄露、环境变量、构建路径排查、Dockerfile安全、CI/CD安全、镜像扫描、密钥管理摘要：在容器化构建与交付流程中，敏感信息泄露问题屡见不鲜，覆盖了硬编码密钥、构建残留、环境变量注入、配置文件外泄等多个维度。本文将基于真实的工程实践，梳理容器生命周期中潜在的敏感信息泄露路径，结合Trivy、Dock
Docker+Kubernetes落地指南：从单机到集群的平滑迁移 sg_knight docker docker kubernetes 容器 java spring cloud
一、为何必须升级到Kubernetes？1.1单机Docker的瓶颈单机环境痛点：├─资源利用率不均衡（CPU飙高vs内存闲置）├─服务扩容需手动操作├─零宕机更新难以实现└─网络配置复杂（跨主机通信困难）企业级需求：┌───────────┬───────────────┐|场景|Kubernetes方案||───────────|───────────────||滚动更新|Deployment
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

一键构建云上高可用蛋白质结构预测平台

你可能感兴趣的:(数据库,大数据,分布式,java,docker)