亚马逊云开发者

Mantium 如何在 Amazon SageMaker 上使用 DeepSpeed 实现低延迟 GPT-J 推理

前言

Mantium （https://mantiumai.com/）是一家全球云平台提供商，致力于构建 AI 应用程序并对它们进行规模化管理。利用 Mantium 的端到端开发平台，与传统方式相比，各种规模的企业能更快、更轻松地构建 AI 应用程序和实现自动化。借助 Mantium，技术和非技术团队可采用低代码方式原型设计、开发、测试和部署 AI 应用程序。通过自动日志记录、监控和安全功能，Mantium 还解放了软件和 DevOps 工程师，他们不需要花时间做重复性工作了。在较高的层面上，Mantium 提供了：

最先进的 AI – 使用一系列精选的开源和私有大型语言模型以及简单的 UI 或 API 进行试验和开发。
AI 流程自动化 – 利用不断扩大的集成库和 Mantium 的图形化 AI Builder，轻松构建 AI 驱动型应用程序。
快速部署 – 利用一键式部署，将生产时间线从几个月缩短至几周甚至几天。只需单击一次，此功能就会将 AI 应用程序转换为可共享的 Web 应用程序。
安全与监管 – 确保安全并遵守治理政策，同时支持人机回圈流程。

借助 Mantium AI Builder，您可以开发先进的工作流来集成外部 API、逻辑运算和 AI 模型。以下屏幕截图显示了一个示例 Mantium AI 应用程序，该应用程序将 Twilio 输入、治理政策、AI 块（可以依赖像 GPT-J 这样的开源模型）和 Twilio 输出联系起来。

为了支持此应用程序，Mantium 不仅提供对来自 Open AI、Co:here 和 AI21 等 AI 提供商的模型 API 的全面统一的访问，还提供最先进的开源模型。在 Mantium，我们认为任何人都应能够构建他们自己的端到端现代 AI 应用程序，为此，我们提供了对性能优化的开源模型的无代码和低代码访问。

例如，Mantium 的核心开源模型之一是 GPT-J，它是由 EleutherAI 开发的最先进的自然语言处理（NLP，Natural Language Processing）模型。GPT-J 拥有 60 亿个参数，是规模最大、性能最优的开源文本生成模型之一。Mantium 用户可以通过 Mantium 的 AI Builder 将 GPT-J 集成到其 AI 应用程序中。对于 GPT-J，这需要指定一个提示（模型应执行的操作的自然语言表示形式）并配置一些可选参数。

GPT-J：

https://github.com/kingoflolz/mesh-transformer-jax/#gpt-j-6b

EleutherAI ：

https://www.eleuther.ai/

例如，以下屏幕截图显示了生成解释和情绪预测的情绪分析提示的简短演示。在此示例中，作者的原文是“食物很美味”并且“他们的服务非常出色”。因此，这段文字表达了积极的情绪。

但开源模型面临一个挑战，即它们很少为实现生产级性能而设计。对于像 GPT-J 这样的大型模型，根据使用案例的不同，这可能会使生产部署变得不切实际甚至不可行。

为了确保我们的用户能够实现一流性能，我们一直在寻找减少核心模型延迟的方法。在本博文中，我们描述了一个推理优化实验的结果，在该实验中，我们使用 DeepSpeed 的推理引擎将 GPT-J 的推理速度加快了约 116%。

我们还介绍了如何在 Amazon SageMaker（https://aws.amazon.com/cn/sagemaker/）推理端点中使用 DeepSpeed 部署 GPT-J 的 Hugging Face Transformers 实施。

GPT-J 模型概览

GPT-J 是一种生成式预训练（GPT，Generative Pretrained）语言模型，就其架构而言，它和常用的私有大型语言模型（例如 Open AI 的 GPT-3）相当。如前所述，它由大约 60 亿个参数和 28 个层构成，其中包括一个前馈块和一个自我注意块。在 GPT-J 首次发布时，它是最早使用旋转嵌入的大型语言模型之一，旋转嵌入是一种新的位置编码策略，它统一了绝对位置编码器和相对位置编码器。它还采用了一种创新性的并行化策略，将密集层和前馈层并入一个层，从而最大限度地减少通信开销。

尽管以今天的标准来看，GPT-J 可能还不够大（大型模型通常包含超过 1000 亿个参数），但它仍然具有令人印象深刻的性能，并且通过一些及时的工程设计或最小微调，您可以使用它来解决许多问题。此外，它的尺寸相对适中，与大型模型相比，您可以更快地部署它，而且成本要低得多。

也就是说，GPT-J 仍然相当大。例如，在 FP32 中使用完整权重更新和 Adam 优化器训练 GPT-J 需要超过 200 GB 的内存：模型参数占用 24 GB，渐变占用 24 GB，Adam 的平方梯度占用 24 GB，优化器状态占用 24 GB，其他内存量用于加载训练批次和存储激活项。当然，在 FP16 中训练可以将所需内存减少近一半，但超过 100 GB 的内存占用仍需要创新性的训练策略。例如，Mantium 的 NLP 团队与 SageMaker 合作，开发了一个使用 SageMaker 分布式模型并行库训练（微调）GPT-J 的工作流。

旋转嵌入：

https://blog.eleuther.ai/rotary-embeddings/

工作流：

https://github.com/aws/amazon-sagemaker-examples/tree/main/training/distributed_training/pytorch/model_parallel/gpt-j

相比之下，使用 GPT-J 进行推理所需的内存要少得多 – 在 FP16 中，模型权重占用不到 13 GB，这意味着可以在单个 16 GB GPU 上轻松执行推理。但是，使用现成的 GPT-J 实施（例如，我们使用的 Hugging Face Transformers 实施）进行推理的速度相对较慢。为了支持需要高响应性的文本生成的使用案例，我们专注于减少 GPT-J 的推理延迟。

Hugging Face Transformers 实施：

https://huggingface.co/EleutherAI/gpt-j-6B

GPT-J 的响应延迟挑战

响应延迟是生成式预训练转换器（GPT，Generative Pretrained Transformer）（例如 GPT-J）面临的主要障碍，这些转换器为现代文本生成提供支持。GPT 模型通过一系列推理步骤来生成文本。在每个推理步骤中，将为模型提供文本作为输入，并根据该输入对词汇表中的某个词进行采样以追加到文本。例如，给定令牌序列“我需要一把伞，因为”，则下一个令牌极有可能是“正在下雨”。不过，它也可能是“阳光太强”或“备用”，这可能是迈向“我需要一把伞，因为肯定要下雨了。”这样的文本序列的第一个推理步骤。

诸如此类的场景给部署 GPT 模型带来了一些有趣的挑战，因为实际的使用案例可能涉及数十、数百甚至数千个推理步骤。例如，生成 1000 个令牌的响应需要 1000 个推理步骤！因此，尽管一个模型提供的推理速度在孤立情况下可能看起来足够快，但在生成长文本时，延迟易于达到难以维持的水平。我们发现，在 V100 GPU 上，每个推理步骤的平均延迟为 280 毫秒。对于一个包含 67 亿个参数的模型来说，这似乎很快，但在这样的延迟下，生成 500 个令牌的响应大约需要 30 秒，从用户体验的角度来看，这并不理想。

使用 DeepSpeed Inference

加快推理速度

DeepSpeed （https://www.deepspeed.ai/）是由 Microsoft 开发的开源深度学习优化库。尽管 DeepSpeed 主要侧重于优化大型模型的训练，但它也提供了一个推理优化框架，该框架支持一组精选模型，包括 BERT、Megatron、GPT-Neo、GPT2 和 GPT-J。DeepSpeed Inference 通过将模型并行性、推理优化的 CUDA 内核和量化相结合，为基于转换器的大型架构提供高性能推理。

为了使用 GPT-J 加快推理速度，我们使用 DeepSpeed 的推理引擎将优化后的 CUDA 内核注入 Hugging Face Transformers GPT-J 实施中。

为了评估 DeepSpeed 的推理引擎的速度优势，我们进行了一系列的延迟测试，其中，我们在各种配置下对 GPT-J 进行了计时。具体而言，我们在是否使用 DeepSpeed、硬件、输出序列长度和输入序列长度上做出了变化。我们专注于输出序列长度和输入序列长度，因为它们都影响推理速度。要生成包含 50 个令牌的输出序列，模型必须执行 50 个推理步骤。此外，执行推理步骤所需的时间取决于输入序列的大小，即输入越大，所需的处理时间越多。虽然输出序列大小产生的影响远大于输入序列大小，但仍需考虑这两个因素。

在我们的实验中，我们使用了以下设计：

DeepSpeed 推理引擎 – 打开、关闭
硬件 – T4（ml.g4dn.2xlarge）、V100（ml.p3.2xlarge）
输入序列长度 – 50、200、500、1000
输出序列长度 – 50、100、150、200

总的来说，该设计包含这四个因素的 64 种组合，对于每种组合，我们进行了 20 次延迟测试。每次测试都在预先初始化的 SageMaker 推理端点上运行，确保我们的延迟测试反映生产时间，包括 API 交换和预处理。

我们的测试表明，DeepSpeed 的 GPT-J 推理引擎比基准 Hugging Face Transformers PyTorch 实现要快得多。下图说明了 ml.g4dn.2xlarge 和 ml.p3.2xlarge SageMaker 推理端点上使用和不使用 DeepSpeed 加速的 GPT-J 的平均文本生成延迟。

在配备了 16 GB NVIDIA T4 GPU 的 ml.g4dn.2xlarge 实例上，我们发现平均延迟减少了约 24% [标准差 (SD) = 0.05]。这相当于从平均每秒 12.5（SD = 0.91）个令牌增加到平均每秒 16.5（SD = 2.13）个令牌。

值得注意的是，在配备了 NVIDIA V100 GPU 的 ml.p3.2xlarge 实例上，DeepSpeed 的加速效果甚至更好。在该硬件上，我们发现平均延迟减少了 53%（SD = 0.07）。就每秒令牌数而言，这相当于从平均每秒 21.9（SD = 1.97）个令牌增加到平均每秒 47.5（SD = 5.8）个令牌。

我们还发现，随着输入序列的增大，DeepSpeed 提供的加速在两种硬件配置上都略有减弱。但在所有条件下，使用 DeepSpeed 的 GPT-J 优化进行推断的速度仍比基准快得多。例如，在 g4dn 实例上，最大和最小延迟减少分别为 31%（输入序列大小 = 50）和 15%（输入序列大小 = 1000）。在 p3 实例上，最大和最小延迟减少分别为 62%（输入序列大小 = 50）和 40%（输入序列大小 = 1000）。

在 SageMaker 推理端点上

使用 DeepSpeed 部署 GPT-J

除了显著提高 GPT-J 的文本生成速度之外，DeepSpeed 的推理引擎还可以轻松集成到 SageMaker 推理端点中。在将 DeepSpeed 添加到我们的推理堆栈之前，我们的端点是在基于官方 PyTorch 映像的自定义 Docker 映像上运行的。利用 SageMaker，可以非常轻松地部署自定义推理端点，并且集成 DeepSpeed 就像包含依赖项和编写几行代码那样简单。GitHub 上提供了使用 DeepSpeed 部署 GPT-J 的部署工作流程的开源指南（https://github.com/mantiumai/aws-sagemaker-gptj-deepspeed-blog）。

结论

Mantium 致力于引领创新，让每个人都能使用 AI 快速构建。从 AI 驱动型流程自动化到严格的安全和合规性设置，我们技术娴熟的的平台提供了大规模开发和管理强大、可靠的 AI 应用程序所需的所有工具，并降低了进入门槛。SageMaker 帮助像 Mantium 这样的公司快速进入市场。

要了解 Mantium 如何帮助您为企业构建综合性 AI 驱动型工作流，请访问 www.mantiumai.com。

本篇作者

Joe Hoover

Mantium 的 AI 研发团队的高级应用科学家。他热衷于开发模型、方法和基础设施，帮助人们利用尖端的 NLP 系统解决实际问题。

Dhawal Patel

亚马逊云科技的首席机器学习架构师，致力于解决与分布式计算和人工智能有关的问题。专注于深度学习，包括 NLP 和计算机视觉领域，帮助客户在 SageMaker 上实现了高性能模型推理。

Sunil Padmanabhan

亚马逊云科技初创公司解决方案架构师。他对机器学习充满热情，专注于帮助初创公司利用 AI/ML 实现业务成果，并大规模设计和部署 ML/AI 解决方案。

听说，点完下面4个按钮

就不会碰到bug了！

Python3.13安装和配置冯一川 Qt项目总结 python
Python3.13安装和配置一、Python的下载点击下面的下载链接，下载需要的版本。以3.13版本为例。如下图所示：3.13.0下载地址（windows）3.13.0下载地址（windows）二、安装下载完成后，双击安装文件。<
基于 LangChain 实现数据库问答机器人敲代码敲到头发茂密人工智能测试开发 langchain 数据库机器人人工智能语言模型
基于LangChain实现数据库问答机器人一、简介二、应用场景三、实战案例1、需求说明2、实现思路3、对应源码一、简介在Retrieval或者ReACT的一些场景中，常常需要数据库与人工智能结合。而LangChain本身就封装了许多相关的内容，在其官方文档-SQL能力中，也有非常好的示例。二、应用场景在未出现人工智能，如果想要完成数据查询与数据分析的工作，则需要相关人员有相应的数据库的功底，而在L
【项目分享】使用python的ttkbootstrap模块构建一个炫酷的计时器命运之光我的项目源代码集：持续更新 python 开发语言
目录前言项目背景项目展示（图片）项目实现1.安装与设置2.创建主窗口3.初始化计时器功能4.实现计时功能5.实现隐藏边框与置顶功能6.运行应用完整代码结论嗨，我是命运之光！2024，每日百字，记录时光，感谢有你一路同行。携手启航，探索未知，激发潜能，每一
【漫话机器学习系列】079.超参数调优（Hyperparameter Tuning） IT古董漫话机器学习系列专辑机器学习深度学习人工智能
超参数调优（HyperparameterTuning）是机器学习中优化模型性能的重要步骤之一。超参数是模型在训练之前设定的参数，而不是通过训练数据学习到的参数。正确地选择超参数可以显著提高模型的预测能力，反之，错误的超参数选择可能会导致过拟合、欠拟合或训练过程缓慢。1.超参数的定义超参数是控制学习过程的外部参数，不同于模型参数（例如权重和偏置），超参数不通过训练过程自动优化。常见的超参数包括：学习
【漫话机器学习系列】054.极值（Extrema） IT古董漫话机器学习系列专辑机器学习人工智能
极值（Extrema）定义极值是数学分析和优化问题中的一个核心概念，指函数在某个定义域内取得的最大值或最小值。根据极值的性质，可以将其分为两类：局部极值（LocalExtrema）：函数在某点附近的最大值或最小值。全局极值（GlobalExtrema）：函数在整个定义域内的最大值或最小值。分类局部极大值（LocalMaximum）：若在点x=a附近存在某邻域，使得对任意x在该邻域内，满足f(x)≤
全场景深度学习开源框架（MindSpore） deepdata_cn 人工智能深度学习开源人工智能
MindSpore是华为推出的一款全场景深度学习开源框架。旨在实现不同计算平台（如云端、边缘端、端侧）和不同硬件（如CPU、GPU、Ascend等）之间的高效协同。无论是在数据中心的大规模计算，还是在手机、物联网设备等资源受限的终端上，MindSpore都能灵活适配，充分发挥各硬件平台的性能优势，实现模型的高效训练和推理。该框架引入了自动并行技术，能够根据模型结构和硬件资源自动进行并行策略的搜索和
Python随笔 scorecardpy笔记 Cairne493 Python学习 python 机器学习数据分析
目录scorecardpy笔记简介运行示例详细分析各函数sc.germancredit()sc.var_fillter(...)sc.split_df(...)woebin(...)woebin_ply(...)sc.perf_eva(...)sc.scorecard(...)sc.scorecard_ply(...)sc.perf_psi()问题解决matplotlib.pyplot未安装[^3
Ubuntu 24.04 LTS安装Python2失败解决 WLHG8PLUS ubuntu linux 服务器
Ubuntu24.04LTS安装Python2失败解决安装Ubuntu24.04之后，安装python2会提示：~/$sudoaptinstallpython2Readingpackagelists...DoneBuildingdependencytree...DoneReadingstateinformation...DonePackagepython2isnotavailable,butisr
潇洒郎： python subprocess 模块子进程潇洒郎 Python学习 python 命令行执行命令 subprocess Popen
'''os.popen()执行操作系统的命令，会将结果保存在内存当中，可以用read()方法读取出来importos#将结果保存到内存中r=os.popen("ls-l")print(res)##用read()读取内容print(res.read())subprocess.run(["df","-h"])subprocess.call()执行命令，返回命令的结果和执行状态，0或者非0subproc
【Python】进程管理之 subprocess jackwongs python windows 开发语言
一个好的子进程管理需要满足什么功能需求？无阻塞/阻塞标准输入/输出信号发送/kill其实也不多。开始123456importsubprocessproc=subprocess.Popen('ping127.0.0.1',shell=True,stdout=subprocess.PIPE,stderr=subprocess.STDOUT,stdin=subprocess.PIPE)print(pro
【机器学习】自定义数据集，使用scikit-learn 中K均值包进行聚类加德霍克机器学习 scikit-learn 均值算法 python 作业
一、K均值算法简介K均值算法的目标是将数据集划分为K个簇，使得每个数据点属于离它最近的簇中心（centroid）所代表的簇。K均值聚类算法步骤①初始化：随机选择原始数据的K个数据点作为初始质心（聚类中心）。②分配：将每个数据点划分到距离最近的质心所对应的簇中，即计算每个数据点到每个质心的距离，选择距离最近的质心作为该数据点所属的簇。③更新：重新计算每个簇的质心，即将该簇中所有数据点的坐标取平均值，
#Java 与 C++ 核心差异详解：从语法到实战的代码对比新宿椎名琳擒 java 开发语言
##一、语言定位差异||Java|C++|设计目标|"Writeonce,runanywhere"|"高性能系统级开发"|运行方式|JVM解释执行字节码|直接编译为机器码|典型场景|企业应用/Android/大数据|游戏引擎/操作系统/高频交易系统---###二、基础语法对比####1.HelloWorld程序```java//Java:严格面向对象publicclassHelloWorld{
AI学习指南HuggingFace篇-高级优化技巧俞兆鹏 AI学习指南 ai
一、引言在深度学习和自然语言处理（NLP）中，模型训练的效率和性能至关重要。HuggingFace提供了多种高级优化技巧，帮助开发者提升模型训练的效率和效果。本文将介绍混合精度训练、分布式训练等高级优化技巧，并探讨如何通过这些方法提升模型训练效率。二、混合精度训练（一）混合精度训练的原理混合精度训练利用自动混合精度（AMP）技术，高效管理FP16和FP32之间的转换。通过在前向传播中使用FP16加
python连接sqlite数据库豪豪学习8848 oracle 数据库
importsqlite3#连接到SQLite数据库#如果数据库文件不存在，会自动在当前目录创建:conn=sqlite3.connect('example.db')try:#创建一个Cursor对象cursor=conn.cursor()#创建一个新表cursor.execute('''CREATETABLEIFNOTEXISTSusers(idINTEGERPRIMARYKEY,nameTEX
Python定时任务框架Apscheduler实例-----每隔10分钟扫描FTP的文本，下载到本地，非月结期间调airflow工作流不朽的诗篇 Python sftp python httpwebrequest
1.安装anacondahttps://www.jianshu.com/p/d3a5ec1d9a082.安装虚拟环境monitor//创建虚拟环境monitorcondacreate-nmonitorpython=3.6//查看已创建的虚拟环境condainfo-e3.安装Apscheduler，FTP工具包，Requestspipinstallapschedulerpipinstallparam
python做定时任务的方式及优缺点_使用Python做定时任务及时了解互联网动态 weixin_39617405
前言本人因为比较喜欢看漫画和动漫,所以总会遇到一些问题,因为订阅的漫画或者动漫太多,总会忘记自己看到那一章节或者不知道什么时候更新.故会有这么一个需求,想记录自己想看的漫画或动画并在其更新的时候第一时间知道,当然,你可以拓展到任何你想关注的,都可以通过邮件及时推送.思路目录运行环境Python3.6第三方库fake-useragent==0.1.11pyquery==1.4.0requests==
Python做定时任务 w263044840
最近写一个svn监控工具，每天定时去checksvn是否有更新，有则把更新内容发到指定的邮箱中，其中用到定时任务，看了一下python的文档貌似没有哪个模块提供计划任务这种函数。定时任务可以使用time下的sleep实现，也可以用schu去实现，看介绍都是需要输入一个时间的，所以要计算一个时间差。其实关键就是算差值了，以下是每天10,14,16三个点去执行svncheck这个函数的实现，用到的是c
Python实现定时任务百家晓东 Python
关注公众号“码农帮派”，查看更多系列技术文章：下面提供两种方式实现Python中的定时任务：|time.sleep(seconds)|time,sched方式一：#coding=utf-8importtimedefoperate(inc=1):#dosomethingprint'----'time.sleep(inc)pass#循环执行10次foriinrange(10):operate(1)【说
httprunner实践样例谷隐凡二测试测试工具
目录1.安装HTTPRunner2.基本概念和目录结构3.编写一个HTTPRunner测试用例（YAML示例）4.运行测试用例5.使用Python编写测试用例6.运行Python测试用例7.集成测试报告8.高级用法：集成环境变量、外部数据9.集成到CI/CD流程10.应用说明：简介：HTTPRunner是一个非常好用的自动化测试框架，它用于HTTPAPI测试，支持RESTful、GraphQL等接
python实现轻量级的定时任务包，不引用celery等框架，在注册APP后自启动 rock——you python 开发语言 linux
如果你希望自开发一个轻量级的Python包来实现定时任务，而不依赖Celery等复杂框架，可以使用原生的Python工具如threading或schedule。以下是一个简单实现的方案。实现一个轻量级的定时任务包核心功能使用threading启动一个守护线程。定时执行一个小任务，例如每分钟运行一次。提供启动、停止功能。避免复杂的依赖，纯Python实现。项目结构my_simple_schedule
Python命令汇总：雷电模拟器棠梨煎雪灬 Python学习 python 开发语言
Python命令汇总：雷电模拟器文章目录Python命令汇总：雷电模拟器写在前面一、模拟器参数操作二、模拟器应用操作三、模拟器模拟操作`参考网站名称`雷电模拟器命令操作合集写在前面使用目的：雷电模拟器库函数调用（调用时注意函数前缀）一、模拟器参数操作添加模拟器add(name:str)获取安装包列表get_package_list(index:int)->list检测是否安装指定的应用has_in
零信任赋予安全牙齿，AI促使它更锋利零信任Enlink_Young 零信任网络安全 AI ai 网络安全
距离上次写关于安全的文字已经过去了很久很久，久到上次看到的AI还停留在TTS、ASR等最初的语音交互+搜索类似的各种智能音箱以及通过关键字匹配的基于知识库的聊天的机器人。之后的几年各种视觉识别遍地开花，AI四小龙在人脸识别上成熟应用，再然后到大热的机器学习、深度学习，对于AI一直都有关注，但商业价值均没有得到有效发挥，大部分都停在科研和实验室阶段。19年ChatGPT横空处世，直到ChatGPT通
Python入门初学一、Python简介及发展，带你深入认识Python 2401_86437188 python 开发语言
从整体上看，Python语言最大的特点就是简单，该特点主要体现在以下2个方面：Python语言的语法非常简洁明了，即便是非软件专业的初学者，也很容易上手。和其它编程语言相比，实现同一个功能，Python语言的实现代码往往是最短的。对于Python，网络上流传着“人生苦短，我用Python”的说法。因此，看似Python是“不经意间”开发出来的，但丝毫不比其它编程语言差。事实也是如此，自1991年P
Python在测试中的用途_pathon在软件测试中的应用 2401_86437188 python 开发语言
Python+Selenium实现web端的UI自动化：Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。这个工具的主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览
Python必备库大全，建议留用 2401_86437188 python 开发语言
mechanize-有状态、可编程的Web浏览库。socket–底层网络接口(stdlib)。UnirestforPython–Unirest是一套可用于多种语言的轻量级的HTTP库。hyper–Python的HTTP/2客户端。PySocks–SocksiPy更新并积极维护的版本，包括错误修复和一些其他的特征。作为socket模块的直接替换。网络爬虫框架1.功能齐全的爬虫grab–网络爬虫框架（
进程间的数据桥梁：`multiprocessing.Queue` 的应用清水白石008 python Python题库服务器运维
进程间的数据桥梁：multiprocessing.Queue的应用在多进程编程中，由于每个进程都有自己独立的内存空间，因此进程之间的数据交换和共享比线程间的数据传递要复杂一些。Python提供了多种机制来实现进程间的数据传递，其中multiprocessing.Queue是一个常用且强大的工具。本文将深入探讨multiprocessing.Queue在进程间数据传递中的作用，并结合实例进行讲解，帮
Selenium之免登录获取CSDN代码块内容(Java) fuqying selenium java
Selenium安装配置可见：Selenium安装及配置和Python/Java案例-CSDN博客免登录获取CSDN代码块内容packagecom.fuqying;importorg.openqa.selenium.By;importorg.openqa.selenium.JavascriptExecutor;importorg.openqa.selenium.WebDriver;importor
Selenium安装及配置和Python/Java案例 fuqying python selenium java
什么是Selenium？Selenium起源2004年，是一个开源、免费、简单、灵活，对Web浏览器支持良好的自动化测试工具，在UI自动化、爬虫等场景下是十分实用的。Selenium的用途*Selenium*有很多功能，但其核心是Web浏览器自动化的一个工具集，它使用最好的技术来远程控制浏览器实例，并模拟用户与浏览器的交互。它允许用户模拟终端用户执行的常见活动；将文本输入到字段中，选择下拉值和复选
打造高质量Python代码：使用Black、Ruff和Mypy进行格式化与Lint llzwxh888 python 数据库服务器
#打造高质量Python代码：使用Black、Ruff和Mypy进行格式化与Lint在软件开发过程中，确保代码的风格、可读性和正确性是每位开发者面临的重要任务。借助于现代工具，我们可以自动化许多重复性的检查任务，从而提高代码质量和开发效率。在这篇文章中，我们将探讨如何使用Black、Ruff和Mypy为Python代码进行格式化和Lint。##引言面对不断增长的代码库，维护代码风格和质量可以变得非
提高代码质量：使用Python Lint工具black、ruff和mypy ndAbsAfaqwdav python 服务器开发语言
提高代码质量：使用PythonLint工具black、ruff和mypy在软件开发过程中，代码质量是一个非常重要的环节。良好的代码格式和风格不仅使代码更易于阅读和维护，还能减少潜在的错误和问题。本文将介绍如何使用Python的三个流行工具：black，ruff，和mypy，帮助开发者提升代码质量。引言在这篇文章中，我们将探讨如何有效使用black，ruff，和mypy来提高Python代码的质量。
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

Mantium 如何在 Amazon SageMaker 上使用 DeepSpeed 实现低延迟 GPT-J 推理

你可能感兴趣的:(大数据,python,机器学习,人工智能,深度学习)