Sonhhxg_柒

【Transformers】第 10 章：服务 Transformer 模型

大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流

个人主页－Sonhhxg_柒的博客_CSDN博客

欢迎各位→点赞 + 收藏⭐️ + 留言

系列专栏 - 机器学习【ML】自然语言处理【NLP】深度学习【DL】

foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。

如果你对这个系列感兴趣的话，可以关注订阅哟

文章目录

技术要求

fastAPI Transformer 模型服务

Docker 化 API

使用 TFX 提供更快的 Transformer 模型

使用 Locust 进行负载测试

概括

到目前为止，我们已经探索了有关 Transformer 的许多方面，并且您已经学习了如何从头开始训练和使用 Transformer 模型。您还学习了如何针对许多任务对它们进行微调。但是，我们仍然不知道如何在生产中为这些模型提供服务。与任何其他现实生活和现代解决方案一样，基于自然语言处理( NLP ) 的解决方案必须能够在生产环境中提供服务。但是，在开发此类解决方案时，必须考虑响应时间等指标。

本章将解释如何在 CPU/GPU 可用的环境中提供基于 Transformer 的 NLP 解决方案。此处将描述用于机器学习部署的TensorFlow Extended ( TFX ) 作为解决方案。此外，还将说明将 Transformer 作为 API 提供服务的其他解决方案，例如 FastAPI。您还将了解 Docker 的基础知识，以及如何对您的服务进行 docker 化并使其可部署。最后，您将学习如何使用 Locust 对基于 Transformer 的解决方案执行速度和负载测试。

我们将在本章中介绍以下主题：

fastAPI Transformer 模型服务
Docker 化 API
使用 TFX 提供更快的 Transformer 模型
使用 Locust 进行负载测试

技术要求

我们将使用 Jupyter Notebook、Python 和 Dockerfile 来运行我们的编码练习，这需要 Python 3.6.0。需要安装以下软件包：

TensorFlow
PyTorch
Transformer >=4.00
fastAPI
Docker
Locust

fastAPI Transformer 模型服务

有很多网络框架我们可以用来服务。Sanic、Flask 和 fastAPI 只是一些示例。然而，fastAPI 最近因其速度和可靠性而备受关注。在本节中，我们将使用 fastAPI 并学习如何根据其文档构建服务。我们还将使用pydantic来定义我们的数据类。让我们开始！

在开始之前，我们必须安装pydantic和 fastAPI：
```
$ pip install pydantic

$ pip install fastapi
```
下一步是使用pydantic制作用于装饰 API 输入的数据模型。但是在形成数据模型之前，我们必须知道我们的模型是什么并识别它的输入。
我们将为此使用问答( QA ) 模型。正如你从第 6 章，用于标记分类的微调语言模型中知道的那样，输入的形式为一个问题和一个上下文。

通过使用以下数据模型，您可以制作 QA 数据模型：

from pydantic import BaseModel

class QADataModel(BaseModel):
     question: str
     context: str

我们必须加载模型一次，而不是为每个请求加载它；相反，我们将预加载一次并重用它。因为每次我们向服务器发送请求时都会调用端点函数，这将导致每次都加载模型：
```
from transformers import pipeline

model_name = 'distilbert-base-cased-distilled-squad'
model = pipeline(model=model_name, tokenizer=model_name,   
                          task='question-answering')
```
下一步是创建一个用于审核应用程序的 fastAPI 实例：
```
from fastapi import FastAPI

app = FastAPI()
```

之后，您必须使用以下代码创建一个 fastAPI 端点：

@app.post("/question_answering")
async def qa(input_data: QADataModel):
     result = model(question = input_data.question, context=input_data.context)
     return {"result": result["answer"]}

对函数使用async很重要，以使该函数在异步模式下运行；这将针对请求并行化。您还可以使用workers参数来增加API 的worker 数量，并使其一次响应不同且独立的API 调用。
使用uvicorn，您可以运行您的应用程序并将其作为 API 提供。Uvicorn是一个闪电般的服务器基于 Python 的 API 的实现，使它们尽可能快地运行。为此使用以下代码：
```
if __name__ == '__main__':
    uvicorn.run('main:app', workers=1)
```
请务必记住，前面的代码必须保存在.py文件中（例如main.py）。您可以使用以下命令运行它：
```
$ python main.py
```
结果，您将在终端中看到以下输出：

图 10.1 – fastAPI 在行动

下一步是使用和测试它。我们可以为此使用许多工具，但 Postman 是最好的工具之一。前我们学习如何使用 Postman，使用如下代码：

$ curl --location --request POST 'http://127.0.0.1:8000/question_answering' \
--header 'Content-Type: application/json' \
--data-raw '{
    "question":"What is extractive question answering?",
    "context":"Extractive Question Answering is the task of extracting an answer from a text given a question. An example of a question answering dataset is the SQuAD dataset, which is entirely based on that task. If you would like to fine-tune a model on a SQuAD task, you may leverage the `run_squad.py`."
}'

结果，您将获得以下输出：

{"answer":"the task of extracting an answer from a text given a question"}

Curl 是一个有用的工具，但不如 Postman 方便。Postman 带有一个 GUI，与 CLI 工具 curl 相比，它更易于使用。使用Postman，从Download Postman | Get Started for Free安装它。

安装后Postman，您可以轻松使用它，如下图所示：

图 10.2 – Postman 的使用
设置的每一步up 为您服务的 Postman 在前面的屏幕截图中编号。让我们来看看它们：

选择POST作为您的方法。
输入您的完整端点 URL。
选择身体。
将Body设置为raw。
选择JSON数据类型。
以 JSON 格式输入您的输入数据。
单击发送。
您将在 Postman 的底部看到结果。

在下一节中，您将学习如何对基于 fastAPI 的 API 进行 docker 化。学习 Docker 基础知识对于使您的 API 可打包且更易于部署至关重要。

Docker 化 API

在生产过程中节省时间为了简化部署过程，使用 Docker 是必不可少的。隔离您的服务和应用程序非常重要。另外，请注意，无论底层操作系统如何，相同的代码都可以在任何地方运行。为了实现这一点，Docker 提供了强大的功能和封装。在使用它之前，您必须使用推荐的步骤安装它在 Docker 文档（Get Docker | Docker Documentation）中：

首先，将main.py文件放在 app 目录下。
接下来，您必须通过指定以下内容从代码中删除最后一部分：
```
if __name__ == '__main__':
     uvicorn.run('main:app', workers=1)
```

下一步是为你的 fastAPI 制作一个 Dockerfile；你以前做过这个。为此，您必须创建一个包含以下内容的 Dockerfile：

FROM python:3.7
RUN pip install torch
RUN pip install fastapi uvicorn transformers
EXPOSE 80
COPY ./app /app
CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000"]

之后，您可以构建您的 Docker 容器：
```
$ docker build -t qaapi .
And easily start it:
$ docker run -p 8000:8000 qaapi
```
因此，您现在可以使用端口8000访问您的 API 。但是，您仍然可以使用 Postman，如上一节中所述，fastAPI Transformer 模型服务。

到目前为止，你已经学会了如何基于 Transformer 模型制作自己的 API 并使用 fastAPI 提供服务。然后，您学习了如何对其进行 docker 化。重要的是要知道关于 Docker，您必须了解许多选项和设置；我们在这里只介绍了 Docker 的基础知识。

在下一节中，您将学习如何使用 TFX 改进模型服务。

使用 TFX 提供更快的 Transformer 模型

TFX 提供了一种更快更高效的方式服务于基于深度学习的模型。但它有一些你必须了解的重要关键点在你使用它之前。该模型必须是 TensorFlow 中保存的模型类型，以便 TFX Docker 或 CLI 可以使用它。让我们来看看：

您可以使用 TensorFlow 中保存的模型格式执行 TFX 模型服务。有关 TensorFlow 保存模型的更多信息，您可以在https://www.tensorflow.org/guide/saved_model阅读官方文档。要从 Transformers 中保存模型，您可以简单地使用以下代码：
```
from transformers import TFBertForSequenceClassification

model = TFBertForSequenceClassification.from_pretrained("nateraw/bert-base-uncased-imdb", from_pt=True)
model.save_pretrained("tfx_model", saved_model=True)
```
在我们了解如何使用它为 Transformer 服务之前，需要为 TFX 拉取 Docker 映像：
```
$ docker pull tensorflow/serving
```
这将拉取正在服务的 TFX 的 Docker 容器。下一步是运行 Docker 容器并将保存的模型复制到其中：
```
$ docker run -d --name serving_base tensorflow/serving
```
您可以使用以下代码将保存的文件复制到 Docker 容器中：
```
$ docker cp tfx_model/saved_model tfx:/models/bert
```
这会将保存的模型文件复制到容器中。但是，您必须提交更改：
```
$ docker commit --change "ENV MODEL_NAME bert" tfx my_bert_model
```
现在一切准备就绪，您可以终止 Docker 容器：
```
$ docker kill tfx
```
这将停止容器运行。

现在模型已经准备好并且可以由 TFX Docker 提供服务，您可以简单地将其与其他服务一起使用。我们需要另一个服务来调用 TFX 的原因是基于 Transformer模型具有标记器提供的特殊输入格式。
为此，您必须使一个 fastAPI 服务，它将对 TensorFlow 服务容器提供的 API 进行建模。在对服务进行编码之前，您应该通过为其提供参数来启动 Docker 容器以运行基于 BERT 的模型。如果出现任何错误，这将帮助您修复错误：
```
$ docker run -p 8501:8501 -p 8500:8500 --name bert my_bert_model
```

以下代码包含main.py文件的内容：

import uvicorn

from fastapi import FastAPI

from pydantic import BaseModel

from transformers import BertTokenizerFast, BertConfig

import requests

import json

import numpy as np

tokenizer =BertTokenizerFast.from_pretrained("nateraw/bert-base-uncased-imdb")
config = BertConfig.from_pretrained("nateraw/bert-base-uncased-imdb")

class DataModel(BaseModel):
    text: str
app = FastAPI()
@app.post("/sentiment")
async def sentiment_analysis(input_data: DataModel):
    print(input_data.text)
    tokenized_sentence = [dict(tokenizer(input_data.text))]
    data_send = {"instances": tokenized_sentence}
    response = requests.post("http://localhost:8501/v1/models/bert:predict", data=json.dumps(data_send))
    result = np.abs(json.loads(response.text)["predictions"][0])
    return {"sentiment": config.id2label[np.argmax(result)]}

if __name__ == '__main__':
     uvicorn.run('main:app', workers=1)

我们已经加载了配置文件，因为标签存储在其中，我们需要它们在结果。你可以简单地使
```
$ python main.py
```
现在，您的服务已启动并准备就绪使用。您可以使用 Postman 访问它，如以下屏幕截图所示：

【Transformers】第 10 章：服务 Transformer 模型_第3张图片

图 10.3 – 基于 TFX 的服务的 Postman 输出

整体架构新服务的在 TFX Docker 中如下图所示：

【Transformers】第 10 章：服务 Transformer 模型_第4张图片

图 10.4 – 基于 TFX 的服务架构

到目前为止，您已经学习了如何使用 TFX 为模型提供服务。但是，您需要学习如何使用 Locust 对服务进行负载测试。了解服务的限制以及何时使用量化或修剪来优化服务非常重要。在下一节中，我们将描述如何使用 Locust 在重负载下测试模型性能。

使用 Locust 进行负载测试

我们可以使用许多应用程序来加载测试服务。这些应用程序和库中的大多数都提供了有关服务响应时间和延迟的有用信息。他们也提供有关故障率的信息。Locust 是实现此目的的最佳工具之一。我们将使用它来负载测试为基于 Transformer 的模型提供服务的三种方法：仅使用 fastAPI、使用 dockerized fastAPI 和使用 fastAPI 的基于 TFX 的服务。让我们开始吧：

首先，我们必须安装 Locust：
```
$ pip install locust
```
此命令将安装 Locust。下一步是让所有服务于相同任务的服务使用相同的模型。修复此测试中最重要的两个参数将确保所有服务的设计都相同，以服务于单一目的。使用相同的模型将帮助我们冻结其他任何东西并集中注意力关于方法的部署性能。
一切准备就绪后，您就可以开始对 API 进行负载测试了。您必须准备一个locustfile来定义您的用户及其行为。以下代码是一个简单的locustfile：
```
from locust import HttpUser, task
from random import choice
from string import ascii_uppercase

class User(HttpUser):
    @task
    def predict(self):
        payload = {"text": ''.join(choice(ascii_uppercase) for i in range(20))}
        self.client.post("/sentiment", json=payload)
```
通过使用HttpUser并创建继承自它的User类，我们可以定义一个HttpUser类。@task装饰器对于定义用户在生成后必须执行的任务至关重要。预测功能是用户在生成后将重复执行的实际任务。它将生成一个长度为20的随机字符串并将其发送到您的 API。
要开始测试，您必须启动您的服务。启动服务后，运行以下代码以启动 Locust 负载测试：
```
$ locust -f locust_file.py
```
Locust 将从设置开始您在locustfile中提供。您将在终端中看到以下内容：

图 10.5 – 开始 Locust 负载测试后的终端

可以看到，可以打开加载web界面所在的URL；即http://0.0.0.0:8089。
打开网址后，会看到一个界面，如下图所示：

图 10.6 – Locust 网页界面
我们将要模拟的总用户数设置为10，生成率设置为1，主机设置为http://127.0.0.1:8000，这是我们的服务运行的地方。设置好这些参数后，点击Start swarming。
此时，UI 将发生变化，测试将开始。要随时停止测试，请单击停止按钮。
您还可以单击图表选项卡以查看结果的可视化：

图 10.7 – Charts 选项卡中的 Locust 测试结果
现在测试已经为 API 做好了准备，让我们测试所有三个版本并比较结果，看看哪个版本的性能更好。请记住，服务必须独立测试在您要为他们服务的机器上。换句话说，您必须一次运行一项服务并对其进行测试，然后关闭该服务，然后运行另一项并对其进行测试，依此类推。
结果如下表所示：

表 1 – 比较不同实施的结果

在上表中，每秒请求数( RPS ) 表示API 响应的每秒请求数，而平均响应时间( RT ) 表示服务响应给定调用所需的毫秒数。这些结果表明，基于 TFX 的 fastAPI是最快的。它具有更高的 RPS 和更低的平均 RT。所有这些测试均在配备 Intel(R) Core(TM) i7-9750H CPU、32 GB RAM 和禁用 GPU 的机器上进行。

在本节中，您学习了如何测试您的 API 并根据 RPS 和 RT 等重要参数衡量其性能。但是，现实世界的 API 可以执行许多其他压力测试，例如增加用户数量以使他们表现得像真实用户一样。要执行此类测试并以更真实的方式报告其结果，阅读 Locust 的文档并了解如何执行更高级的测试非常重要。

概括

在本章中，您学习了使用 fastAPI 为 Transformer 模型提供服务的基础知识。您还学习了如何以更高级和更有效的方式为模型提供服务，例如使用 TFX。然后，您学习了负载测试和创建用户的基础知识。让这些用户成组或一个一个地产生，然后报告压力测试的结果，是本章的另一个主要主题。之后，您学习了 Docker 的基础知识以及如何以 Docker 容器的形式打包您的应用程序。最后，您学习了如何为基于 Transformer 的模型提供服务。

python之tkinter库的frame组件谷晓光 python
frame作用就是为了布局，将一组组件作为一个整体放在一个frame中，也方便对这一组组件进行控制。frame组件作为其他组件的框架，将布局分为一个个单独的空间，配合其他布局函数以实现复杂的界面布局。语法：Frame(父对象，参数列表，……)Frame(master=none,**options)(class)参数：参数名称属性举例或备注background或bg组件背景颜色borderwidth
Python, Java 开发鱼类养殖大全APP Geeker-2025 python java
开发一个“鱼类养殖大全APP”是一个非常有意义的项目，特别是对于水产养殖从业者、鱼类爱好者和研究人员来说。该APP可以帮助用户了解鱼类的养殖知识、疾病防治、饲料管理、水质监测等内容，并提供个性化的养殖建议。以下是开发该APP的详细思路和技术实现方案，分别针对Python和Java。---###**功能需求分析**1.**鱼类信息展示**：-提供常见鱼类的基本信息（如名称、图片、生活习性、适宜水温、
编程提示工程高级技巧：从入门到精通 SuperMale-zxq AI编程——程序员的进阶之路 java python c++AI编程人工智能
编程提示工程高级技巧：从入门到精通开篇：当代码与语言的边界变得模糊想象这样一个场景：一位开发者坐在电脑前，面对一个复杂的数据处理任务。传统做法是打开IDE，花几小时编写、调试和优化代码。但今天，他只是打开了AI编程助手，输入了这样一段文字：“创建一个Python函数，读取CSV文件中的销售数据，按季度汇总，并生成一个显示趋势的可交互图表。数据包含日期、产品ID、销售额和区域字段。”几秒钟后，屏幕上
Python(语句) 高育良00003 python 开发语言
一.赋值语句将一个值赋给变量x=5#将5赋给变量xx1=x+6#计算x+6并将结果赋给x1二.条件语句条件语句用于根据不同的条件来执行不同的代码块。语法：if条件表达式1:需注意别漏掉:语句块1elif条件表达式2:语句块2...elif条件表达式n:语句块nelse:语句块(其他)三.循环语句用于重复执行一段代码，知道满足某条件3.1for循环遍历可迭代对象（列表，集合等都行）遍历：经历一遍可迭
一篇文章让你实现前端JS 、 Golang 、 Python如何接入DeepSeek大模型实现自己的AI 一只理智恩 AI 前端后端 python golang javascript
本文将通过三种技术栈实现与DeepSeek大模型的对话交互，提供可直接运行的代码示例及详细注释。一、通用准备步骤1.获取API密钥登录DeepSeek开发者平台创建应用获取DEEPSEEK_API_KEY2.创建测试环境#项目结构deepseek-demo/├──frontend/#前端代码│└──index.html├──go-backend/#Golang后端│└──main.go├──py-
python+MySQL+HTML实现自习室座位管理系统 IT小本本 python python mysql html
自习室座位管理系统项目介绍自习室座位管理系统是一个基于PythonFlask框架开发的Web应用，旨在提供高效、便捷的自习室座位预约和管理功能。该系统适用于学校图书馆、自习室等场所，帮助管理员有效管理座位资源，同时为学生提供便捷的座位预约服务。功能特点1、用户认证模块用户注册：学生可以注册账号，填写个人信息用户登录：支持学生和管理员登录找回密码：通过邮箱验证重置密码2、座位管理模块座位预约：学生可
Python物联网与传感器数据分析 master_chenchengg python python 办公效率 python开发 IT
Python物联网与传感器数据分析开场白：连接物理世界与数字宇宙物联网的魅力：让物体开口说话Python：编织万物互联的魔法传感器：感知世界的触角数据捕获：从现实世界到数字领域传感器类型概览：温度、湿度、光照及其他Python与硬件接口：树莓派的奇妙旅程实时数据流：如何捕捉每一刻的变化数据处理：挖掘数字宝藏的秘密数据清洗：让数据焕发光彩数据分析：揭秘模式与趋势异常检测：识别噪声与干扰可视化展示：讲
9种Python数据可视化方案，让财务数据焕发生命力 IT小本本 python 信息可视化数据分析数据挖掘
想象一下：你即将向董事会展示季度财务报告，面对的是一群已经看过无数PPT的高管。你是选择用普通的柱状图和折线图，还是用能够直观展示收入、支出、利润动态关系的交互式仪表板？本文将通过一个完整的Python财务数据可视化案例，展示如何将枯燥的财务数据转变为直观、动态且富有洞察力的可视化作品。场景：财务分析的可视化挑战李总是一家快速成长的科技公司CFO，每月需要向董事会汇报公司的财务状况。尽管他精通Ex
Pytorch 小记第八回：GoogleNet卷积神经网络模型代码 Start_Present pytorch cnn 神经网络分类 python 深度学习
本次小记，提供了一份基于pytorch的GoogleNet卷积神经网络模型的代码。除此之外，对代码中不容易理解的部分进行了讲解。本代码的平台是PyCharm2024.1.3，python版本3.11numpy版本是1.26.4，pytorch版本2.0.0+cu118，d2l的版本是1.0.3importnumpyasnpimporttorchfromtorchimportnnfromtorchv
python编程基础与案例集锦,python编程案例教程答案青峰235 python 开发语言信息可视化
大家好，小编来为大家解答以下问题，python编程案例教程航空工业出版社课后答案，python编程案例教程答案航空工业出版社，现在让我们一起来看看吧！1.整理字符串输入整理用户输入的问题在编程过程中极为常见。通常情况下，将字符转换为小写或大写就够了，有时你可以使用正则表达式模块「Regex」完成这项工作python编程代码画樱花。但是如果问题很复杂，可能有更好的方法来解决：user_input="
python列表排序方法从大到小,python列表排序sorted 青峰235 windows python linux 人工智能
本篇文章给大家谈谈python列表排序的方法有几种，以及python列表排序方法从大到小，希望对各位有所帮助，不要忘了收藏本站喔。Pythonlist内置sort()方法用来排序，也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。1）排序基础简单的升序排序是非常容易的python引用turtle画蝴蝶。只需要调用sorted()方法。它返回一个新的list，新的l
从剪枝到知识蒸馏：深度学习模型压缩与加速的多重策略一键难忘剪枝深度学习算法知识蒸馏
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中文章目录从剪枝到知识蒸馏：深度学习模型压缩与加速的多重策略1.
mac怎么查python的版本_Mac下如何查看Python的版本？ A格调 mac怎么查python的版本
[1，terminal:input:whichpython2,terminal:input:python--->importsys---->printsys.pathok!goodluck!!]问题：Mac下如何查看Python的版本？系统：MacOSX软件：Python编程语言：Python[Mac配置Python开发环境(Eclipse+Pydev+Python)1、首先下载MAC版的64位E
macbook air怎么安装python_Python3安装完全攻略 Mac篇-Go语言中文社区郑丢丢 macbook air怎么安装python
前言：mac系统自带python，不过以当前mac系统的最新版本为例，自带的python版本都是2.X版本，虽然不影响老版本项目的运行，但是python最新的3.X版本的一些语法与2.X版本并不相同，网上的教程大神们也肯定都更新出了最新版的教程，我们不论是学习还是使用，当然用最新版会更好一点。我的电脑是MacBookAir，系统版本是最新的macOSCatalina10.15.1一、熟悉系统自带的
Python中使用vlc库实现视频播放功能小白教程 python python 音视频开发语言 Python视频播放功能 Python中使用vlc库 vlc视频播放
文章目录前言1.环境准备1.1Python安装1.2选择Python开发环境1.3安装必要库2.基础播放示例3.常用播放控制功能4.事件监听5.播放网络流媒体6.结合GUI库制作视频播放器（以Tkinter为例）前言本教程主要包含打开文件、播放和停止按钮，能够实现基本的视频播放控制功能。1.环境准备1.1Python安装访问Python官方网站，根据你的操作系统（Windows、Mac或Linux
如何在Mac电脑中查看自己的python安装环境亲爱的自己 Python学习 python
如何在Mac电脑中查看自己的python安装环境步骤一：在终端中输入“python”步骤二：输入以下两行代码即可看出安装路径importsysprint(sys.path)
如何检查Mac电脑是否已安装Python环境 =蜗牛= mac python python3 环境
1、Python简介Python是一种高级编程语言，由荷兰程序员吉多·范罗苏姆（GuidovanRossum）于1989年底发明，并于1991年首次发布。它的设计理念强调代码的可读性和简洁的语法，使得程序员能够以较少的代码行数表达思想，从而提高开发效率。Python的名字来源于吉多·范罗苏姆喜欢的喜剧团体“蒙提·派森”（MontyPython），这也体现了Python社区幽默、开放的文化氛围。2、
Mac终端shell查看及修改默认python版本进击的西西弗斯知识总结 python shell macos
首先，查看当前默认Python解释器的情况在shell中输入以下命令来查看当前python解释器的默认调用路径：whichpython输出结果（不同设备可能不同）：/usr/bin/python在shell中逐行输入下面命令，来调用python并查看python解释器和模块库包的调用路径：python3importsyssys.path输出结果：（不同设备结果不同）['/Library/Devel
PyTorch 模型剪枝实例教程一、非结构化剪枝小风_ 模型压缩与加速 pytorch pytorch 深度学习人工智能
目录1.导包&定义一个简单的网络2.获取网络需要剪枝的模块3.模块剪枝（核心）4.总结目前大部分最先进的（SOTA）深度学习技术虽然效果好，但由于其模型参数量和计算量过高，难以用于实际部署。而众所周知，生物神经网络使用高效的稀疏连接（生物大脑神经网络balabala啥的都是稀疏连接的），考虑到这一点，为了减少内存、容量和硬件消耗，同时又不牺牲模型预测的精度，在设备上部署轻量级模型，并通过私有的设备
Mac查看python安装版本 petit_wu Python python mac
1、在Launchpad中打开系统信息2、在“软件“->“应用程序“菜单下，能找到当前Python的安装信息
YOLOv8n-seg.pt的使用（实例分割，训练自己制作的数据集）再坚持一下！！！ YOLO
Ubuntu+python3一、YOLOV8源码下载参考：GitHub-ultralytics/ultralytics:NEW-YOLOv8inPyTorch>ONNX>OpenVINO>CoreML>TFLite二、数据集制作1.labelme下载：pip3installlabelme2.终端输入labelme,打开labelme。界面“打开目录”，打开图片目录images，进行多边形标注（右键
python安装哪个版本好win11,安装python选择哪个版本 S1112_ sqlite
这篇文章主要介绍了python安装哪个版本好win11，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。Sourcecodedownload:本文相关源码前言跟其他编程语言一样，Python发展至今，已经发布了很多版本。有很多小伙伴，在刚接触Python时，基本都会纠结一个问题：应该安装哪个版本的Python好呢？下面小编给大家一些建议用p
优化深度学习模型：PyTorch中的模型剪枝技术详解代码之光_1980 深度学习 pytorch 剪枝
标题：优化深度学习模型：PyTorch中的模型剪枝技术详解在深度学习领域，模型剪枝是一种提高模型效率和性能的技术。通过剪枝，我们可以去除模型中的冗余权重，从而减少模型的复杂度和提高运算速度，同时保持或甚至提升模型的准确率。本文将详细介绍如何在PyTorch框架中实现模型剪枝，并提供相应的代码示例。1.模型剪枝的基本概念模型剪枝主要分为两种类型：结构化剪枝和非结构化剪枝。结构化剪枝通常指的是剪除整个
Dropout: 一种减少神经网络过拟合的技术冰蓝蓝自然语言处理神经网络人工智能深度学习
在深度学习中，过拟合是一个常见的问题，尤其是在模型复杂度较高或训练数据较少的情况下。过拟合意味着模型在训练数据上表现得很好，但在未见过的数据上表现不佳，即泛化能力差。为了解决这个问题，研究者们提出了多种正则化技术，其中之一就是Dropout。什么是Dropout？Dropout是一种正则化技术，由Hinton和他的学生在2012年提出。它通过在训练过程中随机“丢弃”（即暂时移除）网络中的一些神经元
模型保存与加载：PyTorch中的实践指南冰蓝蓝自然语言处理 pytorch 人工智能 python
在深度学习项目中，模型的保存和加载是一个至关重要的步骤。它不仅有助于在训练过程中保存进度，还可以在训练完成后部署模型。PyTorch提供了灵活的方式来保存和加载模型，本文将详细介绍这些方法。模型保存在PyTorch中，有两种主要的模型保存方法：保存整个模型和仅保存模型参数。保存整个模型保存整个模型意味着保存模型的结构和参数。这种方法简单直接，但文件体积较大，且依赖于模型的具体实现。importto
深度学习中的注意力机制：解锁智能模型的新视角冰蓝蓝深度学习深度学习人工智能
在人工智能的快速发展中，深度学习模型已经成为了处理复杂数据和任务的主力军。然而，随着数据量的激增和任务的复杂化，传统的深度学习模型面临着效率和性能的双重挑战。在这样的背景下，注意力机制（AttentionMechanism）应运而生，它不仅提升了模型的处理能力，还为深度学习领域带来了新的研究视角。什么是注意力机制？注意力机制是一种受人类视觉注意力启发的技术，它允许模型在处理大量信息时，能够动态地聚
torch.unsqueeze：灵活调整张量维度的利器冰蓝蓝 transformer transformer 深度学习
在深度学习框架PyTorch中，张量（Tensor）是最基本的数据结构，它类似于NumPy中的数组，但可以在GPU上运行。在日常的深度学习编程中，我们经常需要调整张量的维度以适应不同的操作和层。torch.unsqueeze函数就是PyTorch提供的一个非常有用的工具，用于在指定位置增加张量的维度。本文将详细介绍torch.unsqueeze的用法和一些实际应用场景。什么是torch.unsqu
Python在生物信息学中的应用：基因组学与蛋白质组学 PyTechShare Python教程-基础 python
摘要：本文主要介绍了Python在生物信息学中的应用，特别是在基因组学和蛋白质组学领域。文章详细讲述了各个原理，并以代码实例展示了实际应用。我们将探讨如何利用Python分析基因组数据，解析蛋白质序列，以及进行比对分析等。文章目录1.引言2.分析基因组数据2.1读取和解析FASTA文件2.2基因频率分析2.3代码实例3.蛋白质组学3.1解析蛋白质序列3.2蛋白质序列比对3.3代码实例4.总结1.引
40岁重启人生学python，今天搞明白了，啥是循环结构？飞哥知行录中年人 python 经验分享开发语言
今天学习了循环结构，其实说心里话，不是太明白，尤其是老师讲了那些高深的理论之后，就更加糊涂了。后来还是借助deepseek，它说：循环结构就是让计算机重复执行某段代码，直到满足特定条件（比如吃饱了就停止吃饭）。吃饱了就停止吃饭，多么简单的一句话，我一下就明白了，忽然觉得那些讲课喜欢高深理论的人，他们真的好可悲。总是抱着概念和教条的东西，不知道你们是怎么听明白的。循环结构的三种常见类型是`for循环
python基于django/flask网上书城系统Django-SpringBoot-php-Node.js-flask QQ_1963288475 python django flask spring boot php laravel node.js
目录技术栈介绍具体实现截图![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/7b88ca45e7124106a000075acaf2f4e8.png)系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情