Tensorflow Rust实战下篇[整合actix-web提供http服务]

上一篇我写的文章Tensorflow Rust实战上篇. 这一次我们看看使用tensorflow建立了什么,并通过http接口提供服务。随着Actix Web1.0版本发布,我认为用它构建一些东西将是一个很好的时机。

本文假设您对Futures及其运作方式有一定的了解。我将尽量用更简单的术语解释,但理解Futures生态系统将非常有效地帮助阅读本文。为此,我建议你从tokio开始。

有些人建议在深入Futures之前等待async/await和friends功能发布。我认为你现在应该亲自动手:异步编程总是很有挑战性。

再一次为了不耐烦的人,您可以在actix-web分支上找到参考代码:
https://github.com/cetra3/mtc...

一、API定义

这里的API非常简单。我们想模仿我们在命令行上所做的事情:提交一张图片,返回结果是一张图片。为了使事情变得有趣,我们将提供一种方式:将边界框以JSON数组返回。

关于通过http协议提交二进制数据,我首先想到了几种选择:

  • 只需提交原始数据即可
  • 使用multipart/form-data
  • 序列化为JSON格式提交

我认为最简单是原始数据,所以让我们这样做! multipart/form-data可能ok,但是你必须处理多个图像的时候呢? JSON格式似乎有点浪费,因为您不可避免地必须使用base64或类似的方式转换二进制数据。

所以我们的API是这样的:

  • 提交POST请求作为原始文件提交
  • 运行会话,通过MTCNN算法以提取人脸
  • 将边界框作以JSON格式返回;或者命令行示例一样,将图像叠加以JPEG格式返回。

二、MTCNN的结构体(struct)

在我们上一篇博客中,我们只是简单地使用main函数来执行所有操作,但我们必须一些重构才能与actix一起使用。我们希望将MTCNN行为封装为结构,可以传递和转移。最终目标是在应用程序状态下使用它。

2.1结构体(struct)定义

让我们将结构包含我们想要的一切:

  • 图片
  • 会话
  • 一些多个请求中共用的Tensor框架的输入参数

首先,我们创建一个新文件mtcnn.rs并加上结构体定义。

use tensorflow::{Graph, Session, Tensor};

pub struct Mtcnn {
    graph: Graph,
    session: Session,
    min_size: Tensor,
    thresholds: Tensor,
    factor: Tensor
}

然后,现在我们只是用new方法填充初始化内容。由于其中一些值的初始化并非绝对可靠,我们将返回Result:

pub fn new() -> Result> {

    let model = include_bytes!("mtcnn.pb");

    let mut graph = Graph::new();
    graph.import_graph_def(&*model, &ImportGraphDefOptions::new())?;

    let session = Session::new(&SessionOptions::new(), &graph)?;

    let min_size = Tensor::new(&[]).with_values(&[40f32])?;
    let thresholds = Tensor::new(&[3]).with_values(&[0.6f32, 0.7f32, 0.7f32])?;
    let factor = Tensor::new(&[]).with_values(&[0.709f32])?;

    Ok(Self {
        graph,
        session,
        min_size,
        thresholds,
        factor
    })

}

2.2Run方法

我将在这里开始加快节奏,所以如果你遇到困难或不确定发生了什么,请查看 Tensorflow Rust实战上篇,以解释这里发生的事情。

我们已经添加了所有需要跑一个会话的东西。让我们创建一个需要API做什么的方法:提交一张图片,响应一些边界框(框出人脸的位置):

pub fn run(&self, img: &DynamicImage) -> Result, Status> {
    ...
}

再一次,我们响应了一个Result类型,因为在某些情况下run方法会失败。我们使用Status类型来表示响应错误的类型。

像我们先前的main方法,我们需要压平图片的输入:

let input = {
    let mut flattened: Vec = Vec::new();

    for (_x, _y, rgb) in img.pixels() {
        flattened.push(rgb[2] as f32);
        flattened.push(rgb[1] as f32);
        flattened.push(rgb[0] as f32);
    }

    Tensor::new(&[img.height() as u64, img.width() as u64, 3])
        .with_values(&flattened)?
};

然后我们将提供所有相关输入。这与我们之前的main方法相同,但我们只是从self中借用值,而不是为每次运行创建它们:

let mut args = SessionRunArgs::new();

args.add_feed(
    &self.graph.operation_by_name_required("min_size")?,
    0,
    &self.min_size,
);
args.add_feed(
    &self.graph.operation_by_name_required("thresholds")?,
    0,
    &self.thresholds,
);
args.add_feed(
    &self.graph.operation_by_name_required("factor")?,
    0,
    &self.factor,
);
args.add_feed(&self.graph.operation_by_name_required("input")?, 0, &input);

接下来,我们抓住我们想要的输出:

let bbox = args.request_fetch(&self.graph.operation_by_name_required("box")?, 0);
let prob = args.request_fetch(&self.graph.operation_by_name_required("prob")?, 0);

2.3会话(running in session)

现在我们设置了所有参数,我们可以跑session了:

&self.session.run(&mut args)?;

噢哦!我们得到一个编译器错误:

error[E0596]: cannot borrow `self.session` as mutable, as it is behind a `&` reference
  --> src/mtcnn.rs:68:10
   |
36 |     pub fn run(&self, img: &DynamicImage) -> Result> {
   |                ----- help: consider changing this to be a mutable reference: `&mut self`
...
68 |         &self.session.run(&mut args)?;
   |          ^^^^^^^^^^^^ `self` is a `&` reference, so the data it refers to cannot be borrowed as mutable

事实证明,Session::run()方法采用&mut self。我们可以做些什么来解决这个问题:

  • 使我们的run方法拿到 &mut self
  • 做一些棘手的内部可变性
  • 提交issue给tensorflow-rust crate,看看Session是否真的需要&mut self

我们选择了第三种方式!
更新你的 Cargo.toml,指定git而不是cargo里的crate版本号:

tensorflow = { git = "https://github.com/tensorflow/rust"}

2.4获取边界框(人脸位置)

自从我们的main方法以来,这一点都没有改变。我们获取边界框,将它们放入我们的BBox结构中:

//Our bounding box extents
let bbox_res: Tensor = args.fetch(bbox)?;
//Our facial probability
let prob_res: Tensor = args.fetch(prob)?;

//Let's store the results as a Vec
let mut bboxes = Vec::new();

let mut i = 0;
let mut j = 0;

//While we have responses, iterate through
while i < bbox_res.len() {
    //Add in the 4 floats from the `bbox_res` array.
    //Notice the y1, x1, etc.. is ordered differently to our struct definition.
    bboxes.push(BBox {
        y1: bbox_res[i],
        x1: bbox_res[i + 1],
        y2: bbox_res[i + 2],
        x2: bbox_res[i + 3],
        prob: prob_res[j], // Add in the facial probability
    });

    //Step `i` ahead by 4.
    i += 4;
    //Step `i` ahead by 1.
    j += 1;
}

debug!("BBox Length: {}, BBoxes:{:#?}", bboxes.len(), bboxes);

Ok(bboxes)

到此,我们的run方法完成了。

2.5BBox结构的JSON格式

我们打算响应代表BBox结构体的JSON,所以添加serde_derive中的Serialize(序列化相关模块):

use serde_derive::Serialize;

#[derive(Copy, Clone, Debug, Serialize)]
pub struct BBox {
    pub x1: f32,
    pub y1: f32,
    pub x2: f32,
    pub y2: f32,
    pub prob: f32,
}

2.6绘制输出的图片

我们将要添加一个方法,输入一张图片和一个边界框数组,响应输出的图片:

pub fn overlay(img: &DynamicImage, bboxes: &Vec) -> DynamicImage

这里也没有多大的变化,只是响应了一张图片而不是保存一个文件:

//Let's clone the input image
let mut output_image = img.clone();

//Iterate through all bounding boxes
for bbox in bboxes {
    //Create a `Rect` from the bounding box.
    let rect = Rect::at(bbox.x1 as i32, bbox.y1 as i32)
        .of_size((bbox.x2 - bbox.x1) as u32, (bbox.y2 - bbox.y1) as u32);

    //Draw a green line around the bounding box
    draw_hollow_rect_mut(&mut output_image, rect, LINE_COLOUR);
}

output_image

好的,我们已经完成了我们的Mtcnn结构体和方法!我们可以进一步吗?是的,绝对可以!但就目前而言,我认为这就是我们所需要的。我们已经封装了行为并创建了一个很好用的几个函数。

三、新main方法

我们不再将它用作命令行程序,而是用作自托管的Web应用程序。因为我们不再有输入和输出文件,所以我们需要更改应用程序所需的参数。
我认为我们最初应该拿到的唯一参数是监听地址,即使这样我们也应该使用合理的默认值。所以让我们通过structopt的帮助来制作这个非常小的demo:

#[derive(StructOpt)]
struct Opt {
    #[structopt(
        short = "l",
        long = "listen",
        help = "Listen Address",
        default_value = "127.0.0.1:8000"
    )]
    listen: String,
}

3.1日志框架

Actix Web使用log crate来显示errors和debug message。
让我们使用log替代println!。我喜欢使用pretty_env_logger,因为它将不同的级别打印为不同的颜色,并且我们可以使用有用的时间戳。
pretty_env_logger仍然使用环境变量。那就让我们设置环境变量RUST_LOG,然后启动我们的logger。

//Set the `RUST_LOG` var if none is provided
if env::var("RUST_LOG").is_err() {
    env::set_var("RUST_LOG", "mtcnn=DEBUG,actix_web=DEBUG");
}

//Create a timestamped logger
pretty_env_logger::init_timed();

这为我们的app和actix web设置了DEBUG级别日志,但允许我们通过环境变量更改日志级别。

四、Actix and 状态(State)

我们需要将一些状态传递给actix使用:Mtcnn结构体和run方法。你可以通过多种方式传递状态提供actix,但最简单的方法应该是App::data方法。当我们正在进入一个多线程世界时,我们将不得不考虑Send/Sync。

好的,那么我们如何在线程之间分享数据呢?好吧,作为第一步,我会看看std::sync。由于我们知道mtcnn的run函数不需要可变引用,只需要不可变self引用,我们可以将它包装在Arc中。如果我们不得不使用可变引用,那么可能也需要Mutex,但是如果我们使用tensorflow-rust的主分支,可以避免这种情况。

那么让我们创建一个Arc:

let mtcnn = Arc::new(Mtcnn::new()?);

现在可以实例化服务:

HttpServer::new(move || {
    App::new()
        //Add in our mtcnn struct, we clone the reference for each worker thread
        .data(mtcnn.clone())
        //Add in a logger to see the requests coming through
        .wrap(middleware::Logger::default())
        // Add in some routes here
        .service(
            ...
        )
})
.bind(&opt.listen)? // Use the listener from the command arguments
.run()

总结一下我们已完成的事情:

  • 首先构建一个HttpServer
  • 这需要一个返回App的闭包。此App是为每个http服务器运行的线程实例化的
  • 使用data方法添加Arc,并为每个线程侦听器clone它
  • 添加了一个日志框架
  • 用service方法设置了一些route
  • bind到一个监听地址并运行

五、处理请求

Actix Web是一个异步框架,使用tokio。我们的function是同步,需要一些时间才能处理完成。换句话说,我们的请求是阻塞的。我们可以混合使用同步和异步,当然,处理起来有点麻烦。

5.1方法定义与提取器(Extractors)

Actix 1.0大量使用Extractors,Extractors为方法定义提供完全不同形式。您指定希望接口接收的内容,actix将为您进行串联起来。请注意:这确实意味着在运行之前不能发现错误。我在web::Data参数中使用了错误的类型签名时的一个示例。

那么我们需要从我们的请求中提取什么?request body的bytes和mtcnn:

fn handle_request(
    stream: web::Payload,
    mtcnn: web::Data>,
) -> impl Future {

    ...

}

我们将在mtcnn中使用这种类型(web::Data>),因此让我们为它创建一个类型别名:

type WebMtcnn = web::Data>;

六、从Payload中获取图像

注:这里的payload指的是http请求中header后面的部分。

我们需要一种从payload中检索图像并返回Future的方法。 web::Payload结构体实现了Stream将Item设置为Bytes。

从流中获得单个字节是没有意义的,我们想要获得整个批次并对图像进行解码!因此,让我们将Stream转换为Future,并将我们将要获得的所有单个字节合并到一个大的字节桶中。听起来很复杂,但幸运的是Stream有一个方法:concat2。

concat2是一个非常强大的组合器,它允许我们将单个Stream轮询的结果加入到一个集合中,如果该项实现了Extend(以及一些其它的trait),Bytes就会支持扩展。

因此就像这样:

stream.concat2().and_then(....)

6.1图像解码 和 web::block

我们需要解决的第二件事是:如果我们要解码出图像,那么会阻止线程直到解码完成。如果它是一个巨大的图像,它可能需要几毫秒!因此,我们希望确保在发生这种情况时我们不会发生阻塞。幸运的是,actix web有一种方法可以将阻塞代码包装为future:

stream.concat2().and_then(move |bytes| {
    web::block(move || {
        image::load_from_memory(&bytes)
    })
})

我们采用stream,将其转换为 future 和 bytes,然后使用 web::block 将字节解码为后台线程中的图像并返回结果。load_from_memory 函数返回了一个Result,这意味着我们可以将其用作返回类型。

6.2平衡错误类型

因此,我们的 Item 被转换为 Bytes 再到 DynamicImage,但我们还没有处理错误类型,无法编译通过。我们的错误类型应该是什么?让我们使用 actix_web::Error 作为 ActixError:

use actix_web::{Error as ActixError}

fn get_image(stream: web::Payload) -> impl Future {
    stream.concat2().and_then(move |bytes| {
        web::block(move || {
            image::load_from_memory(&bytes)
        })
    })
}

好吧,当我们尝试编译时,出现了错误:

error[E0271]: type mismatch resolving `::Error == actix_http::error::PayloadError`
  --> src/main.rs:67:22
   |
67 |     stream.concat2().and_then(move |bytes| {
   |                      ^^^^^^^^ expected enum `actix_threadpool::BlockingError`, found enum `actix_http::error::PayloadError`
   |
   = note: expected type `actix_threadpool::BlockingError`
              found type `actix_http::error::PayloadError`
              
还有一些未列出的内容...

当您组合 stream 时,将它们映射为 future,以及尝试从这些组合器获得一些输出时,您实际上处理的是Item类型 和 Error类型 。
处理多种类型的响应结果会使代码变得丑陋,这里不像 Result类型可以使用问号(?)自动调整到正确的错误。当 ops::Try 和 async/await语法变得稳定的时候,事情可能变得简单,但是现在,我们必须想办法处理这些错误类型。

我们可以使用 from_err() 方法。作用跟问号(?)基本相同,区别是from_err作用于future。我们有两个正在处理的future:来自stream的字节数组 和 来自阻塞闭包的图像。我们有3种错误类型:the Payload error, the Image load from memory error, and the blocking error:

fn get_image(stream: web::Payload)
  -> impl Future {
    stream.concat2().from_err().and_then(move |bytes| {
        web::block(move || {
            image::load_from_memory(&bytes)
        }).from_err()
    })
}

七、从图像中获得边界框

最重要的是,我们需要run起来:

mtcnn.run(&img)

但是我们想要在一个线程池里跑起来:

web::block(|| mtcnn.run(&img))

让我们看看函数声明。至少我们需要图像和mtcnn结构体。然后我们想要返回BBox的Vec。我们保持错误类型相同,因此我们将使用ActixError类型。

函数声明如下:

fn get_bboxes(img: DynamicImage, mtcnn: WebMtcnn) 
  -> impl Future, Error = ActixError> 

我们需要在 web::block 上使用 from_err() 来转换错误类型,使用move来将图像提供给闭包:

fn get_bboxes(img: DynamicImage, mtcnn: WebMtcnn) -> impl Future, Error = ActixError> {
    web::block(move || mtcnn.run(&img)).from_err()
}

但还是会发生了编译错误:

error[E0277]: `*mut tensorflow_sys::TF_Status` cannot be sent between threads safely
  --> src/main.rs:75:5
   |
75 |     web::block(move || mtcnn.run(&img)).from_err()
   |     ^^^^^^^^^^ `*mut tensorflow_sys::TF_Status` cannot be sent between threads safely
   |
   = help: within `tensorflow::Status`, the trait `std::marker::Send` is not implemented for `*mut tensorflow_sys::TF_Status`
   = note: required because it appears within the type `tensorflow::Status`
   = note: required by `actix_web::web::block`

tensorflow::Status,它是错误类型,不能在线程之间发送。

快捷方式是将error转换成String:

fn get_bboxes(img: DynamicImage, mtcnn: WebMtcnn) -> impl Future, Error = ActixError> {
    web::block(move || mtcnn.run(&img).map_err(|e| e.to_string())).from_err()
}

因为String实现了Send,因此允许跨越线程间发送Result。

八、返回JSON对象 BBoxes

好的,我们有2个函数,一个用于从请求中获取图像,另一个用于获取边界框。我们要返回回json HttpResponse:

fn return_bboxes(
    stream: web::Payload,
    mtcnn: WebMtcnn,
) -> impl Future {
    // Get the image from the input stream
    get_image(stream) 
        // Get the bounding boxes from the image
        .and_then(move |img| get_bboxes(img, mtcnn)) 
        // Map the bounding boxes to a json HttpResponse
        .map(|bboxes| HttpResponse::Ok().json(bboxes))
}

接着,在App里添接口定义:

HttpServer::new(move || {
    App::new()
        .data(mtcnn.clone()) 
        .wrap(middleware::Logger::default()) 
        // our new API service
        .service(web::resource("/api/v1/bboxes").to_async(return_bboxes))
})
.bind(&opt.listen)?
.run()

run起来,用 curl 来提交一个请求:

$ curl --data-binary @rustfest.jpg  http://localhost:8000/api/v1/bboxes

[{"x1":471.4591,"y1":287.59888,"x2":495.3053,"y2":317.25327,"prob":0.9999908}....

使用 jmespath 来获取120张脸:

$ curl -s --data-binary @rustfest.jpg  http://localhost:8000/api/v1/bboxes | jp "length(@)"
120

九、返回叠加图像

我们想要的另一个API调用是返回一个覆盖了边界框的图像。 这不是一个很大的延伸,但在图像上绘制框肯定是一个阻塞动作,所以我们将其发送到线程池中运行。
让我们包装叠加函数,将其转换为future:

fn get_overlay(img: DynamicImage, bboxes: Vec)
   -> impl Future, Error = ActixError> {
    web::block(move || {
        let output_img = overlay(&img, &bboxes);
        
        ...

    }).from_err()
}

我们想要返回一个u8字节的Vec,这样我们就可以在返回体中使用它。 所以我们需要分配缓冲区并以JPEG格式写入:

let mut buffer = vec![];

output_img.write_to(&mut buffer, JPEG)?; // write out our buffer

Ok(buffer)

将目前为止的函数尝试编译一次:

fn get_overlay(img: DynamicImage, bboxes: Vec)
  -> impl Future, Error = ActixError> {
    web::block(move || {
        let output_img = overlay(&img, &bboxes);

        let mut buffer = Vec::new();

        output_img.write_to(&mut buffer, JPEG)?; // write out our buffer

        Ok(buffer)
    }).from_err()
}

还差一点, 我们缺少一个类型注解:

error[E0282]: type annotations needed
  --> src/main.rs:82:5
   |
82 |     web::block(move || {
   |     ^^^^^^^^^^ cannot infer type for `E`

为什么这里是类型问题?关联到这一行:

Ok(buffer) // What's the `Error` type here?

目前,唯一的错误类型来自write_to方法,即ImageError。 但是这一行没有错误类型,可能是任何东西。
我想到三种方法处理这个问题:

方法一:在web::block中声明错误

web::block::<_,_,ImageError>

这看上去有点凌乱,但可以编译通过。

方法二:使用 as 声明 Result 类型:

Ok(buffer) as Result<_, ImageError>

方法三:使用map在成功时返回一个buffer:

output_img.write_to(&mut buffer, JPEG).map(|_| buffer)

我认为为了可读性,#2可能是最简单的。 web::block函数需要3个类型的参数,这些参数在第一次阅读代码时可能会引起混淆。 #3也不错,但我觉得它看起来有点奇怪。

最终我的选择:

fn get_overlay(img: DynamicImage, bboxes: Vec)
   -> impl Future, Error = ActixError> {
    web::block(move || {
        let output_img = overlay(&img, &bboxes);

        let mut buffer = Vec::new();

        output_img.write_to(&mut buffer, JPEG)?;

        // Type annotations required for the `web::block`
        Ok(buffer) as Result<_, ImageError> 
    }).from_err()
}

9.1API调用

好的,我们拥有了一些返回future的方法,future返回边界框和叠加图像。 让我们将它们拼接在一起并返回一个HttpResponse:

fn return_overlay(
    stream: web::Payload,
    mtcnn: WebMtcnn,
) -> impl Future {
    //... magic happens here
}

第一步是从字节流中获取图像:

get_image(stream)

然后我们想要获取边界框:

get_image(stream).and_then(move |img| {
    get_bboxes(img, mtcnn)
})

9.2如何使用image对象

现在我们想要获得叠加图像。 我们有一个问题,如何使用image? get_bboxes返回future的图像,然后计算image上的人脸返回一个边界框数组。 这里有几个选择。 当我们将image传递给get_bboxes时,我们可以克隆image,但这会发生内存拷贝。 我们可以等待 Pin 和 async/await 语法完成,然后可能更容易处理它。
或者我们可以调整我们的get_bboxes方法:

fn get_bboxes(
    img: DynamicImage,
    mtcnn: WebMtcnn,
) -> impl Future), Error = ActixError> {
    web::block(move || {
        mtcnn
            .run(&img)
            .map_err(|e| e.to_string())
            //Return both the image and the bounding boxes
            .map(|bboxes| (img, bboxes))
    })
    .from_err()
}

记录把 return_bboxes 方法也修改了:

fn return_bboxes(
    stream: web::Payload,
    mtcnn: WebMtcnn,
) -> impl Future {
    get_image(stream)
        .and_then(move |img| get_bboxes(img, mtcnn))
        .map(|(_img, bboxes)| HttpResponse::Ok().json(bboxes))
}

9.3获取叠加层

如果rust可以将元组变成命令参数,那就太好了。 不幸的是不适合我们,所以我们需要创建一个闭包:

//Create our image overlay
.and_then(|(img, bbox)| get_overlay(img, bbox))
.map(|buffer| {
// Return a `HttpResponse` here
})

9.4创建响应

我们的 HttpResponse 需要将 buffer 包装到一个body:

HttpResponse::with_body(StatusCode::OK, buffer.into())

将 Content-Type设置为jpeg:

let mut response = HttpResponse::with_body(StatusCode::OK, buffer.into());

response
    .headers_mut()
    .insert(CONTENT_TYPE, HeaderValue::from_static("image/jpeg"));

获取叠加层的最终实现:

fn return_overlay(
    stream: web::Payload,
    mtcnn: WebMtcnn,
) -> impl Future {
    get_image(stream)
        .and_then(move |img| {
            get_bboxes(img, mtcnn)
        })
        .and_then(|(img, bbox) | get_overlay(img, bbox))
        .map(|buffer| {
            let mut response = HttpResponse::with_body(StatusCode::OK, buffer.into());
            response
                .headers_mut()
                .insert(CONTENT_TYPE, HeaderValue::from_static("image/jpeg"));
            response
        })
}

在App注册此接口:

HttpServer::new(move || {
    App::new()
        .data(mtcnn.clone()) //Add in our data handler
        //Add in a logger to see the requets coming through
        .wrap(middleware::Logger::default()) 
        //JSON bounding boxes
        .service(web::resource("/api/v1/bboxes").to_async(return_bboxes))
        //Image overlay
        .service(web::resource("/api/v1/overlay").to_async(return_overlay))
}

run一下:

$ curl --data-binary @rustfest.jpg  http://localhost:8000/api/v1/bboxes > output.jpg

结果:

十、总结

我们逐步将CLI应用程序转换为HTTP服务,并尝试了异步编程。如您所见,actix web是一个非常通用的Web框架。 我对它的兴趣来自于拥有构建Web应用程序所需的所有功能:多组件,线程池,高效率。虽然actix写异步还不是很优雅,但未来可期,因为我认为很多开发人员都在努力解决这个问题。

如果您正在寻找更多的actix示例,这个示例仓库是您最好的选择:https://github.com/actix/exam...

我期待看到社区未来的建设!

你可能感兴趣的:(tensorflow,rust,rust-lang)