如何将你的AI算法迅速分享给别人,让对方体验,一直是一件麻烦事儿。
首先大部分人都是在本地跑代码,让别人使用你的模型,以往有这三种方案:
上github
将代码打包或者封装成docker后,用QQ/百度云/U盘传输
学习前后端知识,写个前端界面,买个域名,用flask这样微服务框架快速部署,看情况结合一下内网穿透。
这些方案的问题在于——前两者需要对方会编程会配置环境(还得愿意),我们的分享对象满足这个条件的寥寥无几;后者则需要你这个算法工程师升级成全栈,学习前后端开发,学习成本太高。
总结起来:场景不匹配,需求不契合,费时又费力!
那么有没有更好的解决方案呢?有!它就是我今天要给大家安利的一个python开源库:Gradio。
Gradio是MIT的开源项目,GitHub 2k+ star。
使用gradio,只需在原有的代码中增加几行,就能自动化生成交互式web页面,并支持多种输入输出格式,比如图像分类中的图>>标签,超分辨率中的图>>图等。
同时还支持生成能外部网络访问的链接,能够迅速让你的朋友,同事体验你的算法。
总结起来,它的优势有:
自动生成页面且可交互
改动几行代码就能完成
支持自定义多种输入输出
支持生成可外部访问的链接进行分享
目前已经有很多优秀的开源项目使用Gradio做demo页面。那么该怎么使用Gradio,让我们一起来玩玩~
pip install gradio
import gradio as gr
import cv2
def to_black(image):
output = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
return output
interface = gr.Interface(fn=to_black, inputs="image", outputs="image")
interface.launch()
gradio的核心是它的gr.Interface
函数,用来构建可视化界面。
fn:放你用来处理的函数
inputs:写你的输入类型,这里输入的是图像,所以是"image"
outputs:写你的输出类型,这里输出的是图像,所以是"image"
最后我们用interface.lauch()
把页面一发布,一个本地静态交互页面就完成了!
在浏览器输入http://127.0.0.1:7860/
,查收你的页面:
上传一张图片,点击「SUBMIT」,大功告成。
对于任何图像处理类的ML代码来说,只要定义好一个图像输入>>模型推理>>返回图片的函数(逻辑和RGB转灰度图本质上没区别),放到fn
中,就完事了。
我们可以在页面下方添加供用户选择的测试样例。
在gr.Interface
里的examples
中放入图片路径,格式为[[路径1],[路径2],…]。
import gradio as gr
import cv2
def to_black(image):
output = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
return output
interface = gr.Interface(fn=to_black, inputs="image", outputs="image")
interface.launch()
增加example不仅能让你的UI界面更美观,逻辑更完善,也有一些其他意义:
当然example建议选择效果最好的图,原因和写论文选best case一样(大雾)。
创建外部访问链接非常简单,只需要launch(share=True)
即可,在打印信息中会看到你的外部访问链接。
免费用户的链接可以使用24小时,想要长期的话需要在gradio官方购买云服务。
import gradio as gr
import torch
from torchvision import transforms
import requests
from PIL import Image
model = torch.hub.load('pytorch/vision:v0.6.0', 'resnet18', pretrained=True).eval()
# Download human-readable labels for ImageNet.
response = requests.get("https://git.io/JJkYN")
labels = response.text.split("\n")
def predict(inp):
inp = Image.fromarray(inp.astype('uint8'), 'RGB')
inp = transforms.ToTensor()(inp).unsqueeze(0)
with torch.no_grad():
prediction = torch.nn.functional.softmax(model(inp)[0], dim=0)
return {labels[i]: float(prediction[i]) for i in range(1000)}
inputs = gr.inputs.Image()
outputs = gr.outputs.Label(num_top_classes=3)
gr.Interface(fn=predict, inputs=inputs, outputs=outputs).launch()
图像分类任务是机器学习经典任务。上面我们在outputs中设置了gr.outputs.Label(num_top_classes=3)
,这是Gradio中专为图像分类展示类标定制的函数.
修改inputs和outputs的组合,总能找到适合你的算法的那一个。
ps:不得不说imagenet的类标真细
Gradio的最大的价值我认为是缩短了算法与应用的距离,人人都能迅速分享与体验项目成果,这不管在同事交流,项目汇报,甚至是同学吹牛(大雾),都性感多了。
同时,作为一个python库,不论是ML,还是数据分析,图像处理,甚至做一个视频转gif的小工具(自媒体老哥表示很有用),都能适用。
你还在发愁怎么做大作业PPT汇报吗?不如试试Gradio。
Gradio官网:https://www.gradio.app/
Gradio官方文档:https://gradio.app/docs
使用Gradio的项目「Anime2Sketch」:https://www.gradio.app/hub/AK391/Anime2Sketch