前段时间一直在钻研深度学习中的卷积神经网络,其中的预处理环节可以说非常关键,主要就是对图片和视频进行处理。而图像处理就涉及到图形学和底层技术细节,这是一个比较精深和专业的领域,假设我们要从头开始做起,那简直太麻烦和低效了。为解决这个问题,openCV就此应运而生,它屏蔽了很多底层技术细节,抽象出方便的API,而我们只需要灵活组合相关的 api 就能实现强大的功能。
openCV有各种语言的版本,比较常用的是C++ 和Python,也有JavaScript版本,因为基于js可以更快的验证和查看效果,同时也是因为本人不太擅长C++和Python,真的是有了 js 这把锤子把什么问题都看成钉子了。当然前提是因为目前V8引擎和wasm性能足够强悍,很多轻量级的需求完全可以放在前端来完成。
安装Emscripten
openCV是基于C/C++的,我们要用js版本的openCV,需要做转换,这就需要Emscripten 这个编译器了。
Emscripten 是一个基于LLVM的编译器,可以将C/C++语言编译为JavaScript。我们按着官网步骤一步一步下载安装就好:
# Get the emsdk repo
git clone https://github.com/emscripten-core/emsdk.git
# Enter that directory
cd emsdk
# Fetch the latest version of the emsdk (not needed the first time you clone)
git pull
# Download and install the latest SDK tools.
./emsdk install latest
# Make the "latest" SDK "active" for the current user. (writes .emscripten file)
./emsdk activate latest
# Activate PATH and other environment variables in the current terminal
source ./emsdk_env.sh
下载openCV源码
安装完编译器,接着就是获取openCV的源码
git clone https://github.com/opencv/opencv.git
打包openCV.js
工具链和源码都准备完毕,最后一步还需要安装Python,步骤确实有点多,Python的安装就不提了,下载包安装或者homebrew安装都可以,我们直接看打包的命令吧,默认打包为asm,我们选webAssembly版本的,最后从build_wasm拷贝出opencv.js。
cd opencv #进入opencv目录
python ./platforms/js/build_js.py build_js # default asm
python ./platforms/js/build_js.py build_wasm --build_wasm # build wasm
运行openCV.js,cv 默认是一个Promise,因此需要异步才能获取出openCV全局对象。
这里只做最简单的操作,读取图片,转换灰度图,显示图片
矩阵操作,矩阵就是一个多维数组,而图片就是二维数组,这些基础操作我认为也是挺有用的。
const mat = new cv.Mat();// 默认矩阵
const mat = new cv.Mat(rows, cols, type);// 类型二维矩阵
const mat = new cv.Mat(rows, cols, type, new cv.Scalar());// 有初始值的类型二维矩阵
const mat = cv.Mat.zeros(rows, cols, type);//全部填充为0
const mat = cv.Mat.ones(rows, cols, type);//全部填充为1
const mat = cv.Mat.eye(rows, cols, type); //单位矩阵
const mat = cv.matFromArray(rows, cols, type, array);//由数组构建矩阵
const mat = cv.matFromImageData(imgData);//由图片构建矩阵
const dst = src.clone();//克隆
src.copyTo(dst, mask);//根据mask拷贝
cv.add(src1, src2, dst, mask, dtype);//矩阵相加
cv.subtract(src1, src2, dst, mask, dtype);//矩阵相减
cv.bitwise_and(roi, roi, imgBg, maskInv);//矩阵与运算
cv.bitwise_or(roi, roi, imgBg, maskInv);//矩阵或运算
cv.bitwise_xor(roi, roi, imgBg, maskInv);//矩阵异或运算
cv.bitwise_not(mask, maskInv);//矩阵非运算
数据结构类型,这个类型也可以了解一下
//点
const point = new cv.Point(x, y);
const point = {x: x, y: y};
//向量
let scalar = new cv.Scalar(R, G, B, Alpha);
let scalar = [R, G, B, Alpha];
//大小
const size = new cv.Size(width, height);
const size = {width : width, height : height};
//圆形
let circle = new cv.Circle(center, radius);
let circle = {center : center, radius : radius};
//矩形
let rect = new cv.Rect(x, y, width, height);
let rect = {x : x, y : y, width : width, height : height};
//旋转矩形
let rotatedRect = new cv.RotatedRect(center, size, angle);
let rotatedRect = {center : center, size : size, angle : angle};
打包构建出openCV.js,同时也学习了openCV相关的基础。后面我们就可以基于openCV做很多有趣的操作了,敬请期待。