这位是广东仲恺毕业算法工程师。
曾在广州棒谷(跨境电商)工作,近期入职环球易购(跨境电商)
还记得上一篇文章中提及到当算法工程师发现导航的时间和实际时间有差异时会做什么吗?
没错,就是要调整其算法中的参数。
算法工程师都自嘲自己为调参师、调参狗、特征猪、指标奴。
这就和我们常常说的产品汪、运营喵、程序猿,是一样一样的。
算法工程师的工作流水帐
下面这部分的流水帐,不建议你们看,可直接路过看图。
从土黄色的Justin Ho开始,到黄色的数据异常及调参,则是整个算法工作的闭环。
这基本上是整个图像识别算法工程师,大致的工作流。
一句话:
定义问题-数据预处理(ETL/特征工程/特征筛选等)-模型评估-模型训练及优化-应用
举2个例子
假设
Eno想要买一个杯子
它是长成这样
打开淘宝拍照搜商品
哇!!!
有没有发现
发现11个点星星
组成星座图
自动识别出:相似马克杯/杯子
点击查看
一模一样
黑外壳
白内衬
大耳朵
Eno选了一家商店进行购买
交易新增量为1
过两天Eno老婆生日,之前其老婆在商场里看中了一条皮裤,大约是这样的。
淘宝扫描之后,是这样的
商品却是这样的
于是,Eno就默默的关闭了淘宝
交易新增量为0
交易新增量为0
这个背后,算法工程师们做了什么呢?
从上面可以看出,显然杯子的算法模型训练得非常杯,而皮裤的算法模型可能还需要进一步优化,是不是特征的筛选有问题,不过至少黑色这个特征是没有问题的。
本期内容就到这里,此次是以图像识别算法来举例,下期我们进行到第三个问题:算法工程师的分类等交易新增量为0
这个背后,算法工程师们做了什么呢?
从上面可以看出,显然杯子的算法模型训练得非常杯,而皮裤的算法模型可能还需要进一步优化,是不是特征的筛选有问题,不过至少黑色这个特征是没有问题的。
本期内容就到这里,此次是以图像识别算法来举例,下期我们进行到第三个问题:算法工程师的分类等
名词通俗解释
CV:
Compute Vision,计算机视觉,(这可不是HR眼中的那个CV哦)
关键节点信息:
还记得马克杯上的星座图式的点吗?其实我们知道整个图片都是由一个又一个图素组成,每个相素都是有坐标的。这些坐标,就是关键节点信息的一种。
RGB的色系,也是关键节点信息
特征工程:
获取关键节点信息的过程,就是特征工程
特征筛选:
将无关的关键节点信息删除,以免影响算法的结果。比如马克杯,如果其扫描出背景颜色的信息作为特征,可能会出现灰色的马克杯。
RCNN 目标检测技术
我们只要理解,将图片切割成不同的区域,然后将区域中的关键节点信息放入到CNN(卷积网络),再通过CNN进行判定,哪个部分是人。
CNN:
简单理解为,假设我们使用Photoshop做设计时,我们需要把不同的图片放在不同的图层。这样,我们可以把不相关的图层进行隐藏,做好目标图层的设计,再放其他部分放出来,这样我们可以更专注设计,而不会受其他图层的干扰。CNN,大致的意思也是类似的吧。
RESNET(CNN)残差网络
用一张图解释会比较好,柱状图是误差值。
ResNet 层次是152层,而之前的GoogleNet 才22 层,VGG才19层。(只是个名字)
一种误差更小的CNN模型。
1080P的视频为什么更清晰,480P的视频为什么会差一些,大致是因为像素差一些。
题外话
提出ResNet模型的人是一个中国人,何凯明。
2003年广东省高考理科状元,2007年清华本科,2011年香港中文大学博士。
其导师孙剑博士,旷视科技(Face++)首席科学家。
题目
特征工程和特征筛选,与HR领域的什么工作最相似?