Face Alignment at 3000 FPS via Regressing Local Binary Features

前几天看了下Face Alignment by Explicit Shape Regression(ESR)的代码,今天再看3000FPS,发现好多地方都是复用的ESR代码。感觉3000FPS在ESR上的最大改动就是将手动设计的Shape-indexed features,再通过Random Forest 生成新的特征,扩大了特征的数量。不过记得看过Facebook的GBDT+LR做CTR预估的论文,感觉生成特征用GBDT是不是会更好些。
3000FPS比ESR好的另外一处是,每次迭代之后缩小特征生成的范围,这样可以有效的防止位置跑偏。看了一下代码,感觉速度上应该会比ESR慢才对吧,不知道怎么能到3000,可能作者有优化吧。
简单写几句自己的理解,如果有不对的地方请指正。

你可能感兴趣的:(alignment,人脸识别)