准备做个魔镜(树莓派+HTK(或者Kaldi)+Opencv+apache)

想法来源

几年前就听过别人用树莓派做魔镜的想法,看了下别人的流程感觉挺不错的。不过那时候他们应该还没有完全实现,看来下演示应该只能简单的进行文字交流,不是很智能。现在这个已经是个开源项目,大家可以在下面这里看下详情。上次不小心在哪看到微软已经收购了这个项目,不知道是不是真的。
http://michaelteeuw.nl/post/111886383522/magic-mirrors-around-the-world

构想

根据上面的想法,想要弄个能真正进行人脸识别和语音交互的魔镜。所以现在的初步设想是

用树莓派或者其它的minipc+屏幕+半透射玻璃来作为产品的硬件外观。

其中人脸识别初步决定用开源opencv库来进行。

其中语音识别将初步决定用开源的HTK(或者Kaldi)来做。(语音识别刚接触所以还不确定用那个有把握)

界面布局的话准备用web来开发吧,所以还要用台好一点的主机来搭建apache服务器了。

学习计划

上面所有要用到的技术都只是简单有过涉及,所以所有技术都要从新学习哈。(已经很久没有专门从事程序开发了)
因为语音识别还没接触过,所以准备先从HTK入手,如果效果不理想再试试Kaldi。
然后是关于opencv的人脸识别,以前只用这个做过图像变换等等,并没有用到机器学习,这方面也要加强学习。
接下来当然是web界面和整个交互过程的确定。
最后是对整个玩具的组装和包装了。

虽然不知道最后能不能搞出来,但是重要的是学习各个部分的过程了,各部分学习中遇到的困难和经历将在其它文章里面总结出来。

你可能感兴趣的:(start)