9-2号应聘Rokid公司的面试

  今天面试了杭州一家公司,叫Rokid,是一家做只能机器人的公司。

  在面试官问到一个语音处理方面问题的时候,答得很不好,最后请教了面试官他们公司现有的算法思路,在这里简单记录下,应该不会造成算法泄露问题,面试官只是给我讲了一种很简单的聚类思路。

  问题描述:在公司现阶段(刚开始),没有很丰富的数据存储,所以就没法用“有监督学习”来训练模型处理这个问题。想一个其他思路。问题是这样:当用户向机器人发出指令后,机器人在后台检测到用户发出的指令具有二义性,怎么办?

  问题举例:

    用户:机器人,我要听十年

    机器人:十年是一首歌,还是一本有声电子书

  解决办法:在网上很丰富的百科网站上收集很多的文字语料。每次在机器人有二义性的时候,就将用户说的话,先进行中文分词,将每个词用向量表示,然后使用聚类算法,得到用户的真实意图

你可能感兴趣的:(其他)