谷歌和微软的ASR的差异和特点

      为满足海外客户的业务需求,目前天天讯通的AI机器人系统正在对接谷歌和微软的ASR,目前微软的开发进入尾声了。

       这两家是国际上知名的ASR厂商了,当然还有亚马逊、IBM等,之所以选择这两家来对接测试,主要也是海外的客户给我们提供的建议,毕竟这个客户以前就是在海外从事思科、Avaya的技术大牛。

       那今天跟大家说说谷歌和微软的ASR各自有什么不同和他们的特点。

       一、对接过程的不同:

1. API风格:

        Google Cloud使用REST和gRPC两种API风格,开发者可以根据需求选择相应的接入方式。

Microsoft Azure提供了一系列的SDKs,可用于多种编程语言和平台,带来了可能性的灵活性,以及对不同客户端应用程序的原生支持。

2.认证方式:

         Google Cloud通常使用OAuth 2.0协议进行身份验证和授权。

         Microsoft Azure使用Azure Active Directory进行身份验证,并且提供了一系列的安全性和认证选项。

3.文档和支持:

         Google和Microsoft都提供了详细的文档和开发者指南,但他们的社区支持、教程和案例研究就会有所不同。

       二、特点以及优劣:

1.语种支持:

        Google Cloud Speech-to-Text支持120多种语言和方言,适合需要支持多种语言的全球化应用。

        Microsoft Azure Speech也支持多种语言,但可能在某些语种或方言上不如Google全面。

2. 实时识别能力:

        Google支持实时语音识别,其流式传输功能可以即时转写长时间的语音。

        Microsoft Azure同样支持实时转写,并提供了对实时、互动式会话场景的优化。

3. 准确性和识别性能:

        准确性方面,两者都基于先进的深度学习模型,但在不同的用例和数据集上的表现可能会有所不同。

        客户需要自行测试以确定哪个服务更适合特定的应用和语言。

4.价格:

        Google和Microsoft的定价模型可能存在差异,例如按请求次数或音频长度计费,这可能会影响到成本考虑。

        还需要考虑免费层额度和价格随使用量增加的折扣。

5. 自定义模型:

        Google允许开发者通过上传特定领域的文本数据来训练自定义模型。

        Microsoft也提供了类似的Custom Speech服务,允许开发者优化识别准确性,特别是针对特定词汇和噪音环境。

6. 集成和生态系统:

        集成到现有的Google Cloud或Microsoft Azure的服务和工具可能更加方便些,因为这两家公司都提供了比较完善的云服务生态系统。

你可能感兴趣的:(microsoft,人工智能,语音识别,大数据,机器人)