景联文科技:为自动驾驶车载语音识别技术提供全方面的数据支持

随着车联网和智能汽车的兴起,越来越多的功能被搭载在汽车上。随着语音识别技术在智能车载领域落地应用越来越成熟,更多司机解放了双手,通过简单的语音指令就可以进行导航、听音乐、控制车窗和空调等设备。

景联文科技:为自动驾驶车载语音识别技术提供全方面的数据支持_第1张图片

 在前不久刚刚举办的华为夏季旗舰新品发布会上出现了汽车作为压轴产品的发布,即AITO品牌的第二款车型——问界M7,Harmony OS智能座舱配备了一个更加智能的语音助手“小艺”。它不但能够实现60秒连续对话,期间不需要额外唤醒,还可分别根据声音来源,识别主驾、副驾和后排的指令。并且为了照顾部分地区的用户,未来小艺还将支持粤语和四川话两种语言命令,解决方言难题。

虽然作为新车标配的车载语音交互在近年来已经取得了很大的发展,但还有很多技术问题可以进行完善和提升。

在现实生活中,智能车载场景中的语音识别会受到各种车内外噪音的干扰,如车内的发动机声、空调声,车外的风声、音乐声等。为了降低噪音对车载语音识别的干扰,众多AI企业开始致力于训练数据的开发和技术的升级,研发出可以排除噪音影响的车载语音系统。使车载语音系统可以在车内外噪音嘈杂的环境中准确识别用户的语音指令。

车载语音识别成功“去噪”的关键在于使用大量车载语音数据用于AI模型的训练和调优,不断训练其语音识别能力。

景联文科技支持车载环境语音数据,覆盖多种车型、天气、道路类型、多种方言及噪音背景语音数据集采集。

针对车载环境语音采集数据量大,工时短的特点景联文科技配备3年以上语音采集项目管理经验的项目经理和多人采集团队,严格控制关键时间节点为满足多种音质需求,景联文科技购置各式多种规格类型的录音设备;针对录制时十几个麦克风同时运行,设备容易出现问题的情况,景联文科技对采集人员进行严格培训,一旦发现录音问题就直接叫停相关人员,重新录制,尽可能缩短时间;由于采集规则对地域口音多样性较高,需要在全国范围内建立采集渠道景联文科技针构建全国27个省市直辖市的数据采集资源网络,及时反馈采集过程遇到的问题并准备多个解决方案。

景联文科技:为自动驾驶车载语音识别技术提供全方面的数据支持_第2张图片

 景联文还提供《800小时麦克风手机采集车载噪音数据》、《1000小时粤语语音采集数据》、《1000小时四川语音采集数据》、《1000小时英语语音采集数据集》、《600小时远场语音数据集》等,为人工智能公司提供算法训练数据支持。

除此之外,景联文支持车载语音采集、粤语采集、四川话采集、多语种采集等;培养了930人的全职标注团队,针对数据定制标注服务建立了先进的数据标注平台,支持语音切割、ASR语音转写、语音情绪判定、声纹识别标注等;大力优化标注平台实现Al数据的全生命周期管理和供应链管理,项目协同,AI人机协同,自定义权限的数据处理能力,将数据处理效率提升8倍以上,赋予AI企业快速处理大规模感知数据的能力;平台拥有实时量化的可视化管理系统,包括数据集管理、项目管理、人员管理、供应链管理等内容;拥有全面的质检流程,能够有效提高人机协作效率,扩大产能,及时调整标注方案,做好逾期风险管控,准确把控数据质量问题;对全职采标团队建立完善的人员培训、管理体系,推出整套AI产业人才培养解决方案,分别开通理论课程、实训课程、结业考试等培养项目,通过理论与实践相结合为行业输送高素质数据采集标注员,推动人工智能在更多垂直场景实现落地应用。

景联文科技严格保障数据质量,总高质量的训练数据助力自动驾驶AI模型更加准确,创造出更加安全的驾乘体验。

你可能感兴趣的:(数据标注,数据采集,语音识别,人工智能)