汉语拼音标注,汉字加拼音

现状:可以用WORD中的拼音指南解决,但是拼音指南一次性只能标注30个字。

思路:找到汉字库,自己做一个工具

需要数据

1、汉字库

2、汉字拼音对应库

3、多音字库,由于多音字没有规律,但是一般有优先次序,比如都字常规念dou,在都市中念du,大都会,念du;

存在困难

多音字组词库网上找不到,初步搜了一下,高质量的要收费,比如海天瑞生。

一般的免费,但是数据不全。

解决途径

1、初步建立多音字库。

2、通过大量文本,识别多音词库,人工建立

猜测一下语音转汉字怎么转的:建立词语库,通过词语库来解决发音问题;

难和易的转换,汉字和英语的几个回合

回合 对比 英语 汉语
第1回合 书写 容易
第2回合 单词数量
第3回合 单词增加 极少
第4回合 学习难度 容易
第5回合 文字库大小
第6回合 语音库大小
第7回合 组词库
第8回合 语音识别 简单 复杂

以前的语音库来说,中文相对是简单的,倒过来就难很多了。

到了人工智能时代,语音识别中文太难了,主要是没有公开的词库。 

你可能感兴趣的:(大数据)