原创文章,引用转载请注明作者出处。
针对上一篇博文--汉字转拼音的程序,我在这里写一下程序用的数据库。我显示从网上找了一个开源数据库,是cedit的,下载下来之后是txt文件,而且里面处理简体中文还有繁体中文,还有英语的翻译,原txt内容的部分截图如下:
所以要先对txt文件进行筛选,只留下简体汉字跟拼音,代码如下(WinDev语言,法文版)
MonBuffer est un Buffer
MonBuffer = fChargeTexte("C:\Users\stagiaire57\Desktop\Notes\BD_donne\cedit.txt")
MaChaîne est une chaîne UNICODE
MaChaîne = MonBuffer
nIDFichier est int= fOuvre("C:\Users\stagiaire57\Desktop\Notes\BD_donne\cedittestSimplifie.txt", foLectureEcriture)
i est un int=1
TANTQUE ExtraitLigne(MaChaîne,i)<> EOT //<>是不等于的意思,就是说只要不等边界付就继续执行,一旦等于就停止执行。
unechaine est une chaîne=ExtraitLigne(MaChaîne,i)
//sUneNouvelleChaine1 est une chaîne=ExtraitChaîne(unechaine,1," ",DepuisDébut)
sUneNouvelleChaine2 est une chaîne=ExtraitChaîne(unechaine,2," ",DepuisDébut)
sUneNouvelleChaine3 est une chaîne=ExtraitChaîne(unechaine,2,["[","]"," and "])
sUneNouvelleChaine4 est une chaîne=sUneNouvelleChaine2+TAB+sUneNouvelleChaine3
fEcritLigne(nIDFichier,sUneNouvelleChaine4)
i++
FIN
可以看出WinDev非常方便,几行代码就解决了可能其他语言要写一页的代码。处理后的txt文件如下:
那么现在大家可以清楚地看到,原始txt文件里面的拼音虽然有声调,但是都是用数组表示的,并没有真正的显示在字母上面,下面就是我的程序的新颖的地方,我把声调加在了相应的字母上面,然后再把数据放到数据库里面。代码如下:
PROCEDURE DetecterETchanger(UnPinyin):chaîne UNICODE
sChaineTest est une chaîne UNICODE=Milieu(UnPinyin,Taille(UnPinyin),1)
sLettreAremplace est une chaîne UNICODE=""
sLettreRemplace est une chaîne UNICODE=""
nTrouve est un entier=0
SI ChercherVoyelle(UnPinyin,"a")=Vrai ALORS
nTrouve=1
sLettreAremplace="a"
SELON sChaineTest
CAS "1"
sLettreRemplace="ā"
CAS "2"
sLettreRemplace="á"
CAS "3"
sLettreRemplace="ǎ"
CAS "4"
sLettreRemplace="à"
CAS "5"
sLettreRemplace="a"
AUTRE CAS
RENVOYER UnPinyin
FIN
FIN
SI nTrouve=0 _ET_ ChercherVoyelle(UnPinyin,"o")=Vrai ALORS
nTrouve=1
sLettreAremplace="o"
SELON sChaineTest
CAS "1"
sLettreRemplace="ō"
CAS "2"
sLettreRemplace="ó"
CAS "3"
sLettreRemplace="ǒ"
CAS "4"
sLettreRemplace="ò"
CAS "5"
sLettreRemplace="o"
AUTRE CAS
RENVOYER UnPinyin
FIN
FIN
SI nTrouve=0 _ET_ ChercherVoyelle(UnPinyin,"e")=Vrai ALORS
nTrouve=1
sLettreAremplace="e"
SELON sChaineTest
CAS "1"
sLettreRemplace="ē"
CAS "2"
sLettreRemplace="é"
CAS "3"
sLettreRemplace="ě"
CAS "4"
sLettreRemplace="è"
CAS "5"
sLettreRemplace="e"
AUTRE CAS
RENVOYER UnPinyin
FIN
FIN
SI nTrouve=0 _ET_ ChercherVoyelle(UnPinyin,"i")=Vrai ALORS
nTrouve=1
sLettreAremplace="i"
SELON sChaineTest
CAS "1"
sLettreRemplace="ī"
CAS "2"
sLettreRemplace="í"
CAS "3"
sLettreRemplace="ǐ"
CAS "4"
sLettreRemplace="ì"
CAS "5"
sLettreRemplace="i"
AUTRE CAS
RENVOYER UnPinyin
FIN
FIN
SI nTrouve=0 _ET_ ChercherVoyelle(UnPinyin,"u")=Vrai ALORS
nTrouve=1
sLettreAremplace="u"
SELON sChaineTest
CAS "1"
sLettreRemplace="ū"
CAS "2"
sLettreRemplace="ú"
CAS "3"
sLettreRemplace="ǔ"
CAS "4"
sLettreRemplace="ù"
CAS "5"
sLettreRemplace="u"
AUTRE CAS
RENVOYER UnPinyin
FIN
FIN
SI nTrouve=0 _ET_ ChercherVoyelle(UnPinyin,"v")=Vrai ALORS
nTrouve=1
sLettreAremplace="u:"
SELON sChaineTest
CAS "1"
sLettreRemplace="ǖ"
CAS "2"
sLettreRemplace="ǘ"
CAS "3"
sLettreRemplace="ǚ"
CAS "4"
sLettreRemplace="ǜ"
CAS "5"
sLettreRemplace="ü"
AUTRE CAS
RENVOYER UnPinyin
FIN
FIN
SI nTrouve=0 ALORS
RENVOYER UnPinyin
FIN
sUnPinyinRemplace est une chaîne UNICODE=Remplace(UnPinyin,sLettreAremplace,sLettreRemplace)
RENVOYER Milieu(sUnPinyinRemplace,1,Taille(sUnPinyinRemplace)-1)
PROCEDURE ChangerPinyinAccent()
MonBuffer est un Buffer
MonBuffer = fChargeTexte("C:\Users\stagiaire57\Desktop\PinyinTest.txt")
MaChaîne est une chaîne UNICODE
MaChaîne = MonBuffer
HOuvre(ChangerPinyin1)
i est un int=1
TANTQUE ExtraitLigne(MaChaîne,i)<> EOT
PinyinFinale est une chaîne UNICODE=""
unechaine est une chaîne=ExtraitLigne(MaChaîne,i)
ChangerPinyin1.Hanzi=ExtraitChaîne(unechaine,1,TAB)
PinyinInitiale est une chaîne UNICODE=ExtraitChaîne(unechaine,2,TAB)
numbre est un entier=1
BOUCLE
UnPinyin est une chaîne UNICODE=ExtraitChaîne(PinyinInitiale,numbre," ",DepuisDébut)
numbre++
SI UnPinyin=EOT ALORS SORTIR
PinyinFinale+=DetecterETchanger(UnPinyin)
SI ExtraitChaîne(PinyinInitiale,numbre," ",DepuisDébut)<>EOT ALORS PinyinFinale+=" "
FIN
ChangerPinyin1.Pinyin=PinyinFinale
HAjoute(ChangerPinyin1)
i++
FIN
PROCEDURE ChercherVoyelle(UnPinyin,lettre):booléen
i est un entier=1
longuerUnPinyin est un entier = Taille(UnPinyin)
SI lettre="v" ALORS
BOUCLE
chaineInstant est une chaîne UNICODE=Milieu(UnPinyin,i,1)
SI chaineInstant="u" ET Milieu(UnPinyin,i+1,1)=":"ALORS
RENVOYER Vrai
FIN
SI i=longuerUnPinyin ALORS
RENVOYER Faux
FIN
i++
FIN
FIN
SI lettre="u" ALORS
BOUCLE
chaineInstant est une chaîne UNICODE=Milieu(UnPinyin,i,1)
SI chaineInstant=lettre ET Milieu(UnPinyin,i+1,1)<>":" ALORS
RENVOYER Vrai
FIN
SI i=longuerUnPinyin ALORS
RENVOYER Faux
FIN
i++
FIN
FIN
BOUCLE
chaineInstant est une chaîne UNICODE=Milieu(UnPinyin,i,1)
SI chaineInstant=lettre ALORS
RENVOYER Vrai
FIN
SI i=longuerUnPinyin ALORS
RENVOYER Faux
FIN
i++
FIN
最终的数据库如下:
好了所有的数据库程序就这些,可以看出WinDev真的是一门很方便的语言,它的数据库是HyperSQL,但是这个语言也可以往其他的数据库中写数据。
下面我会把上一篇博文的法文版程序发出来,法文的程序功能还多一些,因为中文的程序是在法文的写好之后再写的。
希望文章对大家有帮助。