作者:连玉君 (知乎 | 简书 | 码云)
Stata连享会 最新专题课程
适用于 stata15 用户。可以一次性对当前工作路径以及所有子文件夹中的文件进行转码(unicode),以保证中文字符可以正常显示。
2018/1/6 更新:
ua 命令已经被 SSC (help ssc
) 收录。ua
命令:ssc install ua, replace
ua.ado
和 ua.hlp
,放置于 D:\stata15\ado\base\u
或 D:\stata15\ado\plus\u
文件夹中。(下载地址:https://gitee.com/arlionn/ua)help ua
,查看命令介绍和 Stata 范例。参照范例使用即可。
* 改变当前工作路径(进入这个文件夹)
* change current working directory (CWD)
. cd "D:\stata15\ado\personal\mypaper"
* 对当前文件夹以及所有子文件夹中的所有文件进行转码
* Unicode all files (.do, .ado, .dta, .hlp, etc.) in CWD and files in sub-directories
. ua: unicode encoding set gb18030
. ua: unicode translate *
复制如下代码,每次使用时,选中如下三行,按快捷键 Ctrl+D
即可完成转码。你只需修改需要转码的文件路径即可:
. cd "D:\stata15\ado\personal\mypaper" // 请自行修改路径
. ua: unicode encoding set gb18030
. ua: unicode translate *
注:后续内容与
ua
命令的使用没有直接关系,只是记录了程序的撰写过程。
……最新专题课程……
我昨天下午 5 点有个需求:我是从 Stata 13 直接跳到 15 的。可是,Stata 15 的中文编码方案全变了,导致 do-file 和数据文件中的中文字符全是乱码。Stata 提供了一组
unicode
开头的命令,可以很方便地进行转码。但只能一个文件夹一个文件夹地转。我用了 14 年的 stata,有成百上千个文件夹需要转码! 搜索了半天无果。只好求助涛哥 (李春涛是也)。涛哥的第一反应是需要编程。我们的共识是需要遍历所有文件夹,记录下来,然后用循环语句进入每一个文件夹,进行转码。
我以为他会停几天再开始做这个工作。又不好催促他,以便搭他的便车。只好自己开始弄。或许他也不好意思搭我的便车,哈哈。
没想到今天晚上写好所有程序和说明文档后分享给他时,他居然也完工了!
看来,有好奇心的人都是一样的亟不可待!
整体思路:遍历当前文件夹下的所有子文件夹,对每个文件夹进行转码。
问题的关键:如何遍历所有的子文件夹,并记录这些文件夹的名称。
涛哥的思路:使用如下
dos
命令遍历当前工作文件夹下的所有子文件夹,并将他们存入一个文本文件output.txt
,随后使用infix
命令读入内存:
!dir /B /S /ad >> output.txt
infix strL v 1-2000 using "output.txt"
君哥的思路:使用外部命令
rcd
实现上述功能,所有子文件夹名称均以返回值的形式存储于内存中。执行过程如下:
然后就可以写一个循环逐个文件夹进行转码了:
最终,君哥的程序长这样:
涛哥的程序尚未封装成 .ado
文件,但用起来到也方便。直接复制如下代码到一个 Do-file 中,使用 cd
命令进入需要转码的文件夹,然后选中如下命令,执行即可(快捷键是 Ctrl+D
):
cd "D:\stata15\ado\personal\mypaper" //自行修改
!dir /B /S /ad >> output.txt
clear
unicode analyze output.txt
unicode encoding set gb18030
unicode translate "output.txt", transutf8
unicode erasebackups, badidea
infix strL v 1-2000 using "output.txt"
levelsof v ,local(urllist)
! del output.txt
clear
unicode translate * , transutf8
foreach c of local urllist{
clear
cd `"`c'"'
unicode encoding set gb18030
cap unicode translate * , transutf8
}
已经封装成 .ado
文件,并配有说明文档。请到 Stata连享会-码云-ua项目中(链接为:https://gitee.com/arlionn/ua )下载 ua.ado
和 ua.hlp
文件,放置于 D:\stata15\ado\base\u
或 D:\stata15\ado\plus\u
文件夹中。然后在 Stata 命令窗口中输入 help ua
,查看命令介绍和 Stata 范例。参照范例使用即可。
* 程序下载地址和使用说明:
* https://gitee.com/arlionn/ua
* 进入需要转码的文件夹
. cd D:\stata15\ado\personal\mypaper
* 对当前文件夹及子文件夹中的所有 .dta 文件转码
. ua: unicode encoding set gb18030
. ua: unicode translate *.dta
* 对所有类型的文件转码
. ua: unicode analyze *
. ua: unicode encoding set gb18030
. ua: unicode translate *
生活如此美好!因为有你有我!
关于我们
Stata
或Stata连享会
后关注我们。联系我们
Stata连享会(公众号: StataChina)
,我们会保留您的署名;录用稿件达五篇
以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。往期精彩推文
Stata连享会 精彩推文1 || 精彩推文2