自己碰到的 R : invalid multibyte string 的原因

今天替客户做一个研究,用的是一个开源的库,github: Participate on HypertensionCombination study

代码有好几个 bug, 比如 CreateCohorts.R 文件的第 25 - 41 行是创建 EXPOSURETABLE / OUTCOMETABLE 表的,但是却被注释掉了,导致 ca_cohort_per_protocol.sql 第 619 行删除该表的语句报错,直接将该语句在 SQL Developer 里执行会说该表或视图不存在,但是在 RGui 执行该研究的 R 程序的时候报的错就是 invalid multibyte string, element 4。

还有 CreateCohorts.R 文件有好几处自定义的 sql 语句的 delete from 语句如第 481 行没有分号,同样会报错 invalid multibyte string 错误。

所以这种错误大多数都是被 R 调用的 SQL 出问题了,需要 debug(目前没有好办法,就是在 SQL 文件里加打印语句)。而不是网上所说的那种是系统编码的问题,至少我经常碰到的都是这么个情况。

你可能感兴趣的:(R)