BUG|Java 大小写转化和国际化

当国际化遇上大小写转化(Java),可能需要知道的这个坑。

发现问题

在PUBG内嵌社群用户可以发布想法结交好友。最近线上监控到视频上传失败率过高,引起了我们的注意,随即联系了云团队。


定位原因

云后台给到最近一天的视频上传日志,排除网络问题、用户手动取消等可预见问题外,发现一个异常日志最近24h报了将近300条,且集中在土耳其和阿塞拜疆地区。在本地切换系统语言为土耳其,发布视频后也确实会有异常提示"发送失败,原因:视频上传失败"。


日志提示有无法识别的参数,正是q-url-param-list=uploadıd中的ı字符应该是i字符,因此无法识别出正确的上传id信息导致上传失败。

CosXmlClientException:com.tencent.qcloud.core.common.QCloudClientException: java.lang.IllegalArgumentException: Unexpected char 0x131 at 205 in Authorization value:...q-url-param-list=uploadıd...

那这个字符又是如何产生的?这一串参数信息是在云客户端拼接的,q-url-param-list对应的值会经过toLowerCase()转成小写。

authorization.append("q-url-param-list").append("=").append(sourceProvider.getRealParameterList().toLowerCase().append("&");

再看toLowerCase()的实现,传入的语言是Locale.getDefault(),也就是使用当前系统语言。


而在土耳其、阿塞拜疆、立陶宛,İ(\u0130,土耳其语大写i)对应的小写字符为i(\u0069,英语小写i),I(\u0049,英语大写i)对应的小写字符为ı(\u0131,土耳其语小写i)。所以当系统是土耳其语时候,转UPLOADID就转出了'ı'字符。参考: İ-维基百科

解决办法

其实在toLowerCase()注释里官方已经给出了解决办法,使用toLowerCase(Locale.ROOT)这个方法转换就好了。区别在于传入的Locale不同,Locale.ROOT是空串对象,区域不敏感,如此一来就不会当做特殊地区语言去处理了。


下面演示了系统语言为土耳其情况下不同接口转化UPLOADID的结果:

同样的,将小写i转大写也有类似问题:

改完之后视频也可以上传成功了!

另外提一句,在Dart(Futter)中大小写转化本身就是语言无关的。

总结

对于海外产品,尤其涉及到土耳其、阿塞拜疆、立陶宛区域的,需要注意在大小写转化时 ,有无可能对i字符进行转化(包括 大写i转小写、 小写i转大写)?转化结果是否不仅用作展示,还有其他用途,比如字符串比较?比如像下面这种转小写且比较对象包含了i字符,就要考虑加Locale.ROOT了。

你可能感兴趣的:(BUG|Java 大小写转化和国际化)