Linux中[]方括号匹配问题[A-Z]会匹配小写a-z

Linux中[]中括号匹配问题[A-Z]会匹配小写a-z:
在Ubuntu使用[]进行匹配时,发现ls [A-Z]*仍然可以匹配到小写字母开头的目录,这是因为语系不同,导致编码顺序不同:
LANG=C:ABC...Zabc...z
LANG=zh_CN: aAbBcC...zZ
当语系为zh_CN,[a-z] 就会包括ABC..Y
如果要用[A-Z]只表示大写字母范围,需要设置环境变量
export LC_ALL=C
取消用
unset LC_ALL

在很多shell脚本中在开头部分加LC_ALL=C就是为了去除所有本地化的设置,让命令能正确执行。
在Linux中通过locale来设置程序运行的不同语言环境,locale由ANSI C提供支持。locale的命名规则为<语言>_<地区>.<字符集编码>,如zh_CN.UTF-8,zh代表中文,CN代表大陆地区,UTF-8表示字符集。在locale环境中,有一组变量,代表国际化环境中的不同设置:

  1. LC_COLLATE
    定义该环境的排序和比较规则
  2. LC_CTYPE
    用于字符分类和字符串处理,控制所有字符的处理方式,包括字符编码,字符是单字节还是多字节,如何打印等。是最重要的一个环境变量。
  3. LC_MONETARY
    货币格式
  4. LC_NUMERIC
    非货币的数字显示格式
  5. LC_TIME
    时间和日期格式
  6. LC_MESSAGES
    提示信息的语言。另外还有一个LANGUAGE参数,它与LC_MESSAGES相似,但如果该参数一旦设置,则LC_MESSAGES参数就会失效。LANGUAGE参数可同时设置多种语言信息,如LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。
  7. LANG
    LC_的默认值,是最低级别的设置,如果LC_没有设置,则使用该值。类似于 LC_ALL。
  8. LC_ALL
    它是一个宏,如果该值设置了,则该值会覆盖所有LC_*的设置值。注意,LANG的值不受该宏影响。
    C"是系统默认的locale,"POSIX"是"C"的别名。所以当我们新安装完一个系统时,默认的locale就是C或POSIX。

参考链接:
https://blog.csdn.net/z4213489/article/details/7937894(推荐,更为详细,通俗易懂)
http://blog.sina.com.cn/s/blog_81b27a5a0101gkqf.html

你可能感兴趣的:(Linux中[]方括号匹配问题[A-Z]会匹配小写a-z)