lua获取utf8(包含中文字)字符串长度

原文地址http://www.freecls.com/a/2712/e

lua自带的string库计算字符串长度是以字节来算的,所以一个中文字一般会占用1-4个字节

string.len('测试abc')返回的不是5而是大于5,如果想要实现中文字占1个长度,则要引入lua-utf8库

本人用的是centos7,可以直接敲如下命令就行

luarocks install luautf8

从控制台可以看出,就是利用lua库把lutf8lib.c编译成动态库lua-utf8.so放在/usr/lib64/lua/5.1目录

当然也可以手动编译,源码下载地址https://github.com/starwing/luautf8

unzip luautf8-master.zip

cd luautf8-master

#编译

gcc -O2 -fPIC -I/usr/include -c lutf8lib.c -o lutf8lib.o

#链接成动态库

gcc -shared -o lua-utf8.so -L/usr/lib64/lua/5.1 lutf8lib.o

然后把lua-utf8.so拷贝到lua默认package.cpath指定的路径,64位centos7拷贝到/usr/lib64/lua/5.1即可

使用例子

local utf8 = require 'lua-utf8'

local str_len = utf8.len('测试abc')

print(str_len)      --5

该库的方法跟标准的string库用法一样,具体用法可以参考lua官网

utf8.byte

utf8.char

utf8.find

utf8.gmatch

utf8.gsub

utf8.len

utf8.lower

utf8.match

utf8.reverse

utf8.sub

utf8.upper

总结

1.lua的版本为5.1,运行环境centos7 64位

备注

1.觉得本文有帮助的小伙伴可以关注笔者
2.原文地址http://www.freecls.com/a/2712/e

你可能感兴趣的:(lua获取utf8(包含中文字)字符串长度)