erlang 文件编码

在R16B版本之后,erlang允许使用UTF-8来对源代码编码,默认下使用latin1编码。
可以通过在源代码文件前加入
%% -- coding: utf-8 --来设置编码方式。
string和注释可以使用UTF-8,但函数名和atom还是使用ISO-latin-1字符集,这个有可能在R18改变。
二进制类型的位语法中也加入了对Unicode的处理:

   <> = Bin1,
   <> = Bin2,

   Bin3 = <<$H/utf32-little, $e/utf32-little, $l/utf32-little, $l/utf32-little,$o/utf32-little>>,
   Bin4 = <<"Hello"/utf16>>

非常方便。。
erlang的输出函数会启发式的检测输入的list,binariy是否是可以打印的字符。
默认检测的字符范围是ISO-Latin-1,也可以在启动时通过+pc指定为UTF-8。

你可能感兴趣的:(erlang 文件编码)