在LotusScript中处理UTF-8编码的内容

最近工作需要,要完成一个基于Lotus Domino的网站。由于涉及混合语种问题,网站编码基调定为UTF-8,而且其中有部分需要用LotusScprit代理直接接收HTML Form里Submit过来的数据。以前遇到这个问题都是想办法绕开的,那时候没时间,为了赶进度,只能这样。这次项目时间较富裕,我决定吭一下,看看牙口尚好否。
目标:Decode UTF-8 form data in LotusScript Agent.
Google、Baidu外加IBM Lotus论坛,搜索了一通,有四、五段现成的代码,经测试没有一个对的,想偷懒都不行了:(
转变思路,查询UTF-8编码规则,Baidu上找到一篇关于UTF-8的说明,很不错,终于看懂了字符编码到UTF-8编码的转换规则。
原来UTF-8编码是将字符编码通过一种转换规则变成1~6字节的编码。
浏览器将form中的多字节字符和一部分单字字符转变成这种编码,与其他单字节字符连成字符串,再把其中的空格用“+”代替,就成了在Lotus Agent中接收到的字符串参数了。
由于LotusScript中Uchr()函数最多只能转换双字节字符,3、4字节的字符就不做转换了,保留在原字符串中。
Function Utf8Decode(s As String) As String
  Dim i As Integer
  Dim tmp As String
  Dim c As String
  tmp = ""
  For i = 1 To Len(s)
    c = Mid$(s, i, 1)
    If c = "+" Then
      c = " "
    Elseif c = "%" Then
      c = Mid$(s, i + 1, 2)
      If (Val("&H" & c) >= 0) And (Val("&H" & c) <= Val("&H7F")) Then
        c = Uchr$("&H" & c)
        i = i + 2
      Elseif (Val("&H" & c) >= Val("&HC0")) And (Val("&H" & c) <= Val("&HDF")) Then
        c = Right(Bin$(Val("&H" & Mid$(s, i + 1, 2))),5)
        c = c & Right(Bin$(Val("&H" & Mid$(s, i + 4, 2))),6)
        c = Uchr$("&B" & c)
        i = i + 5
      Elseif (Val("&H" & c) >= Val("&HE0")) And (Val("&H" & c) <= Val("&HEF")) Then
        c = Right(Bin$(Val("&H" & Mid$(s, i + 1, 2))),4)
        c = c & Right(Bin$(Val("&H" & Mid$(s, i + 4, 2))),6)
        c = c & Right(Bin$(Val("&H" & Mid$(s, i + 7, 2))),6)
        c = Uchr$("&B" & c)
        i = i + 8
      Else
        c = Mid$(s, i, 3)
        i = i + 2
      End If
    End If
    tmp = tmp + c
  Next i
  Utf8Decode = tmp
End Function

你可能感兴趣的:(script)