lua 4-14


新一篇: (LUA教程)第5章 函数 | 旧一篇: (LUA教程)第3章 表达式

Lua C PASCAL 几乎支持所有的传统语句:赋值语句、控制结构语句、函数调用等,同时也支持非传统的多变量赋值、局部变量声明。
4.1 赋值语句
赋值是改变一个变量的值和改变表域的最基本的方法。
a = "hello" .. "world"
t.n = t.n + 1
Lua 可以对多个变量同时赋值,变量列表和值列表的各个元素用逗号分开,赋值语句右边的值会依次赋给左边的变量。
a, b = 10, 2*x       <-->       a=10; b=2*x
遇到赋值语句 Lua 会先计算右边所有的值然后再执行赋值操作,所以我们可以这样进行交换变量的值:
x, y = y, x                     -- swap 'x' for 'y'
a[i], a[j] = a[j], a[i]         -- swap 'a[i]' for 'a[i]'
当变量个数和值的个数不一致时, Lua 会一直以变量个数为基础采取以下策略:
a.  变量个数  >  值的个数               按变量个数补足 nil
b.  变量个数  <  值的个数               多余的值会被忽略
例如:
a, b, c = 0, 1
print(a,b,c)             --> 0   1   nil
 
a, b = a+1, b+1, b+2     -- value of b+2 is ignored
print(a,b)               --> 1   2
 
a, b, c = 0
print(a,b,c)             --> 0   nil   nil
上面最后一个例子是一个常见的错误情况,注意:如果要对多个变量赋值必须依次对每个变量赋值。
a, b, c = 0, 0, 0
print(a,b,c)             --> 0   0   0
多值赋值经常用来交换变量,或将函数调用返回给变量:
a, b = f()
f() 返回两个值,第一个赋给 a ,第二个赋给 b
4.2 局部变量与代码块(block
使用 local 创建一个局部变量,与全局变量不同,局部变量只在被声明的那个代码块内有效。代码块:指一个控制结构内,一个函数体,或者一个 chunk (变量被声明的那个文件或者文本串)。
x = 10
local i = 1              -- local to the chunk
 
while i<=x do
    local x = i*2        -- local to the while body
    print(x)             --> 2, 4, 6, 8, ...
    i = i + 1
end
 
if i > 20 then
    local x              -- local to the "then" body
    x = 20
    print(x + 2)
else
    print(x)             --> 10 (the global one)
end
 
print(x)                 --> 10 (the global one)
注意,如果在交互模式下上面的例子可能不能输出期望的结果,因为第二句 local i=1 是一个完整的 chunk ,在交互模式下执行完这一句后, Lua 将开始一个新的 chunk ,这样第二句的 i 已经超出了他的有效范围。可以将这段代码放在 do..end (相当于 c/c++ {} )块中。
应该尽可能的使用局部变量,有两个好处:
1.  避免命名冲突
2.  访问局部变量的速度比全局变量更快 .
我们给 block 划定一个明确的界限: do..end 内的部分。当你想更好的控制局部变量的作用范围的时候这是很有用的。
do
    local a2 = 2*a
    local d = sqrt(b^2 - 4*a*c)
    x1 = (-b + d)/a2
    x2 = (-b - d)/a2
end            -- scope of 'a2' and 'd' ends here
 
print(x1, x2)
4.3 控制结构语句
控制结构的条件表达式结果可以是任何值, Lua 认为 false nil 为假,其他值为真。
if 语句,有三种形式:
if conditions then
    then-part
end;
 
if conditions then
    then-part
else
    else-part
end;
 
if conditions then
    then-part
elseif conditions then
    elseif-part
..            ---> 多个 elseif
else
    else-part
end;
while 语句:
while condition do
    statements;
end;
repeat-until 语句:
repeat
    statements;
until conditions;
for 语句有两大类:
第一,数值 for 循环:
for var=exp1,exp2,exp3 do
    loop-part
end
for 将用 exp3 作为 step exp1 (初始值)到 exp2 (终止值),执行 loop-part 。其中 exp3 可以省略,默认 step=1
有几点需要注意:
1.  三个表达式只会被计算一次,并且是在循环开始前。
for i=1,f(x) do
    print(i)
end
 
for i=10,1,-1 do
    print(i)
end
第一个例子 f(x) 只会在循环前被调用一次。
2.  控制变量 var 是局部变量自动被声明 , 并且只在循环内有效 .
for i=1,10 do
    print(i)
end
max = i       -- probably wrong! 'i' here is global
如果需要保留控制变量的值,需要在循环中将其保存
-- find a value in a list
local found = nil
for i=1,a.n do
    if a[i] == value then
       found = i         -- save value of 'i'
       break
    end
end
print(found)
3.  循环过程中不要改变控制变量的值,那样做的结果是不可预知的。如果要退出循环,使用 break 语句。
 
第二,范型 for 循环:
前面已经见过一个例子:
-- print all values of array 'a'
for i,v in ipairs(a) do print(v) end
范型 for 遍历迭代子函数返回的每一个值。
再看一个遍历表 key 的例子:
-- print all keys of table 't'
for k in pairs(t) do print(k) end
范型 for 和数值 for 有两点相同:
1.  控制变量是局部变量
2.  不要修改控制变量的值
再看一个例子,假定有一个表:
days = {"Sunday", "Monday", "Tuesday", "Wednesday",
              "Thursday", "Friday", "Saturday"}
现在想把对应的名字转换成星期几,一个有效地解决问题的方式是构造一个反向表:
revDays = {["Sunday"] = 1, ["Monday"] = 2,
                     ["Tuesday"] = 3, ["Wednesday"] = 4,
                     ["Thursday"] = 5, ["Friday"] = 6, 
                     ["Saturday"] = 7}
下面就可以很容易获取问题的答案了 :
x = "Tuesday"
print(revDays[x])        --> 3
我们不需要手工,可以自动构造反向表
revDays = {}
for i,v in ipairs(days) do
    revDays[v] = i
end
如果你对范型 for 还有些不清楚在后面的章节我们会继续来学习。
4.4 breakreturn语句
break 语句用来退出当前循环( for repeat while )。在循环外部不可以使用。
return 用来从函数返回结果,当一个函数自然结束时,结尾会有一个默认的 return 。(这种函数类似 pascal 的过程( procedure ))
Lua 语法要求 break return 只能出现在 block 的结尾一句(也就是说:作为 chunk 的最后一句,或者在 end 之前,或者 else 前,或者 until 前),例如:
local i = 1
while a[i] do
    if a[i] == v then break end
    i = i + 1
end
有时候为了调试或者其他目的需要在 block 的中间使用 return 或者 break ,可以显式的使用 do..end 来实现:
function foo ()
    return            --<< SYNTAX ERROR
    -- 'return' is the last statement in the next block
    do return end        -- OK
    ...               -- statements not reached
end

发表于 @ 2008年05月08日 11:37:50|评论(0)|编辑




新一篇: (LUA教程)第6章 再论函数 | 旧一篇: (LUA教程)第4章 基本语法

函数有两种用途: 1. 完成指定的任务,这种情况下函数作为调用语句使用; 2. 计算并返回值,这种情况下函数作为赋值语句的表达式使用。
语法:
function func_name (arguments-list)
    statements-list;
end;
调用函数的时候,如果参数列表为空,必须使用 () 表明是函数调用。
print(8*9, 9/8)
a = math.sin(3) + math.cos(10)
print(os.date())
上述规则有一个例外,当函数只有一个参数并且这个参数是字符串或者表构造的时候, () 可有可无:
print "Hello World"      <-->       print("Hello World")
dofile 'a.lua'           <-->       dofile ('a.lua')
print [[a multi-line     <-->       print([[a multi-line
           message]]                          message]])
f{x=10, y=20}            <-->       f({x=10, y=20})
type{}                   <-->       type({})
Lua 也提供了面向对象方式调用函数的语法,比如 o:foo(x) o.foo(o, x) 是等价的,后面的章节会详细介绍面向对象内容。
Lua 使用的函数,既可是 Lua 编写的,也可以是其他语言编写的,对于 Lua 程序员,用什么语言实现的函数使用起来都一样。
Lua 函数实参和形参的匹配与赋值语句类似,多余部分被忽略,缺少部分用 nil 补足。
function f(a, b) return a or b end
 
CALL              PARAMETERS
 
f(3)              a=3, b=nil
f(3, 4)           a=3, b=4
f(3, 4, 5)        a=3, b=4   (5 is discarded)
5.1 多返回值
Lua 函数可以返回多个结果值,比如 string.find ,其返回匹配串“开始和结束的下标”(如果不存在匹配串返回 nil )。
s, e = string.find("hello Lua users", "Lua")
print(s, e)       --> 7 9
Lua 函数中,在 return 后列出要返回的值得列表即可返回多值,如:
function maximum (a)
    local mi = 1             -- maximum index
    local m = a[mi]          -- maximum value
    for i,val in ipairs(a) do
       if val > m then
           mi = i
           m = val
       end
    end
    return m, mi
end
 
print(maximum({8,10,23,12,5}))     --> 23   3
Lua 总是调整函数返回值的个数以适用调用环境,当作为独立的语句调用函数时,所有返回值将被忽略。假设有如下三个函数:
function foo0 () end                   -- returns no results
function foo1 () return 'a' end        -- returns 1 result
function foo2 () return 'a','b' end    -- returns 2 results
第一,当作为表达式调用函数时,有以下几种情况:
1.  当调用作为表达式最后一个参数或者仅有一个参数时,根据变量个数函数尽可能多地返回多个值,不足补 nil ,超出舍去。
2.  其他情况下,函数调用仅返回第一个值(如果没有返回值为 nil
x,y = foo2()             -- x='a', y='b'
x = foo2()               -- x='a', 'b' is discarded
x,y,z = 10,foo2()        -- x=10, y='a', z='b'
 
x,y = foo0()             -- x=nil, y=nil
x,y = foo1()             -- x='a', y=nil
x,y,z = foo2()           -- x='a', y='b', z=nil
 
x,y = foo2(), 20         -- x='a', y=20
x,y = foo0(), 20, 30     -- x='nil', y=20, 30 is discarded
第二,函数调用作为函数参数被调用时,和多值赋值是相同。
print(foo0())            -->
print(foo1())            --> a
print(foo2())            --> a   b
print(foo2(), 1)         --> a   1
print(foo2() .. "x")     --> ax
第三,函数调用在表构造函数中初始化时,和多值赋值时相同。
a = {foo0()}             -- a = {}    (an empty table)
a = {foo1()}             -- a = {'a'}
a = {foo2()}             -- a = {'a', 'b'}
 
a = {foo0(), foo2(), 4} -- a[1] = nil, a[2] = 'a', a[3] = 4
另外, return f() 这种形式,则返回“ f() 的返回值”:
function foo (i)
    if i == 0 then return foo0()
    elseif i == 1 then return foo1()
    elseif i == 2 then return foo2()
    end
end
 
print(foo(1))        --> a
print(foo(2))        --> a b
print(foo(0))        -- (no results)
print(foo(3))        -- (no results)
可以使用圆括号强制使调用返回一个值。
print((foo0()))      --> nil
print((foo1()))      --> a
print((foo2()))      --> a
一个 return 语句如果使用圆括号将返回值括起来也将导致返回一个值。
函数多值返回的特殊函数 unpack ,接受一个数组作为输入参数,返回数组的所有元素。 unpack 被用来实现范型调用机制,在 C 语言中可以使用函数指针调用可变的函数,可以声明参数可变的函数,但不能两者同时可变。在 Lua 中如果你想调用可变参数的可变函数只需要这样:
f(unpack(a))
unpack 返回 a 所有的元素作为 f() 的参数
f = string.find
a = {"hello", "ll"}
print(f(unpack(a)))      --> 3  4
预定义的 unpack 函数是用 C 语言实现的,我们也可以用 Lua 来完成:
function unpack(t, i)
    i = i or 1
    if t[i] then
       return t[i], unpack(t, i + 1)
    end
end
5.2 可变参数
Lua 函数可以接受可变数目的参数,和 C 语言类似在函数参数列表中使用三点( ... )表示函数有可变的参数。 Lua 将函数的参数放在一个叫 arg 的表中,除了参数以外, arg 表中还有一个域 n 表示参数的个数。
例如,我们可以重写 print 函数:
printResult = ""
 
function print(...)
    for i,v in ipairs(arg) do
       printResult = printResult .. tostring(v) .. "/t"
    end
    printResult = printResult .. "/n"
end
有时候我们可能需要几个固定参数加上可变参数
function g (a, b, ...) end
 
CALL              PARAMETERS
 
g(3)              a=3, b=nil, arg={n=0}
g(3, 4)           a=3, b=4, arg={n=0}
g(3, 4, 5, 8)     a=3, b=4, arg={5, 8; n=2}
如上面所示, Lua 会将前面的实参传给函数的固定参数,后面的实参放在 arg 表中。
举个具体的例子,如果我们只想要 string.find 返回的第二个值。一个典型的方法是使用哑元( dummy variable ,下划线):
local _, x = string.find(s, p)
-- now use `x'
...
还可以利用可变参数声明一个 select 函数:
function select (n, ...)
    return arg[n]
end
 
print(string.find("hello hello", " hel")) --> 6 9
print(select(1, string.find("hello hello", " hel"))) --> 6
print(select(2, string.find("hello hello", " hel"))) --> 9
有时候需要将函数的可变参数传递给另外的函数调用,可以使用前面我们说过的 unpack(arg) 返回 arg 表所有的可变参数, Lua 提供了一个文本格式化的函数 string.format (类似 C 语言的 sprintf 函数):
function fwrite(fmt, ...)
    return io.write(string.format(fmt, unpack(arg)))
end
这个例子将文本格式化操作和写操作组合为一个函数。
5.3 命名参数
Lua 的函数参数是和位置相关的,调用时实参会按顺序依次传给形参。有时候用名字指定参数是很有用的,比如 rename 函数用来给一个文件重命名,有时候我们我们记不清命名前后两个参数的顺序了:
-- invalid code
rename(old="temp.lua", new="temp1.lua")
上面这段代码是无效的, Lua 可以通过将所有的参数放在一个表中,把表作为函数的唯一参数来实现上面这段伪代码的功能。因为 Lua 语法支持函数调用时实参可以是表的构造。
rename{old="temp.lua", new="temp1.lua"}
根据这个想法我们重定义了 rename
function rename (arg)
    return os.rename(arg.old, arg.new)
end
当函数的参数很多的时候,这种函数参数的传递方式很方便的。例如 GUI 库中创建窗体的函数有很多参数并且大部分参数是可选的,可以用下面这种方式:
w = Window {
    x=0, y=0, width=300, height=200,
    title = "Lua", background="blue",
    border = true
}
 
function Window (options)
    -- check mandatory options
    if type(options.title) ~= "string" then
       error("no title")
    elseif type(options.width) ~= "number" then
       error("no width")
    elseif type(options.height) ~= "number" then
       error("no height")
    end
 
    -- everything else is optional
    _Window(options.title,
       options.x or 0,          -- default value
       options.y or 0,          -- default value
       options.width, options.height,
       options.background or "white", -- default
       options.border           -- default is false (nil)
    )
end

发表于 @ 2008年05月08日 11:38:53|评论(0)|编辑


新一篇: (LUA教程)第7章 迭代器与泛型for | 旧一篇: (LUA教程)第5章 函数

Lua 中的函数是带有词法定界( lexical scoping )的第一类值( first-class values )。
第一类值指:在 Lua 中函数和其他值(数值、字符串)一样,函数可以被存放在变量中,也可以存放在表中,可以作为函数的参数,还可以作为函数的返回值。
词法定界指:嵌套的函数可以访问他外部函数中的变量。这一特性给 Lua 提供了强大的编程能力。
Lua 中关于函数稍微难以理解的是函数也可以没有名字,匿名的。当我们提到函数名(比如 print ),实际上是说一个指向函数的变量,像持有其他类型值的变量一样:
a = {p = print}
a.p("Hello World")   --> Hello World
print = math.sin -- `print' now refers to the sine function
a.p(print(1))     --> 0.841470
sin = a.p         -- `sin' now refers to the print function
sin(10, 20)       --> 10   20
既然函数是值,那么表达式也可以创建函数了, Lua 中我们经常这样写:
function foo (x) return 2*x end
这实际上是 Lua 语法的特例,下面是原本的函数:
foo = function (x) return 2*x end
函数定义实际上是一个赋值语句,将类型为 function 的变量赋给一个变量。我们使用 function (x) ... end 来定义一个函数和使用 {} 创建一个表一样。
table 标准库提供一个排序函数,接受一个表作为输入参数并且排序表中的元素。这个函数必须能够对不同类型的值(字符串或者数值)按升序或者降序进行排序。 Lua 不是尽可能多地提供参数来满足这些情况的需要,而是接受一个排序函数作为参数(类似 C++ 的函数对象),排序函数接受两个排序元素作为输入参数,并且返回两者的大小关系,例如:
network = {
    {name = "grauna",    IP = "210.26.30.34"},
    {name = "arraial",   IP = "210.26.30.23"},
    {name = "lua",       IP = "210.26.23.12"},
    {name = "derain",    IP = "210.26.23.20"},
}
如果我们想通过表的 name 域排序:
table.sort(network, function (a,b)
    return (a.name > b.name)
end)
以其他函数作为参数的函数在 Lua 中被称作高级函数( higher-order function ),如上面的 sort 。在 Lua 中,高级函数与普通函数没有区别,它们只是把“作为参数的函数”当作第一类值( first-class value )处理而已。
下面给出一个绘图函数的例子:
function eraseTerminal()
    io.write("/27[2J")
end
 
-- writes an '*' at column 'x' , 'row y'
function mark (x,y)
    io.write(string.format("/27[%d;%dH*", y, x))
end
 
-- Terminal size
TermSize = {w = 80, h = 24}
 
-- plot a function
-- (assume that domain and image are in the range [-1,1])
function plot (f)
    eraseTerminal()
    for i=1,TermSize.w do
       local x = (i/TermSize.w)*2 - 1
       local y = (f(x) + 1)/2 * TermSize.h
       mark(i, y)
    end
    io.read() -- wait before spoiling the screen
end
要想让这个例子正确的运行,你必须调整你的终端类型和代码中的控制符 [3]一致:
plot(function (x) return math.sin(x*2*math.pi) end)
将在屏幕上输出一个正弦曲线。
将第一类值函数应用在表中是 Lua 实现面向对象和包机制的关键,这部分内容在后面章节介绍。
6.1 闭包
当一个函数内部嵌套另一个函数定义时,内部的函数体可以访问外部的函数的局部变量,这种特征我们称作词法定界。虽然这看起来很清楚,事实并非如此,词法定界加上第一类函数在编程语言里是一个功能强大的概念,很少语言提供这种支持。
下面看一个简单的例子,假定有一个学生姓名的列表和一个学生名和成绩对应的表;现在想根据学生的成绩从高到低对学生进行排序,可以这样做:
names = {"Peter", "Paul", "Mary"}
grades = {Mary = 10, Paul = 7, Peter = 8}
table.sort(names, function (n1, n2)
    return grades[n1] > grades[n2]    -- compare the grades
end)
假定创建一个函数实现此功能:
function sortbygrade (names, grades)
    table.sort(names, function (n1, n2)
       return grades[n1] > grades[n2]    -- compare the grades
    end)
end
例子中包含在 sortbygrade 函数内部的 sort 中的匿名函数可以访问 sortbygrade 的参数 grades ,在匿名函数内部 grades 不是全局变量也不是局部变量,我们称作外部的局部变量( external local variable )或者 upvalue 。( upvalue 意思有些误导,然而在 Lua 中他的存在有历史的根源,还有他比起 external local variable 简短)。
看下面的代码:
function newCounter()
    local i = 0
    return function()    -- anonymous function
       i = i + 1
        return i
    end
end
 
c1 = newCounter()
print(c1()) --> 1
print(c1()) --> 2
匿名函数使用 upvalue i 保存他的计数,当我们调用匿名函数的时候 i 已经超出了作用范围,因为创建 i 的函数 newCounter 已经返回了。然而 Lua 用闭包的思想正确处理了这种情况。简单的说,闭包是一个函数以及它的 upvalues 。如果我们再次调用 newCounter ,将创建一个新的局部变量 i ,因此我们得到了一个作用在新的变量 i 上的新闭包。
c2 = newCounter()
print(c2()) --> 1
print(c1()) --> 3
print(c2()) --> 2
c1 c2 是建立在同一个函数上,但作用在同一个局部变量的不同实例上的两个不同的闭包。
技术上来讲,闭包指值而不是指函数,函数仅仅是闭包的一个原型声明;尽管如此,在不会导致混淆的情况下我们继续使用术语函数代指闭包。
闭包在上下文环境中提供很有用的功能,如前面我们见到的可以作为高级函数( sort )的参数;作为函数嵌套的函数( newCounter )。这一机制使得我们可以在 Lua 的函数世界里组合出奇幻的编程技术。闭包也可用在回调函数中,比如在 GUI 环境中你需要创建一系列 button ,但用户按下 button 时回调函数被调用,可能不同的按钮被按下时需要处理的任务有点区别。具体来讲,一个十进制计算器需要 10 个相似的按钮,每个按钮对应一个数字,可以使用下面的函数创建他们:
function digitButton (digit)
    return Button{ label = digit,
           action = function ()
              add_to_display(digit)
           end
    }
end
这个例子中我们假定 Button 是一个用来创建新按钮的工具,  label 是按钮的标签, action 是按钮被按下时调用的回调函数。(实际上是一个闭包,因为他访问 upvalue digit )。 digitButton 完成任务返回后,局部变量 digit 超出范围,回调函数仍然可以被调用并且可以访问局部变量 digit
闭包在完全不同的上下文中也是很有用途的。因为函数被存储在普通的变量内我们可以很方便的重定义或者预定义函数。通常当你需要原始函数有一个新的实现时可以重定义函数。例如你可以重定义 sin 使其接受一个度数而不是弧度作为参数:
oldSin = math.sin
math.sin = function (x)
    return oldSin(x*math.pi/180)
end
更清楚的方式:
do
    local oldSin = math.sin
    local k = math.pi/180
    math.sin = function (x)
       return oldSin(x*k)
    end
end
这样我们把原始版本放在一个局部变量内,访问 sin 的唯一方式是通过新版本的函数。
利用同样的特征我们可以创建一个安全的环境(也称作沙箱,和 java 里的沙箱一样),当我们运行一段不信任的代码(比如我们运行网络服务器上获取的代码)时安全的环境是需要的,比如我们可以使用闭包重定义 io 库的 open 函数来限制程序打开的文件。
do
    local oldOpen = io.open
    io.open = function (filename, mode)
       if access_OK(filename, mode) then
           return oldOpen(filename, mode)
       else
           return nil, "access denied"
       end
    end
end
6.2 非全局函数
Lua 中函数可以作为全局变量也可以作为局部变量,我们已经看到一些例子:函数作为 table 的域(大部分 Lua 标准库使用这种机制来实现的比如 io.read math.sin )。这种情况下,必须注意函数和表语法:
1.  表和函数放在一起
Lib = {}
Lib.foo = function (x,y) return x + y end
Lib.goo = function (x,y) return x - y end
2.  使用表构造函数
Lib = {
    foo = function (x,y) return x + y end,
    goo = function (x,y) return x - y end
}
3. Lua 提供另一种语法方式
Lib = {}
function Lib.foo (x,y)
    return x + y
end
function Lib.goo (x,y)
    return x - y
end
当我们将函数保存在一个局部变量内时,我们得到一个局部函数,也就是说局部函数像局部变量一样在一定范围内有效。这种定义在包中是非常有用的:因为 Lua chunk 当作函数处理,在 chunk 内可以声明局部函数(仅仅在 chunk 内可见),词法定界保证了包内的其他函数可以调用此函数。下面是声明局部函数的两种方式:
1.  方式一
local f = function (...)
    ...
end
 
local g = function (...)
    ...
    f()   -- external local `f' is visible here
    ...
end
2.  方式二
local function f (...)
    ...
end
有一点需要注意的是在声明递归局部函数的方式:
local fact = function (n)
    if n == 0 then
       return 1
    else
       return n*fact(n-1)   -- buggy
    end
end
上面这种方式导致 Lua 编译时遇到 fact(n-1) 并不知道他是局部函数 fact Lua 会去查找是否有这样的全局函数 fact 。为了解决这个问题我们必须在定义函数以前先声明:
local fact
 
fact = function (n)
    if n == 0 then
       return 1
    else
       return n*fact(n-1)
    end
end
这样在 fact 内部 fact(n-1) 调用是一个局部函数调用,运行时 fact 就可以获取正确的值了。
但是 Lua 扩展了他的语法使得可以在直接递归函数定义时使用两种方式都可以。
在定义非直接递归局部函数时要先声明然后定义才可以:
local f, g        -- `forward' declarations
 
function g ()
    ... f() ...
end
 
function f ()
    ... g() ...
end
6.3 正确的尾调用(Proper Tail Calls
Lua 中函数的另一个有趣的特征是可以正确的处理尾调用( proper tail recursion ,一些书使用术语“尾递归”,虽然并未涉及到递归的概念)。
尾调用是一种类似在函数结尾的 goto 调用,当函数最后一个动作是调用另外一个函数时,我们称这种调用尾调用。例如:
function f(x)
    return g(x)
end
g 的调用是尾调用。
例子中 f 调用 g 后不会再做任何事情,这种情况下当被调用函数 g 结束时程序不需要返回到调用者 f ;所以尾调用之后程序不需要在栈中保留关于调用者的任何信息。一些编译器比如 Lua 解释器利用这种特性在处理尾调用时不使用额外的栈,我们称这种语言支持正确的尾调用。
由于尾调用不需要使用栈空间,那么尾调用递归的层次可以无限制的。例如下面调用不论 n 为何值不会导致栈溢出。
function foo (n)
    if n > 0 then return foo(n - 1) end
end
需要注意的是:必须明确什么是尾调用。
一些调用者函数调用其他函数后也没有做其他的事情但不属于尾调用。比如:
function f (x)
    g(x)
    return
end
上面这个例子中 f 在调用 g 后,不得不丢弃 g 地返回值,所以不是尾调用,同样的下面几个例子也不时尾调用:
return g(x) + 1      -- must do the addition
return x or g(x)     -- must adjust to 1 result
return (g(x))        -- must adjust to 1 result
Lua 中类似 return g(...) 这种格式的调用是尾调用。但是 g g 的参数都可以是复杂表达式,因为 Lua 会在调用之前计算表达式的值。例如下面的调用是尾调用:
return x[i].foo(x[j] + a*b, i + j)
可以将尾调用理解成一种 goto ,在状态机的编程领域尾调用是非常有用的。状态机的应用要求函数记住每一个状态,改变状态只需要 goto(or call) 一个特定的函数。我们考虑一个迷宫游戏作为例子:迷宫有很多个房间,每个房间有东西南北四个门,每一步输入一个移动的方向,如果该方向存在即到达该方向对应的房间,否则程序打印警告信息。目标是:从开始的房间到达目的房间。
这个迷宫游戏是典型的状态机,每个当前的房间是一个状态。我们可以对每个房间写一个函数实现这个迷宫游戏,我们使用尾调用从一个房间移动到另外一个房间。一个四个房间的迷宫代码如下:
function room1 ()
    local move = io.read()
    if move == "south" then
       return room3()
    elseif move == "east" then
       return room2()
    else
       print("invalid move")
       return room1()   -- stay in the same room
    end
end
 
function room2 ()
    local move = io.read()
    if move == "south" then
       return room4()
    elseif move == "west" then
       return room1()
    else
       print("invalid move")
       return room2()
    end
end
 
function room3 ()
    local move = io.read()
    if move == "north" then
       return room1()
    elseif move == "east" then
       return room4()
    else
       print("invalid move")
       return room3()
    end
end
 
function room4 ()
    print("congratilations!")
end
我们可以调用 room1() 开始这个游戏。
如果没有正确的尾调用,每次移动都要创建一个栈,多次移动后可能导致栈溢出。但正确的尾调用可以无限制的尾调用,因为每次尾调用只是一个 goto 到另外一个函数并不是传统的函数调用。

发表于 @ 2008年05月08日 11:40:28|评论(0)|编辑



新一篇: (LUA教程)第8章 编译·运行·错误信息 | 旧一篇: (LUA教程)第6章 再论函数

在这一章我们讨论为范性 for 写迭代器,我们从一个简单的迭代器开始,然后我们学习如何通过利用范性 for 的强大之处写出更高效的迭代器。
7.1 迭代器与闭包
迭代器是一种支持指针类型的结构,它可以遍历集合的每一个元素。在 Lua 中我们常常使用函数来描述迭代器,每次调用该函数就返回集合的下一个元素。
迭 代器需要保留上一次成功调用的状态和下一次成功调用的状态,也就是他知道来自于哪里和将要前往哪里。闭包提供的机制可以很容易实现这个任务。记住:闭包是 一个内部函数,它可以访问一个或者多个外部函数的外部局部变量。每次闭包的成功调用后这些外部局部变量都保存他们的值(状态)。当然如果要创建一个闭包必 须要创建其外部局部变量。所以一个典型的闭包的结构包含两个函数:一个是闭包自己;另一个是工厂(创建闭包的函数)。
举一个简单的例子,我们为一个 list 写一个简单的迭代器,与 ipairs() 不同的是我们实现的这个迭代器返回元素的值而不是索引下标:
function list_iter (t)
    local i = 0
    local n = table.getn(t)
    return function ()
       i = i + 1
       if i <= n then return t[i] end
    end
end
这个例子中 list_iter 是一个工厂,每次调用他都会创建一个新的闭包(迭代器本身)。闭包保存内部局部变量 (t,i,n) ,因此每次调用他返回 list 中的下一个元素值,当 list 中没有值时,返回 nil. 我们可以在 while 语句中使用这个迭代器:
t = {10, 20, 30}
iter = list_iter(t)      -- creates the iterator
while true do
    local element = iter()   -- calls the iterator
    if element == nil then break end
    print(element)
end
我们设计的这个迭代器也很容易用于范性 for 语句
t = {10, 20, 30}
for element in list_iter(t) do
    print(element)
end
范性 for 为迭代循环处理所有的薄记( bookkeeping ):首先调用迭代工厂;内部保留迭代函数,因此我们不需要 iter 变量;然后在每一个新的迭代处调用迭代器函数;当迭代器返回 nil 时循环结束(后面我们将看到范性 for 能胜任更多的任务)。
下面看一个稍微复杂一点的例子:我们写一个迭代器遍历一个文件内的所有匹配的单词。为了实现目的,我们需要保留两个值:当前行和在当前行的偏移量,我们使用两个外部局部变量 line pos 保存这两个值。
function allwords()
    local line = io.read()   -- current line
    local pos = 1            -- current position in the line
    return function ()       -- iterator function
       while line do        -- repeat while there are lines
       local s, e = string.find(line, "%w+", pos)
           if s then         -- found a word?
              pos = e + 1   -- next position is after this word
              return string.sub(line, s, e) -- return the word
           else
              line = io.read() -- word not found; try next line
              pos = 1       -- restart from first position
           end
       end
    return nil    -- no more lines: end of traversal
    end
end
迭代函数的主体部分调用了 string.find 函数, string.find 在当前行从当前位置开始查找匹配的单词,例子中匹配的单词使用模式 '%w+' 描述的;如果查找到一个单词,迭代函数更新当前位置 pos 为单词后的第一个位置,并且返回这个单词( string.sub 函数从 line 中提取两个位置参数之间的子串)。否则迭代函数读取新的一行并重新搜索。如果没有 line 可读返回 nil 结束。
尽管迭代函数有些复杂,但使用起来是很直观的:
for word in allwords() do
    print(word)
end
通常情况下,迭代函数大都难写易用。这不是大问题,一般 Lua 编程不需要自己写迭代函数,语言本身提供了许多。当然,必要时,自己动手构造一二亦可。
7.2 范性for的语义
前面我们看到的迭代器有一个缺点:每次调用都需要创建一个闭包,大多数情况下这种做法都没什么问题,例如在 allwords 迭代器中创建一个闭包的代价比起读整个文件来说微不足道,然而在有些情况下创建闭包的代价是不能忍受的。在这些情况下我们可以使用范性 for 本身来保存迭代的状态。
前面我们看到在循环过程中范性 for 在自己内部保存迭代函数,实际上它保存三个值:迭代函数、状态常量、控制变量。下面详细说明。
范性 for 的文法如下:
for <var-list> in <exp-list> do
    <body>
end
<var-list> 是以一个或多个逗号分隔的变量名列表, <exp-list> 是以一个或多个逗号分隔的表达式列表,通常情况下 exp-list 只有一个值:迭代工厂的调用。
for k, v in pairs(t) do
    print(k, v)
end
上面代码中, k, v 为变量列表; pair(t) 为表达式列表。
在很多情况下变量列表也只有一个变量,比如:
for line in io.lines() do
    io.write(line, '/n')
end
我们称变量列表中第一个变量为控制变量,其值为 nil 时循环结束。
下面我们看看范性 for 的执行过程:
首先,初始化,计算 in 后面表达式的值,表达式应该返回范性 for 需要的三个值:迭代函数、状态常量、控制变量;与多值赋值一样,如果表达式返回的结果个数不足三个会自动用 nil 补足,多出部分会被忽略。
第二,将状态常量和控制变量作为参数调用迭代函数(注意:对于 for 结构来说,状态常量没有用处,仅仅在初始化时获取他的值并传递给迭代函数)。
第三,将迭代函数返回的值赋给变量列表。
第四,如果返回的第一个值为 nil 循环结束,否则执行循环体。
第五,回到第二步再次调用迭代函数。
更具体地说:
for var_1, ..., var_n in explist do block end
等价于
do
    local _f, _s, _var = explist
    while true do
       local var_1, ... , var_n = _f(_s, _var)
       _var = var_1
       if _var == nil then break end
       block
    end
end
如果我们的迭代函数是 f ,状态常量是 s ,控制变量的初始值是 a0 ,那么控制变量将循环: a1=f(s,a0) a2=f(s,a1) 、……,直到 ai=nil
7.3 无状态的迭代器
无状态的迭代器是指不保留任何状态的迭代器,因此在循环中我们可以利用无状态迭代器避免创建闭包花费额外的代价。
每一次迭代,迭代函数都是用两个变量(状态常量和控制变量)的值作为参数被调用,一个无状态的迭代器只利用这两个值可以获取下一个元素。这种无状态迭代器的典型的简单的例子是 ipairs ,他遍历数组的每一个元素。
a = {"one", "two", "three"}
for i, v in ipairs(a) do
    print(i, v)
end
迭代的状态包括被遍历的表(循环过程中不会改变的状态常量)和当前的索引下标(控制变量), ipairs 和迭代函数都很简单,我们在 Lua 中可以这样实现:
function iter (a, i)
    i = i + 1
    local v = a[i]
    if v then
       return i, v
    end
end
 
function ipairs (a)
    return iter, a, 0
end
Lua 调用 ipairs(a) 开始循环时,他获取三个值:迭代函数 iter 、状态常量 a 、控制变量初始值 0 ;然后 Lua 调用 iter(a,0) 返回 1,a[1] (除非 a[1]=nil );第二次迭代调用 iter(a,1) 返回 2,a[2] ……直到第一个非 nil 元素。
Lua 库中实现的 pairs 是一个用 next 实现的原始方法:
function pairs (t)
    return next, t, nil
end
还可以不使用 ipairs 直接使用 next
for k, v in next, t do
    ...
end
记住: exp-list 返回结果会被调整为三个,所以 Lua 获取 next t nil ;确切地说当他调用 pairs 时获取。
7.4 多状态的迭代器
很多情况下,迭代器需要保存多个状态信息而不是简单的状态常量和控制变量,最简单的方法是使用闭包,还有一种方法就是将所有的状态信息封装到 table 内,将 table 作为迭代器的状态常量,因为这种情况下可以将所有的信息存放在 table 内,所以迭代函数通常不需要第二个参数。
下面我们重写 allwords 迭代器,这一次我们不是使用闭包而是使用带有两个域( line, pos )的 table
开始迭代的函数是很简单的,他必须返回迭代函数和初始状态:
local iterator       -- to be defined later
 
function allwords()
    local state = {line = io.read(), pos = 1}
    return iterator, state
end
真正的处理工作是在迭代函数内完成:
function iterator (state)
    while state.line do      -- repeat while there are lines
       -- search for next word
       local s, e = string.find(state.line, "%w+", state.pos)
       if s then     -- found a word?
           -- update next position (after this word)
           state.pos = e + 1
           return string.sub(state.line, s, e)
       else   -- word not found
           state.line = io.read()   -- try next line...
           state.pos = 1     -- ... from first position
       end
    end
    return nil        -- no more lines: end loop
end
我们应该尽可能的写无状态的迭代器,因为这样循环的时候由 for 来保存状态,不需要创建对象花费的代价小;如果不能用无状态的迭代器实现,应尽可能使用闭包;尽可能不要使用 table 这种方式,因为创建闭包的代价要比创建 table 小,另外 Lua 处理闭包要比处理 table 速度快些。后面我们还将看到另一种使用协同来创建迭代器的方式,这种方式功能更强但更复杂。
7.5 真正的迭代器
迭代器的名字有一些误导,因为它并没有迭代,完成迭代功能的是 for 语句,也许更好的叫法应该是生成器( generator );但是在其他语言比如 java C++ 迭代器的说法已经很普遍了,我们也就沿用这个术语。
有一种方式创建一个在内部完成迭代的迭代器。这样当我们使用迭代器的时候就不需要使用循环了;我们仅仅使用每一次迭代需要处理的任务作为参数调用迭代器即可,具体地说,迭代器接受一个函数作为参数,并且这个函数在迭代器内部被调用。
作为一个具体的例子,我们使用上述方式重写 allwords 迭代器:
function allwords (f)
    -- repeat for each line in the file
    for l in io.lines() do
       -- repeat for each word in the line
       for w in string.gfind(l, "%w+") do
           -- call the function
           f(w)
       end
    end
end
如果我们想要打印出单词,只需要
allwords(print)
更一般的做法是我们使用匿名函数作为作为参数,下面的例子打印出单词 'hello' 出现的次数:
local count = 0
allwords(function (w)
    if w == "hello" then count = count + 1 end
end)
print(count)
for 结构完成同样的任务:
local count = 0
for w in allwords() do
    if w == "hello" then count = count + 1 end
end
print(count)
真正的迭代器风格的写法在 Lua 老版本中很流行,那时还没有 for 循环。
两种风格的写法相差不大,但也有区别:一方面,第二种风格更容易书写和理解;另一方面, for 结构更灵活,可以使用 break continue 语句;在真正的迭代器风格写法中 return 语句只是从匿名函数中返回而不是退出循环.  

发表于 @ 2008年05月08日 11:41:33|评论(0)|编辑



新一篇: (LUA教程)第9章 协同程序 | 旧一篇: (LUA教程)第7章 迭代器与泛型for

虽然我们把 Lua 当作解释型语言,但是 Lua 会首先把代码预编译成中间码然后再执行(很多解释型语言都是这么做的)。在解释型语言中存在编译阶段听起来不合适,然而,解释型语言的特征不在于他们是否被编译,而是编译器是语言运行时的一部分,所以,执行编译产生的中间码速度会更快。我们可以说函数 dofile 的存在就是说明可以将 Lua 作为一种解释型语言被调用。
前面我们介绍过 dofile ,把它当作 Lua 运行代码的 chunk 的一种原始的操作。 dofile 实际上是一个辅助的函数。真正完成功能的函数是 loadfile ;与 dofile 不同的是 loadfile 编译代码成中间码并且返回编译后的 chunk 作为一个函数,而不执行代码;另外 loadfile 不会抛出错误信息而是返回错误码。我们可以这样定义 dofile
function dofile (filename)
    local f = assert(loadfile(filename))
    return f()
end
如果 loadfile 失败 assert 会抛出错误。
完成简单的功能 dofile 比较方便,他读入文件编译并且执行。然而 loadfile 更加灵活。在发生错误的情况下, loadfile 返回 nil 和错误信息,这样我们就可以自定义错误处理。另外,如果我们运行一个文件多次的话, loadfile 只需要编译一次,但可多次运行。 dofile 却每次都要编译。
loadstring loadfile 相似,只不过它不是从文件里读入 chunk ,而是从一个串中读入。例如:
f = loadstring("i = i + 1")
f 将是一个函数,调用时执行 i=i+1
i = 0
f(); print(i)     --> 1
f(); print(i)     --> 2
loadstring 函数功能强大,但使用时需多加小心。确认没有其它简单的解决问题的方法再使用。
Lua 把每一个 chunk 都作为一个匿名函数处理。例如: chunk "a = 1" loadstring 返回与其等价的 function () a = 1 end
与其他函数一样, chunks 可以定义局部变量也可以返回值:
f = loadstring("local a = 10; return a + 20")
print(f())        --> 30
loadfile loadstring 都不会抛出错误,如果发生错误他们将返回 nil 加上错误信息:
print(loadstring("i i"))
       --> nil    [string "i i"]:1: '=' expected near 'i'
另外, loadfile loadstring 都不会有边界效应产生,他们仅仅编译 chunk 成为自己内部实现的一个匿名函数。通常对他们的误解是他们定义了函数。 Lua 中的函数定义是发生在运行时的赋值而不是发生在编译时。假如我们有一个文件 foo.lua
-- file `foo.lua'
function foo (x)
    print(x)
end
当我们执行命令 f = loadfile("foo.lua") 后, foo 被编译了但还没有被定义,如果要定义他必须运行 chunk
f()           -- defines `foo'
foo("ok")     --> ok
如果你想快捷的调用 dostring (比如加载并运行),可以这样
loadstring(s)()
调用 loadstring 返回的结果,然而如果加载的内容存在语法错误的话, loadstring 返回 nil 和错误信息( attempt to call a nil value );为了返回更清楚的错误信息可以使用 assert
assert(loadstring(s))()
通常使用 loadstring 加载一个字串没什么意义,例如:
f = loadstring("i = i + 1")
大概与 f = function () i = i + 1 end 等价,但是第二段代码速度更快因为它只需要编译一次,第一段代码每次调用 loadstring 都会重新编译,还有一个重要区别: loadstring 编译的时候不关心词法范围:
local i = 0
f = loadstring("i = i + 1")
g = function () i = i + 1 end
这个例子中,和想象的一样 g 使用局部变量 i ,然而 f 使用全局变量 i loadstring 总是在全局环境中编译他的串。
loadstring 通常用于运行程序外部的代码,比如运行用户自定义的代码。注意: loadstring 期望一个 chunk ,即语句。如果想要加载表达式,需要在表达式前加 return ,那样将返回表达式的值。看例子:
print "enter your expression:"
local l = io.read()
local func = assert(loadstring("return " .. l))
print("the value of your expression is " .. func())
loadstring 返回的函数和普通函数一样,可以多次被调用:
print "enter function to be plotted (with variable 'x'):"
local l = io.read()
local f = assert(loadstring("return " .. l))
for i=1,20 do
    x = i   -- global 'x' (to be visible from the chunk)
    print(string.rep("*", f()))
end
8.1 require函数
Lua 提供高级的 require 函数来加载运行库。粗略的说 require dofile 完成同样的功能但有两点不同:
1.        require 会搜索目录加载文件
2.        require 会判断是否文件已经加载避免重复加载同一文件。由于上述特征, require Lua 中是加载库的更好的函数。
require 使用的路径和普通我们看到的路径还有些区别,我们一般见到的路径都是一个目录列表。 require 的路径是一个模式列表,每一个模式指明一种由虚文件名( require 的参数)转成实文件名的方法。更明确地说,每一个模式是一个包含可选的问号的文件名。匹配的时候 Lua 会首先将问号用虚文件名替换,然后看是否有这样的文件存在。如果不存在继续用同样的方法用第二个模式匹配。例如,路径如下:
?;?.lua;c:/windows/?;/usr/local/lua/?/?.lua
调用 require "lili" 时会试着打开这些文件:
lili
lili.lua
c:/windows/lili
/usr/local/lua/lili/lili.lua
require 关注的问题只有分号(模式之间的分隔符)和问号,其他的信息(目录分隔符,文件扩展名)在路径中定义。
为了确定路径, Lua 首先检查全局变量 LUA_PATH 是否为一个字符串,如果是则认为这个串就是路径;否则 require 检查环境变量 LUA_PATH 的值,如果两个都失败 require 使用固定的路径(典型的 "?;?.lua"
require 的另一个功能是避免重复加载同一个文件两次。 Lua 保留一张所有已经加载的文件的列表(使用 table 保存)。如果一个加载的文件在表中存在 require 简单的返回;表中保留加载的文件的虚名,而不是实文件名。所以如果你使用不同的虚文件名 require 同一个文件两次,将会加载两次该文件。比如 require "foo" require "foo.lua" ,路径为 "?;?.lua" 将会加载 foo.lua 两次。我们也可以通过全局变量 _LOADED 访问文件名列表,这样我们就可以判断文件是否被加载过;同样我们也可以使用一点小技巧让 require 加载一个文件两次。比如, require "foo" 之后 _LOADED["foo"] 将不为 nil ,我们可以将其赋值为 nil require "foo.lua" 将会再次加载该文件。
一个路径中的模式也可以不包含问号而只是一个固定的路径,比如:
?;?.lua;/usr/local/default.lua
这种情况下, require 没有匹配的时候就会使用这个固定的文件(当然这个固定的路径必须放在模式列表的最后才有意义)。在 require 运行一个 chunk 以前,它定义了一个全局变量 _REQUIREDNAME 用来保存被 required 的虚文件的文件名。我们可以通过使用这个技巧扩展 require 的功能。举个极端的例子,我们可以把路径设为 "/usr/local/lua/newrequire.lua" ,这样以后每次调用 require 都会运行 newrequire.lua ,这种情况下可以通过使用 _REQUIREDNAME 的值去实际加载 required 的文件。
8.2 C Packages
Lua C 是很容易结合的,使用 C Lua 写包。与 Lua 中写包不同, C 包在使用以前必须首先加载并连接,在大多数系统中最容易的实现方式是通过动态连接库机制,然而动态连接库不是 ANSI C 的一部分,也就是说在标准 C 中实现动态连接是很困难的。
通常 Lua 不包含任何不能用标准 C 实现的机制,动态连接库是一个特例。我们可以将动态连接库机制视为其他机制之母:一旦我们拥有了动态连接机制,我们就可以动态的加载 Lua 中不存在的机制。所以,在这种特殊情况下, Lua 打破了他平台兼容的原则而通过条件编译的方式为一些平台实现了动态连接机制。标准的 Lua windows Linux FreeBSD Solaris 和其他一些 Unix 平台实现了这种机制,扩展其它平台支持这种机制也是不难的。在 Lua 提示符下运行 print(loadlib()) 看返回的结果,如果显示 bad arguments 则说明你的发布版支持动态连接机制,否则说明动态连接机制不支持或者没有安装。
Lua 在一个叫 loadlib 的函数内提供了所有的动态连接的功能。这个函数有两个参数 : 库的绝对路径和初始化函数。所以典型的调用的例子如下:
local path = "/usr/local/lua/lib/libluasocket.so"
local f = loadlib(path, "luaopen_socket")
loadlib 函数加载指定的库并且连接到 Lua ,然而它并不打开库(也就是说没有调用初始化函数),反之他返回初始化函数作为 Lua 的一个函数,这样我们就可以直接在 Lua 中调用他。如果加载动态库或者查找初始化函数时出错, loadlib 将返回 nil 和错误信息。我们可以修改前面一段代码,使其检测错误然后调用初始化函数:
local path = "/usr/local/lua/lib/libluasocket.so"
-- or path = "C://windows//luasocket.dll"
local f = assert(loadlib(path, "luaopen_socket"))
f() -- actually open the library
一般情况下我们期望二进制的发布库包含一个与前面代码段相似的 stub 文件,安装二进制库的时候可以随便放在某个目录,只需要修改 stub 文件对应二进制库的实际路径即可。将 stub 文件所在的目录加入到 LUA_PATH ,这样设定后就可以使用 require 函数加载 C 库了。
8.3 错误
Errare humanum est (拉丁谚语:犯错是人的本性)。所以我们要尽可能的防止错误的发生, Lua 经常作为扩展语言嵌入在别的应用中,所以不能当错误发生时简单的崩溃或者退出。相反,当错误发生时 Lua 结束当前的 chunk 并返回到应用中。
Lua 遇到不期望的情况时就会抛出错误,比如:两个非数字进行相加;调用一个非函数的变量;访问表中不存在的值等(可以通过 metatables 修改这种行为,后面介绍)。你也可以通过调用 error 函数显式地抛出错误, error 的参数是要抛出的错误信息。
print "enter a number:"
n = io.read("*number")
if not n then error("invalid input") end
Lua 提供了专门的内置函数 assert 来完成上面类似的功能:
print "enter a number:"
n = assert(io.read("*number"), "invalid input")
assert 首先检查第一个参数,若没问题, assert 不做任何事情;否则, assert 以第二个参数作为错误信息抛出。第二个参数是可选的。注意, assert 会首先处理两个参数,然后才调用函数,所以下面代码,无论 n 是否为数字,字符串连接操作总会执行:
n = io.read()
assert(tonumber(n), "invalid input: " .. n .. " is not a number")
当函数遇到异常有两个基本的动作:返回错误代码或者抛出错误。选择哪一种方式,没有固定的规则,不过基本的原则是:对于程序逻辑上能够避免的异常,以抛出错误的方式处理之,否则返回错误代码。
例如 sin 函数,假定我们让 sin 碰到错误时返回错误代码,则使用 sin 的代码可能变为:
local res = math.sin(x)
if not res then      -- error
    ...
当然,我们也可以在调用 sin 前检查 x 是否为数字:
if not tonumber(x) then     -- error: x is not a number
    ...
而事实上,我们既不是检查参数也不是检查返回结果,因为参数错误可能意味着我们的程序某个地方存在问题,这种情况下,处理异常最简单最实际的方式是抛出错误并且终止代码的运行。
再来看一个例子。 io.open 函数用于打开文件,如果文件不存在,结果会如何?很多系统中,我们通过“试着去打开文件”来判断文件是否存在。所以如果 io.open 不能打开文件(由于文件不存在或者没有权限),函数返回 nil 和错误信息。依据这种方式,我们可以通过与用户交互(比如:是否要打开另一个文件)合理地处理问题:
local file, msg
repeat
    print "enter a file name:"
    local name = io.read()
    if not name then return end     -- no input
    file, msg = io.open(name, "r")
    if not file then print(msg) end
until file
如果你想偷懒不想处理这些情况,又想代码安全的运行,可以使用 assert
file = assert(io.open(name, "r"))
Lua 中有一个习惯:如果 io.open 失败, assert 将抛出错误。
file = assert(io.open("no-file", "r"))
       --> stdin:1: no-file: No such file or directory
注意: io.open 返回的第二个结果(错误信息)会作为 assert 的第二个参数。
8.4 异常和错误处理
很多应用中,不需要在 Lua 进行错误处理,一般有应用来完成。通常应用要求 Lua 运行一段 chunk ,如果发生异常,应用根据 Lua 返回的错误代码进行处理。在控制台模式下的 Lua 解释器如果遇到异常,打印出错误然后继续显示提示符等待下一个命令。
如果在 Lua 中需要处理错误,需要使用 pcall 函数封装你的代码。
假定你想运行一段 Lua 代码,这段代码运行过程中可以捕捉所有的异常和错误。
第一步:将这段代码封装在一个函数内
function foo ()
    ...
    if unexpected_condition then error() end
    ...
    print(a[i])   -- potential error: `a' may not be a table
    ...
end
第二步:使用 pcall 调用这个函数
if pcall(foo) then
    -- no errors while running `foo'
    ...
else
    -- `foo' raised an error: take appropriate actions
    ...
end
当然也可以用匿名函数的方式调用 pcall
if pcall(function () ... end) then ...
else ...
pcall 在保护模式( protected mode )下执行函数内容,同时捕获所有的异常和错误。若一切正常, pcall 返回 true 以及“被执行函数”的返回值;否则返回 nil 和错误信息。
错误信息不一定仅为字符串(下面的例子是一个 table ),传递给 error 的任何信息都会被 pcall 返回:
local status, err = pcall(function () error({code=121}) end)
print(err.code) --> 121
这种机制提供了强大的能力,足以应付 Lua 中的各种异常和错误情况。我们通过 error 抛出异常,然后通过 pcall 捕获之。
8.5 错误信息和回跟踪(Tracebacks
虽然你可以使用任何类型的值作为错误信息,通常情况下,我们使用字符串来描述遇到的错误。如果遇到内部错误(比如对一个非 table 的值使用索引下标访问) Lua 将自己产生错误信息,否则 Lua 使用传递给 error 函数的参数作为错误信息。不管在什么情况下, Lua 都尽可能清楚的描述问题发生的缘由。
local status, err = pcall(function () a = 'a'+1 end)
print(err)
--> stdin:1: attempt to perform arithmetic on a string value
 
local status, err = pcall(function () error("my error") end)
print(err)
--> stdin:1: my error
例子中错误信息给出了文件名( stdin )与行号。
函数 error 还可以有第二个参数,表示错误发生的层级。比如,你写了一个函数用来检查“ error 是否被正确调用”:
function foo (str)
    if type(str) ~= "string" then
       error("string expected")
    end
    ...
end
可有人这样调用此函数:
foo({x=1})
Lua 会指出发生错误的是 foo 而不是 error ,实际上,错误是调用 error 时产生的。为了纠正这个问题,修改前面的代码让 error 报告错误发生在第二级(你自己的函数是第一级)如下:
function foo (str)
    if type(str) ~= "string" then
       error("string expected", 2)
    end
    ...
end
当错误发生的时候,我们常常希望了解详细的信息,而不仅是错误发生的位置。若能了解到“错误发生时的栈信息”就好了,但 pcall 返回错误信息时,已经释放了保存错误发生情况的栈信息。因此,若想得到 tracebacks ,我们必须在 pcall 返回以前获取。 Lua 提供了 xpcall 来实现这个功能, xpcall 接受两个参数:调用函数、错误处理函数。当错误发生时, Lua 会在栈释放以前调用错误处理函数,因此可以使用 debug 库收集错误相关信息。有两个常用的 debug 处理函数: debug.debug debug.traceback ,前者给出 Lua 的提示符,你可以自己动手察看错误发生时的情况;后者通过 traceback 创建更多的错误信息,也是控制台解释器用来构建错误信息的函数。你可以在任何时候调用 debug.traceback 获取当前运行的 traceback 信息:
print(debug.traceback())

发表于 @ 2008年05月08日 11:42:47|评论(0)|编辑



新一篇: (LUA教程)第10章 完整示例 | 旧一篇: (LUA教程)第8章 编译·运行·错误信息

协同程序( coroutine )与多线程情况下的线程比较类似:有自己的堆栈,自己的局部变量,有自己的指令指针( IP instruction pointer ),但与其它协同程序共享全局变量等很多信息。线程和协同程序的主要不同在于:在多处理器情况下,从概念上来讲多线程程序同时运行多个线程;而协同程序是通过协作来完成,在任一指定时刻只有一个协同程序在运行,并且这个正在运行的协同程序只在必要时才会被挂起。
协同是非常强大的功能,但是用起来也很复杂。如果你是第一次阅读本章,某些例子可能会不大理解,不必担心,可先继续阅读后面的章节,再回头琢磨本章内容。
9.1 协同的基础
Lua 的所有协同函数存放于 coroutine table 中。 create 函数用于创建新的协同程序,其只有一个参数:一个函数,即协同程序将要运行的代码。若一切顺利,返回值为 thread 类型,表示创建成功。通常情况下, create 的参数是匿名函数:
co = coroutine.create(function ()
    print("hi")
end)
 
print(co)     --> thread: 0x8071d98
协同有三个状态:挂起态( suspended )、运行态( running )、停止态( dead )。当我们创建协同程序成功时,其为挂起态,即此时协同程序并未运行。我们可用 status 函数检查协同的状态:
print(coroutine.status(co))     --> suspended
函数 coroutine.resume 使协同程序由挂起状态变为运行态:
coroutine.resume(co)            --> hi
本例中,协同程序打印出 "hi" 后,任务完成,便进入终止态:
print(coroutine.status(co))     --> dead
当目前为止,协同看起来只是一种复杂的调用函数的方式,真正的强大之处体现在 yield 函数,它可以将正在运行的代码挂起,看一个例子:
co = coroutine.create(function ()
    for i=1,10 do
       print("co", i)
       coroutine.yield()
    end
end)
执行这个协同程序,程序将在第一个 yield 处被挂起:
coroutine.resume(co)            --> co   1
print(coroutine.status(co))     --> suspended
从协同的观点看:使用函数 yield 可以使程序挂起,当我们激活被挂起的程序时,将从函数 yield 的位置继续执行程序,直到再次遇到 yield 或程序结束。
coroutine.resume(co)     --> co   2
coroutine.resume(co)     --> co   3
...
coroutine.resume(co)     --> co   10
coroutine.resume(co)     -- prints nothing
上面最后一次调用时,协同体已结束,因此协同程序处于终止态。如果我们仍然希望激活它, resume 将返回 false 和错误信息。
print(coroutine.resume(co))
        --> false   cannot resume dead coroutine
注意: resume 运行在保护模式下,因此,如果协同程序内部存在错误, Lua 并不会抛出错误,而是将错误返回给 resume 函数。
Lua 中协同的强大能力,还在于通过 resume-yield 来交换数据。
第一个例子中只有 resume ,没有 yield resume 把参数传递给协同的主程序。
co = coroutine.create(function (a,b,c)
    print("co", a,b,c)
end)
coroutine.resume(co, 1, 2, 3)      --> co 1 2 3
第二个例子,数据由 yield 传给 resume true 表明调用成功, true 之后的部分,即是 yield 的参数。
co = coroutine.create(function (a,b)
    coroutine.yield(a + b, a - b)
end)
print(coroutine.resume(co, 20, 10))    --> true 30 10
相应地, resume 的参数,会被传递给 yield
co = coroutine.create (function ()
    print("co", coroutine.yield())
end)
coroutine.resume(co)
coroutine.resume(co, 4, 5)      --> co 4 5
最后一个例子,协同代码结束时的返回值,也会传给 resume
co = coroutine.create(function ()
    return 6, 7
end)
print(coroutine.resume(co))     --> true 6 7
我们很少在一个协同程序中同时使用多个特性,但每一种都有用处。
现在已大体了解了协同的基础内容,在我们继续学习之前,先澄清两个概念: Lua 的协同称为不对称协同( asymmetric coroutines ),指“挂起一个正在执行的协同函数”与“使一个被挂起的协同再次执行的函数”是不同的,有些语言提供对称协同( symmetric coroutines ),即使用同一个函数负责“执行与挂起间的状态切换”。
有人称不对称的协同为半协同,另一些人使用同样的术语表示真正的协同,严格意义上的协同不论在什么地方只要它不是在其他的辅助代码内部的时候都可以并且只能使执行挂起,不论什么时候在其控制栈内都不会有不可决定的调用。( However, other people use the same term semi-coroutine to denote a restricted implementation of coroutines, where a coroutine can only suspend its execution when it is not inside any auxiliary function, that is, when it has no pending calls in its control stack. )。只有半协同程序内部可以使用 yield python 中的产生器( generator )就是这种类型的半协同。
与对称的协同和不对称协同的区别不同的是,协同与产生器的区别更大。产生器相对比较简单,他不能完成真正的协同所能完成的一些任务。我们熟练使用不对称的协同之后,可以利用不对称的协同实现比较优越的对称协同。
9.2 管道和过滤器
协同最具代表性的例子是用来解决生产者 - 消费者问题。假定有一个函数不断地生产数据(比如从文件中读取),另一个函数不断的处理这些数据(比如写到另一文件中),函数如下:
function producer ()
    while true do
       local x = io.read()      -- produce new value
       send(x)                  -- send to consumer
    end
end
 
function consumer ()
    while true do
       local x = receive()      -- receive from producer
       io.write(x, "/n")        -- consume new value
    end
end
(例子中生产者和消费者都在不停的循环,修改一下使得没有数据的时候他们停下来并不困难),问题在于如何使得 receive send 协同工作。只是一个典型的谁拥有主循环的情况,生产者和消费者都处在活动状态,都有自己的主循环,都认为另一方是可调用的服务。对于这种特殊的情况,可以改变一个函数的结构解除循环,使其作为被动的接受。然而这种改变在某些特定的实际情况下可能并不简单。
协同为解决这种问题提供了理想的方法,因为调用者与被调用者之间的 resume-yield 关系会不断颠倒。当一个协同调用 yield 时并不会进入一个新的函数,取而代之的是返回一个未决的 resume 的调用。相似的,调用 resume 时也不会开始一个新的函数而是返回 yield 的调用。这种性质正是我们所需要的,与使得 send-receive 协同工作的方式是一致的。 receive 唤醒生产者生产新值, send 把产生的值送给消费者消费。
function receive ()
    local status, value = coroutine.resume(producer)
    return value
end
 
function send (x)
    coroutine.yield(x)
end
 
producer = coroutine.create( function ()
    while true do
       local x = io.read()      -- produce new value
       send(x)
    end
end)
这种设计下,开始时调用消费者,当消费者需要值时他唤起生产者生产值,生产者生产值后停止直到消费者再次请求。我们称这种设计为消费者驱动的设计。
我们可以使用过滤器扩展这个设计,过滤器指在生产者与消费者之间,可以对数据进行某些转换处理。过滤器在同一时间既是生产者又是消费者,他请求生产者生产值并且转换格式后传给消费者,我们修改上面的代码加入过滤器(给每一行前面加上行号)。完整的代码如下:
function receive (prod)
    local status, value = coroutine.resume(prod)
    return value
end
 
function send (x)
    coroutine.yield(x)
end
 
function producer ()
    return coroutine.create(function ()
       while true do
           local x = io.read()      -- produce new value
           send(x)
       end
    end)
end
 
function filter (prod)
    return coroutine.create(function ()
       local line = 1
       while true do
           local x = receive(prod) -- get new value
           x = string.format("%5d %s", line, x)
           send(x)       -- send it to consumer
           line = line + 1
       end
    end)
end
 
function consumer (prod)
    while true do
       local x = receive(prod) -- get new value
       io.write(x, "/n")        -- consume new value
    end
end
可以调用:
p = producer()
f = filter(p)
consumer(f)
或者:
consumer(filter(producer()))
看完上面这个例子你可能很自然的想到 UNIX 的管道,协同是一种非抢占式的多线程。管道的方式下,每一个任务在独立的进程中运行,而协同方式下,每个任务运行在独立的协同代码中。管道在读( consumer )与写( producer )之间提供了一个缓冲,因此两者相关的的速度没有什么限制,在上下文管道中这是非常重要的,因为在进程间的切换代价是很高的。协同模式下,任务间的切换代价较小,与函数调用相当,因此读写可以很好的协同处理。
9.3 用作迭代器的协同
我们可以将循环的迭代器看作生产者 - 消费者模式的特殊的例子。迭代函数产生值给循环体消费。所以可以使用协同来实现迭代器。协同的一个关键特征是它可以不断颠倒调用者与被调用者之间的关系,这样我们毫无顾虑的使用它实现一个迭代器,而不用保存迭代函数返回的状态。
我们来完成一个打印一个数组元素的所有的排列来阐明这种应用。直接写这样一个迭代函数来完成这个任务并不容易,但是写一个生成所有排列的递归函数并不难。思路是这样的:将数组中的每一个元素放到最后,依次递归生成所有剩余元素的排列。代码如下:
function permgen (a, n)
    if n == 0 then
       printResult(a)
    else
       for i=1,n do
 
           -- put i-th element as the last one
           a[n], a[i] = a[i], a[n]
 
           -- generate all permutations of the other elements
           permgen(a, n - 1)
 
           -- restore i-th element
           a[n], a[i] = a[i], a[n]
 
       end
    end
end
 
function printResult (a)
    for i,v in ipairs(a) do
       io.write(v, " ")
    end
    io.write("/n")
end
 
permgen ({1,2,3,4}, 4)
有了上面的生成器后,下面我们将这个例子修改一下使其转换成一个迭代函数:
1.  第一步 printResult  改为  yield
function permgen (a, n)
    if n == 0 then
       coroutine.yield(a)
    else
       ...
2.  第二步,我们定义一个迭代工厂,修改生成器在生成器内创建迭代函数,并使生成器运行在一个协同程序内。迭代函数负责请求协同产生下一个可能的排列。
function perm (a)
    local n = table.getn(a)
    local co = coroutine.create(function () permgen(a, n) end)
    return function ()   -- iterator
       local code, res = coroutine.resume(co)
       return res
    end
end
这样我们就可以使用 for 循环来打印出一个数组的所有排列情况了:
for p in perm{"a", "b", "c"} do
    printResult(p)
end
--> b c a
--> c b a
--> c a b
--> a c b
--> b a c
--> a b c
perm 函数使用了 Lua 中常用的模式:将一个对协同的 resume 的调用封装在一个函数内部,这种方式在 Lua 非常常见,所以 Lua 专门为此专门提供了一个函数 coroutine.wrap 。与 create 相同的是, wrap 创建一个协同程序;不同的是 wrap 不返回协同本身,而是返回一个函数,当这个函数被调用时将 resume 协同。 wrap resume 协同的时候不会返回错误代码作为第一个返回结果,一旦有错误发生,将抛出错误。我们可以使用 wrap 重写 perm
function perm (a)
    local n = table.getn(a)
    return coroutine.wrap(function () permgen(a, n) end)
end
一般情况下, coroutine.wrap coroutine.create 使用起来简单直观,前者更确切的提供了我们所需要的:一个可以 resume 协同的函数,然而缺少灵活性,没有办法知道 wrap 所创建的协同的状态,也没有办法检查错误的发生。
9.4 非抢占式多线程
如前面所见, Lua 中的协同是一协作的多线程,每一个协同等同于一个线程, yield-resume 可以实现在线程中切换。然而与真正的多线程不同的是,协同是非抢占式的。当一个协同正在运行时,不能在外部终止他。只能通过显示的调用 yield 挂起他的执行。对于某些应用来说这个不存在问题,但有些应用对此是不能忍受的。不存在抢占式调用的程序是容易编写的。不需要考虑同步带来的 bugs ,因为程序中的所有线程间的同步都是显示的。你仅仅需要在协同代码超出临界区时调用 yield 即可。
对非抢占式多线程来说,不管什么时候只要有一个线程调用一个阻塞操作( blocking operation ),整个程序在阻塞操作完成之前都将停止。对大部分应用程序而言,只是无法忍受的,这使得很多程序员离协同而去。下面我们将看到这个问题可以被有趣的解决。
看一个多线程的例子:我们想通过 http 协议从远程主机上下在一些文件。我们使用 Diego Nehab 开发的 LuaSocket 库来完成。我们先看下在一个文件的实现,大概步骤是打开一个到远程主机的连接,发送下载文件的请求,开始下载文件,下载完毕后关闭连接。
第一,加载 LuaSocket
require "luasocket"
第二,定义远程主机和需要下载的文件名
host = "www.w3.org"
file = "/TR/REC-html32.html"
第三,打开一个 TCP 连接到远程主机的 80 端口( http 服务的标准端口)
c = assert(socket.connect(host, 80))
上面这句返回一个连接对象,我们可以使用这个连接对象请求发送文件
c:send("GET " .. file .. " HTTP/1.0/r/n/r/n")
receive 函数返回他送接收到的数据加上一个表示操作状态的字符串。当主机断开连接时,我们退出循环。
第四,关闭连接
c:close()
现 在我们知道了如何下载一个文件,下面我们来看看如何下载多个文件。一种方法是我们在一个时刻只下载一个文件,这种顺序下载的方式必须等前一个文件下载完成 后一个文件才能开始下载。实际上是,当我们发送一个请求之后有很多时间是在等待数据的到达,也就是说大部分时间浪费在调用 receive 上。 如果同时可以下载多个文件,效率将会有很大提高。当一个连接没有数据到达时,可以从另一个连接读取数据。很显然,协同为这种同时下载提供了很方便的支持, 我们为每一个下载任务创建一个线程,当一个线程没有数据到达时,他将控制权交给一个分配器,由分配器唤起另外的线程读取数据。
使用协同机制重写上面的代码,在一个函数内:
function download (host, file)
    local c = assert(socket.connect(host, 80))
    local count = 0      -- counts number of bytes read
    c:send("GET " .. file .. " HTTP/1.0/r/n/r/n")
    while true do
       local s, status = receive©
       count = count + string.len(s)
       if status == "closed" then break end
    end
    c:close()
    print(file, count)
end
由于我们不关心文件的内容,上面的代码只是计算文件的大小而不是将文件内容输出。(当有多个线程下载多个文件时,输出会混杂在一起),在新的函数代码中,我们使用 receive 从远程连接接收数据,在顺序接收数据的方式下代码如下:
function receive (connection)
    return connection:receive(2^10)
end
在同步接受数据的方式下,函数接收数据时不能被阻塞,而是在没有数据可取时 yield ,代码如下:
function receive (connection)
    connection:timeout(0)    -- do not block
    local s, status = connection:receive(2^10)
    if status == "timeout" then
       coroutine.yield(connection)
    end
    return s, status
end
调用函数 timeout(0) 使得对连接的任何操作都不会阻塞。当操作返回的状态为 timeout 时意味着操作未完成就返回了。在这种情况下,线程 yield 。非 false 的数值作为 yield 的参数告诉分配器线程仍在执行它的任务。(后面我们将看到分配器需要 timeout 连接的情况),注意 : 即使在 timeout 模式下,连接依然返回他接受到直到 timeout 为止,因此 receive 会一直返回 s 给她的调用者。
下面的函数保证每一个下载运行在自己独立的线程内:
threads = {}      -- list of all live threads
function get (host, file)
    -- create coroutine
    local co = coroutine.create(function ()
       download(host, file)
    end)
    -- insert it in the list
    table.insert(threads, co)
end
代码中 table 中为分配器保存了所有活动的线程。
分配器代码是很简单的,它是一个循环,逐个调用每一个线程。并且从线程列表中移除已经完成任务的线程。当没有线程可以运行时退出循环。
function dispatcher ()
    while true do
       local n = table.getn(threads)
       if n == 0 then break end    -- no more threads to run
       for i=1,n do
           local status, res = coroutine.resume(threads[i])
           if not res then   -- thread finished its task?
              table.remove(threads, i)
              break
           end
       end
    end
end
最后,在主程序中创建需要的线程调用分配器,例如:从 W3C 站点上下载 4 个文件:
host = "www.w3c.org"
 
get(host, "/TR/html401/html40.txt")
get(host, "/TR/2002/REC-xhtml1-20020801/xhtml1.pdf")
get(host, "/TR/REC-html32.html")
get(host,
    "/TR/2000/REC-DOM-Level-2-Core-20001113/DOM2-Core.txt")
 
dispatcher()      -- main loop
使用协同方式下,我的机器花了 6s 下载完这几个文件;顺序方式下用了 15s ,大概 2 倍的时间。
尽管效率提高了,但距离理想的实现还相差甚远,当至少有一个线程有数据可读取的时候,这段代码可以很好的运行。否则,分配器将进入忙等待状态,从一个线程到另一个线程不停的循环判断是否有数据可获取。结果协同实现的代码比顺序读取将花费 30 倍的 CPU 时间。
为了避免这种情况出现,我们可以使用 LuaSocket 库中的 select 函数。当程序在一组 socket 中不断的循环等待状态改变时,它可以使程序被阻塞。我们只需要修改分配器,使用 select 函数修改后的代码如下:
function dispatcher ()
    while true do
       local n = table.getn(threads)
       if n == 0 then break end    -- no more threads to run
       local connections = {}
       for i=1,n do
           local status, res = coroutine.resume(threads[i])
           if not res then   -- thread finished its task?
              table.remove(threads, i)
              break
           else   -- timeout
              table.insert(connections, res)
           end
       end
       if table.getn(connections) == n then
           socket.select(connections)
       end
    end
end
在内层的循环分配器收集连接表中 timeout 地连接,注意: receive 将连接传递给 yield ,因此 resume 返回他们。当所有的连接都 timeout 分配器调用 select 等待任一连接状态的改变。最终的实现效率和上一个协同实现的方式相当,另外,他不会发生忙等待,比起顺序实现的方式消耗 CPU 的时间仅仅多一点点。
 

发表于 @ 2008年05月08日 11:44:22|评论(0)|编辑


新一篇: (LUA教程)第11章 数据结构 | 旧一篇: (LUA教程)第9章 协同程序

本章通过两个完整的例子,来展现 Lua 的实际应用。第一个例子来自于 Lua 官方网站,其展示了 Lua 作为数据描述语言的应用。第二个例子为马尔可夫链算法的实现,算法在 Kernighan & Pike 著作的 Practice of Programming 书中有描述。本章结束后, Lua 语言方面的介绍便到此结束。后续章节将分别介绍 table 与面向对象( object-orient )、标准库以及 C-API 等内容。
10.1 Lua作为数据描述语言使用
慢慢地, Lua 正被世界上越来越多的人使用。 Lua 官方网站的数据库中保存着一些“使用了 Lua ”的项目的信息。在数据库中,我们用一个构造器以自动归档的方式表示每个工程入口,代码如下:
entry{
    title = "Tecgraf",
    org = "Computer Graphics Technology Group, PUC-Rio",
    url = "http://www.tecgraf.puc-rio.br/",
    contact = "Waldemar Celes",
    description = [[
    TeCGraf is the result of a partnership between PUC-Rio,
    the Pontifical Catholic University of Rio de Janeiro,
    and <A HREF="http://www.petrobras.com.br/">PETROBRAS</A>,
    the Brazilian Oil Company.
    TeCGraf is Lua's birthplace,
    and the language has been used there since 1993.
    Currently, more than thirty programmers in TeCGraf use
    Lua regularly; they have written more than two hundred
    thousand lines of code, distributed among dozens of
    final products.]]
}
有趣的是,工程入口是存放在 Lua 文件中的,每个工程入口以 table 的形式作为参数去调用 entry 函数。我们的目的是写一个程序将这些数据以 html 格式展示出来。由于工程太多,我们首先列出工程的标题,然后显示每个工程的明细。结果如下:
<HTML>
<HEAD><TITLE>Projects using Lua</TITLE></HEAD>
<BODY BGCOLOR="#FFFFFF">
Here are brief descriptions of some projects around the
world that use <A HREF="home.html">Lua</A>.
 
 
<UL>
<LI><A HREF="#1">TeCGraf</A>
<LI> ...
</UL>
 
<H3>
<A NAME="1"
    HREF="http://www.tecgraf.puc-rio.br/">TeCGraf</A>
 
 
<SMALL><EM>Computer Graphics Technology Group,
PUC-Rio</EM></SMALL>
</H3>
 
TeCGraf is the result of a partnership between
...
distributed among dozens of final products.<P>
Contact: Waldemar Celes
 
<A NAME="2"></A><HR>
...
 
</BODY></HTML>
为了读取数据,我们需要做的是正确的定义函数 entry ,然后使用 dofile 直接运行数据文件( db.lua )即可。注意,我们需要遍历入口列表两次,第一次为了获取标题,第二次为了获取每个工程的表述。一种方法是:使用相同的 entry 函数运行数据文件一次将所有的入口放在一个数组内;另一种方法:使用不同的 entry 函数运行数据文件两次。因为 Lua 编译文件是很快的,这里我们选用第二种方法。
首先,我们定义一个辅助函数用来格式化文本的输出(参见 5.2 函数部分内容)
function fwrite (fmt, ...)
    return io.write(string.format(fmt, unpack(arg)))
end
第二,我们定义一个 BEGIN 函数用来写 html 页面的头部
function BEGIN()
io.write([[
<HTML>
<HEAD><TITLE>Projects using Lua</TITLE></HEAD>
<BODY BGCOLOR="#FFFFFF">
Here are brief descriptions of some projects around the
world that use <A HREF="home.html">Lua</A>.
]])
end
第三,定义 entry 函数
a.  第一个 entry 函数,将每个工程一列表方式写出, entry 的参数 o 是描述工程的 table
function entry0 (o)
    N=N + 1
    local title = o.title or '(no title)'
    fwrite('<LI><A HREF="#%d">%s</A>/n', N, title)
end
如果 o.title nil 表明 table 中的域 title 没有提供,我们用固定的 "no title"

你可能感兴趣的:(数据结构,function,list,table,lua,语言)