Scheme是一种多范型的编程语言,并主要支援函数式范型。它是Lisp两种主要的方言之一(另一种为Common Lisp)。与Common Lisp不同的是,Scheme强调极简主义设计与简约而可扩展的语言特性。它的精简性与优雅的语法广受计算机科学教育者以及语言设计学者的欢迎,并经常被用于基础计算机科学教育上。麻省理工学院与其他院校曾利用Scheme教授入门课程,并且著名的入门教材《计算机程序的构造和解释》(SICP,或称“魔法书”)就是利用Scheme来解释程式设计[1]。Scheme的广泛受众被视为它的一个主要优势,然而不同实现之间的差异成为了它的一个劣势[2]。
Scheme最早由麻省理工学院的盖伊·史提尔二世与杰拉德·杰伊·萨斯曼在1970年代发展出来,并由两人发表的“λ论文集”推广开来。 Scheme语言与λ演算关系十分密切。小写字母“λ”是Scheme语言的标志。
Scheme的哲学是:设计计算机语言不应该进行功能的堆砌,而应该尽可能减少弱点和限制,使剩下的功能显得必要[3]。Scheme也是第一个使用静态而非动态变量区域的Lisp方言。
目录
|
Scheme起源于约翰·麦卡锡于1958年提出的Lisp语言。通过Lisp,麦卡锡证明了图灵完备的系统可以仅仅由几个简单的算子与函数定义功能组成。这一设计对Scheme的影响非常深刻。
麦卡锡最早提出两套语法:所谓“M表示式”是通常熟知的函数语法,如car[cons[A,B]]
。在麦卡锡原本的设计中,用M表示式写成的程式将自动译至“S表示式”,如(car (cons A B))
,然而由于S表示式具备homoiconic的特性(即程式与资料由同样的结构储存),实际应用中一般只使用S表示式。Scheme的语法即来自S表示式。这一特性使得在Scheme中实现自循环直译器变得非常简单。
Scheme的灵感来自麻省理工学院的Carl Hewitt提出的一种叫做参与者模式的数学模型。Hewitt当时正在试图将参与者模式加入Planner语言,而受其影响的史提尔与萨斯曼决定在MacLisp中实现一个支援参与者模式的Lisp方言[4]。史提尔与萨斯曼两人很快发现参与者模式与λ演算非常类似,而所谓“参与者”不过是Peter J. Landin提出并由Joel Moses于1970年发表的闭包而已[5]。因此,两人很快意识到λ演算是在Lisp中实现变量范围的关键[6]。基于这一见解,两人很快开发出了一套精简的编程语言,并命名为“Schemer”(后因操作系统字数限制改为Scheme)。尽管Hewitt认为Scheme抽象性的不足是一个倒退,它简约的语法很快赢得广泛接受,并成为最具影响力的编程语言之一。在Scheme被广为接受后,史提尔与萨斯曼曾承认他们事实上没有刻意实现Scheme的简约性。两人认为简单而强大的λ演算最终使得Scheme得以实现极度的精简化[4]。
“λ论文集”是Scheme的发明人史提尔与萨斯曼所撰写的关于编程语言设计的一系列论文,最早作为麻省理工学院的内部备忘录发表。Scheme的功能很大一部分是由这些论文确立的。 通常认为λ论文集包括:
目前Scheme由IEEE负责标准管理,并由一个专门的委员会发表的“算法语言Scheme报告,第N版”(Revisedn Report on the Algorithmic Language Scheme)进行标准化。现在的标准是1998年的R5RS[3],并且R6RS[8]已经在2007年被批准了[9]。R6RS带来了很大的变动[10],导致Scheme社区对其意见不一,更有一些使用者指责R6RS仅仅是在堆积华而不实的功能[11][12]。
Scheme的标准委员会目前正在讨论R7RS的事宜,并决定是否将Scheme分为两个独立的语言:一个为教育者提供精简的语法,另一个为专业人士提供强大的功能[2]。
Scheme主要是一个函数式编程语言,并支援其他程式设计范型。它的语法基于Lisp的S表示式:函数调用在Scheme中表示为一个列表,其中第一个元素为函数名,而后的元素为函数的参数。由于Scheme的资料存储也是基于列表,实际上每一个Scheme程式都可以被视为程式输入资料。因此,Scheme程式可以轻易读入并分析其他Scheme程式。
Scheme的列表与其他Lisp方言都是基于最基础的数据结构“有序对”(pair)。Scheme提供cons,car,与cdr方法[13]操作有序对与列表。
Scheme的变量都使用动态强型别系统,而函数被视为变量的一种,并可以作为参数提供给其他函数。换句话说,Scheme中的函数都是第一类物件。
Scheme的简约性使它成为具备同级别功能的编程语言中最易于实现的语言[14]。Scheme的很多结构源于λ演算,例如let可以写作创造并调用一个匿名函数:
(define-syntax let (syntax-rules () ((let ((var expr) ...) body ...) ((lambda (var ...) body ...) expr ...))))
换句话说,调用let语句如(let ((a 1) (b 2)) (+ a b))
等同于λ演算语句((lambda (a b) (+ a b)) 1 2)
。 基于这一特性,Scheme的解释器可以得到极大的精简。
Scheme的函数式范型主要受到了邱奇的λ演算的影响。在Scheme中,“lambda
”关键词被用于定义匿名函数,且所有非匿名函数都可以被视作取值为lambda
函数的变量。(换句话说,(define (foo x) (+ x 1))
与(define foo (lambda (x) (+ x 1)))
在语法上是等同的,而前者在直译器中会被译为后者。)这一设定在历史上推动了函数式编程语言的发展。事实上,Scheme中所有函数式控制语句都可以用λ演算的语言表示,例如有序对可以表示为[1]
(define (cons x y) (lambda (m) (m x y))) (define (car z) (z (lambda (p q) p))) (define (cdr z) (z (lambda (p q) q)))
甚至递归也可以利用λ演算的“Y算子”表示。用Scheme创始人的话讲,Scheme中的lambda
不仅是定义函数的功能,而是整个语言的控制结构与环境操作语句[7]。Scheme的这一特性使得形式化证明变得非常容易。
Scheme的代码块结构来自更早时候的ALGOL语言。在Scheme中,本地变量可以由let
,let*
,与letrec
产生。这些语句实际上与lambda
等同:它们都通过函数的形式参数来实现本地变量。例如,
(define foo 5) ;; foo 現在取值 5 (let ((foo 10)) ;; foo 現在取值 10 ) ;; foo 現在取值 5
这三者的区别在于,let
所绑定的变量仅在它的区块内有效,而let*
所绑定的变量可以在以下的绑定中使用,例如,
(let* ((var1 10) (var2 (+ var1 5))) var1) ;; 返回 15 ;; 如果僅使用 let,程式會出錯。
letrec
所绑定的变量可以互相引用。因此,letrec
通常被用于双重递归:
(letrec ((female (lambda(n) (if (= n 0) 1 (- n (male (female (- n 1))))))) (male (lambda(n) (if (= n 0) 0 (- n (female (male (- n 1)))))))) (display "i male(i) female(i)")(newline) (do ((i 0 (+ i 1))) ((> i 8) #f) (display i) (display " ")(display (male i))(display " ")(display (female i)) (newline)))
这一程式可以列出侯世达的阴阳数列。
Scheme是最早实现尾端递回优化的Lisp方言。换句话说,Scheme中所有尾端递回都会被自动作为循环解释(Scheme支援do
语句,但是一般Scheme中循环都会写作递归)。尾端递回优化使得Scheme支援任意数目的尾端递回调用,而无需担心堆栈溢位。如以下计算阶乘的程式将自动优化为循环。[1]
(define (factorial n) (define (iter product counter) (if (> counter n) product (iter (* counter product) (+ counter 1)))) (iter 1 1))
根据Scheme语言规范,Scheme中的标准语句可分为“标准模式”(Standard form)与“标准过程”(Standard procedure),其中标准模式提供语言的控制结构,而标准过程提供一些常用的功能。 下表给出所有R5RS所定义的标准语句[3](R6RS在这一基础上加入了大量标准过程,因此无法全部列出)。
标注为“L”的模式为库模式(Library form),通常是用其他更加基础的模式来实现的。
功能 | 模式 |
---|---|
定义函数 | define |
Binding constructs | lambda, do (L), let (L), let* (L), letrec (L) |
条件判断 | if, cond (L), case (L), and (L), or (L) |
顺序执行 | begin (L) |
循环执行 | lambda, do (L), named let (L) |
语法延伸 | define-syntax, let-syntax, letrec-syntax, syntax-rules (R5RS), syntax-case (R6RS) |
引用符号 | quote('), unquote(,), quasiquote(`), unquote-splicing(,@) |
赋值 | set! |
延缓执行 | delay (L) |
功能 | 过程 |
---|---|
Construction | vector, make-vector, make-string, list |
相等判断 | eq?, eqv?, equal?, string=?, string-ci=?, char=?, char-ci=? |
型别转换 | vector->list, list->vector, number->string, string->number, symbol->string, string->symbol, char->integer, integer->char, string->list, list->string |
数学运算 | 参见下表 |
字串操作 | string?, make-string, string, string-length, string-ref, string-set!, string=?, string-ci=?, string string-ci, string<=? string-ci<=?, string>? string-ci>?, string>=? string-ci>=?, substring, string-append, string->list, list->string, string-copy, string-fill! |
字符操作 | char?, char=?, char-ci=?, char char-ci, char<=? char-ci<=?, char>? char-ci>?, char>=? char-ci>=?, char-alphabetic?, char-numeric?, char-whitespace?, char-upper-case?, char-lower-case?, char->integer, integer->char, char-upcase, char-downcase |
阵列(vector)操作 | make-vector, vector, vector?, vector-length, vector-ref, vector-set!, vector->list, list->vector, vector-fill! |
符号操作 | symbol->string, string->symbol, symbol? |
有序对与列表 | pair?, cons, car, cdr, set-car!, set-cdr!, null?, list?, list, length, append, reverse, list-tail, list-ref, memq. memv. member, assq, assv, assoc, list->vector, vector->list, list->string, string->list |
型别判断 | boolean?, pair?, symbol?, number?, char?, string?, vector?, port?, procedure? |
Continuations | call-with-current-continuation (call/cc), values, call-with-values, dynamic-wind |
环境操作 | eval, scheme-report-environment, null-environment, interaction-environment (optional) |
输入输出 | display, newline, read, write, read-char, write-char, peek-char, char-ready?, eof-object? open-input-file, open-output-file, close-input-port, close-output-port, input-port?, output-port?, current-input-port, current-output-port, call-with-input-file, call-with-output-file, with-input-from-file(optional), with-output-to-file(optional) |
系统操作 | load (optional), transcript-on (optional), transcript-off (optional) |
函数式方法 | procedure?, apply, map, for-each |
布尔操作 | boolean? not |
功能 | 过程 |
---|---|
基本算术运算 | +, -, *, /, abs, quotient, remainder, modulo, gcd, lcm, expt, sqrt |
分数运算 | numerator, denominator, rational?, rationalize |
近似值 | floor, ceiling, truncate, round |
精确性 | inexact->exact, exact->inexact, exact?, inexact? |
不等判断 | <, <=, >, >= |
其他判断 | zero?, negative?, positive? odd? even? |
最大与最小值 | max, min |
三角函数 | sin, cos, tan, asin, acos, atan |
幂与对数 | exp, log |
复数运算 | make-rectangular, make-polar, real-part, imag-part, magnitude, angle, complex? |
输入与输出 | number->string, string->number |
型别判断 | integer?, rational?, real?, complex?, number? |
Scheme的精简设计使得编程语言设计人士与爱好者特别钟爱研究它的实作,很多嵌入式系统语言与指令码语言即是基于Scheme。Scheme的实作一般小而精简,造成了很多不可互通的实作互相竞争。尽管Scheme的精简性是它的一个主要长处,在Scheme中写作复杂的程式往往十分困难。
几乎所有Scheme实作都是基于Lisp的“读取–求值–输出循环”(read–eval–print loop)模式。一些Scheme实作亦可作为编译器,并将Scheme程式译为二进制码。很多用类似C的基础语言写成的软件都利用Scheme作为指令码语言。还有一些Scheme翻译器(例如Gambit,Chicken,Bigloo等)可将Scheme程式译为C或Java,或甚至.Net。将Scheme译作C的翻译器往往可以在源代码中利用C的特性。
最基本的Scheme实作是在《计算机程序的构造和解释》中实现的自循环直译器。这一直译器以Scheme写成,并利用底层的Scheme功能来实现被执行的Scheme语言程式。尽管在实际上这一直译器的意义不大(要想运行自循环直译器,计算机中必须已经存在一个Scheme直译器),它简单的语法可以帮助使用者理解Scheme的执行过程。
很多著名的计算机科学院校都利用Scheme来教授入门级课程。以下为一些最为著名的教授Scheme的学校: