Haxe特性杂谈

这个世界有很多的语言, 不同的语言适合不同的情境, Ruby因为很适合开发领域语言(DSL), 所以被大卫选择用于开发Rails, JavaScript因为常用异步模型和方便的回调处理, 被Ryan Dah用于开发node, 而JAVA期望通过JVM一次编写, 随处运行. 各种语言因为不同的目标场景, 也使得语言本身的特性趋于目标场景, 决定了这些语言应该是什么样子, 比如C++因为效率的考虑和兼容C的需求, 决定了C++之所以成为现在的C++.

同时也有很多语言是为生成另外一种语言而生的, 最典型的就是CoffeeScript, 我知道我的语言要更加优美, 但是我也知道我无法彻底替代你, 这是这个世界中习惯和惯性带来的悲哀, 所以, 不能替代你, 那我首先通过生成你来取代你. 这就是Coffee这样语言的思路. 因为JavaScript是如此的不好用和难以简单替代, 所以成为了这类语言的竞技场.
但是, Haxe就更加夸张了, 他也是一种通过生成其他语言而生的语言, 只不过, 他可以生成多达7种不同的语言.

  • Haxe简单介绍
  • 环境
  • 生成C++初体验
  • 生成JavaScript With nodejs
  • Haxe入门
    • 变量和类型
    • 函数
    • 操作符
    • 流程控制
    • 作用域
  • Haxe特性
    • 基于模版(class-based)的类和接口模型(类似JAVA)
    • 静态类型但是有对动态类型的支持
      • 参数化动态类型
    • 包和模块的直接支持
    • 泛型
      • 泛型参数限制
    • 对所有变量适用的先进类型推导, 包括函数参数, 返回值(除了类成员变量)
    • 具有结构化继承的匿名结构
    • 严格静态的函数类型, 闭包和偏函数
    • 有限制的多态函数
    • 函数的可选参数和默认参数
    • 指定的内联函数和常量的内联
  • 可以使用this的匿名函数
    • 自动闭包创建
    • 强大的枚举类型, 有构造函数参数和模型匹配
    • 没有声明, 只有表达式
    • 异常(try/catch)
    • 元数据
    • 偏函数
    • Getter/Setter
    • 使用using的Mixin方法注入
    • 宏条件编译
    • 迭代器
  • 其他特性
    • 反射
    • 数组解析(Array Comprehension)(3.0特性)
    • 正则表达式
    • 内建单元测试组件
    • 一些内置的元数据
  • 缺点
  • 总结

Haxe简单介绍

One language, everywhere.
– Haxe’s slogan

Haxe可能是我学习的最冷门的语言了, 不过因为Haxe的特性, 他再冷门, 我在实际中用到他的可能性都应该比Lisp要强的多. 我可以这么说, Haxe可能是世界上最有野心的语言, 并且它还真的部分做到了. 其实Haxe与我还真有些渊源, 因为我以前的leader出来创业, 最后选择的就是Haxe. 并且对它的适用性和成熟程度都很认可, 甚至还向我推荐过.
Haxe起源于flash社区, 号称’multiplatform language’, 据说是一个喜欢OCaml但是又知道OCaml实在无法推广的法国人Nicolas Cannasse开发的, 可以生成的语言如下: (具体的见Haxe的intro)

  • JavaScript: 直接生成单个的.js文件, 支持DOM API.
  • Flash: 直接可以生成swf, 兼容Flash Players 6到11.
  • NekoVM: 可以直接编译成NekoVM的字节码. NekoVM本来就挺冷门的.
  • PHP: 很难想象哪个真的Phper会准备用Haxe替代掉自己的语言.
  • C++: 生成源代码并且包含Makefiles, 另外, 提到了一个名为NME的2D跨平台游戏库. 简单的看了一下, 从特性上看, 似乎是除了Cocos2D-X以外一个较为不错的选择, 而从一些介绍看, 这个库本似乎是一个模仿Flash的库, 因为使用了Haxe这个神奇的语言, 所以现在已经支持了从iOS到Android到Windows等众多平台了.
  • C#和JAVA: 2.1以后开始支持, 但是还在实验中, 官方称在3.0时才算成熟.

因为能生成这么多语言, 所以Haxe可以支持一些我们经常用到的框架和库, 比如NodeJS, 比如直接生成PHP代码结合Apache做后台, 比如生成C++代码以直接支持跨平台的游戏开发.
以上的事实已经足够让我震惊了, 更逆天的是Haxe竟然还有自己的着色器语言解决方法, hxsl, 什么叫征服世界, 那就是不仅要征服CPU上运行的语言, 还要征服GPU上运行的语言~~~
总的来说, Haxe就是希望自己能干任何事情, 而按它的理念, 它还真的有可能有一天能做到, 语言的世界很残酷, 各种语言都有他最适合的情景, 没有一种语言能统一世界, 但是假如真有的话, Haxe一定是最可能的那一个. 事实上, 我说Haxe的野心大并不是贬义, 这是事实上Nicolas脑海中存在的概念, 他自己就做过一个讲座, 名字就叫Plans for World Domination(youtube视频 — 请自备梯子), Haxe就是他占领世界的计划~~

在官方的Why user Haxe文档中提到了用Haxe的以下理由:

  • 适用于客户端, 服务端和桌面程序开发的ECMA风格的程序语言.
  • 极为快速的编译(这似乎不是理由, 因为不用Haxe都不用多出这道编译流程, 更何况, 我实际感受是其实也没有那么快, 特别是编译成C++的时候)
  • 类型检测的好处(事实上喜欢动态语言的人就是因为喜欢没有类型检测带来的自由)
  • 为你的目标平台增加需要的语言特性.
  • 开源

其中提到的干货不多, 其实我觉得支持编译到多种语言, 所以支持多种平台, 使得只需要学习一种语言就能适用于几乎任何环境, 这就是最大并且足够强大的理由了.

环境

Haxe 2.1, 我会通过生成C++代码和JavaScript代码来观察结果. 其中JavaScript我用的不是HTML, 而是我可能稍微熟悉一点的Node, 所以还用了Hx-node这个haxe对nodejs的支持库.
另外, 有Haxe的REPL环境ihx, 和官方提供的在网页上尝试Haxe的http://try.haxe.org/

生成C++初体验

从简单的HelloWorld开始吧:
HelloWorld.hx:

class HelloWorld {
  public static function main() {
    trace("Hello World!");
  }
}

从例子中能够看到, 原来所谓的ECMA风格就是类似C#和JAVA的风格…
我用来编译成cpp的.hxml配置是cpp.hxml:

-main HelloWorld
-cpp cpp
-debug
-D HXCPP_M64

通过haxe cpp.hxml命令给我的生成结果是在cpp目录下的一堆文件, 其中cpp/src目录下看到有100多行C++代码, 我甚至都不想现在就全都弄懂. 不过还好的是给我的执行文件的确输出了HelloWorld.

生成JavaScript With nodejs

首先需要通过haxelib install nodejs命令来安装haxe的nodejs库. 然后通过以下配置(我命名为nodejs.hxml)编译上例中的HelloWorld.hx生成想要的.js文件.

-main HelloWorld
-js helloworld.js
-debug
-lib nodejs

通过haxe nodejs.hxml命令会生成两个文件, 一个是helloworld.js, 一个是helloworld.js.map(用于debug), 此时通过node helloworld.js能看到输出结果正常. 当然, 首先你得把node安装好.

Haxe入门

变量和类型

支持以下类型:

  • Integer(int): 整数类型, 不支持更进一步详细的整数类型,比如short, long啥的, 类似动态语言的做法.
  • Float: 浮点数, 也是一个浮点走天下.
  • Boolean(Bool): 布尔, 代表的是true和false.
  • String: 字符串, 不解释.
  • Void: 用于表示没有类型和值.
  • Dynamic: 类似C#中的dynamic类型, 意图在静态语言中加入动态的效果, 个人很欣赏的尝试.
  • Unknown: 类似javascript中的undefined.

另外, 还有null关键字, 类型是Unknown<0>.

定义一个变量的语法和UnityScript(Unity中的JavaScript)类似(或者说JScript), 我甚至怀疑javascript2将来就会是这个样子.

var i : Int = 5;

不过还是有个区别, 那就是当同样使用简化的语法时:

var i = 5;

Haxe使用的是类似C++和C#的类型推导技术, 也就是说类型会在编译器决定, 不影响执行效率, 而UnityScript则不一样, 会影响执行效率. 就这点来说, Haxe是足够先进的.
同时, 作为现代语言, String的连接操作符是没啥问题的.

class HelloWorld {
  public static function main() {
    var hello = "Hello,";
    var world = "World!";
    trace(hello + world);
  }
}

自从发现javascript和C#的扭曲特性后, 我总是喜欢用1 + "1"的操作来实验一个语言, 很不幸的是, Haxe就是这样中招的语言, 会无错误的输出11.

函数

用的还是类似UnityScript的方式, 使用function关键字, 同时用str:String这样的方式来表示参数类型, 通过把:Int加到函数定义语句的结尾来表示返回值, 熟悉UnityScript的XD是无障碍了.

class HelloWorld {
  static function add(n1 : Int, n2 : Int) : Int {
    return n1 + n2;
  }

  public static function main() {
    trace( add(3,4) );
  }
}

操作符

没有看到操作符重载的内容, 但是支持常见操作符, 包括>>>这个javascript特有的和C系的++--等.

流程控制

基本上该有的都有, while, do-while, for-in, switch. 不过也没有啥亮点. 有些诡异的是去掉了常规的for, 即for(int i=0; i形式的for语句. 不知道是为什么. 倒是避免了javascript中for块变量作用域的问题.
稍微值得一提的是switch的自动break, case支持常量字符串和用逗号分隔的多路匹配, 现在的语言一般都是从C那儿来的, C特别别扭的switch也就成为了各大语言改进的对象, 有意思的是, 改进的效果都不一样, Haxe就是这样改的:

class HelloWorld {
  public static function main() {

    var choice : String = "";
    while (true) {
      choice = Sys.stdin().readLine();

      switch( choice ) {
        case "y", "Y":
          Sys.println("You surely want it!");
        case "n", "N":
          Sys.println("you don't want it?!");
          break;
        default:
          Sys.println("Not a valid choice.");
      }
    }
  }
}

我没有在case "y"后面使用break, 但是不会执行到下面的case, 而事实上, 后面的那个break是用来从while死循环中退出的.
上面的代码没法在js下运行, 因为读了命令行, 我们得使用nodejs中读命令行的process模块, 上面的代码经过处理就成了下面这样了:

import js.Node;

class HelloWorld {
  public static function main() {

    Node.process.stdin.resume();
    Node.process.stdin.setEncoding('utf8');
    Node.process.stdin.on('data', function (chunk) {
      var choice : String = chunk.trim();
      switch( choice ) {
        case "y", "Y":
          Node.console.log("You surely want it!");
        case "n", "N":
          Node.console.log("you don't want it?!");
        default:
          Node.console.log("Not a valid choice.");
      }
    });
  }
}

首先, 因为没有了while死循环, 所以可能得自己加个条件作为退出(这里没有), 其次, 为了使用js的模块, 可能得稍微费点周折.

  1. 在预先设为Haxe lib的地址git clone https://github.com/cloudshift/hx-node.git nodejs
  2. 修改nodejs.hxml, 添加一个-cp YOUR_PATH. 比如我的地址是~haxe_libs, 于是就是-cp ~/haxe_libs/nodejs.

作用域

类作用域和函数作用域不用说了, 好消息是Haxe有块作用域, 也就是说, {}范围内定义的变量只在大括号范围内有效, 这个很有很有用. 假如不能这样的话, 需要用javascript扭曲的匿名函数hack, 太扭曲了.

Haxe特性

因为Haxe是如此的冷门, 所以明明本文是讲Haxe特性的, 结果也拉入了一堆简介. 好了, 以下是正题. 我选择的特性列表直接来自于官方列出的列表Language Features, 没有什么比这个更有代表性了.

基于模版(class-based)的类和接口模型(类似JAVA)

Classic Object-Oriented class + interface model (similar to Java)

  1. 类的访问限制只有public和private两层, 相对一些语言(比如JAVA)还在C++经典的三权限中去增加一个默认的package不同, Haxe甚至去掉了通常的private, 而把protected称为private, 并且默认状态就是private.
  2. new()表示构造函数.
  3. super来访问父类
  4. interface可以implement一个interface.
  5. 覆盖父类的函数时要求必须使用override关键字标志.(和C#一样)
  6. 允许在一个文件中定义多个类. 可以用private限定一个类只在当前文件中可用.

下例我尽量多用了更多特性, 不过一个例子还是有些难, 看个风格吧, 反正和JAVA, C#很像.

interface PointProto {
  function length() : Float;
}

class Point {
  var x_ : Float;
  var y_ : Float;

  public function new(x : Float, y : Float) {
    this.x_ = x;
    this.y_ = y;
  }

  public function x() : Float {
    return x_;
  }

  public function y() : Float {
    return y_;
  }
}

class Point3D extends Point, implements PointProto{
  var z_ : Float;

  public function new(x : Float, y : Float, z : Float) {
    super(x, y);
    this.z_ = z;
  }

  public function z() : Float {
    return z_;
  }

  public function length() : Float {
    return Math.sqrt(x_ * x_ + y_ * y_ + z_ * z_);
  }
}

class HelloWorld {
  public static function main() {
    var p = new Point3D(1.0, 2.0, 3.0);
    trace(p.length());
  }
}

静态类型但是有对动态类型的支持

Strict typing but with [Dynamic]((http://haxe.org/ref/dynamic) support

这点很像C#, 我觉得也就就应该这样, 为啥非要需要区分动态语言和静态语言?
这个世界上的语言有些很有意思的现象:
1. 对于动态语言来说, 没有静态类型可以选择, 但是对于静态语言来说, 就算有动态语言的选择时, 一定是推荐你尽量使用静态类型, 因为效率和编译期的静态检查. 没有人会推荐你把一个同时有动态类型和静态类型的语言当作动态类型的来用, 比如C#, UnityScript, 还有Haxe.
2. 对于语句必须以;结尾或者必须用{}的情况, 你没得选择. 对于语句完全不需要;{}时, 也没得选择. 但是对于语句可以以;结尾也可以不以;结尾, 语句可以用{}也可以不用时, 一定是推荐你用;{}, 因为更加严谨, 不容易出现错误. 比如javascript的;和类C语言的单行if语句.

上面的例子可能还有一些, 不过总得来说, 开发社区还是有保守的倾向和对运行效率的追求.
Dynamic除了可以把Haxe当作动态语言来用, 还有个好处就是不用模版来实现模版的功能.

class HelloWorld {

  public static function add(left_param : Dynamic, right_param : Dynamic) {
    return left_param + right_param;
  }

  public static function main() {
    trace( add( 1, 2.0) );
  }
}

事实上, 上例要是用模版的话, add函数还需要是双模版(即T1, T2两个类型) 才能实现整数对浮点数的操作. 当然, 上例太弱智了, 但是真实情况下对多种类型进行一样的操作是完全可能的, 特别是你准备用duck typing的时候.
有趣的是, Haxe在动态化上走的非常远, 一般情况下, 即使是Dynamic的对象, 也不能访问一个不存在的成员变量和成员函数, 只是把检测推迟到运行时了, 但是Haxe允许动态为Dynamic类型的对象添加成员变量, 甚至函数, 也就是说, 就像javascript里面的Object那样, 对于一个静态类型的语言加入这个特性大大的超乎我的想象. 不过回头想想, Haxe起源于flash社区的Action Script(javascript的方言), 也就没有那么奇怪了. 只是因为Haxe的静态特性又太深入, 使得我有些都忘了它的起源, 这点和UnityScript很不一样.

class HelloWorld {

  public static function main() {
    var obj : Dynamic = {};
    obj.name = "Simon";
    obj.hello = function() {
      trace("hello," + obj.name);
    }

    obj.hello();
  }
}

以上代码可以说是摘抄自我在javascript特性杂谈中javascript对象的演示代码. 几乎一模一样.

参数化动态类型

Parameterized Dynamic Variables

在Dynamic如此自由后, 作为静态类型的语言, Haxe加入了参数化动态类型这个新的特性, 作用如下:

class HelloWorld {

  public static function main() {
    var dyn : Dynamic<String> = cast {};
    dyn.name = "Paul";
    dyn.age = "28";   // can't be dyn.age = 28;

    trace( dyn.name + ":" + dyn.age );
  }
}

而使用了参数化的动态类型后, (比如dyn变量被设定为Dynamic)一个变量能在参数化的范围内, 随意的访问成员变量, 但是, 仍然是有限制的, 比如上例中的dyn, 就不能将其成员变量赋值成字符串意外的类型.
更觉的是, 这个参数化类型甚至能被继承… 具体的就还是看官方的介绍吧, 因为这样的特性已经超出我的想象了, 所以不知道什么时候能用上.

包和模块的直接支持

Packages and modules

默认情况下一个.hx文件就是一个module, 此时是以文件名为模块名的, 比如下例, 我讲上面例子中的add函数拆分到一个新的文件中去:

// file: utility.hx
class Utility {

  public static function add(left_param : Dynamic, right_param : Dynamic) {
    return left_param + right_param;
  }
}

// file: helloworld.hx
import Utility;

class HelloWorld {

  public static function main() {
    trace( Utility.add( 1, 2.0) );
  }
}

值得注意的有以下几点:

  1. 一个模块中可以有多个类.
  2. 默认时每个类都是public的, 外部都可以访问, 设定为private时, 该类为模块内的internal内, 只能在模块内访问.
  3. 模块名只与文件名有关, 和文件里面的类没有关系. 同时, 就算文件名为全小写, import的时候仍然要求首字符大写, 并且可以正常import.
  4. 导入后, 实际已经将导入模块的所有类型都加入到了全局空间, 不需要加模块名即可访问, 假如有冲突的话, 仍然可以通过模块名的限定来取得指定模块的类型.

另外, 有可选的关键字package.

泛型

Generics (type parameters) with one or several constraints, but not variance

在静态类型上走远了, 总会需要泛型的, 不然一些基础的容器会很累人, Haxe也又泛型, 基本的语法如下:

class Array<T> {

  function new() {
    // ...
  }

  function get( pos : Int ) : T {
    // ...
  }

  function set( pos : Int, val : T ) : Void {
    // ...
  }
}

单纯函数的泛型官网上没有说明, 可能实际上就没有, 因为正如上面动态类型的例子中所演示的, 用Dynamic就能模拟出泛型的效果, 还能通过参数限定.

泛型参数限制

Constraint Parameters

一般意义的泛型往往太过灵活, 所以Haxe加入了泛型参数限制的特性. 很类似C#的约束类型. 概念上类似, 就不写例子了, 只是语法上有差异:

class EvtQueue<T : (Event, EventDispatcher)> {
  var evt : T;
  // ...
}

对所有变量适用的先进类型推导, 包括函数参数, 返回值(除了类成员变量)

Advanced Type Inference for all variables including methods arguments and return types (except member variables)

这个在上面最开始讲类型的地方就介绍过了, 不再重复.
只在这里介绍一个辅助的标记$type, 在编译期这个标记会移除, 但是具有这个标记的表达式会保留, 同时通过Warning信息输出推导出来的类型, 作为方便调试的一个手段. 比如下面的代码:

var x : Int = $type(0);

具有结构化继承的匿名结构

Anonymous Structures with structural subtyping

这是个很让人惊叹的特性, 同样的也是因为Haxe其实源于Action Script. Haxe允许以以下的格式来定义新的对象, 这在Haxe被称作匿名结构(Anonymous Structures).

var point = { x : 1, y : -5};

var user = {
  name : "Nicolas",
  age : 32,
  pos : [ {x:0, y:0}, {x:0, y:0}],
};

了解javascript的人, 一眼就能看出, 这就是javascript Object的一种定义方式. 到这还没有什么, 作为静态语言, Haxe还真的给上面这种对象定义了类型, 比如, 上面的point类似就是{ x : Int, y : Int }, 而user的类型是{ name : String, age : Int, pos : Array<{ x : Int, y : Int }> }, 这是个很神奇的事情. 可以通过刚提到的$type来验证.
既然是类型, 你甚至就可以直接使用, 只是要是多次使用会稍微麻烦一点, 所以Haxe提供了C/C++里面的typedef来简化这种操作. 见下面的代码:

typedef Point = { x : Int, y : Int }

class Path {
    var start : Point;
    var target : Point;
    var current : Point;
}

这就是Haxe中定义一个对象简便的办法, 假如需要的是一个临时使用的对象, 的确不需要兴师动众的动用class来做了. 特别的, 虽然官方的例子中没有演示, 我上面已经演示了, Haxe的这种结构实际上也是支持函数成员的, 使得它的应用可以更加广泛.
具体还有些细节, 这里就不一一列举了.
需要稍微注意一点的是在Haxe中结构是按javascript那么动态实现的, 所以运行效率会低于静态实现的class类型. 但是带来一个好处, 就是Haxe官方所谓的Structural Subtyping, 其实又没有subtyping的语法, 只是当一个对象拥有另一个对象的所有成员时, 可以完全当作另一个对象使用, 这个有些类似Duck Typing.
更进一步的是, 可以不指定函数参数的类型(似乎默认就是Dynamic), 然后自动适配structural.

public static function getLength(pt) {
  return pt.x + pt.y;
}

此时就完全可以接受上面typedef的Point类型对象. 更加神奇的是, 假如你真的传入了一个不对的对象, Haxe能在编译期就发现错误… 这简直逆天了. 在具有极为动态特性的时候, 还能有强大的编译期类型检测, 你还能说什么…

严格静态的函数类型, 闭包和偏函数

Strictly typed function types, functions closures and partial applications

静态类型什么的就不提了, 闭包的例子再演示一次吧. 例子来源于javascript特性杂谈.

class HelloWorld {

  public static function makeIncrementor(base : Int) {
    var count = base;
    return function(num : Int) {
      count += num;
      return count;
    }
  }

  public static function main() {

    var obj1 = makeIncrementor(10);
    var obj2 = makeIncrementor(20);

    trace(obj1(1));
    trace(obj1(1));

    trace(obj2(2));
    trace(obj2(2));
  }
}

偏函数是一个很有用的特性, 在很早的时候C++为了支持这个特性鼓捣出了bind1st, bind2nd等恶心的函数, 在C++11中由bind统一了, 主要的作用就是可以让一个函数在经过少量的适配代码后就能应用到需要函数作为参数, 但是参数个数对不上的地方.
其实本质上就算没有, 我们也可以通过新建一个函数, 然后调用原有函数实现, 只是有了原生的支持后会变得简单很多.

function add( x: Float, y: Float ) {
  return x + y;
}

var addOne = callback( add, 1 );

addOne( 5 ); // returns 6

callback就是实现偏函数的函数, 有个遗憾是, 暂时没有(2.09版本)发现通过常见的通过占位符实现任意参数的bind, 目前只能依照参数从左至右的实现partical function. 在3.x版本中, callback将被废弃, 引入了通过占位符_实现的任意参数bind.
届时, 以上的代码将会是类似var addOne = add(1, _);

有限制的多态函数

Polymorphic Methods (per-method type parameters), with constraints

恕我愚钝, 官方也没有直接提供例子, 光看文本, 我不知道说的是什么, 函数重载? 函数调用时的多态性?

函数的可选参数和默认参数

Optional and constant default value function arguments

概念上很简单, 就不举例子了, 需要稍微注意一下的是Haxe奇怪的可选参数语法, 是在参数的最前面加?.

指定的内联函数和常量的内联

Explicit Inline methods and constant inlined variables

这是纯粹的运行效率考虑了, 用函数的inline来减少函数的调用开销, 通过常量替换实现减少中间变量. 这两个特性可能只有需要编译的语言才能实现了. 用的也是inline关键字, 用法和C++基本一样, 限制也是一样的, 那就是要求在编译器的确能够决定调用的函数内容, 才能形成内联, 比如动态绑定的情况, 就没法实现.

可以使用this的匿名函数

Local function declarations with this capturing

Haxe中可以用类似javascript的通过变量来定义函数, 毕竟起源于AS啊, 比如:

var fun = function() { };

上面的形式可以在一个局部定义, 此时函数像普通变量一样, 只在作用域内有效, 在外部无法访问.
至于with this capturing的意思, 大概是指在这种情况下, 匿名函数还能调用this吧, 比如下面:

class Point {
  var x_ : Float;
  var y_ : Float;
  public function new(x : Float, y : Float) {
    x_ = x;
    y_ = y;

    var fun = function() {
      // this capturing
      this.x_ = 10.0;
      this.y_ = 20.0;
    };

    fun();
  }

  public function x() {
    return x_;
  }

  public function y() {
    return y_;
  }

}

class HelloWorld {

  public static function main() {
    var pt = new Point(20.0, 10.0);

    trace("x:" + pt.x());
    trace("y:" + pt.y());
  }
}

要是没有this捕获, 那匿名函数的作用会大打折扣.

自动闭包创建

Automatic closure creation

就是闭包被, 难道哪个语言的闭包还不是自动创建的? 不明白. 指的是Objective-C中Blocks创建的时候需要手动指定哪些局部变量需要进行捕获才能更改吗?

强大的枚举类型, 有构造函数参数和模型匹配

Powerful Enums (with constructor parameters and pattern matching)

不知道是何种原因, Nicolas对枚举似乎有强大的兴趣和偏好, 现代语言中的确对原来C/C++的枚举很反感, 所以一般都会让枚举变得强类型一些, 但是Haxe中就不仅仅是让枚举变的强类型而已, 而是极大的复杂化了枚举(或者说极大的强大?) 比如, 在Haxe中枚举支持构造函数参数:

enum Color {
    Red;
    Green;
    Blue;
    Grey( v : Int );
    Rgb( r : Int, g : Int, b : Int );
    Alpha( a : Int, col : Color );
}

上面例子中的Grey, Rgb, Alpha就是带构造函数参数的枚举, 甚至在Alpha中递归引用了Color这个枚举类型. 问题是, 我没有发现这个到底有什么用, 因为枚举都是常量, 你可以如下定义Alpha:

Alpha( 127, Red );
Alpha( 255, Rgb(0,0,0) );

定义后就不能更改, 然后呢? 我不知道然后怎么样了. 官方的文档中似乎是想用switch中, 在case语句中使用枚举的构造函数参数, 一则这种用处非常之小, 二则真的要用到, 定义一个枚举和一个class, 差异也不大了.

没有语句, 只有表达式

No statements : only expressions

//没有具体的文档, 意思是说没有C++/Objective-C中那样所谓的接口和实现分离吗? 那样的做法的确很不人道, 我在C#的文章中就提到过, 看来碰到知音了. 不过稍微现代一点的语言, 比如JAVA, C#都早就是这样了, 说明持这样看法的人不是一个两个了.

Haxe中所有的控制语句实际上也是表达式,比如:
var max = if (a > b) { a; } else { b; };
又比如: 
var option = switch (flag) { case 0: "a"; case 1: "b"; };没有具体的文档, 意思是说没有C++/Objective-C中那样所谓的接口和实现分离吗? 那样的做法的确很不人道, 我在C#的文章中就提到过, 看来碰到知音了. 不过稍微现代一点的语言, 比如JAVA, C#都早就是这样了, 说明持这样看法的人不是一个两个了.

异常(try/catch)

Exceptions (try/catch)

只有try catch没有finally的异常机制根本就不值得作为优点提出来(就像C++中的那样), 那是不完善的设计. 有意思的是在Haxe用catch Dynamic类型的异常作为捕获所有的异常, 因为内部没有为异常建立一个完整的树壮继承对象体系?

元数据

Metadata

使用元数据可以对类, 枚举, 类成员变量, 类方法, 枚举的构造函数 进行一些修饰, 有些类似Python中的Decorator, C#中的Attribute, Java的Annotation. 也不是什么新鲜玩意儿了. 在原来, 这个功能似乎是由方便类似profile, log统计等功能提供的, 后来随着人们的挖掘, 作用领域似乎扩充了很多. 就我知道的, 像Bottle这个Python的Web framework, 都开始用Decorator来做route了, 而实际使用中也的确是比RoR那种方式要更加轻量级和方便.
下面我还是用经典的profile需求的例子来看Haxe的元数据吧, 不过有些遗憾的是, Haxe的元数据本质上还是不是那么强大, 比如很受人推崇的C++的Attribute, 都已经是基于对象的了, 甚至可以继承~~
下面我通过经典的使用情景来展示Metadata的作用, 比如, 我们首先有一个函数:

public static function HelloWorld() {
  var i = 0;
  while( i < 1000 ) {
    trace("Hello World");
    ++i;
  }
}

当然, 这个函数的功能似乎是没有啥用, 作为演示, 算了吧. 作为程序的一部分, 我们有一天觉得这行代码是不是因为有IO的存在, 太慢了? 决定对其进行profile, 以便对进一步要进行的优化提供参考.

public static function HelloWorld() {
  var time_begin = haxe.Timer.stamp();
  var i = 0;
  while( i < 1000 ) {
    trace("Hello World");
    ++i;
  }
  var time_passed = time_begin - haxe.Timer.stamp();
  trace(time_passed);
}

这种代码首先是嵌入破坏式的, 在很久以前, 我还真在C++中写过很多类似这样的代码. 这个方法的问题在于当你准备为很多函数都进行类似的测试的时候, 你需要对每个函数都进行嵌入破坏, 使得代码最后难以修复, 要开关profile的进行也相当费劲, 这个问题在C++中我已经倾向于用一些第三方的库来解决这种问题. 在Haxe这种有Metadata的语言, 其实就可以通过Metadata很轻量级的完成这个任务.

首先, Meta的主要相关函数有3个, 如下:

Meta
class haxe.rtti.Meta
Available in flash8, flash, neko, js, php, cpp, cs, java
An api to access classes and enums Metadata at runtime.

  • static function getFields( t : Dynamic ) : Dynamic>
    Returns the metadata that were declared for the given class fields or enum constructors

  • static function getStatics( t : Dynamic ) : Dynamic>
    Returns the metadata that were declared for the given class static fields

  • static function getType( t : Dynamic ) : Dynamic
    Returns the metadata that were declared for the given type (class or enum)

要对类使用, 用getType, 对类成员使用, 用getFields, 我们此例中是对静态成员函数使用, 所以用的是getStatics. 使用的方法很简单, 如下:

var need_to_profiles = $type(haxe.rtti.Meta.getStatics(HelloWorld));

但是上述函数都有个问题, 因为类型都是Dynamic的数组, 所以不能用for-in简单的迭代. 需要用到反射. 基本的代码如下:

var need_to_profiles = haxe.rtti.Meta.getStatics(HelloWorld);
for ( fun_name in Reflect.fields(need_to_profiles)) {
  var fun = Reflect.field(need_to_profiles, fun_name);
  if (Reflect.hasField(fun, "profile") ) {
    var fun_to_call = Reflect.field(HelloWorld, fun_name);
    profile(fun_to_call);
  }
}

其中profile函数是一个类似下面的函数:

public static function profile( fun: Void -> Dynamic ) {
  var time_begin = haxe.Timer.stamp();
  fun();
  var time_passed = time_begin - haxe.Timer.stamp();
  trace(time_passed);
}

作用是针对一个函数进行调用, 然后统计时间, 实际上我们也不需要自己实现这样的函数, Haxe已经实现了, 为Timer.measure函数.
有了上述代码后, 你可以简单的在一个类里面通过@profile的Metadata来实现对一个静态函数开启和关闭profile.

偏函数

Partial function call with callback

上面提到过一次了, 怎么又来了? 凑数啊~~

Getter/Setter

Getter/Setter and more with Properties

这本身是个语法糖, 因为没有的语言会比较苦恼, 所以这个语法糖比较甜.
基础语法是public var x(getter,setter) : Int; 的形式, 只是Haxe对getter, setter设定的可用修饰符还真的比较多:

  • 可以直接指定函数
  • null表示限定对象方法调用
  • default表示和成员变量修饰符的访问权限一样
  • dynamic只有当动态生成代码后才能访问(通过反射)
  • never表示不能访问

一个例子如下:

class C {
   public var ro(default,null) : Int;
   public var wo(null,default) : Int;
   public var x(getX,setX) : Int;
   public var y(getX,never) : Int; // here y should always equal x
   public var z(default, setZ) : Int;

   private var my_x : Int;

   private function getX():Int {
       return my_x;
   }

   private function setX( v : Int ):Int {
      if( v >= 0 )
         my_x = v;
      return my_x;
   }

   private function setZ( v : Int ) : Int {
      return z = v;
   }

}

使用using的Mixin方法注入

Method injection with “using” mixin

这里的Mixin和Ruby里面的Mixin意义并不一样, 有些类似Objective-C中的类别, 主要用于打猴子补丁的.
比如常见的字符串扩展, 当标准的字符串不符合我们的需求时我们会怎么做呢? 像C++中, boost库里面就有个string的扩展库boost::string_algo, 你引入了这个库后, 并没有给std::string添加任何方法, 只能从外部用Help类的方法来使用(事实上, 在C++的社区似乎还更偏好这种方法, 不仅仅因为C++没有办法). 在可以打猴子补丁的语言里面, 可以讲Help类的方法直接引入对象本身, 以方便调用, 使得调用更加自然.
比如说, 我特别喜欢Ruby中类似自然语言的循环和块调用方式, 你可以用5.times { |x| print x }的方式来实现5次循环. 我想要在Haxe中模拟这种方法的话, 我给整数类型增加一个Help函数, times. 比如下例:

// TimesLoop.hx
class TimesLoop {
  public static function times( n : Int, fun : Void -> Void ) : Void {
    var i = 0;
    while (i < n) {
      fun();
      ++i;
    }
  }
}

此时我只能以以下形式调用该函数:

TimesLoop.times(5, callback( log, "Hello") );

但是, 用了using后(完全不同于C++的using), TimesLoop的第一个参数所在的对象, 就能获得times方法, 此例中是整数能获得times方法, 于是我们就能这样调用:

5.times( callback( log, "Hello") );

虽然还没能用上Ruby的Blocks, 但是形式上已经类似了.
主要注意的是, 实际使用中我发现, 这种Using的用法只能在import一个类后立刻使用, 使得没法在当前文件中定义一个对象, 然后使用using, 这也算是个缺憾.

宏条件编译

Conditional Compilation

在流程控制那一节, 我们可以看到因为node和Haxe本身的Sys库不兼容, 所以需要分别实现, 实现在多个不同的文件自然是没有问题, 但是同样的就无法共用共有的部分了, C++中这种问题常用宏指定的条件编译来解决. Haxe也有类似的命令, 命令格式也很类似, 如下:

#if js
import js.Node;
#end

class HelloWorld {
  public static function main() {

  #if js
    Node.process.stdin.resume();
    Node.process.stdin.setEncoding('utf8');
    Node.process.stdin.on('data', function (chunk) {
      var choice : String = chunk.trim();
      switch( choice ) {
        case "y", "Y":
          Node.console.log("You surely want it!");
        case "n", "N":
          Node.console.log("you don't want it?!");
        default:
          Node.console.log("Not a valid choice.");
      }
    });
  #else
    var choice : String = "";
    while (true) {
      choice = Sys.stdin().readLine();

      switch( choice ) {
        case "y", "Y":
          Sys.println("You surely want it!");
        case "n", "N":
          Sys.println("you don't want it?!");
          break;
        default:
          Sys.println("Not a valid choice.");
      }
    }
  #end
  }
}

迭代器

Iterators

很难理解, 为什么这会是个语言特性.
在Haxe中迭代器都继承自Iterator的一个结构.

  typedef Iterator<T> = {
    function hasNext() : Bool;
    function next() : T;
  }

然后就能在for-in中进行迭代了, 不可思议的是,(再次提到) 为啥没有普通的for循环啊~~~ 不讲了, 迭代器太普遍了.

Macros

这绝对是个惊天地泣鬼神的特性, 在Ruby中也只是部分实现, 只有Lisp这种天然没有语法(只有S表达式的)的语言, 实现了宏, 在这之前, 我也以为只有Lisp这种语言, 才能方便和优美的实现宏. 我还没有见过任何C语言系的语言实现过类似特性. 当然, 首先声明的是C++, C#中的#define宏并算不上真正的宏, 那只是简单的文本替换而已.
真正的宏应该是如Lisp里一样, 其实就是一个函数, 只不过这个函数是在编译期运行(有语法规则), 并且运行后不是返回值, 而是返回一段程序代码. Haxe里的宏就是这样的宏.
因为宏, 我们可以在Haxe中实现自己想要的语法, 比如在前面, 我们用using的注入, 实现了类似5.times( callback( log, "Hello") );的语法, 但是其实还离Ruby中有差距, Ruby中通过Block, 执行的实际是一段代码, 而不是如目前我在Haxe中实现的一样, 需要一个确定的函数, 这会限制times的应用范围, 并且也较为麻烦, 因为我总是得构建函数才能方便的使用times, 假如不方便的话, 构建times的意义就没有了.
用宏的话, 能够稍微解决这个问题.

// TimesLoop.hx
import haxe.macro.Expr;
import haxe.macro.Context;
class TimesLoop {
  @:macro public static function times( n : Int, e:Expr ) : Expr {
    var n_expr = Context.makeExpr(n, Context.currentPos());
    return macro for (i in 0...$n_expr) { $e; };
  }
}

// HelloWorld.hx
import TimesLoop;
using TimesLoop;

class HelloWorld {

  public static function main() {
    5.times( trace("HelloWorld") );

    var x = 0;
    5.times( trace(x++));
  }
}

这里实际上是用using + macro的方式实现了整数的表达式调用, 这里特意用trace(x++)的代码来证明, 这里不是单纯的函数调用, 而是表达式调用, 因为实际上会输出0,1,2,3,4, 而不是输出0 5次. 事实上, 表达式的调用灵活度要比函数调用灵活的多.
上面的宏创建代码有些难以理解, 稍微解释上面times里的语法:

  1. 在Haxe中, 用$:macro的元数据来完成对宏函数的指定.
  2. 常用到的两个宏相关的类就是Expr和Context了, Expr本身是一个包含pos(位置)和expr(表达式)的结构.
  3. Context的makeExpr函数用于简单的从基本类型构造Expr.
  4. macro关键字可以通过$expr的方式, 实现从表达式到表达式的构建.

到目前为止, 其实还不够完美, 在Ruby中可以用5.times { |x| print x}的语句输出01234, 而目前, Haxe中我们只能盲目的执行五次, 没法知道目前是执行到第几次了, 上面仅仅只能通过外部变量的方式实现了类似的功能.
其实Haxe的宏还有@:build的部分, 用于生成一个类, 而不是上面这种通过函数返回表达式的方式. 这里不讲了.

其他特性

上述特性都是官方觉得值得一提, 然后在特性列表中列出来的特性, 事实上, 我觉的值得一提的特性还有一些, 不过可能是通过库实现的, 也有些可能是官方觉得不值一提, 所以没有提及.

反射

这个特性不是什么很牛的特性了, 虽然C++中仍然还没有, 这些特性Haxe通过Reflect库实现, 该库不需要导入, 我在元数据那一节就用到了反射.

数组解析(Array Comprehension)(3.0特性)

在3.0版本以后, Haxe提供了数组解析的功能, 相对应的功能在Python中是列表解析(list comprehension), 起码所有的Pythoner都认为该特性极大的改善了代码的风格, 在Haxe其实也可以这样.
比如, 在一个从1到100的整数数组中过滤出所有的奇数, 只留下偶数. 这个功能在Python中大概是这个样子:

[i for i in range(1, 101) if i % 2 == 2]

在Ruby中没有列表解析, 通过Block实现的特性也很不错, 并且挺接近自然语言(这也是Ruby被广泛称赞的理由).

(1..100).to_a.select { |x| x % 2 == 0 }

在很多没有类似特性的语言中, 那就郁闷了, 稍微好一点的, 你还能通过类似filter的函数实现, 再不济的, 你得通过循环才能实现这么简单的事情, 在Haxe3中就能通过数组解析较为简单的实现:

[for( x in 1...101 ) if( x % 2 == 0 ) x];

就我所知, 连javascript的下一版本都将会加入列表解析的功能.

正则表达式

这个本来是很常见的功能, 因为C++的问题(非C++ 11), 这里稍微提一下, Haxe通过库EReg来实现正则表达式. 并且支持~/regex/的简化语法.

内建单元测试组件

单元测试被越来越多的人所接受, Haxe直接内置了单元测试的组建, 省的你东找西找了. 单元测试的组建在Haxe.unit package中

一些内置的元数据

正如JAVA通过元数据提供一些辅助功能一样, Haxe也通过元数据提供了一些语言本身没有提供的功能, 比如:

  • @:final: 静止继承
  • @:allow(my.pack): 类似C++的友元, 直接允许某个类访问my.pack中所有的私有成员.
  • @:noUsing: 不允许使用using.

缺点

这个世界上生成另外一种语言的编程语言还从来没有成为主流的例子, 我能知道的最流行的是CoffeeScript, 目前在github上排名第11. 因为代码生成本身对于程序员来讲就是一种恐怖的负担, 因为这些代码不是我自己的, 所以出错了, 很难查出来, 同时, 也很难去理解生成后的代码, 就更不用说调试没有那么方便了.
CoffeeScript算是有些例外, 因为它非常专注(只生成javascript), 并且目标明确(语句对语句的对译), 看看的CoffeeScript的官网就能明白CoffeeScript作者为了解决生成语言的问题而做出的努力.
而这些好处Haxe都没有, 一个HelloWorld Haxe可以生成100多行的C++或JavaScript代码, 目标的语言多达7种, 虽然生成的代码还算清晰简单, 但是不知道真的复杂后会怎么样. 有Bug在里面又怎么办?
有可能就是这些原因, Haxe这个几乎是上帝般的语言, 其实并没有在真实的世界中流行.
而任何不流行的语言, 会带来一个副作用, 使得其更加难以流行, 那就是社区支持, 流行的语言有着丰富的第三方库, Python敢号称batteries included, 那是因为的确流行了很多年了, 第三方的库足够的丰富和成熟, 而Haxe也敢号称“batteries included”, 我都觉得有些自大. 目前Haxe的第三方库真正流行和成熟的并不多, 一般我在github上找到的Haxe库followers都在10多个人, 这种库几乎等于没有保证… 作为Haxe不足够流行的一个例子, 作为我博客的上色工具, pygmentize一直以来非常不错, 无论是对C++, C#, Java, Ruby, Python等语言都很不错, 但是当我开始用它来解析Haxe时, 十次有八次就会出现问题, 所以你看到本文很多源代码无法正确的上色…
但是, 我真的希望他能流行.

总结

总的来说, 假如单纯的从程序设计语言的角度来看, Haxe是一门足够严谨, 特性足够多, 有亮点, 又没有太多硬伤的语言, 可以严谨的当C#来用, 又可以自由的像javascript, 我个人很欣赏Haxe的设计. 可以这么说, 从来就没有一个静态类型的语言可以这么深入的支持动态类型, 能够这么灵活, 也从来没有一个动态语言, 能在静态类型上走这么远.
但是, 真的要在项目中使用的话, 我可能会谨慎, 也许等我在业余项目中尝试了几次后, 才敢肯定使用Haxe到底值不值得.

你可能感兴趣的:(杂谈)