翻译 | 一行 JavaScript 代码的逆向工程

  • 原文地址:Reverse Engineering One Line of JavaScript
  • 原文作者:Alex Kras
  • 译者:李波
  • 校对者:冬青、小萝卜

几个月前,我看到一个邮件问:有没有人可以解析这一行 JavaScript 代码

这一行代码会被渲染成下图的效果。你可以在这里用浏览器打开来观看。这是 Mathieu ‘p01’ Henri 写的,你还可以在作者的网站www.p01.org里看到更多很酷的例子。

好的!我决定接受挑战

第一步:让代码变得可读

第一件事,让 HTML 文件里只有 HTML 代码,然后把 JavaScript 代码放到 code.js 文件里。我还用 id="p" 来包装 pre 标签。

index.html


我注意到变量 k 只是一个常量,所以把它移出来,然后重命名为 delay

code.js

var delay = 64;
var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var n = setInterval(draw, delay);

接下来,因为 setInterval 可以接收一个函数或者字符串来执行,字符串 var draw 会被 setInterval 用 eval 来解析并执行。所以我把它移到一个新建的函数体内。 然后保留旧的那行代码,以供参考。

我注意到的另一个点,变量 p 指向了存在于 HTML 的 DOM 结构里 id 为 p 的标签,就是那个之前我包装过的 pre 标签。事实上,元素标签可以通过他们的 id 用 JavaScript 来获取,只要 id 仅由字母数字组成。这里,我通过 document.getElementById("p") 来让它更加直观。

var delay = 64;
var p = document.getElementById("p"); // < --------------
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    for (n += 7, i = delay, P = 'p.\n'; i -= 1 / delay; P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2]) {
        j = delay / i; p.innerHTML = P;
    }
};
var n = setInterval(draw, delay);

下一步,我声明了变量 ipj,然后把他们放在函数的顶部。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay; // < ---------------
    var P ='p.\n';
    var j;
    for (n += 7; i > 0 ;P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2]) {
        j = delay / i; p.innerHTML = P;
        i -= 1 / delay;
    }
};
var n = setInterval(draw, delay);

我把 for 循环分解成 while 循环。只保留了 for 的CHECK_EVERY_LOOP部分(for的三个部分分别是RUNS_ONCE_ON_INIT; CHECK_EVERY_LOOP; DO_EVERY_LOOP),然后分别把其他的代码移到循环的内外部。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) { // <----------------------
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;
        P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2];
    }
};
var n = setInterval(draw, delay);

接着我将会展开 P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2] 中的三元操作(判断条件 ? true时运行 :false时运行

i % 2 是用来检测 i 是奇数还是偶数,如果 i 是偶数,则返回 2。如果是奇数,则返回 (i % 2 * j - j + n / delay ^ j) & 1 的计算结果(更多的是这种情况)。

最终,这个返回值被当作索引,被用于获取字符串P的某个字符,因此它可以写成 P += P[index]

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) {
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;

        let index;
        let iIsOdd = (i % 2 != 0); // <---------------

        if (iIsOdd) { // <---------------
            index = (i % 2 * j - j + n / delay ^ j) & 1;
        } else {
            index = 2;
        }

        P += P[index];
    }
};
var n = setInterval(draw, delay);

下一步,我会把 index = (i % 2 * j - j + n / delay ^ j) & 1 里的 & 1 分解到另外的 if 表达式里。

这是一种聪明的方法来检测括号内的值是奇数还是偶数,如果是偶数则返回 0,反之返回 1.& 是与的位运算符。与的逻辑如下:

  • 1 & 1 = 1
  • 0 & 1 = 0

因此 something & 1 则可以看成把“something”转化成二进制,接着在 1 的前面填充对应数量的 0,从而保持和 something 的长度一致,然后仅仅返回与运算的最后一位。例如,5的二进制是 101。如果我们和 1 进行与运算,将会得到如下结果:

    101
AND 001
    001

或者说,5是一个奇数,5 & 1 的结果是 1。用 JavaScript 的控制台很容易可以证明下面这个逻辑。

0 & 1 // 0 - even return 0
1 & 1 // 1 - odd return 1
2 & 1 // 0 - even return 0
3 & 1 // 1 - odd return 1
4 & 1 // 0 - even return 0
5 & 1 // 1 - odd return 1

注意,我将上述 index 的剩余部分重命名为 magic。因此这些代码加上展开 & 1 后的代码看起来是下面这样的。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) {
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;

        let index;
        let iIsOdd = (i % 2 != 0);

        if (iIsOdd) {
            let magic = (i % 2 * j - j + n / delay ^ j);
            let magicIsOdd = (magic % 2 != 0); // &1 < --------------------------
            if (magicIsOdd) { // &1 <--------------------------
                index = 1;
            } else {
                index = 0;
            }
        } else {
            index = 2;
        }

        P += P[index];
    }
};
var n = setInterval(draw, delay);

接下来,我将会分解 P += P[index] 到一个 switch 表达式里。现在我们可以很清晰的知道 index的值只可能为 0、1 和 2 中的一个。也可以知道 P 的初始化总是 var P ='p.\n', index 为 0 时指向 p,为 1 时指向 .,为 2 时指向 \n —— 新的一行字符串。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) {
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;

        let index;
        let iIsOdd = (i % 2 != 0);

        if (iIsOdd) {
            let magic = (i % 2 * j - j + n / delay ^ j);
            let magicIsOdd = (magic % 2 != 0); // &1
            if (magicIsOdd) { // &1
                index = 1;
            } else {
                index = 0;
            }
        } else {
            index = 2;
        }

        switch (index) { // P += P[index]; <-----------------------
            case 0:
                P += "p"; // aka P[0]
                break;
            case 1:
                P += "."; // aka P[1]
                break;
            case 2:
                P += "\n"; // aka P[2]
        }
    }
};

var n = setInterval(draw, delay);

我将简化 var n = setInterval(draw, delay)setInterval 会返回一个从 1 开始的整数,并且每次执行完 setInterval 之后返回值都会递增。这个整数可以在 clearInterval 方法里面用到(用来取消定时器)。在我们的代码里, setInterval 仅仅只会执行一次,所以 n 可以简单的设置为 1.

我还把 delay 重命名为 DELAY 让它看起来是一个常量。

最后但并非不重要的一点,我用括号把 i % 2 * j - j + n / DELAY 包起来,指明 ^ 异或运算的执行优先度低于 %,*,-,+/操作。或者说,所有的运算操作都会比 ^ 先执行。包装后的代码应该是这样的 ((i % 2 * j - j + n / DELAY) ^ j)


// 之前我把 `p.innerHTML = P;` 放错地方了,更新后,把它移出了while循环

const DELAY = 64; // approximately 15 frames per second 15 frames per second * 64 seconds = 960 frames
var n = 1;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";

/**
 * Draws a picture
 * 128 chars by 32 chars = total 4096 chars
 */
var draw = function() {
    var i = DELAY; // 64
    var P ='p.\n'; // First line, reference for chars to use
    var j;

    n += 7;

    while (i > 0) {

        j = DELAY / i;
        i -= 1 / DELAY;

        let index;
        let iIsOdd = (i % 2 != 0);

        if (iIsOdd) {
            let magic = ((i % 2 * j - j + n / DELAY) ^ j); // < ------------------
            let magicIsOdd = (magic % 2 != 0); // &1
            if (magicIsOdd) { // &1
                index = 1;
            } else {
                index = 0;
            }
        } else {
            index = 2;
        }

        switch (index) { // P += P[index];
            case 0:
                P += "p"; // aka P[0]
                break;
            case 1:
                P += "."; // aka P[1]
                break;
            case 2:
                P += "\n"; // aka P[2]
        }
    }
    //Update HTML
    p.innerHTML = P;
};

setInterval(draw, 64);

你可以在这里看到最后的结果。

第二步:理解代码

这部分将会介绍什么内容呢?不要心急,让我们一步一步来解析。

i 通过 var i = DELAY,被初始化为 64,然后每次循环递减 1/64,等于0.015625(i -= 1 / DELAY)。循环持续到 i 小于 0 时(while (i > 0) {)。每次执行循环,i 将会减少 1/64,所以每执行 64 次循环,i 就会减 1 (64 / 64 = 1),总得来说, i 需要执行 64 x 64 = 4096 次,之后小于 0.

之前的图片中,一共有 32 行,每行包含了 128 个字符。恰巧的是 64 x 64 = 32 x 128 = 4096。我们触发 32 次 i 为严谨的偶数的情况,i 是绝对的偶数时,i 才为偶数(非奇数 let iIsOdd = (i % 2 != 0); 译者提示:偶数是整数,所以2.2是奇数),例如 i 为 64,62,60等。在这 32 次里,index 通过 index = 2 赋值为 2,意味着字符串将添加 P += "\n"; // aka P[2] 从而换行,开始一行新的字符串。剩余的 127 个字符则都是 p.

那么我们根据什么来判断何时用 p 或者 . ?

当然,之前我们就已经知道了,当 let magic = ((i % 2 * j - j + n / DELAY) ^ j) 中的 magic 是奇数的时候用 . ,如果是偶数则用 p

var P ='p.\n';

...

if (magicIsOdd) { // &1
    index = 1; // second char in P - .
} else {
    index = 0; // first char in P - p
}

但我们很难知道 magic 是奇数还是偶数,这是一个很有分量的问题。在此之前,让我们证实一些事情。

如果我们把 + n/DELAYlet magic = ((i % 2 * j - j + n / DELAY) ^ j) 当中移除掉,我们最终将会看到一个静态的布局,如下图

现在,让我们来看看移除了 + n/DELAYmagic。如何能得到上面漂亮的图片。

(i % 2 * j - j) ^ j

注意到每次循环里,我们都会执行:

j = DELAY / i;
i -= 1 / DELAY;

换句话说,我们可以将上述表达式中的 ji 表示,变成 j = DELAY/ (i + 1/DELAY),但因为 1/DELAY 是一个非常小的数值,所以我们暂时去掉 + 1/DELAY 并简化成 j = DELAY/i = 64/i

// 译者注

为何这里不是 j = DELAY/ (i - 1/DELAY)呢?

原因:

i -= 1 / DELAY 转化成 i = i - 1 / DELAY

这里有 2 个 i 可以代入消元,但是因为 j 的表达式在 i 前面,所以 j 取得 i
该是自减前的 i,故 i = i + 1/ DELAY

因此我们可以重写 (i % 2 * j - j) ^ j(i % 2 * 64/i - 64/i) ^ 64/i

让我们用在线的图形计算器来绘制那些函数

首先,我们来绘制下 i%2 的图

从下面的图形可以看出,y 的值区间在 0 到 2 之间。

如果我们绘制 64 / i 则会得到如下图形

如果我们绘制 (i % 2 * 64/i - 64/i) 表达式,我们将得到一个混合了上面两张图的一个图形,如下

最后,如果我们把2个函数同时绘制出来,将会是如下的图(红线为 j 的关系图)

我们能从图形里知道些什么?

让我们回忆下我们要去解答的问题:如何得到如下静止图像:

好的,我们知道如果 (i % 2 * j - j) ^ j 的值是一个偶数,那么我们将添加 p,如果是一个奇数则添加 .

让我们专注在图形的前面 16 行,i 的值在 64 到 32 之间。

异或运算在 JavaScript 里会把小数点右边的值忽略掉,所以它看起来和执行 Math.floor 的效果一样。

其实当2个对比位都是 1 或者 0 的时候, 异或操作会返回0。

这里我们的 j 初始值为 1,且慢慢的递增趋向于 2,但始终小于 2,所以我们可以把它当成 1 来处理(Math.floor(1.9999) === 1),为了得到结果为 0 (意味着是偶数),我们还需要异或表达式的左边也是 1,使得返回一个 p 给我们。

换句话说,每条藏青色的倾斜线都相当于我们图像中的一行,因为前面16行的 j 值总是介于 1 和 2 之间,而唯一能得到奇数值的方法是让 (i % 2 * j - j) ^ j(也可以说i % 2 * i/64 - i/64 或者藏青色的倾斜线)大于 1 或小于 -1。

为了将这个地方讲清楚,这里有一些Javascript控制台的输出,0 或者 -2 意味着结果是偶数,1 则是奇数。

1 ^ 1 // 0 - even p
1.1 ^ 1.1 // 0 - even p
0.9 ^ 1 // 1 - odd .
0 ^ 1 // 1 - odd .
-1 ^ 1 // -2 - even p
-1.1 ^ 1.1 // -2 - even p

如果我们观察下我们的图形,可以看出原点右边的斜线大部分都是大于 1 或者小于 -1(几乎没有偶数,或者说几乎没有 p),且越靠后(靠近原点)越如此。第 16 行几乎介于 2 和 -2 之间。第 16 行之后,我们可以看到图形是另外一种模式。

16 行之后 j 超过了 2,使得结果发生了变化。现在当藏青色的斜线大于 2 ,小于 -2 ,或者在1和-1之间且不等于的时候,我们将会得到一个偶数。这也是为什么在 17 行之后我们会在一行内看到两组和两组以上的 p

如果你仔细看动图的最底部几行,你会发现这几行不符合上面的规则,图表曲线看起来起伏非常大。

现在让我们把 + n/DELAY 加回来。在代码里我们可以看到 n 的初始值是 8 (初始是 1 ,但是每次定时器被调用时就加 7),它会在每次执行定时器时增加 7。

n 变成 64,图形会变成如下样子。

可以注意到,j 总是 ~1(这里的 ~ 是近似的意思),但是现在红斜线的左半边位于 62-63 区间的值无限趋近于 0,红斜线的右半边位于 63-64 则无限趋近与 1。因为我们的字符按64到62的顺序排列,那么我们可以猜测斜线的 63-64 部分(1^1=0 是偶数)添加的是一段 p,左边 62-63 部分(1^0=1 是奇数)添加的是一段 .。就像普通的英语单词一样,从左到右的添加上。

用 HTML 渲染出来的话,将会看到下图(你可以自己在 codepen 改变 n 来观看效果)。这和我们的预期一致。

这一时刻 p 的数量已经增长了一定的数量。例如第一行里面就有一半的值是偶数,从现在起,一大段的ps 将移动他们的位置。

为了说明这一点,我们可以看到当 n 在下一个定时器里增加了 7 时,图形就会有稍微的变化

注意,第一行的斜线(在 64 附近)已经稍微移动了 1 小格,假设 4 个方格代表 128 个字符,1 个方格 相当于 32 个字符,那么 1 个小格则相当于 32/5=6.4 个字符(大约)。正如下图所示,我们可以看到第一行实际上向右移动了 7 个字符。

最后一个例子。就是当定时器被调用超过 7 次时(n 等于 64+9x7)会发生什么。

对于第一行,j 还等于 1。现在红斜线的上部分在 64 左右的值趋向于 2,下部分趋向于 1。这个图片将会翻转,因为现在 1^2 = 3 是奇数-输出.1^1 = 0 是偶数- 输出p。所以我们预期在一大段 p 之后会是一大段 .

他会这么渲染。

自此,图形将会以这种形式无限循环下去。

我希望我解释清楚了。我不认为自己有能力写出这样的代码,但是我很享受理解它的过程。

iKcamp原创新书《移动Web前端高效开发实战》已在亚马逊、京东、当当开售。

沪江Web前端上海团队招聘【Web前端架构师】,有意者简历至:[email protected]

你可能感兴趣的:(逆向工程,javascript)