一个通用编程语言要做的最基本的就是图灵完备,我们常用的语言的通用语言都是图灵完备。那么为什么图灵完备(Turing Complete)这么重要呢?
维基百科
在可计算性理论,如果一系列操作数据的规则(如指令集、编程语言、细胞自动机)可以用来模拟任何图灵机,那么它是图灵完备的。
那么问题来了,啥又是图灵机呢。继续维基百科
通俗而简单的说法就是:一个处理器能不断的处理输入数据,并输出数据,这个处理器维护一个有限状态集,状态集+数据对应的结果是固定。
那么图灵完备的通俗说法就是:能控制图灵机完成所有功能的编程语言。
我们大名鼎鼎的编程语言C语言,当然是图灵完备的。但是我们今天要介绍一款神奇的编程语言,简洁,关键字少,容易上手,关键是图灵完备。要说缺点么,就是要实现功能,过于繁琐了。
Brainfuck
它的默认有状态集:
一个以字节为单位、被初始化为零的数组、一个指向该数组的指针(初始时指向数组的第一个字节)、以及用于输入输出的两个字节流。
能执行的操作:
字符 | 含义 |
---|---|
> |
指针加一 |
< |
指针减一 |
+ |
指针指向的字节的值加一 |
- |
指针指向的字节的值减一 |
. |
输出指针指向的单元内容(ASCII码) |
, |
输入内容到指针指向的单元(ASCII码) |
[ |
如果指针指向的单元值为零,向后跳转到对应的] 指令的次一指令处 |
] |
如果指针指向的单元值不为零,向前跳转到对应的[ 指令的次一指令处 |
打印 hello world!
(摘抄自wikipedia)
++++++++++[>+++++++>++++++++++>+++>+<<<<-]
>++.>+.+++++++..+++.>++.<<+++++++++++++++.
>.+++.------.--------.>+.>.
代码很简洁,但不是很那读懂,非常烧脑。但是读代码可以倒过来看,不是要打印Hello World!
吗?打印字符用的是.
,那么肯定要执行至少12个.
,实际上还有一个不可见字符换行符\n
,总共执行13个.
。我们往代码里面数,发现正好13个。那就可以倒推出来,第一个.
打印的是H
。依次类推,我们就能知道所有点对应的字符是啥了。
下面给出从打印开始的,状态集的状态:
'.', arr: [00 48 64 1e 0a], ptr: 1 # print arr[1] 'H'
'>', arr: [00 48 64 1e 0a], ptr: 2
'+', arr: [00 48 65 1e 0a], ptr: 2
...
'.', arr: [00 57 64 21 0a], ptr: 4 # print arr[4] '\n'
c语言实现的解析器(简单):
typedef struct {
char arr[1024];
char ptr;
void (*putc)(char* p);
void (*getc)(char* p);
} BrainfuckStateSet;
void Brainfuck_putc(char* p) {
putc(*p, stdout);
}
void Brainfuck_getc(char* p) {
*p = (char)getc(stdin);
}
void Brainfuck_parser(BrainfuckStateSet* state, const char* code) {
int codeIdx = 0;
while (code[codeIdx]) {
//printf("arr: [%02x %02x %02x %02x %02x %02x], ptr: %02x ---- code: %4d: %c\n", state->arr[0], state->arr[1], state->arr[2], state->arr[3], state->arr[4], state->arr[5], state->ptr, codeIdx, code[codeIdx]);
switch (code[codeIdx]) {
case '>':
state->ptr++;
break;
case '<':
state->ptr--;
break;
case '+':
state->arr[state->ptr]++;
break;
case '-':
state->arr[state->ptr]--;
break;
case '.':
state->putc(&state->arr[state->ptr]);
break;
case ',':
state->getc(&state->arr[state->ptr]);
break;
case '[':
if (!state->arr[state->ptr]) {
while (code[codeIdx] != ']') codeIdx++;
}
break;
case ']':
if (state->arr[state->ptr]) {
while (code[codeIdx] != '[') codeIdx--;
}
break;
default:
// nothing todo, ignore
break;
}
codeIdx++;
}
}
// print hello world use brainfuck
// simulate brainfuck
void Brainfuck_PrintHelloWorld() {
// prepare state set
BrainfuckStateSet state = {
{0}, 0, Brainfuck_putc, Brainfuck_getc
};
memset(&state.arr, 0, 1024);
// parser
const char* code = "++++++++++[>+++++++>++++++++++>+++>+<<<<-]"
">++.>+.+++++++..+++.>++.<<+++++++++++++++."
">.+++.------.--------.>+.>.";
Brainfuck_parser(&state, code);
}
其实编程语言的三要素:顺序执行,条件判断,循环(条件判断+跳转),其它都是辅助功能。