图灵机谈学习编程

一个通用编程语言要做的最基本的就是图灵完备,我们常用的语言的通用语言都是图灵完备。那么为什么图灵完备(Turing Complete)这么重要呢?

维基百科
在可计算性理论,如果一系列操作数据的规则(如指令集、编程语言、细胞自动机)可以用来模拟任何图灵机,那么它是图灵完备的。

那么问题来了,啥又是图灵机呢。继续维基百科

通俗而简单的说法就是:一个处理器能不断的处理输入数据,并输出数据,这个处理器维护一个有限状态集,状态集+数据对应的结果是固定。

那么图灵完备的通俗说法就是:能控制图灵机完成所有功能的编程语言。

我们大名鼎鼎的编程语言C语言,当然是图灵完备的。但是我们今天要介绍一款神奇的编程语言,简洁,关键字少,容易上手,关键是图灵完备。要说缺点么,就是要实现功能,过于繁琐了。

Brainfuck
它的默认有状态集:
一个以字节为单位、被初始化为零的数组、一个指向该数组的指针(初始时指向数组的第一个字节)、以及用于输入输出的两个字节流。

能执行的操作:

字符 含义
> 指针加一
< 指针减一
+ 指针指向的字节的值加一
- 指针指向的字节的值减一
. 输出指针指向的单元内容(ASCII码)
, 输入内容到指针指向的单元(ASCII码)
[ 如果指针指向的单元值为零,向后跳转到对应的]指令的次一指令处
] 如果指针指向的单元值不为零,向前跳转到对应的[指令的次一指令处

打印 hello world! (摘抄自wikipedia)

++++++++++[>+++++++>++++++++++>+++>+<<<<-]
>++.>+.+++++++..+++.>++.<<+++++++++++++++.
>.+++.------.--------.>+.>.

代码很简洁,但不是很那读懂,非常烧脑。但是读代码可以倒过来看,不是要打印Hello World!吗?打印字符用的是.,那么肯定要执行至少12个.,实际上还有一个不可见字符换行符\n,总共执行13个.。我们往代码里面数,发现正好13个。那就可以倒推出来,第一个.打印的是H。依次类推,我们就能知道所有点对应的字符是啥了。

下面给出从打印开始的,状态集的状态:

'.', arr: [00 48 64 1e 0a], ptr: 1 # print arr[1] 'H'
'>', arr: [00 48 64 1e 0a], ptr: 2
'+', arr: [00 48 65 1e 0a], ptr: 2
...
'.', arr: [00 57 64 21 0a], ptr: 4 # print arr[4] '\n'

c语言实现的解析器(简单):

typedef struct {
    char arr[1024];
    char ptr;
    void (*putc)(char* p);
    void (*getc)(char* p);
} BrainfuckStateSet;

void Brainfuck_putc(char* p) {
    putc(*p, stdout);
}

void Brainfuck_getc(char* p) {
    *p = (char)getc(stdin);
}

void Brainfuck_parser(BrainfuckStateSet* state, const char* code) {
    int codeIdx = 0;
    while (code[codeIdx]) {
        //printf("arr: [%02x %02x %02x %02x %02x %02x], ptr: %02x  ---- code: %4d: %c\n", state->arr[0], state->arr[1], state->arr[2], state->arr[3], state->arr[4], state->arr[5], state->ptr, codeIdx, code[codeIdx]);
        switch (code[codeIdx]) {
        case '>':
            state->ptr++;
            break;
        case '<':
            state->ptr--;
            break;
        case '+':
            state->arr[state->ptr]++;
            break;
        case '-':
            state->arr[state->ptr]--;
            break;
        case '.':
            state->putc(&state->arr[state->ptr]);
            break;
        case ',':
            state->getc(&state->arr[state->ptr]);
            break;
        case '[':
            if (!state->arr[state->ptr]) {
                while (code[codeIdx] != ']') codeIdx++;
            }
            break;
        case ']':
            if (state->arr[state->ptr]) {
                while (code[codeIdx] != '[') codeIdx--;
            }
            break;
        default:
            // nothing todo, ignore
            break;
        }
        codeIdx++;
    }
}

// print hello world use brainfuck
// simulate brainfuck
void Brainfuck_PrintHelloWorld() {
    // prepare state set
    BrainfuckStateSet state = {
        {0}, 0, Brainfuck_putc, Brainfuck_getc
    };
    memset(&state.arr, 0, 1024);


    // parser
    const char* code = "++++++++++[>+++++++>++++++++++>+++>+<<<<-]"
        ">++.>+.+++++++..+++.>++.<<+++++++++++++++."
        ">.+++.------.--------.>+.>.";
    Brainfuck_parser(&state, code);
}

其实编程语言的三要素:顺序执行,条件判断,循环(条件判断+跳转),其它都是辅助功能。

你可能感兴趣的:(图灵机谈学习编程)