二十年不敌三天

二十年不敌三天,我们的伤感,人类的进步

前日,《自然》杂志刊登了谷歌DeepMind团队的新成果,名为AlphaZero(暂译:阿尔法元)的机器系统仅训练3天就战胜了AlphaGo Lee,比分100:0,后者就是战败李世石的那套。

二十年不敌三天_第1张图片

经过40天训练后,Alpha Zero又以89:11战胜了Alpha Master,即横扫柯洁的那套。

更令人震惊的是,Alpha Zero的设计理念和系统配置完全和Lee/Master不同,它不依托于人类的先验成果,完全靠自我对弈学习下棋。此前,Lee/Master都是用上千盘人类业余和专业棋手的棋谱进行训练。

阿尔法元只需要在4个TPU上,花三天时间,自己左右互搏490万棋局。而它的哥哥阿法狗,需要在48个TPU上,花几个月的时间,学习三千万棋局,才打败人类。
原因就是突破了原有系统的束缚,建立了新的机器逻辑系统。更深层次的,这个机器的逻辑系统可以自我更迭,其速度会超出人类的想象。


那么什么是TPU 呢?

Google的处理器命名为“Tensor Processing Unit”(TPU),因为它能加速其第二代人工智能系统TensorFlow的运行,而且效率也大大超过GPU——Google的深层神经网络就是由 TensorFlow引擎驱动的。
Google的处理器将是自产自销,不会对外出售,但仍会对Intel、NVIDIA这样的大客户产生巨大冲击,因为随着越来越多的企业采用Google云服务,采购处理器并自建服务器/数据中心的会越来越少。

对于这一进步,人类围棋现世界第一柯洁以及前世界冠军古力分别发表看法,柯洁称:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”

古力也慨叹“20年不抵3天,我们的伤感,人类的进步”。

对于人类来说,解放了人类。人类的发展让科学家所需的基础知识越来越多,爱因斯坦26岁就解决了光电效应、迎来了著名的“爱因斯坦奇迹年”。可是现在物理方向的研究人员,往往26岁还没有完成基础知识的积累,更别说在年轻的时候有所突破了。矛盾的是,往往学习完了基础知识也会过了大脑最适宜产出的年龄了。是时间限制了人类的进步,随着人类的发展,毫无疑问地想产生突破所需的基础知识会越来越多,以此更替阻碍人类的进步。而机器的学习是迅速的,成果是可以迅速读取的,快速而有效,解放了人类的大脑。


我们对机器学习的发展充满期待。比如,商用可控核聚变,将让人类探索宇宙变成了可能。相信通过人工智能,人类生活水平的上升、文明程度的提高将指日可待。




你可能感兴趣的:(其他)