吴军 207封信丨印度文化使得它在体育上非常落后
分享一个和印度有关的话题——为什么印度在体育上十分落后?
作为拥有近13亿人口的大国,印度在2016年里约奥运会上只获得一枚银牌和一枚铜牌,名列第60多名,不仅不如巴哈马、科特迪瓦这种小国,甚至中国一名好的运动员获得的奖牌都比他们全国多。究竟什么原因导致印度的体育如此落后呢?
很多人首先想到奥运会在项目设置上是否缺少印度擅长的项目,比如板球和壁球,印度人自己也是这么抱怨的。但是,先不说如果设置了板球和壁球,印度是否能取得好成绩,就算今天他们能够在这两个项目中获得奖牌,只要这两个项目一旦成为了奥运会项目,欧美国家就会开展,很快就能超过印度。
类似的事情在印度身上就发生过,那就是他们的国球——曲棍球。印度从1928年开始参加奥运会,在1980年之前,印度总共获得过11枚曲棍球奖牌,其中8枚是金牌——它们也是印度在半个多世纪奥运史上获得的全部金牌。
1984年洛杉矶奥运会后,商业进入了奥运会,运动员可以名正言顺地获得商家的赞助,因此全世界的竞技体育水平有了很大提高,凡是奥运会项目,都会有很多人从事,曲棍球也不例外。当欧洲和澳洲国家认真对待曲棍球运动后,印度的先发优势很快丧失,被德国等其它国家超越,并且从此在这个项目中一蹶不振。
你可能会将这其中的原因归结为印度是穷国,体育开展不普及,体育设施差。但是,很多经济发展还不如印度的小国,竞技体育的水平都比印度高很多。更何况作为一个高速发展的新兴经济体,印度并不是很缺钱。
如果印度真的有决心改变体育落后的现状,它应该制定体育发展战略,建设体育设施。但印度根本就没有这么做,虽然他们每次在奥运会上都在打酱油,但全国上下对此无所谓。这种态度,才是印度体育落后的真正原因,而进一步究其根源,则要归结于印度的文化了。
我们知道奥运会源于古希腊,它是古希腊文明的一部分。古希腊人可以用“修心也修身”来形容,他们不仅崇尚理性和科学,喜欢思辨,并且热衷于讨论,而且喜欢把自己练就出强壮的体魄。这一点不仅天生就是战士的斯巴达人如此,多才多艺的雅典人也是如此。古希腊不仅出毕达哥拉斯和柏拉图,也出掷铁饼者。
因此,古希腊虽然人口不多,但是面对强大的波斯帝国在战场上并不落下风。奥林匹克精神所强调的更高、更快、更强,实际上是那个时代希腊精神的体现。后来虽然希腊衰落了,但它的文明被欧美继承,一个人内外兼修的传统一直延续至今。到了近代,在奥运会被恢复之后,各种竞技体育项目,尤其是奥运会项目,就在欧美开始普及发展。健身、锻炼和休闲成为民众生活的一部分,源于古希腊文明。
然而对于希腊文化的产物,印度人却并不买账。印度是一个和古希腊并行发展的古老文明中心,因此印度人直到今天在文化上依然非常自负。如果你接触过很多印度人,就会发现他们不仅为自己是早期文明中心而自豪,而且会编出很多段子来讲述他们往日高度的文明。
今天,在文化上对印度影响最深的是婆罗门文化。我们都知道印度的婆罗门教将国民按照种姓进行划分,最上层是婆罗门,他们在历史上除了担任神职之外,还从事教育和宫廷文士等职。在印度独立之前,政府部门里四分之三的公职人员是婆罗门。
由于婆罗门处在印度种姓的金字塔顶端,因此他们的思想实际上成为了全印度人行为的准则。婆罗门认为,世界有天(梵)和人(我)的区别,印度人的梵天有点像斯宾诺莎所说的上帝——宇宙的最高原则,而他们所说的“我”则是现世的载体,如果能努力经过修行以达到梵我一致的境地,就能免去轮回之苦而得到大自在。
在这样的文化中,印度高种姓的人鄙视体力活动,而注重精神修行,以禁欲和苦行为荣,简单地讲就是修心不修身。在生活中,越是高种姓的人,越是素食者,他们以吃肉、从事体力劳动为耻,甚至对我们的休闲活动也不屑一顾。在学校里,知识、文化与科学技术的教育得到重视,而体育活动则被轻视。因此,印度国民在整体上缺乏强壮的体魄,而且对此一点都不在乎。
在观念上,印度人对自己的文化颇为自豪,对源于古希腊文明的体育非常淡漠。即便在美国,体育设施很好,印度人参加体育活动的也并不多。因此,印度体育落后也就毫不奇怪了,而且在相当长的时间里,也难以改善。
尽管不同的文化会提倡不同的价值观,但具体到体育运动这件事情上,我一直认为多参与不仅可以让人的身心全面发展,而且对人的智力发展也是有好处的。因此,我经常建议身边的亲友无论工作多忙,也要每周坚持锻炼。其实我们中国文化,也是主张身心双修,内外平衡的。
万维钢 答读者问|这一次的输赢和这一生的输赢
读者 问:
我觉得“好”CEO的这个概念很模糊。于是,我就去翻了一下hbr的原文,原文中“high-performing”的定义是“达到或者超过董事会和投资人的预期”。那我可不可以理解为“好”等同于“为董事会和投资人带来明显收益”,也就是公司业绩。用公司业绩来划分出“好”真的靠谱吗?经济大环境属于business cycle的回复期,那么因此而来的业绩又有多少应该归功于CEO本人的英明神武?或者更严重的,那些被炒了的CEO,有多少是因为个人能力,而不是所在企业内部的不稳定和经济冲击?
万维钢
CEO、包括总统的*业绩*的确不能完全说明问题,受经济周期影响很大。但是这个研究说的“performance”,并不单指经营业绩。研究者还特别强调,according to INTERVIEWS with board members and majority investors DEEPLY FAMILIAR with the CEO’s performance —— 他们并没有单看财务报表,而是已经做到了直接采访熟悉这个 CEO 表现的人,对于这样规模的研究来说,也算是可以了。
来自日课:用别人预测自己
读者 问:
现在很多中国所谓的“中产阶级”都在走移民这条路,万老师作为先行者,能否给一些建议,如何在移民浪潮中做出选择?
万维钢
我的例子不具备可比性。我并不是“中产阶级移民”,我是个穷学生,带着父母给的两千美元只身来到美国,没有任何家庭负担,也没有“到美国之后该干什么”的疑惑。
但移民这样的决策的确适合使用“用别人预测自己”这个方法。第一步,跟自己*情况类似*的人移民之后怎样了。第二步,*对你来说*,有什么特殊之处。两国经济状况、环境差异、教育水平这些东西,是对所有人来说都一样的因素,我们更应该关心的是具体到自己,是个什么状况。比如移民之后的工作问题,每个人就非常不同。
读者 问:
但是如果我们真的很想做一件事,可能会专门找一些幸存者偏差来骗自己,就算不是全部,也可能是比较大部分。还有一种情况是如果身边没有例子,那么肯定就会去找一些认知度较高的例子,然后分析。这些例子可能就是幸存者偏差,那么这样的分析会有危害吗?
万维钢
说得很好。如果你意识到可能会有幸存者偏差,那你就可能避免被它影响。上周我们专栏问读者,是否应该把每期的长度控制在音频10分钟之内,结果很多读者留言表示长点没关系。当时主编就跟我分析,这其中可能有幸存者偏差 —— 专门听音频、而且不喜欢长音频的读者可能没有留言,甚至可能根本就没看到这个问题。事实上,主编说,后台数据显示,10分钟的确是最受欢迎的长度。所以客观的数据真是特别重要。
读者 问:
对于目前信息爆炸的时代,一个门类的知识穷其一生也掌握不了,我们应该怎样才不被时代所淘汰呢?
万维钢
罗胖说,《我懂你的知识焦虑》:)不过现在知识实在太多的确是根本不可能全都掌握。
想要不被时代淘汰,我理解关键在于四个字:有恃无恐 。有所凭借就有安全感 —— 或者凭借本事,或者凭借财富,或者凭借跟某人的血缘关系,等等。凭借本事的话,最好能有一个“核心竞争力”,一个让你不可替代的东西。
我搞科研的时候,有几个老头子好几年内,在各种会议上作报告,讲的都是大同小异的一套。他并没有紧跟领域内所有最新进展,他并没有时刻更新自己的知识,可是那个东西是他搞出来的,只有他最懂,你不能不服还不能不理,所以他非常安全。
来自日课:网购是怎么把我们变成傻瓜的
读者 问:
万老师,面对商家“算法”,发起“反击”的消费者,是否只是少数?商家,面对的以上不在乎小钱的消费者越多,越能赚钱,结果是否就是商家的“恒胜”呢?那些推出比价的网站或公司,最后是否会被诸如Amazon这样的公司收购掉,因为看中这些小公司手里虽不够海量但足够精确的消费者数据?
万维钢
是只有少数消费者在反击,这给了商家钻空子的机会,但这少数人的反击,就已经构成了极大的威慑。如果商店定价太不像话,他们会抗议,然后我们就可能会跟着抗议。正所谓《只要有一小撮人玩真的》。
亚马逊是可以对比价网站施加影响,比如 Adblock Plus 现在就被很多网站抗议,还在搞什么“白名单”。可是你总不能一手遮天吧?允许一小撮人闹事,对大家的健康都有好处。
来自日课:成大事者怎么才能不纠结
读者 问:
当决策失败,该如何调整心态来接受?之前的日课也讲过,对小概率事件的接受度标志一个人的成熟度。道理都懂,可是该如何面对呢?
万维钢
这个问题,我记得好像是丹尼尔·卡尼曼说过。你要想象人生并不是一锤子买卖,是由很多很多决策构成的。
举个例子,赌钱游戏。咱俩赌硬币正反面,如果是正面,我输给你150万元,如果是反面,你输给我100万元 —— 这个游戏你赌还是不赌呢?概率论告诉你应该赌,因为数学期望是正的25万元。但你可能不会赌,因为一旦输了,这个损失不好承受。
然后咱们换个玩法。正面,我输给你150元;反面,你输给我100元,而且咱们连玩1万次。那这回你当然要赌!数学期望还是25万元,但这一次你基本上一定会拿到差不多这么多钱。
真实生活,更像是第二种玩法。每一次都面临输的可能性,但是只要你坚持正确的选择,而且能承受小失败,那么从长期看来必定是赢。
所以答案就是想想长期。你在乎的不是这一次的输赢,而是这一生的输赢。你要的不是一次赌对,而是一个能够多次赌对的系统。
刘润 20小时快速学习
作为一名商业顾问,每天面对各行各业的客户。他们用20年,“精通”行业99%的商业细节,而商业顾问,必须用20小时,“学会”行业80%的核心逻辑,然后才有资格说“我认为...”。
所以快速学习的能力是一名优秀的顾问的核武。
四步法:
1.大量泛读
比如你想学习“区块链”,先上豆瓣,搜关键词或相关关键字,找到评价最高的三本书。然后通过买过这本书的人,还买过那本书的方法,再选五本。最后再加两本不畅销,但是明显系统性强的书,比如《区块链原理》等。(工具书)
然后把这是本书都买回来,开始泛读。并注意以下:
a. 五分钟看序,五分钟看目录。在序中梳理框架逻辑,在目录中提炼核心观点。
b. 15分钟泛读。要点是:略过故事,略过案例,略过证明;标注概念,标注模型,标注公式,标注核心观点。
c. 最后五分钟简单回顾,记录自己的困惑问题和想法。
用一个长一点的下午,或者再加上晚上的时间,高强度把这10本书读完。推荐电子版,这样可以高效检索回顾记录。
2. 建立模型
接下来,好好睡一觉,让只是在大脑中自有碰撞,连接,融合。(也就是交给潜意识处理)。
第二天早上,给自己最清醒的三小时,建立模型。
找一面巨大的白板墙,吧标注的概念,模型,公式,写在便贴纸上,贴到白板上,再用白板笔和板擦,建立休整他们之间的关联,准建形成系统模型。
注意,白板是非常重要的思考工具,以后节目会介绍(又勾引我消费 :D)。
(截图)
3. 求教专家
还有不清楚的问题就要求交真正的专家。
比如刘润在研究“VR”的时候,找了一个专门投VR的基金,登门拜访。他们一年看200多个VR创业项目。刘润向其求教了2小时,很多问题豁然开朗。
重要的是,必须先建立模型,而不是先去求教。因为没有基本的全局观就问不出好问题。另外,专家的洞察犀利,但未必有全局观。如果让他自由发挥2小时,你很可能不知所云。
如果人脉不够,没有渠道找专家,可以上知乎,在行之类的平台,花些费用,虚心求教,然后修正模型。
4. 理解复述
当你已经花了5小时泛读,3小时建模,2小时求教,还需要再花10小时复述。
“费曼技巧”:用自己的语言,把自己的模型,讲给别人听。你很可能会发现,讲着讲着就不明白了,或者你觉得讲明白了,但别人就是听不懂。这些地方就是你理解的薄弱点。
记下这些薄弱点,回到泛读资料里,重新理解;或者上网找答案;或者再次请教专家。重新理解后,再复述,如此重复。
最终,20小时就可快熟学习一项完全陌生只是的80%内容。
品牌迭代:决定了中国企业存亡
魅族科技的副总裁李楠,针对品牌定位说,在今天的中国,品牌迭代决定了中国企业的生死。
品牌迭代这么重要吗?李楠举了无印良品的例子。无印良品原来说的是“无印”,意思是没有品牌,最初它对自己的定位是卖没有包装、没有品牌,价格便宜的好东西。但是这样的定位,让无印良品在日本根本做不下去。因为再怎么便宜,它也便宜不过那些百元店。这种情况就让无印良品不得不迭代品牌。
它是怎么做的呢?无印良品把自己的定位从“便宜”转为了“设计”,它还是卖杂货,但不说自己是最便宜的杂货了。无印良品去请了全日本第一流的设计师,像原研哉、深泽直人等等,让他们去设计日常生活中那些最小、最不起眼的杂货。说白了,就是制造反差。想想看,消费者如果知道自己在无印良品买的一些很不起眼的东西,比如牙刷、毛巾,居然都出自一流的设计师之手,他们当然乐意接受。
李楠说,其实日本是一个相对进化很缓慢的市场,但即使是在这个市场,一个品牌想要持续生存,也需要更新和迭代。相比来看,中国企业就更得进行品牌迭代了。为什么这么说呢?有两点原因。
第一个原因是,中国的出生人口数量在不断减少。李楠说,根据统计数据,80后的人口数量大概是1.9亿,90后人口数量1.7亿,00后不到1.6亿,是在逐渐减少的。可想而知,如果一家企业一直针对同一年龄群的价值观,坚持自己的品牌定位,即使做得很完美,它所面临的市场也会以每年一两千万的速度不停地缩减。因此,要想市场不萎缩,企业必须考虑品牌迭代。比如你可以做一个新的子品牌,去跟随中国人口结构中最宽的那个市场。
还有一个原因是,就算单看今天的年轻人,他们的整个诉求也是在不断地变化的。比如在过去的10到15年,80、90后可能选择在淘宝上购物,今天呢,他们可能都转移到了京东和天猫上。淘宝、天猫、京东都是做电商的,区别在哪呢?李楠说,淘宝的本质是“有没有”,而京东和天猫的本质是“好不好”。消费者主流人群的转移,说明大家已经解决了“有没有”的问题,而开始关心“好不好”了。
那消费者下一步关注什么呢?李楠认为,消费者下一步很可能关注的是“美不美”、价值观“认不认同”。现在天猫和京东在品牌渗透率上遇到了明显的困难,但在美国的电商销售额当中呢,是品牌自有电商的销售额在一直增长。他觉得,中国未来可能会跟随美国的这种趋势,一个能表达这个品牌所有态度、设计和价值观的官网,更容易唤起消费者的情感,让消费者更认同。
总结一下,李楠认为,中国企业的品牌迭代要考虑两方面的问题:一个是,中国的主流消费人群在变老,你是不是要跟随他们,不跟随他们市场就要不断变小。还有一个是,就算是今天的年轻人,他们的需求也在不断地变化,你是不是要跟随他们?
砚青觉得,每一代人或者每个人的不同时期选择新的社群商品,设计什么的都是副产品。其实只是想跟上一代人或者老圈层的关系拉开距离而已。同样的通讯产品,用新的平台的目的不过是为了逃脱(父辈的)关联网。说得好听是为了断舍离。也可以理解为“网络社交搬家”,搬到新的“城市/社区”,独立于之前的社群存在。这也是主要是基于匿名属性导致的。
新分享丨警惕理性人的最大错误
尚德机构创始人欧蓬演讲时说,花太多时间来提高效率而不是制造壁垒,是理性人的最大错误。(说白了,就是你没有壁垒的话,大公司可以轻易用钱砸死你!)
欧蓬认为,真正影响行业格局的,并不是员工们一个个加班努力、拼命工作,而是经济学中的边际利润趋零定律,也就是说在任何一个完全竞争的企业里,大家都在边际利润趋近于零时停下来。因为在完全竞争状态下,你的竞争对手会不断模仿你,变得跟你一样,最终的结果是边际利润趋零,这也是大多数企业的宿命。
那么,怎么对抗这个定律呢?战略大师波特有三个解决方案。第一,成本领先,努力做到最便宜;第二,差异化;第三,细分市场,你需要做一个足够小的市场。这三个解决方案欧蓬认为很正确,但是实际操作起来比较困难。真正能对抗边际利润趋零的,是建立竞争壁垒。
什么是壁垒呢?欧蓬认为,壁垒就是对手无法攻击你,但你可以任性地攻击对手的实力。具体有两个:第一个,报复实力,就是具备打击对手的能力。第二个是进入门槛。他以尚德机构为例,详细解释了这两个壁垒。
先说报复实力。尚德机构经常根据不同班型做不同补贴,精准打击对手。比如对手做心理咨询,尚德也做心理咨询,那尚德就在心理咨询课程降价,不挣钱,但可以在人力资源课程挣钱。或者在北京挣钱,但是在上海降价,不挣钱。这是尚德机构起家的实力。
再说进入门槛。教育有两个模式,一个是面授,也就是老师给学生面对面上课;另一个是在线教育。面授模式要增加利润,就要开更多的班。但是当1个班扩充到2千个班的时候,公司不会更强,而是更弱。因为管理2千个班的边际成本远远大于管理1个班。这就是面授的困扰。
在线教育就不一样了。在这种模式下扩张,可以先砸几个亿,放在产品、技术、教学、运营等方面。然后扩大规模,利润率会越来越高。所以,尚德机构在2014年从线下教育机构转型成直播教育平台,在线上扩张,这就抬高了进入门槛,减少了竞争对手的数量,还让强行进入这个领域的对手在初期很弱,容易被打击。
说完尚德机构的两个壁垒,再来说说,成人教育的在线直播教学,有什么特点。
欧蓬说,成人教育的在线直播教学,要重构学习价值,先要重构教学内容,具体分为三个方面。
第一,运营和学术并重,甚至运营比学术更重要。因为成人学习的特点是不容易坚持,怎么让他们坚持下来呢?这就需要做大量的用户运营工作。比如班主任给学员分配碎片化的学习内容,给学员PK排名,调动他们的学习积极性。
第二,生动化传播。一般情况下,学员不愿意接受抽象的数据化信息,需要重新加工,生动地表达出来。
第三,教学周迭代。成人主要用业余时间学习,生活中的干扰很多,比如家里有事、接送孩子等等,都会中断学习,所以成人面授的出勤率很低。但是直播的出勤率达到60%到70%,比面授高很多。这说明场景非常重要。直播教学要根据学员的情况重新调整课件,根据数据、活跃度等情况调整运营策略,这就是周迭代。
重构教学内容后,还要重构考试。到了考试阶段,要把知识点再拆分开,搭建成一棵知识树,把所有知识点变成高频、低频的分布,再把这些知识点跟专业相结合,提升学员的学习效率。
薛兆丰:专利减少社会资源浪费
为什么有些人不看好专利保护。我们知道,市场经济是提倡充分竞争的,但是专利保护阻碍了这种竞争。本来两个人都可以利用一种技术来创新,但是其中一个人有了专利,另一个人就连竞争的机会都没有了。也就是说,专利保护在鼓励个人创新的同时,阻碍了知识的传播和分享。从这个角度来看,专利保护确实有它不好的地方。
既然如此,那为什么我们还是需要专利保护呢?薛兆丰说,因为在很多时候,它可以帮我们有效地减少社会资源的浪费。他给我们举了个例子,说如果现在一公里外有袋金子,所有的人肯定都想跑过去抢,这叫竞争。但我们知道最后只能有一个优胜者,剩下所有人都只是陪跑的,这就造成了大部分人时间和体力的浪费。但如果说,大家知道这些人当中有一个人是刘翔,很多人可能就放弃了,连跑都不跑了。
对创业者来说也是这样,哪个公司手里的专利多,跑赢的概率就大,你一个专利都没有,还是别参与了,做别的吧。很多人说创业就是摸着石头过河,这个专利就好比石头,手里的石头越多,走到对岸的可能性就越大。专利的作用,就是尽早地告诉别人,你比较强,这就可以减少社会资源的浪费。
但同时薛兆丰也说,实际上现在绝大多数的专利都没有实际的用途,90%以上的专利都躺在专利局里睡觉。原因是什么呢?其实在中国,很多发明创造都是政府资助的,所以很多专利的所有权并不在个人的手里,而在国家和单位的手里,这就导致很多专利的商业化开发不够充分。还有就是,科学家们也没有动力去商业化这些专利,他们只是做科研,做完一个做下一个。这些耗费了大量资金研究出来的东西,就那么浪费地放在那里。但我们知道,一个专利从它诞生到真正能投入使用,是需要很长一段时间的。所以薛兆丰认为,没有被开发价值的产品,没有被商业化的专利,根本不能带来技术的进步。
那该怎么让这些沉睡的专利“醒”过来呢?薛兆丰在之前的演讲里曾经说过,发明人包办的时代过去了,现在是企业家必须发挥转化作用的时候。企业家可以让研发和商业转化的价值比达到1:100。这是什么意思呢?过去我们觉得,只有农民和生产线上的工人才算是真正做生产的人,他们对社会财富的贡献更多,而在中间赚差价的商人呢,赚的都是不义之财。
但从经济学的角度来看,商人在经济活动里解决了信息不对称的问题。只有商人才知道,什么人在什么地方需要什么东西,愿意付什么价钱。到现在,企业家在研发到商业化的过程里分成比例更大,有的时候甚至能到1:100,也就是科学家拿1,企业家拿100。科学家愿意这么做吗?薛兆丰认为,是愿意的,因为如果不愿意就是0,一个专利只能在专利局里躺着。而且今天这个利润比原来大得多,即使只拿1,也比过去拿100要多。
也就是说,原来的时候,资本很重要,出资本的人拿大头,出人力的拿小头。但今天,人力比资本更重要,我们应该把顺序倒过来,让出资本的人拿一个固定的分成,而出人力的人,去拿剩下的、那个可以无限想象的分成。
后图灵测试:机器人何以为人
《科学美国人》3月刊文章。作者是纽约大学心理学和神经科学教授盖瑞·马库斯。
早在1950年,世界计算机之父图灵就提出过一个名为“图灵测试”的方法,来判断机器是否具有智能。具体来说,就是让参加实验的人跟机器聊天,这些人不知道自己正在说话的对象是机器,然后让他们根据聊天的情况做判断。如果超过一定比例的人认为自己的聊天对象是人类,那么就可以说,这个机器具有人一样的智能。这个方法在当时被称为人工智能终极测试的思想实验。
但图灵测试是有缺陷的,那就是太容易作弊,机器想要获胜,可以采取避而不答的方法。2014 年,就有一个聊天机器人通过伪装成一名来自乌克兰的13 岁男孩,通过了图灵测试。在测试中,这个机器从不正面回答问题,而是顾左右而言他。科学家问它,鞋盒子与珠穆朗玛峰,哪个更大?机器会说:“现在我还不确定,我得再想想。”然后机器会接着说句话来转移话题,比如机器会说:“对了,我忘记问你来自哪儿了?”
所以这篇文章认为,原始的这版图灵测试,经不住时间的考验。通过测试的机器可能只是偷奸耍滑,而不是真的有智能。那么现在,我们到底应该怎么判断一个机器有没有和人一样的智能呢?文章介绍了四个最广为接受的方法。
第一个,叫威诺格拉德模式挑战。这个测试其实是一种语言问题的考验,要想正确解答,需要被测试者具备足够的人类常识。
考官会设置一个场景,比如说,市议员拒绝提供示威许可,因为他们害怕出现暴力,然后问机器,谁害怕暴力?在这种情况下,对于“他们”一词的指代问题存在着歧义。作为人类,我们都知道,“他们”指的是市议员。那么考官又会问了,市议员拒绝给示威者许可,因为他们提倡暴力。谁在提倡暴力?这时候,答案就变成了示威者。
互联网有海量的信息,一些知识性的、有正确答案的问题,机器可以轻易就找到答案。但是这个方法的好处就是,在有互联网搜索条件的情况下,仍然很难作弊。而缺点就是,题目不好想。文章认为,总体来看,用这种方法测试的难度还是挺高的。在 2016 年,有 4 个系统比赛回答了这个测试,胜出系统的准确率只有 58%,而研究者设定的门槛是 90%。
第二个,叫做人类标准化测试。在这个测试里,人工智能会像人一样,参加小学、中学的标准化考试。这个方法的优点是,题目海量,标准测试相对简单,而且容易执行。而有关常识的问题需要进行阅读理解,有可能不存在独一无二的答案。但缺点是,这个测试是面向人类设计的,通过标准化考试并不一定意味着机器具有了真正的智能。整体上看,这个方法难度中等。
第三个方法,是物理图灵测试。大多数机器智能测试还只集中在认知方面。而这个测试更像是实践课,需要机器人动手。分为两个方向。在构建方向,机器人必须学会阅读使用说明,将一堆部件组装成实体。而探索方向,需要人工智能发挥自己的创造力,使用积木来完成指定的任务。这两个方向都要求被测试的机器理解任务内容、找到解决方法。
这个测试的优点显而易见,它模拟了现实世界中智能生物需要解决的问题。另外,这种测试很难作弊。但这个测试繁琐且难以自动进行。而且对机器而言,难度极大,按文章的话说,就是科幻级的。
第四个方法,叫做I-Athlon算法。和上面三个方法的考官是人不同,这个方法没有人监督,完全由算法自动化测试。测试内容包括让人工智能总结音频文件中的内容,叙述视频中发生的情节,即时翻译人类语言,同时执行其他任务。最后给出一个客观的智能分数。
这样做可以保证理论上的客观公正。但是具有不可预见性,比如,这个算法可能会给人类研究者无法完全理解的人工智能系统打个高分。