转:我在科学讲坛的《互联网二十年- 被计算技术影响的生活》算法科普

上周日,4月20日是一个特殊日子,互联网20周年纪念日。我应图灵教育的邀请,在中国科技馆为互联网二十年做了一个计算技术的科普报告,听众假定为青少年和成人公众,讲座从10点开始,到12多在回答问题中结束,整个讲座延长了半个多小时,根据现场和后来的反馈,效果很不错,家长和孩子的反应还是非常喜欢这个主题的讲座的,也觉得听后收获不小。

为了下一个版本能够更好地服务大众,同时我自己也非常enjoy这种为了把艰深的数学和技术问题给青少年讲清楚所做的努力 - 这种努力其实对讲者本人是极大的锻炼,你要把一个算法和任何一个技术扒到底层然后用浅显的,能够打比方说透的话讲清楚,你非得对这个技术点有非常透彻的认识不可。这个认识往深了说,就是必须具备“慧”,就是看到事物之间的相同相似,这样才可以找到适合青少年或普罗大众听得懂的比喻来讲专业词汇,在这个过程中,我经历了深入地书本查询,上网Wikipedia和寻根溯源,因为青少年问问题不会考虑自己的面子,你不知道他会问出什么样的问题。相反,对所谓的专业人群,其实有些时候是可以姑妄言之姑妄听之的(取决于对方是否认真:-)).当然,要在一个半小时(原计划)内把有关算法的话题讲给普通听众和青少年,还是有非常大的挑战,从选材和组织表达,还要注意能够吸引一时听不懂的听众能够始终愿意听下去,那就得靠一个方法“讲故事”!虽然近10年在大大小小的学术会议,对着更多更专业的人群讲过数不清的演讲,即使自己也在讲演讲技巧的培训,但是这一次的经验和准备,还是使我获益匪浅,小有刺激,也重新发现了发现和改进的乐趣。下面做一个简明的分析,为了下一个版本的改进,立此存照。

演讲题目叫 《互联网二十年-被计算技术影响的生活》,题目很大,决定落到实处,就是算法(algorithm), 互联网应用太多了,和大家休戚相关又不被注意的,可能就是那些重要和基本的算法,在小规模是不被人注意,但是一旦上了规模,由于大规模并行和数据量的剧增,掩盖了后面算法的基本面,但是真是值得学习,并且能够将趣味性,时效性和基础知识很完美的结合,所以我一开始决定讲算法,就面临一个如何将我们理工科感兴趣的小东西让没有多少基础的青少年马上赶兴趣。通过联想,用《黑客帝国》,《查理的巧克力工厂》作为引子,可以把孩子们一下子抓住。找局部最优点的8个算法的动画我非常喜欢,但是下一次就尽量不要用“收敛”“初始值”这些术语,我随口说出来,就可能大断了听众的思路,把人家撂那儿了,要用比喻。还有,判定听众听不懂带不走的技术细节,不影响主题message的话,就不要讲了。第一部分,计算的核心是算法这一页信息量非常大,一笔画蒙娜丽莎作为TSP 100000个城市的问题完全可以细讲,下次吧。下面是第一部分的重要截图,从Cyber space直接进入算法世界:

第二部分是最有意思的一部分,孩子们很喜欢听搜索引擎背后是怎么做到的,虽然随机访问的把戏那里有点拐弯,其实完全可以用更具体的数字或更小的模型来讲清楚。关于公钥加密算法,历史的回顾部分,莫尔斯电码和字典式密码可以用更贴近青少年的例子而不是用国外的例子更好。福尔摩斯的《跳舞的小人》,可以从字母E深挖,直接将福尔摩斯探案那一段讲出来会更好,当然要言简意赅。数据压缩部分造的例子很好,但是用夫妻作为主人公不如用父母和孩子,更贴近听者。而有损压缩算法,提到离散余弦变换立马把听众搞蒙了,可以变换为为什么二维平面上的像素分布可以用二维频率就是纹理表达,切掉那些频率为什么能够压缩,这样讲清楚了,他们未来学习时域/空间域和频率域的变换,就打下了很好的基础。关于模式识别,机器学习的算法,决策树,神经网络和K-means 聚类分析都是非常好的题材,但由于时间仓促,给出的例子讲得不够透,还是要转化成他们生活中的例子更易理解。由于准备时间仓促,关于CRC纠错码算法, 人工智能这一部分都没来得及加进来,有些可惜了,但是这么多内容其实是可以办成序列的。

第3部分,我们探讨了并行计算所需要的并行思维,也是大规模互联网后面的支撑技术,比如Google搜索要是没有MapReduce的分布式计算网页排名,根本无法实现。我用汤姆索亚粉刷篱笆的故事引出并行思维,整个过程中不断提问让孩子们发言,这样的效果很好地保证了听众的投入,后面用复杂的气象气候模型引出并行处理的框架,也就不太难了,但是也许还是太专业,可以换成别的例子,但是把事情做快的三种方法,无疑是很有启发性的,这是来自一本国外的Cluster专著的比喻,我直接拿了过来。关于是否要考虑一心N用的问题,脱胎于08年文汉博士在敦煌ChinaGrid答记者问时的一个反问,在计算都转向并行的今天,我们对孩子的数学教育是否早一些教并行思维呢?

第4部分,是我熟悉的技术计算的”高大上“的例子,就是技术计算如何影响我们的日常生活,这部分孩子爱听,我爱讲,准备了很眩的视频和动画,将技术计算在制造业,石油勘探,移动互联网金融和梦工厂3D电影制作方面的例子给讲出来,其实大家非常感兴趣,知道原来在这些高大上的应用背后也是基本的算法在支撑,希望引起他们的兴趣,也许会改变一些人的选择呢也说不定。这里真的要感谢我的一个搞数字金融的朋友华诚,我刚开始搞不定主意用什么样的例子,因为FSI金融计算离我们普通老百姓的日常生活太远,是搞股票期货投资的人士的专业,我们你来我往微信讨论了好一阵子,我想到了金融危机,但是太负面被否了,后来想到支付宝/余额宝,他独立作出了3页”杜甫很忙“的故事,让杜甫把钱交给余额宝又快速当日赎回给娃买衣服的桥段,给出了余额宝20日赎回概率的估计算法,这个比较”轻“的技术应用,因为极贴近日常应用,听者也很感兴趣。最后还是总结了TSP旅行商问题,P/NP问题的由来,各种变体和挑战,图灵提出的halting问题的判据,这些对大众可能太抽象了,下一次还是得讲故事。

60多页的材料,写起来真是挺累的,因为要想像青少年的语言,画面要酷,不要太多字,然后最重要是要讲故事。关于这次演讲的目的,我在最后问,”你们谁看过三体?“,有 几个人举手微笑,其实这一次成年人和年轻人来得比青少年多,可能有时间读大部头《三体》的人并不多。我接着说:”这些算法可能对你们还有些高深和距离,但是他们并不是难以理解的高高在上的东西,就像如果你学习了一些天文学知识,看过《三体》,那么当你需要仰望星空的时候,你心里的东西和别人是不一样的,它可以使你更加成其为一个全面的人,当你在未来操作电脑上网时,你也和别人不一样,你会知道后面发生了什么,这个很有意义“。实际上,科普,我觉得意义就在这里,有时候不会有马上的用处,但它改变的是人的心智模式,使一个人成为更为智慧和丰富的人。最后感谢图灵教育和中国科技馆组织这个系列活动,还给我留了个有意思的纪念,其实这个在玻璃内部雕刻的工艺本身,就是典型的TSP问题,用激光在玻璃内部进行逐点烧灼以形成图像,怎样移动激光头可以使得整个移动距离最小?
科普有意思,有难度,有意义,希望更多人加入。
何万青
微博:万青@insideintel
2014/4/22

http://note.youdao.com/share/?id=6caebb789ec1ecdbfac25fba85345629&type=note

你可能感兴趣的:(转:我在科学讲坛的《互联网二十年- 被计算技术影响的生活》算法科普)