===========================================
原文:The Alice and Bob After Dinner Speech given at the Zurich Seminar, April 1984,by JohnGordon, by invitation of Professor James Massey
===========================================
女士们、先生们,晚上好。
像这样的学术会议,人们不时希望来点轻松些的东西。变变节奏,换换口味,把乱七八糟的专业东西搁边上去,想些新鲜事。
那么我们谈谈编码理论吧。你们当中有些人可能不是编码理论的专家,而是哭爹喊娘地被硬扯来的,所以我觉得,给你们来个快餐式的,五分钟的编码理论研究生课程应该不错。
编码理论家关心两件事。第一件,也是最重要的,他们关心两个人的私生活——爱丽丝和鲍勃。在众多的理论文章中,每当一个编码理论学者想描述一个涉及双方的交易的时候,他不会用A和B来指代交易双方,出于某种长久以来的传统,他会用爱丽丝和鲍勃。
如今,关于爱丽丝和鲍勃的论文已经成百上千。他俩年复一年地试图欺骗保险公司,用邮件玩儿高赌注的扑克游戏,用被监听的电话传递秘密消息。
如果我们从各种论文中四处搜集一下各种小细节,就可以拼出一幅关于他们生活的迷人画卷。我这可能是第一次正儿八经地给爱丽丝和鲍勃立传呢。
在美国学者的论文中,鲍勃经常向投机商卖股票。看看鲍勃参与的股市交易数量,我们推断他估计是个股票经纪人。然而他却那么关心是否被窃听,他可能也 是颠覆活动的活跃分子。再看看爱丽丝尝试从他那儿买股票的次数,我们推断她应该是个投机商。爱丽丝还老是担心她和鲍勃的金融交易被她丈夫发现。综上,总之 Bob是个心怀不轨的经纪人,而Alice是个同床异梦的投机贩子。
但爱丽丝有一连串严重的问题。她和鲍勃只能通过电话和电子邮件交流,在他们居住的国家,电话费出奇的贵,他俩还都是吝啬鬼。于是爱丽丝首要的任务就是减少电话费开销。
电话还有好多杂音,干扰通常强到爱丽丝和鲍勃互相都听不见对方说话。此外他俩还有好多非常强大的敌人,比如税务机构啊,秘密警察啊啥的——这真糟糕,因为他俩最喜欢讨论的话题就是骗税和推翻政府。
他们敌人拥有的资源几乎是无限的,他们永远监听着爱丽丝和鲍勃的所有电话交谈,这些敌人还非常狡猾,他们最喜欢的招数就是假装鲍勃给爱丽丝打电话。
呃,你可能会想,爱丽丝只要仔细听就能听出鲍勃的声音吧?错。爱丽丝和鲍勃从来就没见过,她压根儿不知道鲍勃的声音啥样。
所以你看,爱丽丝面前有一大票问题。哦对了,还有件事我忘了说——爱丽丝不信任鲍勃。我们不知道为什么,但过去可能出过什么事情。
大部分人如果站在爱丽丝的处境上,恐怕都要放弃了吧。但爱丽丝不会。她的勇气只能用“可怖”来形容。不管成功与否,电话线路多嘈杂,还被税务机构和 秘密警察窃听,爱丽丝会满怀希望地尝试着与一个她并不信任、听不清楚,还可能是被假冒的人,去胡搞一些退税啊,武力夺取政权之类的事情,同时还要把电话费 开销控制到最小。
一个编码理论家就是相信爱丽丝没疯的人。
编码理论家关心的另外一件事就是信息。再没什么东西像信息一样了。真是个奇特的玩意儿——既能被产生,也能被消灭,你可以偷“到”它但不会偷“走” 它【物质和能量就不行。】,有时你光凭猜也能得到一些【举个例子,某国的军事线路平时总是闲着,突然之间变得极为繁忙,别国不需要知道线路上传递的内容是 什么也知道该国要用兵了。】。即使如此,它非常值钱,可以买也可以卖。
有一种信息叫“钱”。有些人不愿意承认钱可以被创造和销毁,花毕生精力修改、调整记录,确保每次一点点钱离开某处时,另外一处有等量的钱出现。这种人叫会计。编码理论,像高卢一样,被分成三部分【凯撒在《高卢战记》中,将高卢全境分为三个部分。】,称为信源编码、信道编码和密码学。
我先讲信源编码。信源编码是爱丽丝用来省电话费的,通常用来做数据压缩,换句话说,把消息长度变短。
有个故事,讲一个信息论的学生进大学的第一天,发现自己进的是一个无比陌生而诡异的世界,惟一能听到的,就是偶尔由教授喊出的数字,及随后的笑声。比如一个教授说“52”,短暂的停顿之后出现隆隆的笑声。另一个人喊“713”,一样的结果。每个人都笑得东倒西歪。
“这儿出了什么事?”他问他的导师。
“我们在讲笑话。”导师说
“讲笑话?”
“是啊,你看,我们都在这儿干好久了,互相知道对方的笑话,有一千个呢。所以,我们这些信息论的专家就做了数据压缩,给每个笑话一个编号,从0到999,省时又省力。你想试试么?随便说个数,从0到999都行……”
他将信将疑,不过试了试。用很小很小的声音嘟囔:“477”。
周围只有一片低语,低到几乎听不见。
他看着他的导师,“出错了?”他问。“再试试”,导师说。
他照做了:“318”——和刚才一样死气沉沉,甚至连低语都算不上。
“肯定出错了。”他说。
“呃,”导师说,“是你讲的不好笑!”
这故事有个古怪的结尾。这个学生最后以一个最戏剧化和意想不到的方式意外地成功了。他喊了一个不在0到999范围内的数字:“负105!”
最初是惊愕,接着一个教授笑了,然后一个接一个,直到他们全都捧腹大笑,站都站不稳。
这个笑话他们都没听过。
接下来我们讲信道编码,信道编码是爱丽丝用来克服线路噪声和干扰的。大多数人都对信道编码有个直观感觉,就是把重要的词读慢点。这么做增加了冗余 度,并使得接收方可以做校检【就是说如果传错了,接收方能发现,甚至能改回来。】,如果部分消息丢失了,丢掉的比特位可以用剩下的部分重建。
像军队、航空、警察等许多组织使用一个专门为此目的设计的,标准的语音字码表。比如Alpha,Bravo,Charlie,Delta,Echo,Foxtrot等等。所以他们可以说“Mike”或者“November”,就比用发音容易混淆的“M”和“N”更清楚。
爱丽丝的丈夫迈克开始怀疑她的优先认股权交易,她是这样向鲍勃解释的:
“我必须得和你讲讲迈克(Mike),”她说,但鲍勃听到的是:“我-嘶嘶-和你讲讲-嘶嘶—嘶-克。”
“你说什么?”鲍勃问。“我必须得和你讲讲迈克”,爱丽丝说。
“最后一个词我没听见,爱丽丝,”鲍勃说,“你能拼一下么?”
“Mike India Kilo Echo”,爱丽丝答。
“我只听见了India Kilo Echo,你说的第一个词是什么?”鲍勃问。
“Mike。”
“你能拼一下么?”
“Mike India Kilo Echo”,如此往复。
其实还有其他的语音字码表。国际语音字码表的“前任”们是Able,Baker,Charlie……
还有基于国名 的:Africa,Brazil,Chile,Denmark,England,France,Greenland,Holland,India,Japan,Khazakistan,Lithuania,Morocco,Niger,Oman,Papua,Qatar,Russia,Spain,Tanzania,Uruguay,Venezuela,Westphalia,Yemen,Xanadu,Zambia。
我个人最喜欢的是这个:
密码学
终于讲到加密编码了。加密编码又叫密码学。爱丽丝用加密编码使得税务机构和秘密警察无法理解她的电话交谈内容。这密码专家可是一群非常奇怪的人,他们的思维非常“迂回”——有时候他们会把笑话加密,安全机构管这些笑话叫“秘密笑话”,创造秘密笑话的人叫蜂蜜酱(疯密匠)。
一个可以理解的笑话的原始形式叫“明笑话”【指密码学中的明文,下面“密笑话”指的是密文,“惟明笑话攻击”指的是惟明文攻击,不再解释。】,加密之后就叫“密笑话”。密笑话只有解密之后才能被理解,或者按某些人的说法,解释之后才能被理解。按照笑话分析者【指攻击者】拥有的资源分类,有三种针对密笑话的攻击。第一种是惟密笑话攻击,即,笑话分析者有数量无限的“据说很搞笑”的材料。
第二种更强的攻击叫已知明笑话攻击,这种情况下,攻击者得到了一些笑话和对它们的解释的例子。
最强大的攻击是选择密笑话攻击,这种情况下他可以去要求加密的蜂蜜酱解释为什么一个笑话很好笑;或者反过来选择明笑话攻击,要求蜂蜜酱把已知的笑点编成笑话。
【原作者在这儿犯迷糊了,把选择明文攻击讲成了选择密文攻击,把选择密文攻击干脆扔掉没讲。译者已改正……】
不够搞笑的笑话通常是用很简单的密码加密的,比如把笑话的高潮部分更改一下。这叫做“偏离结尾系统”(DEFLECTED ENDING SYSTEM),简称DES。【DES为美国国家标准局(后改名美国国家标准技术研究所,即NIST)征集的一个数据加密标准,由IBM开发,全称 Data Encryption Standard,1977年被采用,后由于计算机普遍计算能力的提高逐渐停用。“不够搞笑”指DES主要是商用的。】
非常搞笑的笑话,比如说,假如外人搞懂什么意思就会危害国家安全的,加密得就更安全,通常是把场景啊,情节啊,结局啊统统改掉。这叫做“特别聪明的 掩护”【PARTICULARLY KLEVER COVERUP】,简称PKC。【PKC指Public Key Cryptosystem,即公钥密码系统。DES属于对称密码系统,即加密和解密需要相同的密钥,这种情况下密码需要在加密处生成以后由安全的途径传递 给解密处,在传递过程中容易被外界窃取;而公钥密码系统可以把加密的密钥公开,解密的密钥只有密钥生成者自己拥有,造成“任意人都能加密,只有特定的人能 够解密”。】最有名的PKC可以“抵抗严重的攻击”(Resist Serious Attack),所以称作RSA【RSA是最早的PKC算法,以该算法的三个发明人Ron Rivest, Adi Shamir 和Leonard Adleman命名的。】。
当然啦,一个自然推论就是,只有非常有天赋的、聪明的人才能真正欣赏一个幽默的演讲。
因为设计一个好的密码系统很困难,并且各种仪器设备非常贵,近年来有很多人努力把密码系统和编码器、译码器标准化。就在我说话的时候,国际标准化组 织(International Standards Organization)还在开会商量这个事儿呢。因为这点很容易让大家迷惑,有人要求我说清楚点。语言的目的是传递信息,而只有当信息的发出者和接受 者使用同一套系统的时候才能实现。换句话说,语言得以奏效,是因为它是标准化的。
另一方面,密码学的目的是让消息除了特定的人以外谁也不懂。换句话说,加密得以奏效,恰恰因为它不是标准化的。所以这帮人做的事情,就是让密码系统的绝大部分标准化,把非标准化的部分集中在一起,叫做“密钥”。
到这儿都还好懂吧。但显然的,非标准化的部分,必须以标准化的方式被“非标准化”。所以密钥管理要符合某些标准。换句话说,标准是这样被描述的,标 准中的非标准部分,我指那些按照某些标准制定的不能标准化的部分,同样是通过标准化的非标准模式制定出来的,于是所有的非标准化的部分都是标准化过的。
我想我这么说你们应该就都懂了。
许多密码系统都有一些糟糕的密钥。如果你使用了这样的密钥,你的密码就很容易破译。比如说,全零密钥就是DES的一个弱密钥。有许多研究专注于搜索这些弱密钥。这些年来,越来越多的弱密钥被发现,所以人们加密的时候要小心,避免使用这样的密钥。
可能有个更好的方案,我们可以只去找强密钥。事实上,为什么不去找“一切密钥中最强的那个”呢?
然后我们就可以用这一个密钥做标准化了。
编码理论也有它自己的问题。对信源编码、信道编码和加密编码的导论课程通常会讲一个叫做“处理延迟”的东西。延迟的时间花在各种编码和解码上。这样的延迟可能很要命。
历史上就有这样的实例,这样的延迟改变了世界局势的走向。有这么一个记录,两个单词的军事信号经历了150年的“处理延迟”。这条消息1972年在五角大楼被解密,上写“派援军”,是1830年由卡斯特将军从小巨角河发出的。
【卡斯特(Custer)是美国名将,据说是美国史上最年轻的将军,攻打(和屠杀)印第安人时立下赫赫战功,然而在1830年小巨角河 (Little Bighorn)一役遭苏族(Sioux)印第安人酋长“坐牛”(Sitting Bull)伏击阵亡,全军覆没。1972其实是指越战,谓美国人不能指望军事优势就随便欺压"弱小"国家,等到终于明白150年前卡斯特同学的教训的时候 已经晚了……】
看看这条消息:“立即返航,行程取消。”然后想想如果它及时被解码的话对历史的影响。这条消息是1492年西班牙伊莎贝拉一世发给克里斯托弗•哥伦布的。
但这几个小事和下一个例子比起来就什么都算不上了。我们从苏埃托尼乌斯处得知,尤里乌斯•凯撒和雄辩家西塞罗用一种把“A”加密成“B”,把“B” 加密成“C”的方式互相交流。如果你这样加密一下HAL——斯坦利•库布里克电影《2001:太空漫游》里的电脑,就得到IBM。凯撒给西塞罗用这个复杂 的加密方式写的一些通信终于由英国国家通信总局成功破译,将会在六月的Cryptologia上发表。这些内容勾勒了一个和凯撒的在罗马发行的《高卢战 记》不同的,让人不安的世界图景。
【Suetonius:罗马历史学家,主要著作《恺撒生平》,记述了前12个罗马皇帝的生平。】
【Cicero Marcus Tullius:罗马政治家、演说家和哲学家。共和时期最后几年的主要人物,以同喀提林的雄辩和对拉丁散文的精通而闻名。】
我有特权提前拿到了一份样本,现在给你们念一段摘要。
“亚历山大,公元前48年4月14日(想想这个时间吧) 【这个时间,凯撒拿下意大利全境不久,将要发兵去希腊干掉庞培余部,应当是他春风得意的时期了,要想做掉哪个潜在的敌人应该是轻而易举。】 “亲爱的马库斯•图留斯: “感谢上苍咱俩有个密码,我才不怕我们的信被敌人读到。坦白说我不相信元老院。 “干掉马克•安东尼。你觉得他可信么?他太无能了,连个祭酒仪式都组织不好。 【马克•安东尼,埃及艳后的情人(之一),这个人军事能力不错,行政管理就一塌糊涂了,最后因为管理失职和凯撒闹翻……他探听到刺杀凯撒的计划,可是居然没能及时告知凯撒。】 “把盖阿斯•布鲁图也干掉。你会从他手里买一辆用过的战车么?我想他背着我在密谋什么。有时他能把我的托加袍都吓掉地上。 【Gaius Brutus,这个人不知道是谁……名字拼法和那个刺杀凯撒的布鲁图斯不一样(那一位是Marcus Junius Brutus,就是"Et tu, Brute"那个),我怀疑是演讲者念错了。在一本叫The Death of Kings的讲凯撒的小说里面有这个人物,可能讹传是从这儿来的。】 “还有那帮高卢人。真是一群白痴。我本以为等我们建成GEC——高卢经济共同体,他们所有的问题都将解决,可结果呢?我们保证了食物出口的最低价 格,所谓的“绿色迪纳里厄斯”。我们给一些廉价的节约劳力的产品提供补助——比如奴隶什么的。可结果呢?大量的迪纳里厄斯被撤走,通货膨胀都破纪录了。他 们却把我们的补助浪费在大量造酒上。我们不得不把这些酒廉价地卖给那些野蛮人,来维持GEC内部的物价。 【“高卢经济共同体”(Gallic Economic Community)显然在讽刺欧洲经济共同体(European Economic Community),存在于1958年到1993年。下文的描述应该是指八十年代英国和欧共体的贸易矛盾,比如节能产品补助之类的。】 “我受够了这整个交易了。我一回到罗马就退休,都计划好了。我在官方发行的《高卢战记》里对高卢的大小撒了谎。我发现一处非常舒适的小地方,和谁都 没提过,打算退休后就到那儿呆着去。绝不让元老院那帮人肮脏的手伸到那块地去。我已经做了些措施,保证他们永远没法这么干。我只和你说,马库斯•图留斯, 我已经把我的特别的秘密的隐退地点都收拾好了,在什么地图上都找不到,因为所有地图都是我批准的。 “官方说来它并不存在。所以别人找不到它,更没法收税。我成功地把一整块儿高卢藏起来了! “所以,忘了《高卢战记》吧,真正的高卢是分成四部分的。”
编码理论的快餐式课程就到此为止了。作为结尾,我来讲点信息技术对我们日常生活的冲击。
科学的进步太快了,以至于我们把很多不可思议的技术进展视作理所当然。磁电管,在1939到1945年的战争期间还被严格保密,现在每个微波炉里都 有——而且是在日本生产的。我还是个孩子的时候,星际旅行属于科幻,而今科学前进得如此之快,以至于1969年踏上月亮的宇航员们当时甚至没见过电子表或 袖珍计算器。
袖珍计算器!真是好玩意儿。它们太复杂了!我有个计算器,可以算正弦、余弦、正切、对数、双曲函数和多重嵌套的括号算式。你可以用Fortran、 Algol、Basic、Pascal、Forth、Fifth 和Sixth、ADA和Carruthers语言写程序。它可以帮你对质数进行质因数分解。现在它正在研究停机问题。
它可以把一种语言翻译成另外一种。从德语到西班牙语,从马其顿语到世界语,从广东话到希腊语,从美语到英语。
事实上,这是一个多核系统,包括22个“换算机”,有时候它们会自己搞个足球赛。
它有个全彩环绕液晶宽屏幕,三维全息显示。学名叫“全息色品电影照相罗摩镜”。
其音频组件包括杜比数字十倍声学环绕音响,来这儿的路上我用它看了《迷宫》。
它还有语音合成和声音识别系统。我经常把我的困扰讲给它听。有时它能给我做一下精神分析。据它分析我有点妄想狂。不过这是因为它老和我过不去。但请别误会——它使用非常方便。你甚至可以精确地编程控制它使用方便的程度,从0到10。
你设为0的话,它甚至不会暂停足球赛来回答你的问题。但设为10的话,它会体贴到冷天把自己的按钮预热。
然而不管它看起来多么聪明,内核也不过是个又老又哑的电脑罢了。
有一次它真把我惹急了。像所有电脑一样,它非常清楚地知道我想要它做什么。它完全知道我什么意思,为什么非得按我说的去做呢?
怎么才能报复这个笨机器呢?
我先揍了它一小顿——按键比以前更用力了一点。然后我威胁它:“你就不怕我把显示屏砸了?”
没用。它回应说“实际上我是打不碎的——而且你要是不像以前一样好好输入数据,我就不理你。”
不管我做什么,它总是赢家。
我决定和它“推心置腹”地谈一谈,于是我坐下说:“究竟谁是头儿,你还是我?”
它不理我。
我又问了一遍:“究竟谁是头儿,你还是我?快回答我!”
“我正想呢,我正想呢。”它说。
我狠狠地打了它。用力过猛,把外壳打裂了。
当时我以为也只是损坏了外壳,但不久,一些小事上开始出现不对劲。最初没有什么固定的毛病,说不出来哪儿不对,接着是些小毛病,比如口吃。它听起来和以前不太一样了,声音失去了以前的自信。
之后有一次,我发现了它的一个计算错误。我当然没提。但你能看出来,它知道了。它的自我形象彻底粉碎了。
最可悲的是,它把我们的纪念日忘了——我买它的那天。过去,这可是我俩的特别时间啊。
我实在受不了了。有一天晚上,我把它温柔地放在盒子里,点了蜡烛,放了一张我们初遇时流行的唱片,在它边上坐下。
“我们之间哪里出错了?”我问。但它还摆着架子。它不打算在一个非机器面前显露自己软弱的一面。
“错?哪里都没错。”它说,“只是数据不足。”
但你能看出它在内心深处的伤痛。
此后每况愈下,一日千里。
它现在只会咕哝着自言自语,再不对我说话。只能对小数字做些非常简单的计算。
最没面子的事情终于还是来了。它失控了。电解液流得满外壳都是。
我觉得特别遗憾。我的其他一些小配件对此也不太开心。它们都出来对计算器表示同情。我的表总显示错误的时间,而我的电力工具不停地跳闸。
上周的一天晚上,我从伦敦把车往回开,突然引擎在寂静的乡村公路上自动熄火了。
我想下车,但螺线管被中央锁定电脑控制了。突然间空调来劲了,吹出冷空气,发出的声响像风呼啸着吹过树林。随后扬声器中发出了恐怖的音乐声。就是电影里主角在黑暗的森林中迷路时出现的那种音乐。
我很害怕。寒冷、怪风和那神秘的音乐侵蚀着我。它说话了。
“你就是那个痛打袖珍计算器的家伙!”
关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea