原创: 秦陇纪 科学Sciences 今天
科学Sciences导读:选自科学出版社《21世纪100个交叉科学难题》一书的章节“揭开意识的奥秘:兼谈认知相对论纲领”,以飨读者。作者李玉鑑教授近三年还写了两部深度学习著作《深度学习导论及案例分析》(售价¥59.00元,当当¥46.00元7.8折有售http://product.dangdang.com/24049457.html)、《深度学习:卷积神经网络从入门到精通》(售价¥79.00元,京东¥69.30元8.8折预售https://item.jd.com/12397579.html),文后附两书简介、出版信息及目录。欢迎留言探讨科学、技术、工程、方案。欢迎分享、转发“科学Sciences”新媒体文章。
“揭开意识的奥秘:认知相对论”及作者李玉鑑简介 (11321字)
目录
A揭秘意识兼认知相对论 (6117字)
一、研究意识问题的观念变迁
二、研究意识问题的主要思路
三、研究意识问题的难点
四、认知相对论纲领
五、开展意识的科学研究
B教授/博士生导师:李玉鑑 (873字)
作者简介
C《深度学习导论及案例分析》简介 (441字)
图书出版信息
D《深度学习:卷积神经网络从入门到精通》新书简介 (3670字)
图书出版信息
目录CONTENTS
前言/序言
参考文献 (393字)Appx.数据简化DataSimp社区简介 (626字)
揭开意识的奥秘:兼谈认知相对论纲领
文|李玉鑑,来源:科学出版社《21世纪100个交叉科学难题》发表于2005年
我深信全部科学的基础,特剧是物理学的基础,须等待着生物学,尤真是感觉的分析跟进一步的重要阐明。——马赫
在无边无际的宇宙中,充满了无限令人神往的奥秘,而其中最能引起人们的兴趣,同时又被认为最难攻克的问题则是意识在人类的大脑中是怎样发生的这一关于精神活动的基本问题。意识问题历来是哲学家十分关注的研究对象,但是经过长达几个世纪的研究,至今还没有取得实质性的进展。由于研究意识问题涉及到的主观经验难于用客观的实验方法进行度量和分析,所以在很长的时间里,意识一直被排除在科学研究的范围之外,科学家也往往讳言自己的研究与意识问题有关,尽管他们觉得这是一个非常重要的问题。经过诺贝尔奖金获得者克里克的不断倡导,国际学术界对意识问题产生了越来越浓厚的兴趣。不仅哲学家、心理学家,而且神经科学家、数学家、物理学家和计算机科学家等诸多领域的杰出人物都被吸引到意识问题的研究中来,他们决心对意识问题进行全方位的跨学科研究和探索,其标志是1994年春在亚里桑那州图森市召开的“建设意识的科学基础”大会。20世纪90年代被科学界称为“脑的十年”,其目的就是号召科学家们研究脑的工作原理及其发生功能障碍的原因。科学的进步呼唤人类揭开意识的奥秘,但是在国际上广泛开展用自然科学方法研究意识问题的同时,国内却无专门研究意识问题的机构和队伍,因此笔者觉得有必要撰写此文以引起国内学术界对意识问题的兴趣和注意,并在21世纪对解决意识问题做出应有的贡献。
一、研究意识问题的观念变迁
早在2500年以前,希波克拉底就开始了意识的神经底物研究。希腊人发明了灵魂的化学,他们用地、水、火、风四种元素的组合产生四种气质:粘液质、血液质、黑胆汁质和黄胆汁质。亚里士多德将脑想像为一个散热器用以冷却血液。笛卡儿提出脑以流体泵的方式工作,它将被称为“动物的精神”流体送到脊髓再到肌肉,但是神经生理学家却通过实验发现这种“动物的精神”流体并没有可以测量的体积。
科学家曾一度认为脑是动物的精神之源,可是到18世纪晚期,普罗卡斯卡(GiriProchaska)却发现无脑畸形新生儿也可以表现出完全正常的行为,因此他提出感受器是动物的精神之源,而所谓的精神则由来自环境的剌激所释放。后来他利用牛顿光学将这一基本思想、发展成为反射行为理论,并把脑看作一面复杂的、被动的镜子,但是在伽伐尼(Galvani)和伏特(Volta)刚发现生物电不久,他犯了一个错误,即把感觉印象等同于电流。
在能量守恒定律被发现以后,开始把动物的精神看作神经能量,神经能量从环境通过感受器流入脑再通过肌肉流出,它可以被神经细胞所存贮和释放,而环境则被看作产生神经能量之源的力场。一位格式塔心理学家曾经将感知等同于脑中的电场分布,但很快遭到斯佩里(Roger Sperry,1958)的否定。斯佩里把云母条和银针放入经过训练的猫和猴的视觉皮层,发现电场完全扭曲而对有关视知觉的行为影响却可以忽略不计。
随着计算机的发明和信息论的发展,脑逐渐被看作一个复杂的信息处理系统。来自环境的信息通过感觉系统的变换,经由轴突通道的传递和动作电位的携带,在脑中被起工进制开关作用的突触所改变而存贮为固定的模式,并且所存贮的模式在有限信道容量和熵损失的条件下可以通过读出而回忆,以匹配或联系新的输入模式,就像计算机中的内容寻址记忆一样。且然信息处理的概念在一定程度上加深了人们对脑功能的理解,但它并不能解释脑是如何从感觉刺激中获得意义的这一问题,因为信息处理只考虑信息的变换、运算和传输,而信息所包含的意义最后必须通过脑的神经活动来揭示。
二、研究意识问题的主要思路
1.神经还原主义
神经还原主义的代表人物是克里克,他提出惊人的假说,即“你”,你的喜悦、悲伤、记忆和抱负,你的本体感觉和自由意志,实际上都只不过是一大群神经细胞及其相关分子的集体行为而己。这一假说的实质在于把长期困扰哲学、心理学界的复杂问题还原成一个典型的现代神经科学问题,最重要的是强调用严肃而精心设计的实验来研究意识问题,并且应以视觉及其注意机制为突破口。现在一些新的实验仪器技术,如“正电子发射断层图(PET)、功能性核磁共振技术(fMRI)”等无损伤脑技术的发明和改进,已经为用还原主义的方法研究意识问题提供了前所未有的实验证据和可能性。
2.神经达尔文主义
神经达尔文主义的代表人物是埃德尔曼(Gerald Edelman,诺贝尔奖金获得者),他提出选择性学习的概念,即正像环境压力选择一个物种中适应性最强的成员一样,输入大脑的信息通过强化神经元之间的联系,选择不同的神经元集群,以对应于,比如说最有用的记忆。选择性学习的要旨是在学习之前脑中己存在大量具有特定信息结构的神经元集群,但在学习之后只有与外部输入剌激相应的神经元集群才得到选择性强化,这与信息处理或指令性学习是不同的,因为后者在学习之前脑中并不存在任何特异性的神经元集群。
3.量子主义和非决定论
量子主义最有力的代表人物是埃克尔斯(John Eccles,诺贝尔奖获得者),他提倡用量子力学建立关于意识的理论。意识的量子观可以用克里克的搭档科克(Christ of Koch)的一个三段论来概括:量子力学是玄奥难解的:意识也是玄奥难解的;所以,量子力学与意识必然是相关的。
《皇帝的新脑》作者彭罗斯(Penrose)提出准量子效应的概念,并猜想微管执行着某种非决定性的量子计算,这种计算在某种程度上产生了意识,所以每个神经元不应被看作简单的开关,而应被看作一台独立的复杂计算机。
4.新神秘主义
新神秘主义者认为人类根本就不可能建立关于意识的科学理论。哲学家耐格尔(Tomas Nagel)提出,对人类以及许多高等动物(比如蝙蝠)来说,主观经验是其最基本的特征,正是它在一定程度上使得生物成其为生物;而科学根本就无法洞悉主观经验的王国,不论我们掌握多少关于蝙蝠的生理学知识,都无法真正了解是什么使得蝙蝠成其为煽幅。哲学家麦金(Colin Mcginn)也认为人类有其自身的认知限度,其中之一就是不可能解决心身问题,就像老鼠不能求解微分方程一样。
5.功能主义
功能主义的基本思想在于,意识只是大脑的一种功能,它也可以用人造机器来实现,其代表人物是人工智能学家明斯基(Minsky)、西蒙(Simon)和纽韦尔(Newell)。他们认为人类的思维在本质上是物理符号操作,而图灵机则是实现这一操作的基本工具。由于人工智能在实现人类的高级认知功能方面遇到了极大的障碍,所以用计算机产生意识的思想开始受到怀疑,哲学家丘奇兰德等(Paul M Churchland和Partricia SChurchand)因此进一步强调用模仿大脑的系统也许能产生意识。
6.连接主义
连接主义旨在用具有简单计算功能的人工神经元通过相互连接而构成的神经网络系统来作为研究大脑的计算模型。连接主义者主要在分析人工神经网络的结构、算法和动力学特性的基础上来解释大脑的高级认知功能。他们认为只要人工神经网络的复杂性达到一定程度,并且抓住生物神经系统的关键特征,就能产生所谓的意识。
三、研究意识问题的难点
1994年春在亚利桑那大学召开的“建设意识的科学基础”大会上,查默斯(David Chalmers)曾宣称,研究神经元不可能揭示出为什么声波对我们耳朵的撞击,能引起我们对《贝多芬第五交响曲》的主观体验。在他看来,不论神经科学家对大脑的了解有多么透彻,他们都不可能在物理世界与主观世界之间的“鸿沟”上,架起一座理解的桥梁。虽然很多人非常欣赏他的观点,但是科克(Koch)却强烈谴责说:“我怎么知道你的主观体验与我的一样?甚至我怎么知道你具有意识。”
查默斯和科克提到的关于主观体验问题可能是对意识进行还原主义研究的最大难点,哲学家通常称之为可感受特性问题,比如怎样解释红的程度;如果不同的个体(人或动物)在观察某个物体的特性时主观感觉是不一样的,那么使用还原论的术语解释这些特性,就可能遇到很大麻烦。事实上要严格确定大脑中的红色神经相关物也是极其困难的,因为我们所进行的任何一项观察,都需要很多神经元的复杂相互作用才能完成,也许根本就不存在所谓严格红色神经相关物(只要它出现,即意味着你看到了红色)。
研究意识的另一个难题涉及外部世界的真实性。大脑的主要作用是指导我们在周围的世界里生活,但是这一世界是真实的吗?对这个由来已久的哲学问题,克里克的解决方案是假设确实存在一个外部世界,它大体上不依赖于我们对它的观察。克里克提出这个研究假设的目的是为了避免喋喋不休的争论,但是如果事先都没有一个正确的立场来理解观察主体和外部世界的关系,那么,由此而建立的意识理论大厦将必然是脆弱的,所以意识问题的研究仍然期待着哲学观念上的突破。
四、认知相对论纲领
通过对研究意识问题的难点分析不难认识到,如果要建立关于意识的科学理论,就必须有一个合理的哲学立场作为出发点。首先我们不能指望利用意识的理论能够预测大脑中发生的神经过程,但是我们可以用它作为指南来设计具有意识的机器。有人可能会反驳说没有预见能力的理论根本就不是科学的理论,事实上关于飞行的理论,即空气动力学,就不能预测鸟类在飞行时脑中发生的神经过程,但是它却是设计飞机的基础,难道你能说空气动力学不是一门科学吗?此外,关于意识的科学理论应该有它自己的基本原理作为整个意识大厦的支柱,这些原理不仅要在主观世界和客观世界之间架起一座桥梁,还要具有相对独立性,即它们不能够被物理学的基本原理所完全推导。
基于上述关于意识理论的要求和对人类思维以及动物意识行为的观察,笔者提出下面两条基本原理:世界的相对性原理和符号的相对性原理,作为研究意识的理论基础。
1.世界的相对性原理
不同的动物看到的外部世界是不一样的,蜜蜂可以看到偏振光,蝙蝠可以听到超声波,狗可以区分成千上万种气味,青蛙只能看到运动的物体。这说明主观体验所经历的世界并不是唯一的,据此笔者提出:
世界的相对性原理:主体在其精神中所能观察到的世界极大地受限于它对本体世界的观察方式。
世界的相对性原理实际上可以看作著名的人择原理的推广,人择原理的意思是说宇宙的本质极大地受限于我们人类对它的观察。
多年来,哲学家和科学家一直在设法建造一座桥梁,以连接主观世界和客观世界之间的鸿沟,但是他们没有想到,我们的大脑和身体恰恰就是这座桥梁。根据世界的相对性原理,主观经验的世界并不完全对应于纯粹作为客体的本体世界,尽管本体的世界可能只有一个,但是主观的世界却可以丰富多彩,它们之间的桥梁正是主体对本体世界所采用的观察方式。
2.符号的相对性原理
语言是人类进行交流的工具,也是进行思维的工具。虽然世界上有成百上千种语言,但是每一种语言都可以用来思维。比如,中国人可以用汉语思维,美国人可以用英语思维,日本人可以用日语思维。而且从现实生活的角度来看,每种语言对于人类描述和认识世界都是等价的,据此笔者提出:
符号的相对性原理:主体在用语言描述和认识它所能观察到的世界时,所有语言的物理形式都等价。
对符号的相对性原理这一名称,切不可从字面上去理解,事实上它借用了物理学中的狭义相对性原理,即所有惯性坐标系对于物理定律的描述都等价。在符号的相对性原理中,可以把各种语言的物理形式理解为描述世界的不同坐标系。世界的相对性原理和符号的相对性原理构成了认知相对论的核心,笔者以它们为基础提出下面用于解决意识问题的认知相对论纲领:
(1)意识的研究应该分为三个方向,即人类的意识、动物的意识和机器的意识,同时要注意采用不同的方法:不要轻易将人类的意识强加到动物身上,也不要过高地期望机器会具有人类同样的意识;因为人、动物和机器观察世界的方式存在较大的区别,根据世界的相对性原理,他们所观察到的世界可能很不相同。
(2)对人类来说,意识的研究应该集中在发生意识障碍的机制,以及治疗这些障碍的方法(研究正常人受到的限制太大),不要试图建立所谓的脑模型去阐明正常人的意识活动,因为我们的大脑和身体就是一个很好的解释,而且脑模型即使能够产生意识,也可能根本就不是人类的意识。
(3)对动物来说,意识的研究首先应该集中在它们所观察到的世界究竟与人类有何不同,以及它们之间是如何交流的问题上,然后再去考虑动物神经系统的各个器官或核团以及各个皮层功能区在产生这些意识活动时是怎样发生作用的,但不要过于狂热地去寻找所谓外部世界的神经对应物,因为这种神经对应物一方面可能由于信息在神经系统中的大范围分布式表达而根本不存在,另一方面即使存在它对不同类个体几乎没有意义,对同类个体也可能由于依赖它的经历和特异性而具有不同的位置和模式。
(4)解决意识问题的关键和标志是制造出具有意识的人工机器,而不是去揭示意识产生的神经生理机制。虽然人类仍然不清楚鸟类飞行的神经控制机制,但是已经掌握了飞行的秘密,因为我们能够制造飞机。所以,如果人类能够制造出有意识的机器,也同样意味着我们揭开了意识的奥秘。
(5)有多种不同的方案设计具有意识的机器,但是传感技术和模式识别技术的水平将决定着有意识机器所能观察到的世界的极限,同时也决定着机器智能的极限。根据世界的相对性原理,机器所观察到的世界受限于它的观察方式,我们完全可以给机器装上不同于人的传感系统和识别系统,让它直接看到偏振光、电磁场,听到超声波、次生波。根据符号的相对性原理,我们可以选择某种特定物理形式的语吉赋予不同的机器个体,让它们用语言来描述和认识它们所观察到的世界,并用语言进行相互之间的交流。
五、开展意识的科学研究
1998年泰勒(Taylor J G,神经网络专家)明确提出,意识的探究竞赛已经开始了。可见科学界对于意识的研究兴趣已经达到了前所未有的高潮,但是在这种迫在眉睫的形式下,国内还没有建立起自己的研究队伍,不能不令人感到遗憾。意识向来被认为是潜在的、无止境的问题之源,也是科学固守的最后一块阵地,虽然它曾经为科学所拒之门外,但是现在己成为合法的科学研究对象。在征服意识问题这一历时久远的任务中,难道炎黄子孙不应该有所作为吗?
注:本文选自《21世纪100个交叉科学难题》[1]中章节,已获作者授权转载“科学Sciences”新媒体。《21世纪100个交叉科学难题》作者:李喜先,出版社:科学出版社,出版年:2005-1,页数:800,定价:100.00元,ISBN: 9787030146878。[2]
内容简介:本书荟萃一线科学家撰写的100个交叉科学难题,涉及各门类学科(涵盖自然科学与社会科学领域)之间的大跨度、多方式的广泛交叉,均是从宇宙起源、物质结构、生命起源和智力起源四大基本难题中衍生出来的交叉科学难题,反映了21世纪科学的整体化发展趋势。这些难题一旦解决必定会给人类带来巨大利益或使科学技术产生重大突破,因此可以启迪科技工作者的探究志趣,激励广大科学家,特别是年轻学者、研究生和大学生的探索兴趣。[3] 类似书籍[4]如下。
网友留言:①李教授说说您的意识理论吧!教授对意识的本质问题关注过多年,并在《21世纪100个交叉科学难题》上发表《揭开意识的奥秘》一文,提出了解决意识问题的认知相对论纲领,对脑计划和类脑研究具有宏观指导意义。②意识是生物虚念对自然实观的反映,虚念总是趋近实观... 所谓千人千念,通过主体来认识客体,总会带上主体烙印,没有绝对真理,只有相对接近,满足可容忍的误差便可称为真理... 主体研究不在哲学问题,而在微观科技手段,在于提升手段的资金...[5]
教授/博士生导师:李玉鑑
作者简介
李玉鑑,北京工业大学教授,博士生导师,1968年10月10日生于广西桂林。1990年华中理工大学(现名为华中科技大学)数学系本科毕业,获学士学位;1993年中国科学院数学研究所毕业,获硕士学位;1993-1996年在中国科学院生物物理研究所工作;1996-1999年中国科学院半导体研究所毕业,获博士学位;1999-2001年北京邮电大学信息工程学院博士后出站;出站后至今在北京工业大学计算机学院工作。研究兴趣在认知科学、机器人、神经网络、计算机网络、语音信息处理、图像信息处理和自然语言信息处理。在国内外核心期刊、期刊和会议上发表学术论文30余篇、会议论文数十篇。
曾在中国科学院生物物理所工作,对意识的本质问题关注过多年,并在《21世纪100个交叉科学难题》上发表《揭开意识的奥秘》一文,提出了解决意识问题的认知相对论纲领,对脑计划和类脑研究具有宏观指导意义。具有广泛的跨学科领域知识背景,长期围绕人工智能核心目标,在神经网络、自然语言处理、模式识别和机器学习等领域开展教学、科研工作,发表国内外期刊、会议论文数十篇,是2016年出版的《深度学习导论及案例分析》和2018年出版的《深度学习:卷积神经网络从入门到精通》两本书的第一作者。
1、教育状况
1996/09–1999/06,中国科学院半导体研究所,博士,导师:王守觉
1990/09–1993/07,中国科学院数学研究所,硕士,导师:肖玲
1986/09–1990/06,华中理工大学,应用数学系,学士
2、工作(学术)背景状况
2001/06–至今,北京工业大学,计算机学院,副教授、2007教授、博士生导师
2008/10-2009/02,澳大利亚弗林德斯大学,访问学者,导师:David M W Power
1999/07–2001/06,北京邮电大学,信息工程学院,博士后,合作导师:钟义信
1993/07–1996/08,中国科学院生物物理研究所,研实员,合作导师:郭爱克
3、主要工作及成果
长期以来在模式识别、机器学习和人工智能等领域开展教学和科研工作,发表SCI检索论文近20篇、EI检索论文近60篇,其中多篇发表在IEEE Transactions Pattern Analysis and Machine Intelligence、IEEE Transactions Neural Networks, PatternRecognition、Neural Networks、Knowledge-based systems和Neurcomputing等国际权威期刊上。近几年全力从事深度学习的理论、方法及应用的研究,2016年出版《深度学习导论及案例分析》著作1部,2018年出版《深度学习》——卷积神经网络从入门到精通》第一作者。
《深度学习导论及案例分析》简介
文|秦陇纪,来源:《深度学习导论及案例分析》相关网页
图书出版信息
书名:《深度学习导论及案例分析》
作者:李玉鑑
出版社:机械工业出版社
版次:1
出版时间:2016-10-01
ISBN:9787111550754
商品编码:17204977972
中图法分类号:TP273
售价:¥59.00元[6],当当价:¥46.00 [7.8折][7],京东价:¥48.40 [8.2折][8]
内容简介
本书不仅介绍了深度学习的发展历史,强调了深层网络的特点和优势,说明了判别模型和生成模型的相关概念,而且详述了深度学习的九种重要模型及其学习算法、变种模型和混杂模型,讨论了深度学习在图像处理、语音处理和自然语言处理等领域的广泛应用,也总结了深度学习目前存在的问题、挑战和未来的发展趋势,还分析了一系列深度学习的基本案例。本书可以作为计算机、自动化、信号处理、机电工程、应用数学等相关专业的研究生、教师和科研工作者在具备神经网络基础知识后进一步了解深度学习理论和方法的入门教材或导论性参考书,有助于读者掌握深度学习的主要内容并开展相关研究。当当有售http://product.dangdang.com/24049457.html,亦可自己查找。
《深度学习:卷积神经网络从入门到精通》新书简介
文|秦陇纪,来源:《深度学习:卷积神经网络从入门到精通》相关网页
图书出版信息
书名:《深度学习:卷积神经网络从入门到精通》
作者:李玉鑑,张婷,单传辉,刘兆英等著
出版社:机械工业出版社
ISBN:9787111602798
版次:1
出版时间:2018-07-01
商品编码:12397579
开本:16开
包装:平装
用纸:胶版纸
售价:¥79.00 [9],京东价¥69.30 [8.8折],已预售https://item.jd.com/12397579.html [10]
编辑推荐
对卷积神经网络进行由浅入深的分类描述,从现代雏形、突破模型、加深模型一直到强化模型和成就,并附有相关参考文献,方便读者及时查阅和钻研。关于深度学习的专题性著作,也是掌握卷积神经网络内涵的进阶之书。如果大家想了解和学习卷积神经网络,看这本书肯定比看三巨头的书收获要更大。《深度学习:卷积神经网络从入门到精通》旨在全面介绍各种卷积神经网络的模型、算法及应用,指导读者把握其形成和演变的基本脉络,以帮助读者在较短的时间内从入门达到精通的水平。读者可以从本书开始,通过图像分类、识别、检测和分割的案例,逐步深入卷积神经网络的核心,掌握深度学习的方法和精髓,领会AlphaGo战胜人类世界冠军的奥秘。
内容简介
旨在全面介绍各种卷积神经网络的模型、算法及应用,指导读者把握其形成和演变的基本脉络,以帮助读者在较短的时间内从入门达到精通的水平。有兴趣的读者可以从本书开始,通过图像分类、识别、检测和分割的案例,逐步深入卷积神经网络的核心,掌握深度学习的方法和精髓,领会AlphaGo战胜人类世界冠军的奥秘。
目录CONTENTS
前言
第1章 概述 1
1.1 深度学习的起源和发展 1
1.2 卷积神经网络的形成和演变 4
1.3 卷积神经网络的应用和影响 6
1.4 卷积神经网络的缺陷和视图 9
1.5卷积神经网络的GPU实现和cuDNN库 10
1.6 卷积神经网络的平台和工具 10
1.7 本书的内容结构和案例数据 13
1.7.1 内容结构 13
1.7.2 案例数据 15
第2章 预备知识 22
2.1 激活函数 22
2.2 矩阵运算 23
2.3 导数公式 24
2.4 梯度下降算法 25
2.5 反向传播算法 26
2.5.1 通用反向传播算法 27
2.5.2 逐层反向传播算法 28
2.6 通用逼近定理 31
2.7 内外卷积运算 31
2.8 膨胀卷积运算 32
2.9 上下采样运算 33
2.10 卷积面计算 34
2.11 池化面计算 36
2.12 局部响应归一化 36
2.13 权值偏置初始化 37
2.14 丢失输出 37
2.15 丢失连接 38
2.16 随机梯度下降算法 39
2.17 块归一化 39
2.18 动态规划算法 40
第3章卷积神经网络的现代雏形——LeNet 41
3.1LeNet的原始模型 41
3.2LeNet的标准模型 43
3.3LeNet的学习算法 44
3.4LeNet的Caffe代码实现及说明 46
3.5LeNet的手写数字识别案例 54
3.6LeNet的交通标志识别案例 58
3.6.1交通标志数据集的格式转换 58
3.6.2 交通标志的识别分类 60
3.7LeNet的交通路网提取案例 63
3.7.1 交通路网的人工标注 64
3.7.2 交通路网的图像块分类 67
3.7.3交通路网的图像块分类LeNet 69
3.7.4交通路网的自动提取代码及说明 71
3.7.5交通路网的自动提取程序运行结果 75
第4章卷积神经网络的突破模型 78
4.1AlexNet的模型结构 78
4.2AlexNet的Caffe代码实现及说明 82
4.3AlexNet的Caffe大规模图像分类案例及演示效果 95
4.4AlexNet的TensorFlow代码实现及说明 97
4.5AlexNet的TensorFlow大规模图像分类案例及演示效果 103
4.6AlexNet的改进模型ZFNet 107
第5章卷积神经网络的应变模型 109
5.1SPPNet的模型结构 109
5.2SPPNet的Caffe代码实现及说明 112
5.3SPPNet的大规模图像分类案例及演示效果 114
第6章卷积神经网络的加深模型 118
6.1结构加深的卷积网络VGGNet 118
6.1.1VGGNet的模型结构 118
6.1.2VGGNet的TensorFlow代码实现及说明 120
6.1.3VGGNet的物体图像分类案例 129
6.2结构更深的卷积网络GoogLeNet 130
6.2.1GoogLeNet的模型结构 130
6.2.2GoogLeNet的TensorFlow代码实现及说明 136
6.2.3GoogLeNet的鲜花图像分类案例 149
第7章卷积神经网络的跨连模型 154
7.1 快道网络HighwayNet 154
7.2 残差网络ResNet 155
7.2.1ResNet的模型结构 155
7.2.2ResNet的Caffe代码实现及说明 157
7.2.3ResNet的大规模图像分类案例 163
7.3 密连网络DenseNet 169
7.3.1DenseNet的模型结构 169
7.3.2DenseNet的Caffe代码实现及说明 171
7.3.3DenseNet的物体图像分类案例 174
7.4 拼接网络CatNet 178
7.4.1CatNet的模型结构 178
7.4.2CatNet的Caffe代码实现及说明 179
7.4.3CatNet的人脸图像性别分类案例 183
第8章卷积神经网络的区域模型 190
8.1 区域卷积网络R-CNN 190
8.2快速区域卷积网络Fast R-CNN 191
8.3更快区域卷积网络Faster R-CNN 193
8.3.1Faster R-CNN的模型结构 193
8.3.2Faster R-CNN的TensorFlow代码实现及说明 196
8.3.3Faster R-CNN的图像目标检测案例及演示效果 216
8.4 你只看一次网络YOLO 220
8.4.1YOLO的模型结构 220
8.4.2YOLO的TensorFlow代码实现及说明 226
8.4.3YOLO的图像目标检测案例及演示效果 239
8.5 单次检测器SSD 242
8.5.1SSD的模型结构 242
8.5.2SSD的TensorFlow代码实现及说明 245
8.5.3SSD的图像目标检测案例及演示效果 260
第9章卷积神经网络的分割模型 266
9.1 全卷积网络FCN 266
9.1.1FCN的模型结构 266
9.1.2FCN的Caffe代码实现及说明 269
9.1.3FCN的图像语义和几何分割案例 272
9.2金字塔场景分析网络PSPNet 277
9.2.1PSPNet的模型结构 277
9.2.2PSPNet的TensorFlow代码实现及说明 282
9.2.3PSPNet的图像语义分割案例及演示效果 291
9.3掩膜区域卷积网络Mask R-CNN 294
9.3.1Mask R-CNN的模型结构 294
9.3.2Mask R-CNN的Keras和TensorFlow代码实现及说明 297
9.3.3Mask R-CNN的图像实例分割案例及演示效果 318
第10章卷积神经网络的特殊模型 325
10.1 孪生网络SiameseNet 325
10.1.1SiameseNet的模型结构 325
10.1.2SiameseNet的Caffe代码实现及说明 326
10.1.3SiameseNet的手写数字验证案例 328
10.2 挤压网络SqueezeNet 331
10.2.1SqueezeNet的模型结构 331
10.2.2SqueezeNet的Caffe代码实现及说明 334
10.2.3SqueezeNet大规模图像分类案例 337
10.3深层卷积生成对抗网络DCGAN 339
10.3.1DCGAN的模型结构 339
10.3.2DCGAN的TensorFlow代码实现及说明 340
10.3.3DCGAN的CelebA人脸图像生成案例 345
10.4 网中网NIN 348
10.4.1NIN的模型结构 348
10.4.2NIN的Caffe代码实现及说明 350
10.4.3NIN大规模图像分类案例 353
第11章卷积神经网络的强化模型 356
11.1 强化学习的基本概念 356
11.2深度强化学习网络的学习算法 358
11.3深度强化学习网络的变种模型 359
11.4深度强化学习网络的Flappy Bird智能体案例 361
11.4.1笨笨鸟网络的开发环境和工具包 362
11.4.2笨笨鸟网络的代码实现及说明 363
11.4.3笨笨鸟网络的学习训练过程 367
11.4.4笨笨鸟网络的演示效果 370
第12章卷积神经网络的顶尖成就——AlphaGo 371
12.1 人工智能棋类程序简介 371
12.2AlphaGo的设计原理 373
12.2.1 总体思路 373
12.2.2 训练流程 374
12.2.3 搜索过程 377
12.3AlphaGo Zero的新思想 380
12.4仿效AlphaGo的围棋程序案例MuGo 383
12.4.1MuGo的开发环境 383
12.4.2MuGo的代码实现及说明 386
12.4.3MuGo的学习训练过程 401
12.4.4MuGo的演示效果 403
附录ACaffe在Windows上的?安装过程 406
附录BCaffe在Linux上的安装?过程 409
附录CTensorFlow在Windows?上的安装过程 412
附录DTensorFlow在Linux?上的安装过程 414
参考文献 416
前言/序言
PREFACE前言
随着谷歌的AlphaGo、IBM的Watson和百度的小度机器人等智能产品的问世,人工智能成为大众热烈讨论的焦点。深度学习作为其中的核心技术之一,经过学术界与工业界的积极推动,已经被广泛应用于计算机视觉、语音识别和自然语言处理等诸多领域。如果读者想了解深度学习的总体概况,可参考作者编写的《深度学习导论及案例分析》一书。
本书专注讨论深度学习中应用非常广泛的模型——卷积神经网络,该模型特别适用于图像分类和识别、目标分割和检测以及人工智能游戏方面,受众对象包括计算机、自动化、信号处理、机电工程、应用数学等相关专业的研究生、教师以及算法工程师和科研工作者。
卷积神经网络是一种特殊的多层感知器或前馈神经网络,具有局部连接、权值共享的特点,其中大量神经元按照一定方式组织起来对视野中的交叠区域产生反应。其前身是日本学者Fukushima在感受野概念的基础上提出的神经认知机模型。利用神经认知机的思想,LeCun等人在1998年提出了卷积神经网络的现代雏形LeNet。2012年,Krizhevsky等人取得了卷积神经网络研究的重大突破,提出了著名的AlexNet。AlexNet在ImageNet的大规模图像分类竞赛中取得优异成绩,为深度学习的全面推广立下了汗马功劳。随后,卷积神经网络模型如雨后春笋般出现,如VGGNet、GoogLeNet、SPPNet、ResNet、DenseNet、Faster R-CNN、YOLO、SSD、FCN、PSPNet、Mask R-CNN、SiameaseNet、SqueezeNet、DCGAN、NIN,以及在人工智能游戏中用到的深度强化模型等。
本书的最大特色是对卷积神经网络进行由浅入深的分类描述,依次包括:现代雏形、突破模型、应变模型、加深模型、跨连模型、区域模型、分割模型、特殊模型、强化模型和顶尖成就。这种分类框架是在模型概述和预备知识的基础上逐步展开的,既方便读者入门学习,又有助于读者深入钻研。
本书的另一大特色是结合Caffe或TensorFlow的代码来说明各种卷积神经网络模型的具体实现过程,并通过应用案例说明其价值和意义所在。典型的应用案例包括:字符识别、交通标志识别、交通路网提取、大规模图像分类、人脸图像性别分类、图像目标检测、图像语义分割、图像实例分割、人脸图像生成、Flappy Bird智能体、AlphaGo的仿效围棋程序等。读者可以通过运行各个应用案例的程序代码和实验数据,检验其演示效果。
与其他深度学习的书籍相比,本书对卷积神经网络的内容涵盖更为广泛、模型讨论更为深入、应用实践更为细致。特别是,还总结了一些运行卷积神经网络的配置技巧和操作经验。比如,在运行Mask R-CNN的时候,需要先安装读取COCO数据集的程序,然后再进行训练或测试。在运行SSD的时候,可视化结果只给出了类别编号而没有给出类别名,作者对此已进行了修改,以方便读者按照书中所示代码显示相应的类别名。把这些经过摸索得到的技巧和经验分享给读者,对提高读者的深度学习技术水平,无疑具有很好的加速作用。
本书是集体努力的成果,主要作者包括北京工业大学的李玉鑑、张婷、单传辉、刘兆英、聂小广和欧军。他们对全书的内容进行了精心的布局、认真的编写和细致的整理。同时,曾少锋、刘博文、穆红章、余华擎和方皓达等人在文献资料、实现代码和软件工具的收集方面也提供了积极的帮助。此外,华章公司的温莉芳副总经理和张梦玲编辑对本书的排版提出了许多宝贵的意见。最后,需要特别感谢家人的支持,他们也在不知不觉中以各种方式对此书出版做出了贡献。
限于作者水平,本书难免在内容取材和结构编排上有不妥之处,希望读者不吝赐教,提出宝贵的批评和建议,我们将不胜感激。
作者
2018年4月于北京工业大学
-END-
参考文献 (393字)
1. 李喜先. 21世纪100个交叉科学难题.[M]北京:科学出版社, 2005-01, ISBN 9787030146878, 页数:800.
2. 李玉鑑. 21世纪100个交叉科学难题.[EB/OL] 豆瓣, https://book.douban.com/subject/1487549/,访问时间2018.7.24.
3. 创建者:百科生命, 21世纪100个交叉科学难题.[EB/OL] 百度百科, https://baike.baidu.com/item/21%E4%B8%96%E7%BA%AA100%E4%B8%AA%E4%BA%A4%E5%8F%89%E7%A7%91%E5%AD%A6%E9%9A%BE%E9%A2%98/7485796,2017-12-15.
4. 大数据. 21世纪100个交叉科学难题.[EB/OL] 新浪司法, http://news.sina.com.cn/sf/news/fzrd/2017-06-02/doc-ifyfuzmy1156918.shtml,2017-06-02.
5. 李玉鑑. 揭开意识的奥秘:兼谈认知相对论纲领.[EB/OL]今日头条, https://www.ufochn.com/thread-29523-1-1.html,2018-3-16.
6. 李玉鑑, 张婷. 深度学习导论及案例分析.[M]北京:机械工业出版社, 2016-10-01, ISBN:9787111550754, 页数:400.
7. 当当. 深度学习导论及案例分析.[EB/OL] 当当, http://product.dangdang.com/24049457.html, 访问时间2018-07-29.
8. 京东. 深度学习导论及案例分析.[EB/OL] 京东, http://item.jd.com/12916051517.html#product-detail, 访问时间2018-07-29.
9. 李玉鑑,张婷,单传辉,刘兆英. 深度学习:卷积神经网络从入门到精通.[M]北京:机械工业出版社, 2018-07-01, ISBN:9787111602798, 页数:430.
10. 京东. 深度学习:卷积神经网络从入门到精通.[EB/OL] 京东,https://item.jd.com/12397579.html, 访问时间2018-07-24.
x. 秦陇纪.数据科学与大数据技术专业概论;人工智能研究现状及教育应用;纯文本数据神经网络训练;大数据简化之技术体系.[EB/OL] 数据简化DataSimp(微信公众号),http://www.datasimp.org,2017-06-06.
“揭开意识的奥秘:认知相对论”及作者李玉鑑简介(11321字)
秦陇纪
简介:“揭开意识的奥秘:认知相对论”及作者李玉鑑简介、作者《深度学习导论及案例分析》、新书《深度学习导论及案例分析》简介。(公号回复“李玉鑑AI”,文末“阅读原文”可下载6图17k字14页PDF资料,欢迎转发、赞赏支持科普。)蓝色链接“科学Sciences”关注后下方菜单项有文章分类页。作者:李玉鑑。来源:李玉鑑授权转载、秦陇纪微信群聊公众号,引文出处请看参考文献。主编译者:秦陇纪,数据简化社区、科学Sciences知识简化新媒体创立者,数据简化OS设计师、C/Java/Python/Prolog程序员,IT教师。版权声明:科普文章仅供学习研究,公开资料©版权归原作者,请勿用于商业非法目的。秦陇纪2018数据简化DataSimp综合汇译编,投稿合作,或出处有误、侵权、错误或疏漏(包括原文错误)等,请联系[email protected]沟通、指正、授权、删除等。欢迎转发:“数据简化DataSimp、科学Sciences、知识简化”新媒体聚集专业领域一线研究员;研究技术时也传播知识、专业视角解释和普及科学现象和原理,展现自然社会生活之科学面。秦陇纪发起未覆盖各领域,期待您参与~~ 强烈反对并谴责超市银行、学校医院、政府公司肆意收集、滥用、倒卖公民姓名、身份证号手机号、单位家庭住址、生物信息等隐私数据!
Appx.数据简化DataSimp社区简介 (626字)
信息社会之数据、信息、知识、理论持续累积,远超个人认知学习的时间、精力和能力。应对大数据时代的数据爆炸、信息爆炸、知识爆炸,解决之道重在数据简化(DataSimplification):简化减少知识、媒体、社交数据,使信息、数据、知识越来越简单,符合人与设备的负荷。数据简化2018年会议(DS2018)聚焦数据简化技术(DataSimplificationtechniques):对各类数据从采集、处理、存储、阅读、分析、逻辑、形式等方面做简化,应用于信息及数据系统、知识工程、各类数据库、物理空间表征、生物医学数据,数学统计、自然语言处理、机器学习技术、人工智能等领域。欢迎投稿数据科学技术、简化实例相关论文提交电子版(最好有PDF格式)。填写申请表加入数据简化DataSimp社区成员,应至少一篇数据智能、编程开发IT文章:①高质量原创或翻译美欧数据科技论文;②社区网站义工或完善S圈型黑白静态和三彩色动态社区LOGO图标。论文投稿、加入数据简化社区,详情访问www.datasimp.org社区网站,网站维护请投会员邮箱[email protected]。请关注公众号“数据简化DataSimp”留言,或加微信QinlongGEcai(备注:姓名/单位-职务/学校-专业/手机号),免费加入投稿群或“科学Sciences学术文献”读者微信群等。长按下图“识别图中二维码”关注三个公众号(搜名称也行,关注后底部菜单有文章分类页链接):
数据技术公众号“数据简化DataSimp”:
科普公众号“科学Sciences”:
社会教育知识公众号“知识简化”:
(转载请写出处:©秦陇纪2010-2018汇译编,欢迎技术、传媒伙伴投稿、加入数据简化社区!“数据简化DataSimp、科学Sciences、知识简化”投稿反馈邮箱[email protected]。)
普及科学知识,分享到朋友圈
转发/留言/打赏后“阅读原文”下载PDF
阅读原文
微信扫一扫
关注该公众号