AiCharm

深度学习之父Geoffrey Hinton：我的五十年深度学习生涯与研究心得

来源：数据派THU & 机器学习初学者

作者：王菁林亦霖沈佳丽程浩源许菡如胡燕君贾川

编辑：AiCharm

【AiCharm导读】Geoffrey Hinton被公认是人工智能的教父，数十年前他就支持和推动了深度学习，今天让我们来回顾一下大佬的成长史。

他从未正式上过计算机课程，本科在剑桥大学读的是生理学和物理学，期间曾转向哲学，但最终拿到的却是心理学方向的学士学位；他曾因为一度厌学去做木匠，但遇挫后还是回到爱丁堡大学，并拿到「冷门专业」人工智能方向的博士学位；数学不好让他在做研究时倍感绝望，当了教授之后，对于不懂的神经科学和计算科学知识，他也总要请教自己手下的研究生。

学术道路看似踉踉跄跄，但Geoffrey Hinton却成了笑到最后的那个人，他被誉为「深度学习教父」，并且获得了计算机领域的最高荣誉「图灵奖」。

Hinton出身在英国的科学「豪门」，但他一生所经历的学术生涯和坎坷生活丰富而离奇。

他的父亲Howard Everest Hinton是英国昆虫学家，母亲Margaret是一名教师，他们都是共产主义者。他的叔叔是著名的经济学家Colin Clark，发明了「国民生产总值」这个经济术语，他的高祖父是著名的逻辑学家George Boole，他发明的布尔代数奠定了现代计算机科学的基础。

在厚重的科学家家族底蕴熏陶下，Hinton从小拥有独立思考能力以及坚韧品质，并且肩负着继承家族荣誉的担子。母亲给了他两种选择，「要么成为一名学者，要么做个失败者。」他没有理由选择躺平，即便读大学时几经折腾，但他还是完成了学业。

1973年，在英国爱丁堡大学，他师从Langer Higgins攻读人工智能博士学位，但那时几乎没人相信神经网络，导师也劝他放弃研究这项技术。周遭的质疑并不足以动摇他对神经网络的坚定信念，在随后的十年，他接连提出了反向传播算法、玻尔兹曼机，不过他还要再等数十年才会等到深度学习迎来大爆发，到时他的这些研究将广为人知。

博士毕业后，Hinton的生活也历经困苦。他和第一任妻子Ros（分子生物学家）前往美国，并在卡耐基梅隆大学获得教职，不过，由于对里根政府存有不满，以及在人工智能研究基本由美国国防部支持的情况下，他们于1987年前往加拿大，Hinton开始在多伦多大学计算机科学学院任教，并在加拿大高级研究所CIFAR开展机器和大脑学习项目的研究。

不幸的是，1994年，妻子Ros因卵巢癌逝世，Hinton只能独自抚养由他们收养的两个年幼的孩子，其中，儿子还患有注意力缺陷多动症（ADHD）和其他学习障碍。后来，他与现任妻子Jackie（艺术史学家）再婚，但类似的打击再度逼近，Jackie前几年也患上了癌症。

他本人也患有严重的腰椎疾病，这让他无法像正常人那样坐下，日常的大部分时间都必须站立工作，由此他也排斥坐飞机，因为起飞降落时都要求必须坐直，这也限制了他去外地做学术报告。

从左到右依次为Ilya Sutskever、Alex Krizhevsky和Geoffrey Hinton

经过近半个世纪的技术坚守和生活磨砺，终于，2012年曙光乍现，他与学生Alex Krizhevsky、Ilya Sutskever提出的AlexNet震动业界，就此重塑了计算机视觉领域，启动了新一轮深度学习的黄金时代。

也是在2012年底，他与这两位学生成立了三人组公司DNN-research，并将其以4400万美元的「天价」卖给了Google，他也从学者身份转变为Google副总裁、Engineering Fellow。

2019年，非计算机科班出身的AI教授Hinton，与Yoshua Bengio、Yann LeCun共同获得了图灵奖。

饱经风霜之后，这位已经74岁的「深度学习教父」依然奋战在AI研究一线，他不惮于其他学者发出的质疑，也会坦然承认那些没有实现的判断和预言。不管怎样，他仍然相信，在深度学习崛起十年之后，这一技术会继续释放它的能量，而他也在思索和寻找下一个突破点。

那么，他对神经网络的坚定信念源自何处？在如今深度学习「撞墙了」的质疑声中，他如何看待下一阶段AI的发展？对于年轻一代的AI研究者们，他又有怎样的寄语？

近期，在Pieter Abbeel主持的The Robot Brains Podcast节目中，Hinton非常坦诚地分享了自己的学术生涯，深度学习的未来和研究心得，以及拍卖DNN-research的内幕。以下是他的讲述。

对我影响最为深远的是童年时所接受的教育。我的家庭没有宗教信仰，父亲是一名共产主义者，但考虑到私立学校的科学教育比较好，7岁时，他坚持送我去一所昂贵的基督教私立学校读书，除了我，那里所有的孩子都相信上帝。

一回到家，家人就说宗教都是胡扯，当然，可能因为我有较强的自我意识，我自己也不信，意识到信仰上帝是错的，并且养成了质疑别人的习惯。当然，多年之后，他们也确实发现自己当初的信仰是错的，并意识到上帝也许并不是真的存在。

不过，如果我现在告诉你要有信仰，信仰很重要，可能听起来很讽刺，但我们确实需要对科学研究要有信仰，这样即使别人说你是错的，你也能在那条正确的道路上坚持走下去。

1. 1970年代，研究神经网络「孤勇者」

我的教育背景很丰富。在剑桥大学读大一那年，我是唯一一位同时修读物理学和生理学的学生，这为我后来的科研生涯奠定了一定的理工科基础。

不过，我数学不太好，只好放弃学物理，可是，我又很好奇生命的意义，于是转而去学哲学，取得一定成绩后，又开始修读心理学。

在剑桥的最后一年，我过得很艰难，也不开心，所以一考完试就退学，去做一名木匠。其实，相比于做其他事情，我更喜欢做一名木匠。

高中时，白天上完课后，我回家就会做一些木工活，那是我最开心的时刻。慢慢地，我就成为了一名木匠，但大概做了六个月左后，就发现木匠挣得钱少得难以维生，尽管木匠需要做的事情远比表面看到的要多。搞装修轻松得多，来钱快，所以在做木匠的同时，我也会兼职装修活计。除非你是一名高级木匠，否则做木匠赚的钱肯定不如做装修。

直到一天，我遇到了一名真正出色的木匠，才意识到自己不适合这行当。一家煤炭公司让这位木匠给阴暗潮湿的地下室做一扇门，鉴于环境特殊，他就将木料以反方向排列，以此来抵消木料因潮湿膨胀产生的变形，这是我此前从未想过的方式。他还可以用手锯将一块木料切成正方形。他向我讲解道：要是想将木料切成正方形，那么你必须将锯床和木料跟房间对齐。

当时我就感觉，跟他相比自己差得太远了，就想或许还是回学校研究人工智能吧。

后来，我就去爱丁堡大学攻读神经网络的博士，导师是著名的Christopher Longute-Higgins教授。30多岁时，他就弄清了硼氢化物的结构，差点因此获得诺贝尓奖，真的很厉害。直到现在，我仍然不清楚他研究的是什么，只知道是跟量子力学有关，这项研究的事实基础是「恒等算子的旋转不是360度，而是720度」。

他曾经对神经网络和全息图之间的关系很感兴趣，只是在我到爱丁堡大学后，他突然对神经网络失去了兴趣，主要是因为他读了Winograd（美国计算机科学家）的论文后被彻底说服了，认为神经网络没有发展前景，而是应该转做符号人工智能，那篇论文对他影响挺大的。

事实上，他并不赞同我的研究方向，想让我做一些更容易获奖的研究，但他的为人不错，仍然告诉我要坚定自己的方向，也从未阻止我去研究神经网络。

1970年代初，身边的所有人都质问我，Marvin Minsky和Seymour Papert都说神经网络前途渺茫，为什么还要坚持下去？说实话，我感觉很孤独。

1973年，我第一次给一个小组做演讲，内容就是关于如何用神经网络做真正的递归。在第一个项目中，我发现，如果你想让神经网络绘制图形，将图形分割成多个部分，并且这些图形的部分都能被类似的神经硬件绘制出来，那么储存整个图形的神经中枢就需要记住整体图形的位置、方向和大小。

如果正在绘制图形的神经网络突然停止运行了，你想使用另一个神经网络来继续绘制图形，那么就需要有地方来存储这个图形以及工作进度，然后可以继续绘制工作。现在的难点在于，如何使神经网络实现这些功能。显然，仅仅靠复制神经元是不行的，因此我想设计一个系统通过快速权重（fast weight）来实时适配并记录工作进度。如此一来，通过恢复相关状态（state），就可以继续完成任务。

因此，我创建了一套神经网络，通过重用相同的神经元和权重来执行递归调用（就像用于高级调用一样），以此来实现真正的递归。但是，我不擅长演讲，所以感觉可能并没有人理解我演讲的内容。

他们说，明明可以使用Lisp递归，为什么要在神经网络中进行递归。他们不知道的是，除非神经网络能够实现递归之类的功能，否则有一大堆事情无法解决。现在，这又成为了一个有趣的问题，所以我还要再等一年，直到这个问题成为一个拥有50年历史的古董，然后我写了一份关于快速权重的研究报告。

那时，也不是所有人都反对神经网络。如果再往前追溯到1950年代，如冯·诺依曼和图灵这样的研究者还是很相信神经网络，他们都对大脑的工作方式很感兴趣，特别是图灵，很相信神经网络的强化训练，这也让我对自己的研究方向很有信心。

可惜他们英年早逝，若是能多活几年，他们的智慧足以影响一个领域的发展，英国在这方面可能早已取得突破，说不定人工智能的现状也会大有不同。

2. 从纯粹的学者转变为Google员工

去Google工作的主要原因是，我的儿子患有残疾，我得为他挣钱。

2012年，我觉得在Coursera上讲课能挣到很多钱，所以就开设了神经网络相关课程。早期的Coursera软件并不好用，加上我自己并不太擅长操做软件，因此我时常感到烦躁。

最初我与多伦多大学达成了一项协议，如果这些课程能赚到钱的话，那么大学会把到手的钱分一部分给讲课老师。虽然他们没有明确说具体的分成比例，但有人说是对半分，我也就欣然接受了。

在录课过程中，我曾要求过学校帮我录制视频，但他们却反问我，「你知道制作视频有多贵吗？」我当然知道，因为我自己一直在制作视频，校方还是没有提供任何支持。然而在我开课之后（当时我已经骑虎难下了），教务长在没有咨询我和其他任何人的情况下就单方面决定学校会拿走所有的钱，而我则一分钱也拿不到，这就完全违反了当初的协议。

他们让我好好录课，并说那本就是我教学工作的一部分，但那实际上并不属于我的教学范畴，而只是基于我之前做过的相关讲座的课程。因此，我在后续的教学工作中再也没有用过Coursera。那件事让我很生气，甚至开始考虑是否要从事其他的职业。

就在此时，突然有很多公司向我们抛出了橄榄枝，愿意赞助一大笔经费，或者支持我们创立一家公司，这说明还是有很多公司对于我们的研究内容很感兴趣。

鉴于州政府已经给过我们一笔研究经费，我们也不再想赚外快，还是把精力放在自己的研究上。但那次学校骗我赚钱的经历不禁让我萌生想多赚点钱的想法，所以后来把成立不久的DNN-research拍卖了。

这桩买卖发生在2012年12月的NIPS（神经信息处理系统大会）期间，会议在塔霍湖边的一个娱乐场所举办，地下室里灯光闪耀，一群光着膀子的赌徒在烟雾缭绕的房间里尽情高呼，「你赢了25000，这些都是你的」......与此同时，楼上进行拍卖一家公司。

当时就像在演电影，与社交媒体上看到的情形一模一样，真的很棒。我们之所以拍卖公司，是因为我们完全不知道自身的价值，所以我就咨询了一个知识产权方面的律师，他说，现在有两个办法：一是直接雇一名专业的谈判员去和那些大公司谈判，但这可能会遇到不愉快；二是发起一场竞拍。

据我所知，像我们这样的小公司进行拍卖在历史上还是第一次。最终我选择通过Gmail进行竞拍，因为那年夏天我一直在Google工作，我知道他们不会随意窃取用户的邮件，即使到现在，我还是这样认为的。但对于我们这一决定，微软表现出不满。

拍卖过程如下：参与竞拍的公司必须通过Gmail将他们的报价发给我们，然后我们再将其连同Gmail的时间戳发送给其他参与者。起拍价为50万美元，然后有人出价100万美元，看到竞价不断上涨时，我们真是太高兴了，同时也意识到我们的价值远比预想的要高。当竞价达到一定程度时（当时我们认为是天文数字了），我们更倾向于在Google工作，于是叫停了拍卖。

来Google工作是一个正确的选择，到现在我在这儿工作了九年。等我在这里工作满十年，他们应该会给我颁个奖，毕竟在这儿工作这么久的人屈指可数。

相比其他公司，人们都更喜欢在Google工作，我也一样。我喜欢这家公司的主要原因是Google Brain团队很棒。我更专注于研究如何构建大型学习系统和研究大脑的工作机制，Google Brain不仅有研究大型系统所需要的丰富资源，还能跟众多优秀人才交流学习。

我属于那种直性子，而Jeff Dean是一个聪明人，跟他相处很愉快。他想让我做一些基础研究，尝试提出新的算法，而这正是我喜欢做的事。我不擅长管理大型团队，相比之下，我更乐意将语言识别的精度提升一个百分点，为这个领域带来一场新的变革是我一直想做的事。

3. 深度学习的下一个大事件

深度学习的发展取决于，在拥有海量数据和强大算力的大型网络中做随机梯度下降，基于此，一些想法得以更好地生根发芽，比如随机失活（dropout）和现在的很多研究，但这一切离不开强大算力、海量数据以及随机梯度下降。

经常有人说深度学习遇到了瓶颈，但事实上它一直在不断向前发展，我希望怀疑论者能将深度学习现在不能做的事写下来。五年后，我们会证明深度学习能做到这些事。

当然，这些任务必须经过严格定义。比如Hector Levesque（多伦多大学计算机系教授）是一个典型的AI人士，他本人非常优秀。Hector制定了一个标准，即Winograd句子，其中一个例子是，「奖杯不适合放在手提箱中，因为它太小了；奖杯不适合放在手提箱里，因为它太大了。」

如果你想把这两句翻译成法语，必须明白在第一种情况下，「它」指的是手提箱，而在第二种情况下，「它」指的是奖杯，因为它们在法语中是不同的性数（genders ），而且早期的神经网络机器翻译是随机的，所以当机器把上述句子翻译成法语时，机器无法正确识别性数。但这种情况一直在改进，至少Hector给神经元下了一个非常明确的定义，指出神经元可以做什么。虽然做的并不完美，但这样至少比随机翻译要好得多。我希望怀疑论者能提出更多类似的质疑。

我认为，深度学习这种非常成功的范式将继续保持繁荣：即根据一些目标函数的梯度来调整大量的实值参数，但我们很可能不会使用反向传播机制来获得梯度，而目标函数可能会更加局部和分散。

我个人猜测，下一个AI大事件肯定是脉冲神经网络的学习算法。它能够解决是否进行脉冲的离散判定，以及何时进行脉冲的连续性决策，这样就可以利用脉冲时间来进行有趣的计算，这在非脉冲神经网络中其实很难做到。之前没能深入研究脉冲神经网络的学习算法，这是我研究生涯的一大遗憾。

我没打算研究AGI，也尽量避免定义什么是AGI，因为AGI愿景背后有各种各样的问题，而仅仅通过扩大带参数的神经元数量或神经连接还无法实现通用人工智能。

AGI设想了一个类似人类的智能机器人，它和人类一样聪明。我不认为智能一定会这样发展，而是希望它更多地以共生方式发展。我认为，也许我们会设计出智能计算机，但它们不会像人类一样拥有自主意识。如果它们的目的是用来杀死其他人，那它们可能必须得有自主意识，但希望我们不会往那个方向发展。

4. 相信研究直觉，好奇心驱动

每个人的思维方式都有所不同，我们不一定了解自己的思维过程。我喜欢按直觉行事，更倾向于在做研究时运用类比，我认为，人类推理的基本方式是基于在大向量中利用正确的特征来进行类比，我本人也是这样做研究的。

我经常在电脑上对某一研究反复进行试验，来看看哪些有用，哪些没用。弄清事物的数学底层逻辑和进行基础研究确实很重要，进行一些论证也很有必要，但这些不是我想做的事。

做一个小测试：假如现在NIPS会议上有两场讲座，一场是关于用一种全新、聪明和优雅的方法来证明一项已知的结论；另一场则是关于一种新的、强大的学习算法，但算法背后的逻辑暂时无人知晓。

如果你必须在这两场讲座中选择一场去听讲座，你会做何选择？相比第二场讲座，第一场可能更容易被人们所接受，大家似乎更好奇证明已知事物的新方法，但我会去听第二场，毕竟在神经网络领域，几乎所有的进步都源于人们在进行数学推演时瞬间萌生的直觉，而非常规推理。

那么你是否要相信自己的直觉？我有一个标准——要么你有敏锐的直觉，要么干脆没有。如果没有敏锐的直觉，那做什么都没关系；但如果有敏锐的直觉，那应该相信直觉，去做你认为对的事。

当然，敏锐的直觉源自你对世界的理解以及大量的辛劳付出。当你在同一件事上积累了大量经验，就会产生直觉。

我患有轻微的狂躁抑郁症，所以一般会游走在两种状况之间：适当的自我批评会让我非常有创造力，而极度自我批评会让我产生轻度抑郁。但我认为这样比仅有单一情绪的效率更高。当你感到烦躁时，你只要忽视那些显而易见的问题，并且确信一些有趣的、激动人心的东西正等你去发现，继续前进。当你面对问题感到措手不及时，一定要坚持下去，理清思路，仔细斟酌想法的好坏。

由于有这样的情绪交替，我经常会告诉大家，我弄清大脑的工作机制了，可过段时间，我又失望地发现之前的结论是错误的，但事情就应该是这样发展的，正如William Blake的那两句诗，「将快乐和忧伤编织，披在我神圣的心上」。

我认为科研工作的本质也是如此，如果你不会因为成功而感到兴奋，也不会因为失败而感到沮丧，那算不上真正意义上的研究者。

研究生涯里，尽管有时会觉得自己完全摸不着一些算法的门道，但我还从未真正感到迷茫和毫无希望。在我看来，无论最终结果如何，总有值得去做的事情。优秀的研究人员总是有很多想做的事情，只是苦于没有多余的时间。

在多伦多大学任教时，我发现计算机科学专业的本科生都很优秀，而很多辅修计算机科学的认知科学专业的本科生也表现得相当出色，这一部分同学并不擅长技术，但他们仍然把研究做得很好，他们热爱计算机科学，非常想弄清人类的认知如何形成，有着源源不断的兴趣。

像Blake Richards（蒙特利尔神经学研究所助理教授）这样的科学家，他们很清楚自己想解决什么问题，然后就只管朝着这个方向前行。现在，很多科学家都不知道自己到底想做什么。

回头看，我觉得年轻人要找到自己感兴趣的方向，而不是单纯地学些技术。在自身兴趣的驱动下，你会主动去掌握一些应有的知识来寻找你想要的答案，这比盲目地学习技术更重要。

现在想想，我年轻时就应该再多学一点数学知识，这样做线性代数就会容易很多。

数学时常让我感到绝望，导致很难读懂一些论文，尤其要弄懂那一大堆符号，真是一项莫大的挑战，所以我并没有读太多论文。关于神经科学方面的问题，一般我会向Terry Sejnowski（计算神经学教授）请教，计算机科学方面的问题，我会请研究生解释给我听。当我需要用数学来证明某项研究是否可行时，我也总能找到合适的方法。

通过做研究让这个世界变得更美好的想法很不错，但我更享受探索人类创造力上限的乐趣，我真的很想了解大脑的工作机制，我相信我们需要一些新的想法，比如通过脉冲神经网络的学习算法了解大脑的运作方式。

我认为，最棒的研究工作应该由一大群研究生来完成，并且给他们提供丰富的资源。科研工作需要年轻的活力，源源不断的动力，以及对研究的强烈兴趣。

你必须有好奇心的驱动才能做出最好的基础研究。只有这样，你才有动力去忽视那些明显的障碍，去预估自己会取得怎样的结果。如果是一般性研究，创造力就不是最重要的。

如果能弄清一大批聪明人正在研究什么，然后你再去做不一样的研究，总是一个好主意。如果你已经在某个领域取得一定的进展，那就不需要其他新的想法，只需要将现有的研究深挖下去就可以成功。但如果你想研究一些新想法，比如构建大型硬件，那也非常不错，尽管前路可能有些曲折。

参考资料：

https://www.youtube.com/watch?v=4Otcau-C_Yc

https://www.youtube.com/watch?v=2EDP4v-9TUA）

阿里云通义开源首个推理步骤评估标准，探索AI推理模型新路径量子位
1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准ProcessBench，填补了大模型推理过程错误评估的空白。在当前大模型推理过程中，不时存在逻辑错误或编造看似合理的推理步
大数据新视界 -- 大数据大厂之 Impala 性能优化：融合人工智能预测的资源预分配秘籍（上）（29 / 30）青云交大数据新视界 #Impala 之道大数据 Impala 人工智能预测资源预分配数据收集模型构建查询性能优化
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
AI代码生成器赋能软件原型快速构建：吴恩达的最佳实践指南前端
快速构建软件原型对于验证想法、迭代产品至关重要。而随着人工智能技术的飞速发展，AI代码生成器等AI辅助编程工具的出现，为开发者提供了前所未有的效率提升。本文将结合吴恩达教授的观点，探讨如何利用AI工具，高效构建软件原型。吴恩达教授强调选择合适的技术栈并有效利用AI工具是关键，这将帮助开发者在短时间内完成原型开发，快速验证其想法。选择并精通“有主见”的技术栈：效率为王吴恩达教授推荐的技术栈——Pyt
MiniMax开源，突破传统Transformer架构，震撼业界人工智能模型
就在昨天，AI领域迎来了一项重大突破——MiniMax发布并开源了新一代01系列模型。国产大模型市场再掀巨浪，传统Transformer架构或许将不再是唯一选择。MiniMax-Text-01模型：https://huggingface.co/MiniMaxAI/MiniMax-Text-01MiniMax-VL-01模型：https://huggingface.co/MiniMaxAI/Mini
mindspeed-llm源码解析（一）preprocess_data 人工智能
mindspeed-llm是昇腾模型套件代码仓，原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py（基于1.0.0分支），数据处理是模型训练的第一步，经常会用到。文章中贴的源码加了相关注释，同学们可以把源码和注释结合起来看。首先来看一下main函数defmain():#获取入参，通过后面的代码可以知道有哪些关键参数args=get_args()#参
大数据新视界 --大数据大厂之AI 与大数据的融合：开创智能未来的新篇章青云交大数据新视界 AI&人工智能大数据人工智能智能环保智能教育智能农业 ChatGPT 智能能源数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
从RNN到Transformer：生成式AI技术演变与未来展望非著名架构师人工智能 rnn transformer
生成式人工智能（GenerativeAI）近年来取得了令人瞩目的进展，其背后的核心技术是自回归模型的不断演进。从传统的递归神经网络（RNN）到革命性的Transformer架构，本文将全面剖析这一技术发展历程。一、RNN：生成式模型的起点1.RNN的基本原理递归神经网络（RecurrentNeuralNetwork,RNN）是一种专为处理序列数据设计的神经网络架构。其核心思想是通过循环连接的隐藏状
移动终端基带芯片的基本架构介绍之二（移动终端中的基带芯片） a1809032425 网络通信学习
移动终端基带芯片的基本架构介绍之二（移动终端中的基带芯片）参考链接：https://blog.csdn.net/lxl584685501/article/details/46771429http://m.blog.csdn.net/blog/suipingsp/35280465http://m.blog.csdn.net/blog/suipingsp/35574959http://www.bubu
开源多模态推理模型QVQ：视觉推理能力的突破与未来展望前端
近年来，AI代码生成器等人工智能技术飞速发展，多模态推理模型作为其中一个重要分支，正展现出越来越强大的能力。它能够理解和处理多种类型的数据，例如图像、文本、音频等，并进行复杂的推理和决策。阿里云通义千问团队近日发布的QVQ-72B-Preview模型，就是一个极具代表性的例子。该模型开源且在视觉推理方面表现突出，为多模态模型的发展树立了新的里程碑。QVQ模型的核心能力与突破QVQ-72B-Prev
PyTorch建模与应用：从深度学习到大模型屿小夏书籍推荐深度学习 pytorch 人工智能
文章目录一、内容简介二、值得一读1.从基础到深入，适合不同层次的读者2.丰富的实战案例3.全面的数据处理与模型构建三、适用人群1.AI技术初学者2.在校学生和从业者3.培训机构和高校教学四、总结一、内容简介《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章，内容涵盖了从深度学习的基础概念到大语言模型的应用。第1章介绍了深度
debian最小安装后，从零安装GUI界面（gnome）翻滚吧键盘 debian 腾讯云 javascript
安装命令（顺序执行即可）aptinstallsudonala默认普通用户是无法执行sudo命令的，修改使其可以执行sudo命令（不过我看了一下/etc/sudoer文件并没有被修改，先埋个坑）adduser[你的用户名]sudo选择最快的镜像sudonalafetch开始安装GUI（gnome）sudonalainstallgdm3gnome-shellgnome-terminalgnome-te
会捡垃圾、能干家务，元萝卜“视觉+机械臂”技术扫地机器人首秀量子位
在2025开年科技盛宴CES（国际消费电子展）上，AI机器人无疑成为全场焦点，而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用，更获得了全球媒体的高度关注。通过将视觉感知与机械臂技术相结合，能够自主完成拾取垃圾入桶等任务，不仅展示了家用机器人发展的未来形态，也让大众看到了具身智能机器人融入家庭生活的广阔前景。随着大模型技术和具身智能浪潮汹涌而至，家用机器人正迎来全新发
Java基础：Iterator迭代器重生之Java开发工程师 java 开发语言
一、什么是Iterator：迭代器(Iterator)是一个对象，它的工作是遍历并目标序列中的对象，它提供了一种访问一个容器(container)对象中的各个元素的方法，把访问逻辑从不同类型的集合类中抽象出来，又不必暴露该对象内部细节。通过迭代器，开发人员不需要了解容器底层的结构，就可以实现对容器的遍历。由于创建迭代器的代价小，因此迭代器通常被称为轻量级的容器。常常使用JDK提供的迭代接口进行Ja
Java 批量检测微信小程序封禁状态 java微信小程序
随着微信小程序的快速发展，管理小程序的状态变得越来越重要。若某个小程序因违规被封禁，开发者需要及时知晓。本文介绍了如何使用Java批量检测多个微信小程序的封禁状态，并通过接口获取每个小程序的最新状态。项目代码importjava.io.InputStreamReader;importjava.io.BufferedReader;importjava.net.HttpURLConnection;im
全局变量的定义和使用 Alvin's Tech Blog c++
定义全局变量：全局变量在一个源文件中定义，分配内存空间。定义时不需要任何特殊关键字，直接写在函数外部即可。声明全局变量：在其他源文件中使用该全局变量时，需要用extern关键字声明。extern告诉编译器：“这个变量在其他地方定义，这里只是引用。”示例代码文件1:main.c#include#include"global.h"//包含全局变量的声明intmain(){printf("Globalv
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络盼小辉丶遗传算法与深度学习实战深度学习 keras cnn
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络0.前言1.卷积神经网络基本概念1.1卷积1.2步幅1.3填充1.4激活函数1.5池化2.使用Keras构建卷积神经网络3.CNN层的问题4.模型泛化小结系列链接0.前言卷积神经网络(ConvolutionalNeuralNetwork,CNN)的提出是为了解决传统神经网络的缺陷。即使对象位于图片中的不同位置或其在图像中具有不同占比，
题解：AI处理器组合 c++
题解思路为了根据亲和性调度原则选择合适的处理器组合，需按照以下步骤进行：1.链路划分将可用的处理器编号array分为两个独立的链路：链路1：编号0-3链路2：编号4-7这样可以确保不同链路的处理器之间不会混合选择，从而满足不通链路的通信限制。2.统计可用处理器数量分别统计每个链路中可用的处理器数量：链路1的可用处理器数量count1链路2的可用处理器数量count23.确定优先级顺序根据任务申请的
Python网络爬虫入门教程：从抓取数据到应用实现冷夜雨. python
引言在大数据时代，信息就是力量。各种网站每天产生着海量的数据，这些数据中蕴藏着巨大的商业价值和研究价值。如何快速、自动化地从互联网上获取这些信息，成为了数据科学、人工智能、市场分析等领域中的一个重要课题。Python，作为一门易于学习且功能强大的编程语言，其丰富的库和工具使得构建网络爬虫变得非常简单。网络爬虫（WebScraper）是一种自动化程序，用来从网页中提取信息。无论是用于数据分析、竞争对
编程语言大揭秘：各显神通的编程世界冷夜雨. python java c++c#javascript
在当今数字化的时代，编程语言犹如一把把神奇的钥匙，打开了通往不同技术领域的大门。从网页开发到人工智能，从数据分析到游戏制作，每一种编程语言都有其独特的优势与适用场景。今天，就让我们一同深入探索几种主流编程语言的奥秘，看看在什么情况下它们能发挥最大的威力。Python：万能胶水，快速开发的利器Python以其简洁、易读的语法著称，仿佛是用自然语言编写代码一般，新手程序员也能快速上手。它拥有庞大且丰富
【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法：基于原型引导的领域感知渐进表示学习（一）努力学习的大大论文推荐深度学习人工智能机器学习神经网络变化检测
【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法：基于原型引导的领域感知渐进表示学习（一）【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法：基于原型引导的领域感知渐进表示学习（一）文章目录【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图
peewee 怎么实现 count(*) mysqlsql
问题：peewee的.count方法是必须要加参数的，不加参数就会翻译成count()，是非法的SQLSQL的count必须加*或者具体的字段而peewee的count方法直接加.count('')是不行的，会被翻译成count('')，也是非法的SQL合法的SQL是count(*)解决办法回到问题「peewee怎么实现count(*)」问了3个ai：chatgpt、deepseekv3、gemi
服务器数据恢复—raid5阵列2块硬盘报警导致系统无法启动的数据恢复案例数据恢复
服务器数据恢复环境&故障：一台服务器上的8块硬盘组建了一组raid5磁盘阵列。上层安装windowsserver操作系统，部署了oracle数据库。raid5阵列中有2块硬盘的硬盘指示灯显示异常报警。服务器操作系统无法启动，ORACLE数据库也无法启动。**服务器数据恢复过程：**1、将故障服务器上所有硬盘标记后取出，硬件工程师检测后没有发现有硬盘存在硬件故障。将8取出来的硬盘进行异或测试，无明显
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
AppFreeze与资源泄漏能力开放及常见问题定位方法介绍 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第23课。本次议题围绕HarmonyOS应用开发的关键检测能力展开。appfreeze应用卡顿检测能力是保障应用流畅性的重要手段，通过对其深入了解，可及时发现并解决卡顿问题。故障日志规格为问题排查提供了重要依据，结合通用定位思路，能快速锁定故障源。同时，针对句柄、线程、内存泄漏检测能力的介绍，给予开发者全面的检测工具。详细的日志信息及各泄漏类
命中索引一定能提高查询速度吗？繁川 Java面试精选 mysql
命中索引一定能提高查询速度吗？目录命中索引一定能提高查询速度吗？目录索引的基本原理索引命中与查询性能查询复杂性数据量与索引选择性更新与维护成本过多的索引何时索引能提高查询速度？简单查询高选择性字段适当的索引类型结论答案是否定的，在实际项目中我曾踩过这个坑。在进行性能优化时，我发现一个接口的SQL语句没有加索引，EXPLAIN执行后发现是全表扫描。我对查询的字段添加了索引后，性能却没有明显提升。这是
提升CSS动画学习效率的利器——ScriptEcho 前端
引言在现代网页设计中，CSS动画的重要性不言而喻。它不仅能够为用户提供更为生动的视觉体验，还能有效地吸引用户的注意力。例如，按钮的悬停效果、页面的加载动画等，都是通过CSS动画实现的。然而，尽管CSS动画的应用场景广泛，但对于零基础的学习者来说，学习其中的技巧和知识常常面临挑战。本文将介绍如何通过ScriptEcho这一强大的工具来提升CSS动画的学习效率，让每位学习者都能轻松入门。CSS动画基础
十五届蓝桥杯赛题-c/c++ 大学b组 shix . 练习蓝桥杯 c语言 c++
握手问题很简单，相互牵手即可，但是要注意，第一个人只能与其他49个人牵手，所以开头是加上49#includeusingnamespacestd;intmain(){intcnt=0;for(inti=49;i>=7;i--){cnt+=i;//cout#include#includeusingnamespacestd;intres=0;intmain(){//奇数位数字奇数，偶数位intn;cin
【赵渝强老师】Redis的慢查询日志数据库nosqlredis
Redis慢查询日志帮助开发和运维人员定位系统存在的慢操作。慢查询日志就是系统在命令执行前后计算每条命令的执行时间，当超过预设阀值，就将这条命令的相关信息（慢查询ID，发生时间戳，耗时，命令的详细信息）记录下来。Redis客户端的一条命令可以分为四个部分执行，如下图所示。视频讲解如下：https://www.bilibili.com/video/BV1hbpeehEwj/?aid=11309965
安卓编译报错expo-modules-core:prepareBoost Not in GZIP format的解决方案
作者:Kovli重要通知：红宝书第5版2024年12月1日出炉了，感兴趣的可以去看看，https://u.jd.com/saQw1vP红宝书第五版中文版红宝书第五版英文原版pdf下载(访问密码:9696)报错如下[RUN_GRADLEW]Executionfailedfortask':expo-modules-core:prepareBoost'.[RUN_GRADLEW]>Couldnotrea
vSAN数据恢复—vSAN存储中虚拟机无法启动的数据恢复案例数据恢复
vSAN存储故障：异常断电导致vSAN存储上层虚拟机无法启动。vSAN存储结构：vSAN存储数据恢复过程：1、将故障vSAN存储上的硬盘标记后取出，硬件工程师对所有硬盘进行物理故障检测，经过检测确认异常断电并没有导致硬盘出现物理故障，都可以正常读取。将所有硬盘以只读方式进行扇区级完整镜像。镜像完成后将所有磁盘按照标记还原到原存储中。后续的数据分析和数据恢复操作都基于镜像进行，避免对原始磁盘数据造成
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

深度学习之父Geoffrey Hinton：我的五十年深度学习生涯与研究心得

1. 1970年代，研究神经网络「孤勇者」

2. 从纯粹的学者转变为Google员工

3. 深度学习的下一个大事件

4. 相信研究直觉，好奇心驱动

你可能感兴趣的:(AI周刊,深度学习,人工智能,计算机视觉,神经网络,视觉检测)