BAAIBeijing

计算机视觉：学术界与工业界GAP有多大？

近年来，随着以深度学习为代表的机器学习方法在计算机视觉领域的广泛应用，以及计算机视觉在工业界场景中不断落地，CV领域的产、学两界之间的界限逐渐模糊，高校师生大规模加入工业界探索，而工业界也投入大量资本进行学术研究。这就导致一个“奇怪”的现象，在学术顶会中，常常会看到，一篇学术论文的研究者，既有高校师生，又有企业研发团队，似乎基础研究和商业已经实现了无缝衔接。

站在2020年下半年，在计算机视觉领域，学术界和工业界是否还存在 GAP 呢？CV领域研究生如何成功顺利跨入企业，成为优秀人才？企业的顶会参与越来越多，难道他们真的在乎研究？计算机视觉研究的未来趋势有哪些？

针对这些问题，在由中国图象图形学学会主办、视觉大数据专委会承办，北京智源人工智能研究院和美团协办的ECCV 2020中国预会议上，华刚（Wormpex AI Research 副总裁兼首席科学家）、田奇（华为诺亚方舟计算机视觉首席科学家）、王井东（微软亚洲研究院）、魏晓林（美团视觉智能中心负责人）、熊红凯（上海交通大学教授）等学术界和工业界CV学者进行了一次深入探讨，圆桌主席由董晶（中科院自动化所副研究员）担任。

左列由上至下为董晶、田奇、熊红凯

右列由上至下为华刚、魏晓林、王井东

整理：智源社区贾伟

一、当前CV领域的研究生（硕士、博士）应该具备的哪些能力？

//熊红凯——CV，不仅是技术，更是对真理的探索

我几乎没离开过学校，关于学术界，下面谈谈自己的经验。

小时候，家人告诉我，人类面对三个世界，第一个是意识世界，第二个是现实物理世界，第三个是真理的世界或者数学的世界。

按照这种观点，做学术更多的是面向第三个世界，即数学的世界。换句话说就是，做学术的目的是面向物理世界，去寻找它真正存在的规律。而意识世界，我们无法左右，只能通过梦境或其他方式呈现。

但后来接触到计算机视觉，它让计算机像人一样具有视觉的观感。这就意味着，计算机视觉给意识世界打开了一个窗口，它把意识世界和现实的物理世界进行了关联。

现在学术研究存在一个分歧，对心理世界和物理世界的关联研究（不是对真理或规律的研究）是不是学术研究？因为很多人认为计算机视觉的研究成果更多的是用来娱乐和消费，而非探索真理。但我认为，抛开市场的层面，计算机视觉本身是一种向人类自身意识的拓展，这才是计算机视觉作为一种学术研究的内核。

当然，这是我对计算机视觉的理解。

从事计算机视觉研究的学生们，既然选择这个领域，就要有哲学层面上对这个领域的思考，找到那种能打动自己的部分。核心层面要始终意识到，这并不仅仅是一种能带来经济效益的技术，更是一种真理的探索。

//王井东——写作很重要！

我虽然是来自工业界，但实际上更多的还是偏学术界一点。刚才熊老师讲的高度非常高。我就讲一讲在这十几年中，我带实习生的一些感受或心得吧，当然讲的很多东西实际上是从别人那里学到的。

沈向洋曾经提过“三好学生”。哪“三好”呢？就是数学好、编程好、态度好。

数学好：2012年以来，许多学生认为数学不再重要，只需要调参就行了。但其实这是误解。大家以后走向工作岗位，就会发现光会调参是不够的，你没有优势，因为每个人都会调参。只有数学技能充分，才能够具备优势。
编程好：这个很自然，做计算机方向，编程当然重要。
态度好：你想做学术研究，态度是第一。没有一个好的态度，光有良好的基础是不够的。

除了这三个以外，从我个人的许多经历中，我认为还有一点非常重要，就是交流。交流，并不是单指口头交流；对于做研究的人来讲，写作也是一种很重要的交流。

为什么会这么讲呢？做研究，并非是一个人，往往需要跟很多人去合作。在合作的过程中，比如我带一些学生，往往会出现这种情况，我跟学生去讨论一些问题，但不同学生所接受的东西是不一样的。那么，怎么才能保证，最后大家能够达成一个共识？

我的一个建议就是，把它写出来。

写作，并不仅仅是指写论文。其实平时的交流也需要写出来。把平时的交流写下来，一个好处就是，如果你写的好，别人可以非常清晰地看到你最近在想什么，而口头交流则会有许多意思不到位或理解不到位的情况。

除了对自己idea进行写作外，其实对自己其他方面（例如规划、报告等）的写作也非常重要。这个技能其实是非常重要的，它能够帮助你去规划过去和将来的几年应该怎么去做。可能有人会想，我不用写，因为头脑中每天都在想这个问题；但事实上是，只有当你真正把这个东西写出来后，才会发现你头脑中想的和实际中发生的到底有多大差距。因为你在头脑中构想时往往会遗漏许多细节，当你写下来时，才会注意到这些东西。

因此，我建议学生们，不管是在做学术研究，还是到公司工作，写作这个事情，应该做起来，这对你一生都会是非常有帮助的。

//田奇——不管到哪儿，都要有崇高的精神

2017年以前，我在学校当老师；之后几年，我在公司从事研究。因此我从行业的角度来说一说，工业界需要什么样的人才。如果你具备这样一些素质的话，可能就会有一些优势；如果不足，可能要弥补一下。

我总结了几点：

第一点，在工业界来，首先需要专精一个领域，在这个领域中要有一定深度的专业技能和创造力。

第二点，其实井东也提到了，就是沟通合作的能力。同时，我们也要有多领域理解能力，就是能够理解别人的工作。这就要求具备“T型“的知识架构，不仅要有知识的深度，还要有知识的广度。

第三点，从行业应用的角度来说，要有一些真正懂得人工智能产品的人才。这就要求能够从客户的角度，去发现他们真正需要什么；或者，从应用的场景去思考计算机视觉能够做什么，从而来激发一些更新的研究。

第四点，就是能够对新的业务方向具备很好的敏感性，对它的发展有快速、准确把握的能力。

最后，我之前在其他场合也谈过，就是需要有崇高的理想境界，能够以人为本，去思考如何利用自己的能力，去为人们的精神文化需求服务。

二、请问大家是怎么看待产业界和学术界参与国际顶级会议发表科研成果的热度的？

//华刚——Win-Win：学术界与产业界的融合

它的存在是一个客观现象。从我们的角度来说，也非常希望这个趋势能够一直这样紧密的保持下去的。

现在的热度主要来自于两个方面。

第一，现在CV的研究，从方法论上来说，是被深度学习主导的，而深度学习需要大量的数据，这种数据，学术界没有，而产业界却很丰富。这时候产业界与学术界结合，教授们会把他们的学生送到企业去做实习，从而能够访问这些数据；而企业也得到了优秀人才。这本身是一个平衡。

第二，PHD本身是为学术界培养的，大部分博士毕业之后应该是去做教授的，但现在博士生太多了，有点“通货膨胀”，而高校位置就那么多，于是就产生了一个职业，就是工业界中有一群做研究的博士。这群人本身有两个身份，一方面要为企业的商业利益服务，另一方面他也能给自己分配一些精力做研究。他能够通过与高校合作的方式来带学生，通过这种方式，他能够去做一些更难、更长期、更加具有探索性的项目。

从这两个方面来看，其实学术界与产业界之间的深度合作，是一种双赢的局面。所以我并不觉得产业界和学术界存在多大的鸿沟，从有用的技术、有趣的研究这方面考虑，特别是CV发展到今天这种程度，已经很难去区分是不是学术界的问题了。高校的老师和学生在做有趣的研究，而工业界的研究员在做有用的技术，两者结合，Win-Win。

所以，我希望这种热度能够一直保持下去。

//魏晓林——实习生，学术界和工业界融合的桥梁

视觉这个方向，工业界和学术界总体的 GAP 越来越小，这个大家有目共睹。对工业界来讲，GAP小是非常有利的，企业方便招到优秀的人才，另外也能很快将最前沿的算法应用到实际产品中，不断迭代和创新。

为什么 GAP 越来越小呢？刚才华刚老师也提到，深度学习这种新的范式，使得企业具备了学术界所不具备的优势，比如大规模标注数据、算力以及问题的实际应用场景。学术界很难拿到这种资源，这也导致很多非常高层次的学者加入到了工业界。

其实还有一个现象，就是有大量的 CV 领域的学生加入到企业进行实习，并在企业里做研究，发paper。他们，事实上，起到了工业界和学术界融合的桥梁角色。

从现在来看，我觉得两个领域的GAP小一些比较好，这样研究和应用不至于脱节。但是从长远来看，我觉得可能 GAP 大一点会好，因为我觉得还是要回到事情的本质。驱动学术界前进的是基础研究，这是需要花费更多精力，做一些长远探索的事情，往往需要五年、十年之后才能见到效果；而驱动企业去做研究的动力，本质上是商业，它更关注是否能给企业带来经济效益，是短期的。所以两者之间尽管可以密切合作，但也应当保持一点距离。

三、工业界和学术界对顶会顶刊的重视程度/人才吸纳/技术成熟度的判断标准是否有差别？

//华刚——进入企业，论文只是一个敲门砖

学术界和工业界在论文发表上的区别，其实蛮大的。在学术界，论文发表即意味着结束；而在工业界，论文发表只是工作的开始，因为你的研究只是一个概念论证，后面如何进一步提升性能如何找到落地场景等，还有很长的路要走。

至于说工业界对学术顶会期刊的重视程度，其实你之前发表的论文具体做了什么，在找工作的阶段并不重要，它更多的只是一个记录，说明你具备逻辑性思维，在评选候选人的时候，论文是一个加分项，更容易吸引眼球，但也仅限于此，只是初始时的一个敲门砖。实际上，每个候选人，我都会去聊一下他的论文，看看究竟这里头有多少思想是他自己的。更重要的是，他到底有没有形成一个成熟的逻辑体系，我觉得这才是一个人才是否优秀的重要标准之一。其实工业界，更重要的是去看你真实的技能，就是能否去解决问题，因为在工业界很多时候，都是你追着问题，去解决问题，在这个过程中来建立你的技术。所以解决问题的能力，才是工业界衡量人才的标准。

//田奇——解决问题的能力，才是核心竞争力

工业界和学术界，其实它的核心都是人才，都需要非常优秀的AI人才。我们都希望这些人才理论扎实，工作能力强，善于合作，善于创新。但两个领域也有一些差别，学术界更需要的是能够将实践升华为理论的能力；而工业界，其实秉着“不管黑猫白猫，抓到老鼠就是好猫”的态度，更看重解决问题的能力。

关于顶会、顶刊，应该把两者分开来看。工业界会更重视顶会一些，因为能够快速地把工作发表出来。在顶会方面，工业界和学术界的重视程度差不多。

关于人才吸纳，工业界可能更关注以下几点：作者是不是第一作者；有没有对一些开源项目做出一些贡献；或者在一些AI比赛中有很强的表现；是否有参加项目的实习经历；是否有丰富多彩的课外活动等。这里面看的不仅是研究能力，还有工程开发能力。

//魏晓林——企业的论文，只是技术的副产品

关于顶会顶刊论文，从工业界，我觉得可以从两个方面来说。

首先，入门工业界，也即进入企业，大家还是要看论文情况的。尽管这么多年来，我们都在强调不要过于重视论文的数量，应该追求事情的本质。但这就像高考一样，尽管它并不能完全反应出一个人真正的实力，但仍然是一个重要的衡量标准。

第二个方面，在公司内部我们是否重视顶会？这个问题需要去反推。在公司，我们会从市场的需求来反推需要什么技术，这些技术在落地的过程中会产生一些副产品，于是我们就顺便发了个顶会文章。其他公司我不太清楚，至少在美团，我们的KPI里没有必须要发表多少论文。

//熊红凯——传统的学术界，论文不是衡量一切的标准

我说一下学术界。我自己以及家里人都是学术界的人，我也认识一些传统的学术界的前辈。我觉得传统的学术界，其实并不注重顶会顶刊。其中有个前辈说他当时哈佛大学毕业，没有发表任何论文，但最后还是被留为助理教授了。我记得，卡尔曼博士毕业也是没有论文的，当时也没有很大的影响力，但后来却做出了控制论。

今天我们总喜欢讲顶会、顶刊，这实际上是一个偷懒的想法，因为我们不愿意从一个人真正的思想和能力上去认真评判一个人的学术能力，只好用论文的数量或其他一些证书来作为衡量标准。我觉得这其实，不管是工业界还是学术界，都面临的一个问题，就是快餐文化，希望能够用更多证书，短平快地处理一些事情。

针对顶会顶刊，大家会用它的接收率来判断这个顶会、顶刊的质量。但大家都知道，即使评价特别高的顶会顶刊，其发表的论文也是良莠不齐的，因为研究成果的重要性，很难用这些数据评价出来的。

在学术界，其实很多学者可能更希望能用传统的方式，从这个人的思想来做判断，决定是否聘用他，或给他一个发展的周期。

四、请您谈谈本领域工业界和学术界对科研人员的吸引力法则？您如何看待和定义这两者的界别和角色转换的关系？

//华刚——横亘在学术界、工业界之间的不是GAP

我其实不愿意把学术界和工业界之间的不同称为「GAP」。因为研究、开发以及将技术应用到实际场景，这是一个大循环，是相互衔接的。另一方面，我们把学术界限定为高校，事实上，学术共同体是一个很大的范畴，并不只是包含高校的老师和学生。魏老师提到希望学术界和工业界保持一点距离，这其实是希望能够把做基础研究的人保护起来，给他一个干净的环境去做事情。

我们来说，人才在高校和企业之间的流动，我觉得只是每个人自己职业上的选择，其实没有必要拿来评论。其中当然很多人会有“水土不服”的现象，这个只能说，在哪个行当就要做哪个行当的事情，高校进企业的教授，或企业进高校的研究员都要有这样的心态。

//田奇——学术界和工业界互补互益、齐头并进

关于学术界和工业界的关系，我认为是互补的。在华为，我们经常说一句话就是，向上突破天，向下扎到根。前一句就是谈你的创新能力要强，后一句就是说我们要贴近行业。所以我们提出要全栈全场景，这就要求从基础研究到产业落地全部覆盖。如果我们把学术界的研究看做从 0 到 1，那么工业界的工作就是从 1 到 N。怎么把 0~1 和 1~N之间的缩小呢？这就需要有一个从研究到落地的沉淀过程。这个沉淀过程需要那些具备很强的build能力的人才。就像刚才华刚说的，学术界和工业界其实是一个循环，学术界给工业界输送了不少人才，我们也看到很多工业界的人才慢慢回流到学术界，这带来的一个结果就是，他们是带着新问题而来的，因此可以给学术界注入新鲜的内容。因此，我认为它们是互补互益、齐头并进的。

//魏晓林——学术界只有几个学术界，工业界却有N个工业界

在计算机机视觉领域，一个很有意思的现象是，学术界可能只有几个学术界，例如国内的学术界和国外的学术界；而工业界却有 N 个工业界，每一个公司都是一个工业界，因为每一个公司，它的市场所面对的用户历史都是不一样的，它背后所代表的含义也是不一样的。

//王井东——两界不分，这是好事情

刚才王亮老师说我是学术界，而华刚老师不完全同意，认为我是工业界，这意味着大家今天对学术界和工业界之间的区分没有那么清楚了。田奇老师是从学校去的公司，华刚老师也是，大家在这两种身份中切换，都是游刃有余。这是一件好事情。

10年前咱们做视觉研究的人，很多研究生博士毕业后，发现很难找到理想的职业，今天来看这个事情就不存在了。因为现在在工业界，其实有很多需要研究的地方，不像以前一样，毕业即转行。这是很好的一件事情。

五、请您谈谈您对未来 3-5年中计算机视觉行业的发展趋势，对可期的Top 1-2-3行业或某行业的前景预期？下一个阶段计算机视觉的研究热点在哪里？

//王井东——与推理结合

视觉发展到今天，尽管许多研究人员不承认，但Deep Learning事实上就是计算机视觉领域的主流方法。但大家发现Deep Learning存在很多缺点，例如不可解释性、安全性等问题。我认为计算机视觉接下来一个重点就是，要考虑怎么和推理结合起来；具体到方法上，就是怎么和神经符号这些方法进行结合。这也是解决可解释性、安全性和透明性等问题的途径。

//华刚——三个繁荣产业，两个研究趋势

首先，我觉得视觉最有可能三个产业领域上繁荣：第一是安防，大家已经看到了，包括城市大脑这些，我把都归于安防的范畴；第二是无人驾驶，这个行当是相当看好的；第三是零售，很多人还没有注意到，但我觉得视觉会对这个行业产生一个大的颠覆。

下一个阶段计算机视觉的研究热点，我觉得有两个重要趋势。一个是，深度学习与计算机视觉的一些领域知识结合越来越多，结合之后才能产生更好的可解释、鲁棒的模型；另一个是，用小数据去训练模型。

//田奇——数据利用好，至关重要

关于AI的趋势已经聊了很多，就是一些自主自治、资源高效、安全可信等。在计算机视觉领域，其实所有的问题总结来说就是数据、模型和知识的提取。最主要的还是聚焦在数据高效上。因为深度学习需要大量标注数据，如何把数据利用好至关重要。从数据层面，就是把数据的质量做好。另外，一个发展趋势是怎么把软硬件结合起来。从单点的技术来讲，如何进行无监督学习、AutoML、边缘计算、知识蒸馏、模型迁移等都是比较好的研究方向。

//魏晓林——大范式下的小范式

前几位老师都讲了很多，其背后的大逻辑其实就是，我么应该更加关注新的技术范式，像深度学习一样能够完全颠覆原来的范式。

当然，在大的范式下面，有一些小的范式。例如，小样本学习，虽然还没有应用非常广，但它能够加快迭代速度、降低计算成本；自监督学习，能够减少标注成本；AutoML，可以减少人工研发的人工成本；多模态学习与知识图谱的集合、CV与知识图谱的结合，可以对组织上产生一些影响；此外，还有模型压缩，从而找到更加便宜的算法。

//熊红凯——回到哲学层面，重新思考视觉

刚才几位老师提到的，我就不再赘述了。

我这里强调一下新范式的问题。人工智能在最初是基于符号、基于专家系统、基于统计的，最近深度学习火起来之后，我们主要是基于数据。那么接来下大的范式会是什么呢？一个可能的方向便是类脑，即看人是怎么产生思想的，通过模仿人的思考过程来进行研究。

从应用来讲，刚才华刚老师提了几个方向，但这都是可预见的。我觉得，思考这个问题，还得回到哲学层面上，计算机视觉本身更多的是把人的意识世界和现实物理世界进行融合，最终达到我们无法区分到底什么是虚拟、什么是真实的地步。这是我们发展的终极状态，我认为商业落地可以尝试从这个角度来往回推演，从而得出什么才是值得做的应用场景。

点击阅读原文，进入智源社区参与更多讨论。

关于我们

北京智源人工智能研究院（Beijing Academy of Artificial Intelligence，简称BAAI）成立于2018年11月，是在科技部和北京市委市政府的指导和支持下，由北京市科委和海淀区政府推动成立的新型研发机构。

//智源研究院简介

///

学术思想 | 基础理论 | 顶尖人才 | 企业创新 | 发展政策

你可能感兴趣的:(大数据,算法,编程语言,机器学习,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理