极市平台

半路出家OCR后成领域专家，白翔：计算机视觉科研没有捷径

极市学者专访｜第三期
“听大牛说说计算机视觉那些事儿”

本次极市学者访谈，我们非常荣幸地邀请到了华中科技大学白翔教授。白翔教授是计算机视觉领域的优秀学者，也是场景文字领域的知名大牛。在本次访谈中，白翔教授不仅分享了他对于人工智能行业、场景文字检测与识别技术发展的前沿观点，还为当下的计算机视觉科研者们分享了他非常宝贵的科研经历与心得。

每一位科研者都走过一条属于他自己的科研路。那么白翔教授的科研路是什么样的？下文即答案。

白翔，教授，IAPR Fellow。研究领域为计算机视觉与模式识别，文档分析与识别。已在国内外刊物和学术会议上发表论文180余篇，谷歌学术显示引用15000余次，h指数63 ……

这是白翔教授目前的学术成就。可以说在国内计算机视觉研究领域，白翔教授所处的位置是比较高的。而这份成就的取得，可以从他的学生时代说起。

白翔教授于2003年、2005年和2009年在华中科技大学取得本科、硕士及博士学位，2007年获“微软学者”奖，读博期间以第一作者在计算机视觉最具影响力的期刊PAMI上发表了3篇论文，并于2011年获湖北省优秀博士论文。可以说，他在学生时代就是出类拔萃的。

但即便如此，白翔教授也有过被拒稿的经历：

在硕士研究生求学期间，他写了一篇论文投到《软件学报》这个权威期刊上，该文章在投稿前在导师的帮助下至少修改了15遍，最后被拒稿。后来，经过不到两年的努力，白翔教授就在PAMI上发表了2篇论文，同时为SCI核心源杂志Pattern Recognition担任审稿人。

当时的他将这一成功简单地概括为两点：坚持+兴趣。

白翔教授说：“硕士阶段的积累很重要，它为后面出成果打下了基础。学习的收获，不能仅仅用发了多少论文来衡量。其次，计算机视觉研究确实是我的兴趣所在，我是在享受这个过程，名利并不是做研究的目的。”

作为年少成名的科研者，让人意想不到的是，白翔教授也有过找工作被拒的经历。硕士毕业后，他曾进入某国际知名企业的最后一轮面试，但没有获得Offer。

短暂的动摇之后，他坚守了自己的信念：“在找工作的时候，我发现我更喜欢研究我自己感兴趣的东西。我选择了继续攻读博士，因为我觉得前面的研究工作没有完成，这时候放弃比较可惜。”

后来，事实也证明，留在学校继续做研究，是他正确的选择。

在这次访谈中，白翔教授非常耐心地为我们答疑解惑，在分享他在计算机视觉领域的科研经历的同时，表达了他对于深度学习学业与产业的思考。相信下文的访谈实录能为你的科研工作与生活带来不少启发。

01 关于科研

“坚持的力量”

极市平台：您在计算机视觉领域造诣深厚，能否分享一段您印象最深的科研经历？

白翔： 印象比较深的是2011年到2013年间，我面临着选择新研究课题的问题。因为我在博士阶段做的是形状表述与图匹配相关的工作，相对来说比较基础。当时的我特别想尝试一下应用基础研究。研究方向的选择是比较重要的，我花了相当一段时间去思考后，选择场景文字检测与识别这个研究课题。我认为该课题具备较高的应用潜力。

进入该领域前期是一个非常困难的阶段。当时的场景文字检测和识别是非常繁琐的问题，它涉及到很多算法，要实现一套有效的解决方案，需要花大量时间去摸索。具体来说，文本不同于一般目标，是由多个非连通的字符组成，这就要求在算法实现中增加较多经验式的操作。在传统的区域特征提取方法之上，需要完成字符之间的关联，同时需要克服虚景或非文字部分带来的干扰。此外，当时可供参考的开源代码非常稀少，导致在前期摸索中走了不少弯路（这也是之后我们开源了多篇论文源码的重要原因）。

尽管困难重重，我跟学生更多强调的是不要着急写论文，要静下心来解决实际问题。我们花了大量时间去反复论证，这一过程也积累了对该研究领域的深刻认识。后来大家看到的这些论文其实跟这段时间的积累是分不开的。

当时，我们观察到许多照片中的文字并不是呈水平方向排列，很多是倾斜甚至是弯曲的。因此，我们希望做一套方案，能克服当时场景文本检测方法的局限性，通用于各种形状的文本。回头来看，现在多方向文本检测技术已经很普遍，并且这种方式在遥感目标检测领域也被普遍采纳，但这些都离不开当时做研究的这股韧性和坚持。

极市平台：您在计算机视觉领域少年成名，在读博期间就以第一作者发表了3篇计算机视觉顶级期刊TPAMI论文，那么您认为对于一个计算机视觉博士而言，什么是完整、全面的博士科研训练？

白翔： 我觉得首先要有兴趣，兴趣才是最好的老师。按照王国维人生三种境界，初入领域的研究生需经过从第一阶段“独上高楼，忘尽天涯路”通往第二阶段“衣带渐宽终不悔，为伊消得人憔悴”的过程。如果仅仅是把科研做为完成学业的任务去完成，而不是发自内心的喜欢这项工作，是很难在所从事的研究课题上获得突破的。

当然，兴趣也是可以培养的，但必须建立在对计算机视觉研究有一定的了解之上。另外，需要具备一定的程序设计基础，毕竟这是一个偏应用的学科，对实际动手能力有一定的要求。良好的数学基础也是必要的，例如概率论、线行代数有关基础知识。但最重要的不是具备多少基础，而是怎么去做这个事。

对于初入研究的学生，我一般会建议他们去参加一些学术竞赛或实战项目。这种方式能让学生深入了解实际问题，清楚该领域的真正瓶颈所在。阅读文献或者听他人的报告，这虽然有助于快速获得一些经验，但对研究入门者而言，它更多只会带来感性的认识。要获得理性的认识，就需要接触实际的数据、实际的算法和系统。对研究问题的认识越深刻，就越有可能突破其瓶颈。

02 深度探讨OCR领域相关研究

极市平台： OCR在实际应用中经常碰到这样的情形：不同语种、不同形式的文字同时存在，在这种情况下，学术界是否能有较为通用的方法，来解决这一问题？

白翔： 对于文字的多样性的问题，学术界的考虑其实是不够的。为什么这样说？首先，文字数据与其他数据相比不是那么丰富，开源的数据规模和种类相对偏少。基于这种情况，我们也在考虑组织构建大规模文字数据集。另外，文字数据很多时候是涉及到隐私的，比如手写字、发票等，都是不宜对外公开的。第三，文字的标注也比较复杂。对于一般物体，只需一个包围盒即可；而对文字进行词或行级别的包围盒标注不一定足够，例如汉字，字符级别的标注往往是需要的。特别是对于连写的手写字，标注起来更加繁琐。

我们之前的算法基本都是出于使检测和识别过程简易化的目的，对文本行或单词直接处理。但如果要把它做得更加的鲁棒和通用，字符级别的定位与识别也是有较明显的提升作用的，这也体现在最近一些新的研究工作中，例如Mask TextSpotter，CRAFT等。但不管怎样，要解决通用OCR这一难题，学术界缺乏数据类型丰富且标注精细的大规模数据集。从另外一个方面看，小样本或者无监督条件下的文字检测识别方法目前鲜有学者对此展开研究，这可能是解决通用文字识别的一个途径。

总体而言，要实现通用OCR，还要有很多工作需要做。这不能靠一个人来做，它需要工业界和学术界的紧密合作，通过制定有关的标准，以及基本数据集和评价方法，才有希望解决这个问题。就现阶段来看，文字识别技术泛化性尚可，因为它使用合成数据来进行训练就可以取得稳定的识别精度，而文字检测技术的泛化性还存在较大问题，易受环境的影响。但如果遇到版式或结构极其复杂的情况，两者都会遇到极大的困难。

极市平台：对于一个场景文本研究者而言，若想取得一定的学术成就，您认为与其他细分领域相比，会有哪些侧重？

白翔： 研究没有捷径可走，但有方法规律可循，这和做什么细分领域没有太大关系。无论哪个细分领域，没有明显的难易之分，都会面临极大的挑战。那么对于如何做好计算机视觉相关研究，我个人比较注重是否真正的尝试去解决所在方向的瓶颈问题？打个比方，场景文字往往是多方向排列的，但传统文档文字识别方法一般只关注水平排列的文字，这就要求我们对检测算法的适用性提出了更高的要求；做文字识别时，发现适合于英文的方法不适用于中文，如何设计一套方法，同时适用于拉丁文（英文）和非拉丁文（例如中文）？因此，需要找到现阶段限制该技术发展的瓶颈问题，并围绕这些瓶颈问题去突破技术的上限。通过技术的创新可以解决很多问题，但这个问题是不是重要的？是不是卡脖子的问题？当你在做研究的时候，你需要给自己定的一个目标。目标导向正确了，剩下来要做的事情就是如何去解决它。这个过程你会经过反复的验证，大胆的尝试，甚至可能经历无数次的失败，但不要害怕失败，因为失败本身就是经验的积累，是提高自身水平的过程，是成功之路上必须经过的环节。无论做什么样的研究，对于年轻学者而言比较困难的是如何做到不忘初心，在研究过程中需要反复思考你的研究是什么？解决的这个问题是什么？要把它做到什么程度？是不是能给这个领域或者子领域带来技术上的突破？这是关键。

03 关于产业

“计算机视觉离全面落地还有50步要走”

极市平台：作为场景文本领域的集大成者，您认为这个领域还有哪些值得研究的课题与应用？是否还存在一些被人们忽视的方向？您最近正在以及未来打算继续深入研究什么课题？

白翔： 虽然计算机视觉热度非常高，但其中很多技术和方法在实际应用中存在非常大的限制。比如手机端的OCR识别程序，在应对夜间街景图片时会错漏百出。对此，我的看法时，要实现计算机视觉全面落地，深度学习与传统视觉方法可能已经带我们走完了前50步，后面仍然还有50步要走。

在这种情况下，我觉得目前有这么几个方面可以值得去尝试。首先是图像合成技术。目前基于生成的方法，已经取得了一些非常逼真的效果。在一些特定领域会有一些实际用途，包括图像数据生成与扩增，人的服饰搭配，动画制作，视频剪辑等。

另外还有多模态融合与感知。人类在识别物体时候，其实是有其3D或其它先验的，将图像信息与点云或来自其它传感设备得到的信息相融合，可以取得更加可靠的识别效果。例如，国内有些研究组结合红外成像在视频监控中取得了理想的应用效果；我们最近将临床数据与CT影像相结合，在新冠重症预测任务中获得了更鲁棒的测评性能。再举一个例子，要获得更准确的视频行为识别（例如电影片段）需要结合图像和文字甚至语音的方式。

第三，我认为计算机视觉在对地观测领域的应用基础研究将有较大潜力。现有的视觉研究大多面向监控视频图像或日常生活图像，而航拍图像存在目标尺度变化大、方向性强、形状和分布更复杂的特点，从事该方向的研究能够给更多潜在实际应用带来想象空间。

最后，从行业应用来看，计算机视觉在智慧教育和工业质检中将大有可为。随着文字识别与语音识别技术不断进步，已经可以看到计算机视觉在教育领域展露头角，比如公式识别在自动阅卷的应用。而工业缺陷的自动检测能大大减少工业产品质量检测过程的人力成本并且显著提升效率。无论是智慧教育还是工业质检中的视觉技术都存在着较多科学问题和应用问题亟待解决。

极市平台：在计算机视觉研究领域中，精度和速度一直是两个很重要的要素，那么您认为，应当如何取舍模型的精度和速度？

白翔： 我跟很多工业界的朋友们有过这方面讨论。之前我一直很奇怪一件事情：我们2015年底提出来CRNN算法，为什么工业界现在还在用？我们后面提出来的一些更鲁棒的方法，他们反而不用。后来工业界的朋友告诉我，CRNN一般情况下就够用了。在企业的实际应用中，还要考虑模型的大小和运算的速度。像BAT这样的大型互联网公司，每天都有上亿的图片要处理。从实用性角度来看，如果一个算法太慢，即使它精度很高, 但是时间消耗太大，这些企业是无法接受的。

计算机视觉领域中的很多方法，精度和速度往往是互相矛盾的，如何在精度和速度中（甚至还包括能耗）找到一个平衡至关重要。说到底，计算机视觉是一个面向应用的研究领域，一定要了解实际应用的需求，要考虑精度和速度两者的推动。如果应用基础研究问题的定义不从实际应用需求中去总结，那就有点纸上谈兵的感觉，甚至会把一些研究方向带偏。

极市平台：您如何看待学术界和工业界的关系？您如何看待研究生、博士生找工作、找实习这一问题？

白翔： 这个问题问得非常好。现在工业界对人工智能的技术和人才的热情非常高，导致很多教授或优秀学生，都高薪去了工业界，那么这就不是一个稳定的状态。如果说去工业界的高端人才越来越多，就会削弱高校培养高端人工智能人才的能力。过去一两年我在加拿大、美国交流期间，也听到了一些要把教授、学子还给学术界的呼吁。也有少数企业取代了高校的部分功能，对实习学生进行科研训练和指导，甚至发表了高水平论文。总体而言，工业界和学术界之间现在关系已经非常密切，合作产生的研究成果也屡见不鲜，但学术界与工业界的合作形式不应主要放在学生实习方面，我更加看好通过共建校企联合研究实验室的方式，这样可以把学者留在高校，同时也能保证足够的产学研合作。

目前有很多学生可能对实习的热情度较高，但高校教师也需要研究生参与完成自己正在承担的科研课题。总体上我比较支持学生去实习，但我希望学生去实习之前已经具备了一定的研究基础和技术创新能力。这样能更加有效地帮助企业在产品线或研究端进行技术升级，同时也有助于学生增加实战经验。另外，我会注意保证学生的实习任务和研究目标的一致性。具体来说，我会建议研究生找一个跟自己开题研究方向相同或密切相关的公司部门或研究组去实习，避免研究任务跨度太大。因为研究是需要专注的，尤其对于年轻学子，频繁换研究主题会影响做研究的深度。

如今，发表顶会论文已经成为研究生入职的一个重要评价标准，这导致不少研究生在学习阶段加强了对顶会论文或学术竞赛的追逐，却忽视了其它素质方面的锻炼。事实上视觉有关企业的主要任务是推动科技产业进步，推动科技产业进步和发表多少论文没有直接关系，发表论文也不能直接证明其推动了科技产业进步。对此，我还呼吁工业界要看重人才的综合素质，而不能将论文作为评价人才的唯一导向或主要导向。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
我的黑历史袖手围观有来有去
孩子同学与我们一起共进晚餐，俩孩子加我三个人。小同学是一个大方率性礼貌的小孩，我们也都非常喜欢。好了，回到正题上来让我把这个故事讲完。俩孩子都喜欢吃鱼，所以就发生了小孩子之间常会发生的事。我狠狠的盯了我家孩子，孩子表情有些狼狈。和孩子单独一起的时候，见她尚未释怀，并谴责我不该狠盯她，让她没面子。也许是她触动了我的童年往事吧。由此，一狠心，给她讲了一段埋藏心里极深的黑历史：我奶奶有四个儿子，四个儿子
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
《我的青葱岁月之缘来是你》第二章迎新晚会思源思缘思怨
“怎么你也来了这里？”我愉快的问到，想着这是上天给的缘分吗？我还没去找他竟然就相遇了。那个让我开心的老乡。“你好，我也是舞蹈社的新人啊！”他说，笑起来回答我，眼睛弯弯的。“这么巧，我叫吴倩，你叫啥？”“我叫韩欢，你也是B市人吧，c中毕业的？”“我不是，我是f中的，不然肯定会认识你的”“是吗？以后多多关照了”他还冲我眨了眨眼睛。内心一阵悸动，这是……回到寝室，我兴奋的告诉我的室友这个事情，我再次觉得
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
安徽省这个湖,比西湖大8倍,称是安徽的北戴河, 合肥的后花园旅游小号角
旅游爱好者都知道，安徽省是一个旅游资源十分丰富的省份，且不说黄山、九华山、天柱山这三大名山，单说湖泊就不比其它省份少，今天我们一起走遍世界将为大家说说一个号称安徽北戴河，合肥后花园的湖泊，看看到底是哪个湖泊？话说，这个湖泊位于安徽省六安市舒城县境内，东距合肥50千米，大约一个小时左右的车程，它号称是合肥的后花园，安徽的北戴河。相传，湖畔石壁之上有一奇石神似观音临湖，湖中漂动众多小岛栩栩如佛子，宛若
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
红手套节马小媛为中国城市环卫者公益发声：今天我手红疏狂君
#红手套节#公益活动，线头公益以及同多方资源的共同努力我们邀请到了线头公益大使马小媛马小媛，1993年5月3日出生于江苏省南京市，中国内地新生代女演员。2015年马小媛参演网剧《余罪》，饰演警校校花安嘉璐的闺蜜。2016年马小媛主演系列电影《丽人保镖》中女一号林欢馨，正式出道。此后，马小媛陆续接演了电视剧《警花与警犬2》，在网剧《你美丽李美丽》中担任女主角李美丽。拂晓，当你还在睡梦中时，这座城跟你
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
骑昆明到北海—119 砚山县 61清风i
从十年前第一次长途骑行青海湖开始每年一次长途骑行看风景，尝各地美食，探访异域文化，记录途中美食美景美事，已逐渐形成习惯。每年春季详细规划好线路，夏季出行，2020年因为疫情迟迟不能确定线路和行程。总算到了暑期疫情逐渐消失，规划了50多天的云南昆明—广西北海计划。本次行程从云南昆明出发到广西北海市结束，五十一天骑行二千多公里线路昆明-官渡古镇-环滇池--澄江市一抚仙湖—路居镇--江川区--通海县—龙
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http