人工智能与算法学习

如何看待 2022 年秋招算法岗人间地狱？

来源：知乎

文章转载自知乎，著作权归属原作者，侵删

Dr.Wu（NLP搬砖师，就职于微软亚研）回答：

结合最近几天的热点，所谓的“AILab”名存实亡，和在工业界Research Lab 实习+工作8年的经历，我好想好好答这个题。

一切的最开始，请明白你自己想成为研究员还是算法工程师，对于junior的同学们两个角色并不互通，对senior是互通的，可能因为主要靠管理技能吧 = =

研究员：追求关键问题突破，希望研究出Resnet、BERT。影响力大于一切。优点：压力小一些，听起来酷一些，有退路去高校。缺点：门槛太高，对公司没啥用，可能会被砍。

算法工程师：追求应用已有算法在业务。业务价值大于一切。优点：岗位门槛低，如果核心业务做的好，上升通道快，带团队机会大。缺点：辛苦，容易拥抱业务变化，业务的运气因素很影响个人发展。

如果选定了，请坚定不移的为之努力，并且尽量避免去业务部门发paper，或者在研究部门做杂活这种角色，那样很拧巴也不持久。也避免来回横跳，职业生涯是一场投资，一步步积攒。如果是研究员要追求业界的同行之间的影响力，算法工程师请选对业务，选对业务成功了一半多。

我其实对中国未来ailab们的发展是有信心的

1、因为国际关系问题，对技术的投资是政治正确的。

2、其实也花不了多少钱养一个research team，相比大公司的营收

3、Research team对公司的广告效应，和吸引人才还是有帮助

4、技术是颗科技树，很多时候摘果子的时候，是因为树干已经足够粗壮了。

所以，新毕业的同学们完全不要听风就是雨，觉得各个公司ailab都黄了。想成为researcher的同学们，完全可以去ailab认真做研究（别灌水）。

千万不要被最近几天AILab都名存实亡的错误舆论影响。虽然有些公司的lab据我所知是发展的不好，但业界还是有很不错的ailab。

最后给大家个工作2年多的感想吧，对于走研究员track的，想挣钱去阿里、字节，很有竞争力；想踏踏实实做做研究，去腾讯和微软。Follow your heart，不要被舆论影响，公司Ailab的兴衰更多的和公司本身的发展相关，如果公司一直盈利，业务没问题，ailab不会挂的。

最后，我不太喜欢ailab这个名字，research lab可能更正确。

谢流远（深度学习优秀答主）回答：

好像没人提一个事：算法部门的人地矛盾越来越激烈了。

ai发展依赖算力增长，但是近年来单卡算力增长放慢，大家开始扩大分布式，结果是调研需要的资源越来越多。同时算法工程师也越招越多，每个人能分到的实验次数越来越少，有的地方一个人平均一个月开不了一次实验，人地矛盾突出，能有多少产出取决于能抢到多少资源。

求职卷，进来了做实验也卷，卷翻天。

郑华滨（商汤CV研究员）回答：

看到解大

@谢流远

的回答提到了算法部门的“人地矛盾”，我也来贡献一个观察到的矛盾点：汇报宣传时高大上的算法模型，与实际干活时主导成败的脏活累活之间的矛盾。理解了这个矛盾，一定程度上就可以解释，为什么一方面很多学生觉得算法岗很难找，另一方面企业又总是吐槽算法岗很难招了。

有很大一部分算法从业人员，在尚未深入一线业务落地的时候，接触到的最多的信息就是各种高大上的算法模型。大家喜欢兴致勃勃地谈论最近又出了一个什么魔改变形金刚，又出了什么即插即用的涨点神器，ImageNet又被刷爆了，XXX又被屠榜了，PapersWithCode某个Leaderboard右上角又冒出一个新的SOTA散点了，超大模型的参数量破万亿了……他们对于AI技术的理解主要来自于一篇篇顶会论文上的漂亮故事，或者是各大公众号上花团锦簇的PR稿。其中功力较为深厚者，对各种网络结构、训练技巧如数家珍，能对某个领域近年来代表模型的演进路线侃侃而谈，各种设计的insight也能阐述一二。

我说的这部分从业人员，不仅仅包括实验室里的学生，还包括一部分已经身在企业、但是偏中后台技术支持的算法工程师。事实上，一两年前的我也是这样的认知。

但是当这部分从业人员深入一线业务之后，就会发现，算法模型在实际工作中可能只占20%，剩下80%的时间都在围绕着数据做很多脏活累活。在一些成熟任务上如简单的图像分类，算法模型占据的比例可能会更少。他们会发现自己熟知的那些”黑科技“其实作用有限，有时候费了很大劲，把三年前的技术换成上个月的技术，性能也就提升了一小截，而且就到此为止了。当然，有野心的算法工程师会想，我上我也行！我也要来魔改网络结构，拼凑训练技巧，在自家业务上提点！不过这种尝试往往不是以失败告终，就是只提升了可怜的零点几个点，也许还不如毫无技术含量地调调几个超参数。

与之相反，对数据的处理往往可以带来大幅度的、持续的提升，可行的手段除了粗暴地标注更多样本，还包括重新审视原有的标注规则是否合理，现有数据集标注质量如何，要不要定义一些细粒度的类别来辅助模型学会更微妙的语义，当前的模型经常在哪些场景下出问题，能不能从其他数据渠道补充这些场景的样本……上面列举的还只是一些粗糙的思路，很多一线干活的算法工程师肯定还能举出更针对具体任务、具体场景的操作，比如做NLP的朋友就告诉我实际工作中”正则表达式yyds“，当然这种经验在CV任务上就没什么大用了。

于是，实事求是的算法工程师开始深入一线之后，顶着业务指标的压力，很快就会用脚投票，不再花费过多精力在算法模型上，而是老老实实把一些数据上的工作做好，因为他们知道，算法模型不关键，follow最新的黑科技只是锦上添花，唯有数据才决定了业务落地的成败。

但是问题就来了，算法工程师做完这些脏活累活，达成了业务指标，等到向上汇报、对外宣传的时候却傻眼了。有些领导并不关心你做了多少实在的工作，只想听到你用了什么最新技术；有些领导尽管明白业务落地的关键在哪里，精力应该放在什么环节，知道但架不住总还有更上面的领导，要求在汇报中体现出「技术水平」；就算上层领导确实很懂行，但又架不住对外宣传的时候，也没办法把那些实际的工作讲出花来，必须包装成花里胡哨的先进技术，才能体现自家的技术壁垒，对群众秀肌肉，对同行放烟雾弹。

这样一层层压力传导下来，一线的算法工程师难免就会动作走形，甚至会慢慢形成「双重思想」：实际干活时用的都是简单粗暴有效的东西，汇报宣传时又要强行包装出一个又一个fancy的故事。

既然形势如此，很多聪明人就会慢慢拥抱这种评价体系，不管实际干活的时候怎么玩，最后一定会想方设法讲故事、发论文，企业会拿着这些「先进技术」出去宣传，各种AI自媒体也乐见其成。于是很多尚未深入一线的从业者每天看到的，就都是各种高大上的算法模型，为了跟上潮流，他们也卯足了力气卷这些东西，凑成一份份光彩夺目的简历送到面试官手上。可是这个时候，一线出身的面试官可能又开始「双重思想」了：业界平常大力鼓吹的是这些东西没错，但你是要来实际干活的，我得考察你实际干活的能力如何，不然来了拖后腿，团队业绩不达标，我们也有压力啊！

于是，招人时实际考察的，与平日里大力鼓吹的，就产生了脱节。

而且这种脱节有愈演愈烈之势，因为追求高大上的业界舆论影响汇报宣传的导向，汇报宣传的压力又反过来诱导出更多高大上的算法模型，会形成一个正反馈的闭环；而另一方面，即使算法工程师从业务中打磨出了简单粗暴有效的方法，也缺乏汇报宣传这两条重要的内外渠道获得足够的激励，形不成正反馈，散落的单点进步无法连成一片，就会被一直雪藏在算法工程师自己的脑中。

可以把上述逻辑总结为这么一张图：

当然，这些只是我的一家之言，有不同观察或意见的话，欢迎在评论区留言。

匿名用户回答：

很快大家就会用脚投票选不选算法。

如今互联网显然已经进入红海期，人快手字节都不大小周了，你以为真是人大发善心吗？是过了无脑增长，处于内部改进增效的时候了。（怎么增效呢？精简机构和人员，我相信你学过。）

算法现在无非就搜广推还有些cv，分单什么的。现在dnn发展到transformer阶段，提升的点其实已经越来越少。之前的算法，随便搞个数据喂一喂就能有很大提升，现在呢？有些人可能会说，高深的算法工程师结合业务，嘻嘻，那跟你发了多少论文，撸模型多强有啥关系？结合业务的，开发工程师就不能做？

现在基本上已经算法开发同酬了。你搞算法，要顶会，要比赛，要清北，要博士，何必陷入这种机致内卷的环境中？算法就业地区也很受限制，你做算法，就意味着以后要在一线买房生活工作。无他，很多二线算法岗都没有。开发哪里都需要，很多业务系统都要有人维护，实实在在的常青树，以后还可以上岸考公对口。

现在ai四小龙都活的很艰难，对于我们普罗大众来说，何必跟这些清北，博士卷来卷去，自讨苦吃？你看着现在小盆友个个顶会难道心中不慌？

看看国外，做算法的属于research scientist，基本就博士做。别的都是做sde的。

再看看今年zhihu热榜，清北博士一年毕业人数，以及各大人工智能班毕业人数，我相信你知道怎么办。

当然，你要是什么icml nips pami随便发，那你选啥都不要紧，因为你是强者，没有的话就另当别论吧。

夕风Twilighty(布朗大学，理学硕士）回答：

算法岗这个东西在国内互联网IT业界不是新事物了，像MSRA和百度这种老牌AI劲旅，从本世纪初就已开始深耕所谓的AI“算法”领域。但是就毕业生市场的“火热”程度而言，2015-2018年算是第一次需求高峰期，这一是得益于DL在全球工业界实打实地创造了一波收益，各大名企纷纷“抢人”以建立技术后备军；二是以AlphaGo, Transformer为代表的一众学术突破刷爆了存在感，从2015年开始，用机器学习和深度学习炒菜几乎就是各大工科细分领域（不限于纯粹的计算机界）的财富密码；三是硬件算力提升以及随之而来的Theano, Tensorflow等DL框架的出现大幅降低了入门学习乃至后续深入研究的时间成本；由此，算法岗以毋庸置疑的高门槛和高待遇，跻身校招技术岗的就业鄙视链顶端，并逐渐成为内卷红海，是自然而必然的事情。

据我观察，自18年之后网上对算法岗“劝退”和祛魅的声音就逐渐多起来了，这一方面是由于工业界的萝卜坑不再大幅增长，15-18年以AI四小龙（主要是搞CV的商汤旷视等）和阿里达摩院为代表的一众“高纯度”萝卜坑提供商，在2021年的今天看来都有些后劲不足的味道[1]；另一方面，当下学术界和工业界所看重的能力矩阵也出现了一些不同，一般地说，学术界更看重硕博同学将idea的故事讲好、并将这个idea用严谨专业的实验结论支撑起来的能力，而工业界则愈发注重实际工程中落地、处理“脏”问题的能力。这种能力要求的不同，在前些年是可以忽略的，因为在当时所谓“神经网络”对绝大多数在校生还是个新鲜玩意，一个候选人有基本的代码能力、合格的ML\DL知识储备就已经很了不起了。而现在的同学要去竞争算法岗，要么需要用足够分量的paper来为自己的学术水准背书，要么则需要拿出很有说服力的实习经历、工程项目经历，这些都不是在学校实验室里“按部就班”就能做到的。

但是有必要唱衰算法岗，有必要无脑劝退吗？没有必要。因为岗位的选择说到底都是一个小马过河的事情，科班出身、coding能力过硬、实验室经历丰富、同时也有大厂算法实习经验的同学，面前仍然摆着大量的机会。但对于基础知识不很牢固（比如临时转专业方向）、相关经历比较欠缺，但眼下又面临就业窗口的一些同学而言，建议还是冷静看待算法岗与非算法岗之间的差异。这既不是“劝退”也不是“打鸡血”，只是说要实事求是，稳扎稳打。

其实仔细分析目前的行情，算法岗明显存在着“理论”和“工程”的两极化，“理论”性高（也就是上面所说“高纯度”）的岗位，一是需求基本见顶，二是门槛水涨船高，曾经硕士生卷一把就能来的岗位，现在可能都是在那些手握一众顶会的博士中筛选了。而至于更偏向“工程”的岗位，CV和NLP岗经历了15-18年那个时期的野蛮生长之后，目前可以说处在一个整合和沉淀的阶段，未来一段时间内的岗位增长和内卷下降，恐怕会是很有限的。而更靠近一线业务的搜广推（搜索、广告、推荐）作为互联网的cash cow，还是提供了不少的就业机会，对于那些实际项目经验丰富，同时也具备过硬知识基础的同学而言，仍然是一个值得进入的赛道。

参考

^https://www.jiemian.com/article/5889079.html

地址：

https://www.zhihu.com/question/453325429

——The End——

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

如何看待 2022 年秋招算法岗人间地狱？

你可能感兴趣的:(算法,大数据,人工智能,java,编程语言)