笑傲NLP江湖

AI行业分析与面试指南

原创：晏茜
资料来源：陈旸

近年来，人工智能行业的受欢迎程度是有目共睹的，越来越多的人想要加入 AI 这个行业。但是在我们正式开始求职之前，应该进行理性的分析，了解现阶段 AI 行业的发展趋势，AI 行业需要什么样的人才，AI 人才需要掌握什么样的知识技能才能谋求更好的职业发展机会，本文将带大家深入了解 AI 发展趋势和 AI 人才必备技能，希望能够帮助求职者找到正确的方向。

本文将大致分为三个方向。首先我们先带大家了解一下我们所处的时代有哪些关键的技术变革；其次，会带大家了解除了大厂以外，还有哪些传统的行业也在做数字化的转型，这些行业同样值得 AI 从业者去考虑；最后，会介绍在我们的求职面试过程中有哪些需要注意的地方。

1. 云计算、AI、大数据的区别与共生

相信大家都听说过云计算、大数据、人工智能，可能还会对他们有一定程度的了解，那么请问这三者之间有任何的联系吗？他们是相互独立的，还是互生依赖的呢？其实，无论是云计算、AI 还是大数据，都属于朝阳行业。云计算像是一个底层的存储的框架。云计算的岗位广泛存在于互联网企业中，比如，阿里云、腾讯等等，如果你能去这些公司的云计算的相关岗位去工作的话，也是非常好的选择。大数据的岗位职能主要是大数据的治理，还有大数据的运算，实际上很多的算法也是在海量的数据中进行运算的。举个例子，比如京东要上架一本新书，这本新书叫做《数据分析》，针对这本新书，我们想要找到它的潜在的用户去做推送，那么我们如何去做呢？据统计，京东每天的订单量大约有 1000 万单，那么一个月的订单量就会有 3 亿左右，这个数量级是非常惊人的。如果按照更长的时间线的话，我们的用户行为数据是一个海量的数据，所以直接用 Python 其实是无法解决这么大的数据量的，这就需要底层的一个大数据，所以我们可以利用基于 Spark 等大数据处理框架去跑一些数据建模，去预测一下哪些用户会对这本书感兴趣，并做推荐。这是大数据的一些底层的技术。人工智能技术大家应该会更加了解，这里不做更多的介绍。

云计算、大数据和人工智能这三个部分其实都可以把他们称之为新基建，也就是我们在科技领域中所处的第四次革命。在前三次工业革命中，每一次都给我们带来巨大的生产力的变化。在上个时代，出现了电脑、互联网，而现在我们整个的新基建更像是一个机器，它把云计算、大数据以及 AI 串联到了一起。

如图所示，我们的底层是一个云计算，在做计算的过程中，有越来越多的数据会被放到云端，如果你在互联网公司工作，公司一定需要一个 IT 的支持部门，这个支持部门一定会有很多的服务器一起帮你去完成运算，所以，底层可以是私有云，也可以是公有云。中间层是大数据，大数据需要有很多的结构，包括数据治理和数据安全。数据治理的目的就是要把数据标准化做成一个中台，如果公司想要更好的去支持他的业务的发展，就需要有一个强大的中台，这个中台会把数据标准化、规范化，从而让所有的业务部门都可以看到一个相对干净的、标准的、唯一的数据，这是我们的大数据中台。最上层是人工智能。

国内互联网大厂（新基建战场）

在 AI、大数据和云计算这三层架构中，哪一层架构与业务最接近呢？与业务最接近的架构一般指的是能够直接看到结果的那一层架构。不难发现，人工智能其实是离结果最近的，也就是离业务最近的。

我们可以发现一些大厂也在做一些布局，这些互联网公司其实是在做底层的基础设施的建设。比如以华为云为例，华为云做了一个工具，叫做 ModelArts。ModelArts 这个产品实际上是一个自动机器学习的产品，业务人员将数据上传之后，它就可以自动完成模型的搭建，同时也可以自动的完成部署。所以从模型的标注环节，再到数据的预处理、建模、上线、评估，一系列的过程都是通过这个产品来完善的。腾讯云做了一个偏向于云计算的架构，名为 Serverless。如果你在百度工作，一般会使用百度自主研发的深度学习技术框架，Paddle。目前，在国产的深度学习技术框架中，Paddle 是排名第一的框架，它的使用量是非常高的。阿里云目前在做的一件事叫做数据中台，阿里云体系里面有两个产品跟数据中台是有关系的。一个产品叫做 DataWorks，另外一个产品叫做 MaxCompute。DataWorks 是数据治理的工具，包括底层的数据的集成、清洗等等，MaxCompute 可以做各种各样的大数据的运算。

阿里云还有一个很好用的产品叫做数据银行，数据银行里面有它独一无二的数据，也就是每个人的淘宝的用户画像。大家应该都会使用淘宝，也会使用支付宝、微博、优酷，或者哈啰单车等等，这些产品都是阿里系产品。而只要是阿里系产品，他的数据就会流入到阿里的数据银行中。这个数据银行会给每个用户打上大约 2000 个标签，这样就形成了阿里对用户的洞察，而且阿里以人群画像的形式将他所获取的数据开放了出来。为什么阿里不把他最直接的、个性化的 ID 画像提供给我们，而是提供了人群画像呢？假设我们输入某用户的手机号码，数据银行反馈给我们一些信息，包括该用户的个人信息，还有他经常去哪些地方，有什么样的购买行为，他的月均消费是多少，曾关注过哪些品牌等等，这就像是用户的流调信息。如果阿里将这些最直接的信息开放给你，他实际上是没有开放到底层的技术的，并且这些信息属于用户的个人隐私，是涉及到数据安全的。所以，数据银行开放给我们的的不是 ID 的力度，也就是某一个人的数据，而是整体的人群画像。

那么什么叫做人群画像呢？简单来说，人群画像就是对用户群体的整体统计，比如说我们要做 2000 个人的人群画像，我们可以在微博上找到 2000 个 ID 组成一个人群包，我们把这个人群包放到数据银行中，第二天（T + 1 天）我们可以拿到该人群包的报表，它会告诉我们这个人群包里面用不同品牌手机的人的比例是多少，他们更倾向于用哪种型号的手机，还有他们的性别、年龄、学历、人生状态等等，这时我们得到的是一个相对比较抽象的人群画像，这个人群包就可以帮助我们做用户的洞察。那么对于企业来说，这样的人群画像是否是有价值的呢？笔者曾询问过很多企业，这些企业都觉得是非常有价值的，甚至这个价值大于他们自有数据的价值，这是为什么？因为企业现有的自己对用户的洞察是非常稀疏的，事实上，他们很难收集到大量用户的行为数据，但是我们每个人基本上都在阿里的数据银行上有很多的行为的记录，所以对于企业来说，这种数据非常有价值的。而且如果企业获取了这样的人群包，他们就可以建很多新的人群包，如果一个公司有 10 个产品，分别是产品 A、产品B、产品 C 等等，而每个产品都有它自己的独特的受众，只要你能把产品 A 的对应的特定受众群体找到，那么就相当于有了产品 A 的人群包的具体的画像。

对于我们的数据中台来说，阿里提供了两种不同的技术，一是工具，包括 DataWorks 和 MaxCompute，这是云计算的产品，二是开放了淘系产品里面的人群画像，你可以自己去定义人群包，对用户行为进行洞察。

另外，我们看到了一些行业的趋势，比如垂直的生态。中国银联在做的金融云就是垂直生态的体现，中国银联联合旗下及合作过的银行，正在做金融云，并且他想赋能所有的银行金融的企业都来进行合作。

如上图所示，左侧是互联网公司在做的事情，右侧是他们的核心能力的输出。华为的 AutoML 的本质是给你提供一个基建，最终得到的是一个 AI 模型，企业可以通过华为的强大的算力，训练好自己的 AI。腾讯的 Serverless 可以做到非常弹性的部署，比如我们想要搭一个云服务，以前你是不是要买一台主机，这个主机一年大概需要 5000 块钱，对一般人来说，因为你的使用效率不高，一年可能只访问 10 次，平均一次就要花费 500 块钱，相对来说是十分昂贵的。对于腾讯 Serverless 来说，如果只访问 10 次，可能只花 1 块钱就够了。百度 AI 的 Paddle，我们可以把它理解成是我们深度学习的一个计算引擎，而且这个引擎也做了很多的预训练的版本。阿里云更主要的是一些技术，还有一些数据的赋能。

上图为阿里云的技术解决方案。他在给我们的银行提出解决方案的时候，会给到一个整体的方案。底层是他的云平台的基础设施叫做飞天大数据，中间部分是他的一些数据类型的产品，可以指导银行做一些相关的业务，而这些最终都是可以搭建在云原生这个系统上面去完成的。

如图是谷歌的 AutoML（自动机器学习）的页面，关于 AutoML 的使用，我们发现有一个有趣的现象，以前使用 AutoML 的通常是业务人员，因为业务人员不写代码，他们只能用这样的工具，通过网页把数据上传上去，点击按钮后，模型就出来了。而现在我们发现技术人员也在使用它。在去年的一个 CCF 的关于个贷违约预测的比赛中，就有一位选手使用了 AutoML ，并且取得了还不错的成绩。AutoML 把它每一步要做的事情标准化了，写成了一个流程，可以把它称之为 pipeline。这个流程是它内嵌的一套流程，我们只需要把数据给到它，选好你要操作的模式，它就会自动的帮你去进行建模，把这个模型选出来。

Google Cloud：不仅是计算平台，还拥有数据

AutoML 的鼻祖是 Google，在谷歌云上面提供了 AutoML 这个工具，这个产品的主导者叫做李菲菲。李菲菲在谷歌大脑的时候，做了 AutoML 这样一个产品。AutoML 有很多企业的受众，比如日本的电商的企业，Mercari 。Mercari 是一款在日本很受欢迎的购物应用程序（日本跳蚤市场排名第一），类似于我们的闲鱼。在这个 APP 上面，用户可以上传任意一张照片，就可以找到与它相似的一些商品。在这个过程中，我们其实是在进行拍照识别的操作，通过拍照识别判断出这张照片中的商品属于哪一品牌。而这样的操作，在以前我们是需要自己进行建模并打上标签的，可以说这个过程是非常繁琐的。而如果你使用了 Google 的 AutoML ，不仅会使操作更加便捷，同时也提高了效率。虽然 Mercari 自己在 TensorFlow 上训练的模型达到了 75% 的精度，但是使用 Google AutoML Vision 解决方案对图像进行分类，精度可以高达 91.3%，提升了 15%。所以我们可以发现使用 AutoML 不仅能够提高效率，而且得到的效果还会更好。

Google AutoML 世界观

AutoML 的收费模式是按小时来进行付费的，金额是每小时 20 美金，在国内，华为云一个小时的收费大约是 10 块钱。除了 GPU 租用可能需要花一些钱，Google 这个搜索引擎还会给你提供一些专业的数据，我们知道搜索引擎天生就可以拥有海量的数据源，在 Google 里面内嵌的 5 万张图片，它可以自动的帮你找到这样的 5 万张图片来做一些数据的标准。那么基于这件事的话，模型的效率就会更高。

所以我们得出结论，大厂在去做底层的基础设施建设的时候，在这个基础设施里面，我们可以直接使用云端的算例，甚至我们的数据可以来自于搜索引擎给你提供的基础的数据。模型的训练以前是算法工程师在做，现在我们可以直接用一个产品 AutoML 来帮助我们去做这件事。它替代了部分的算法工程师的工作，会帮助你去建一个模型，叫做自动机器学习。我们可以发现大厂已经已经开始涉足模型、算例、数据源这三个维度，他们希望把这三个维度整合到一起，让人们去使用，通过这样的方式，建模会比以往更加的容易。

不仅仅是谷歌，在国内也有很多的云厂商都在关注着这样的事情，2019年 9 月 18 日，华为发布计算战略，他研发出了目前世界上训练速度最快的 AI 集群：Atlas 900 ResNet-50，Atlas 900 只用 59.8 秒就完成了整个训练，它的速度是非常快的。

华为不仅是要进入硬件领域，他还想再做一个 AutoML 的产品。有这样一则新闻报道，2019 年，华为破格招录了 8 个博士生，这些博士生是刚刚毕业的应届生，而他们的年薪竟然达到了 200 万。在招聘的 8 个博士生当中，其中的两个博士生是专门研究 AutoML 的，后来华为推出自己的产品叫做 ModelArts，也就是他们研发出来的一个 AutoML 的产品，而这个产品其实是对标了谷歌的产品。

2. AI 求职风向

总结一下最近 AI 领域的一些求职的方向，一种方向是互联网大厂，他们做的事情更像是一个基础设施的公司，我们所有的互联网大厂提供的基础设施实际上就是一个中台，是所有人都离不开的设施。我们的技术会逐渐的下沉，下沉到产业界，比如，制造业和金融业，这两个行业的发展依赖于算法的不断变革和更迭。

在医疗产业中，现在很多的演变计算都是可以通过 AI 来实现的。有一则新闻曾报道，我们可以通过 AI 计算出奥密克戎病毒的分子结构，并且计算的结果与其实际的分子结构相差不大，这种模拟其实就可以通过某些算法来生成。所以，在各个行业中，比如金融行业、制造行业、医疗行业等等，我们都需要与 AI 技术进行结合。“AI + business”是我们的主流的方向。

在求职过程中，我们可以找到几个行业点，比如说未来有机会的话可以去大厂的 AI Lab，一般大厂都有自己的 AI 实验室，比如腾讯的 AI Lab 和优图，这两个都是 AI 相关的实验室，阿里的达摩院，字节跳动的字节 AI Lab，百度的视觉技术部等等。除了 AI 的工作室以外，互联网大厂的某些核心的产品岗中，也存在一些 AI 的就职机会，比如大家熟知的王者荣耀，前一段时间出了王者荣耀的 AI，绝悟，它已经打败了人类的冠军，并且王者荣耀也已经把这样的 AI 技术迁移到其他的游戏场景中。

3. 传统行业的数字化转型

传统行业的数字化转型这部分的内容，会通过举例说明的方式让大家有更深刻的理解。我们以保险行业为例，在保险这样的传统的金融行业中，有没有一些 AI 的机会呢？一定是有的。首先是产品定价。产品的定价如果过高，就会导致销量的下降，收益也会减少，而如果定价太低，虽然产品的销量提高了，但是最终的收益也不一定能上升，所以价格的界定是非常关键的。那么，究竟要如何定价，我们才能赚取更多的利润呢？我们需要一个仿真模型，去模拟价格和销量之间的关系，同时也要找到一个优化的价位，使得我们整体的收益最大化。

大数据用例：产品定价

不知道大家有没有了解或购买过商业险，商业保险尤其是医疗保险有两种形式，一种是给付型，另外一种是报销型。给付型是指如果被保险人出险，保险公司会给被保险人一笔固定数目的保险金额。报销型是指按照被保险人的实际需要的医疗费用来进行报销，简单来说，就是花多少报多少，在报销型的商业保险中，保险公司会对被保险人的医疗费用做一个准确的判断，只有这样才会使产品定价更为合理。

那么如何去判断价格呢？其实，这就是一个 AI 模型的具体应用。我们要收集患者的特征，收集患病的的阶段，我们还会统计已有的出险情况，已经赔付了多少钱，医疗费用是多少钱，这样我们就会有大量的样本。有了这么多的样本我们就可以进行建模，这是一个经典的回归问题，我们可以利用这些样本去构建医疗费用的预测。

在预测过程中，我们会发现，比如，在癌症治疗时，原位癌的手术的治疗是以激素治疗为主，费用会比较低，如果是 I-III 期的患者，除了手术以外，还可能需要进行化疗，费用就会大大增加。如果是 IV 期的患者，治疗就会以化疗、放疗为主，价格就会更高。所以如果保险公司要为其报销的话，针对不同的用户特征，不同的治疗阶段，以及不同的癌症类型，费用其实都是不一样的，所以，就需要建立一个更加精准的模型去实现准确的保险定价。所以，可以看出来在一些业务场景中，价格的制定是非常关键的，也是非常需要进行 AI 建模的。

大家有没有买车并上过车险呢？在美国，前 10 大财产保险公司，已有 9 家开展了 UBI （Usage Based Insurance）车险。UBI 会基于驾驶行为判断给予车主车险折扣或者基于实际驾驶里程对车主按里程付费。也就是说，你跑了 1 万公里和你跑了 10 万公里的保险费率是不一样的。这里的里程数就是用户行为，所以基于它的话，我们也需要通过它去做建模，对被保险人去制定价格。UBI 车险规则在国内处于起步阶段，比如中国平安保险已经推出了 UBI 的车险，这也是他们的一个主要的项目。

在传统行业，尤其是金融领域中，欺诈的情况尤为严重。对于保险公司来说，是一定会存在欺诈行为的。那么保险公司能否识别出来这样的行为呢？大家有没有接到过诈骗电话？当你接到了一个诈骗电话，这个电话可能是从香港打来的，诈骗者可能会问你是不是前一段时间曾在淘宝上购买过某一个商品，以此来对你实施诈骗行为，类似的情况一定会存在。诈骗行为在我们的日常生活中广泛存在，而金融行业更是一个诈骗集中的地带。

据统计，在保险行业中，保费的理赔有 10% ~ 20% 都是欺诈的行为，甚至在某一些细分的产品中，欺诈概率高达 50%，保险欺诈已经成为仅次于逃税的第二大犯罪领域了。所以这种欺诈的现象，对保险公司来说损失是非常惨重的。在对过去 300 多家的美国已倒闭的保险公司的调查中，数据显示有 30% 保险公司倒闭的原因都是因为保险反欺诈工作不利所造成的损失过多。针对这样的问题，其实最好的解决方式是去做欺诈的预测，由机器先去做一个初筛，然后再将可能存在欺诈行为的保险理赔进行人工的复核，这是最好的解决方案。

Santam 是南非的一个短期保险公司，他们已经统计到每年欺诈行为占他已有保费的 10% 左右，这种欺诈行为就会导致保费的成本过高，转嫁给了其他正常的客户。不仅是价格更高，也会使理赔的周期变得更长。为了更好的去识别可能的欺诈，每一次的理赔都会要求人工介入，这会导致整个保险理赔的流程需要三个工作日才能完成。用户的保费高，体验差，时间长，不利于保险公司的发展。那么 Santam 的解决方案是什么呢？他通过数据建模的方式进行预测。首先通过机器预测保险是否是欺诈行为，并将保险理赔分成不同的等级，比如，欺诈概率很低的理赔，就会快速处理，大约一个小时就可以完成。欺诈概率很高的理赔，就需要进一步的人工核查，以降低保险公司的损失。所以通过 AI 的建模，不仅可以减少欺诈造成的损失，而且可以让保险理赔的效率有了极大的提升。

4. AI 面试考什么

了解了 AI 的求职方向之后，我们再来看一下在面试过程中可能会涉及到的问题，希望对即将或计划面试 AI 相关职位的同学有所帮助。那么接下来我们来看一下 AI 面试考核的内容。

理论基础

首先，面试官会考核你的理论基础。GBDT 的原理是考察的重点，因为在项目过程中，GBDT 是十分常用的。除此之外，还有可能会问到分类树和回归树的区别。你可以关注一下面试的公司在招聘 JD 里面写到了需要求职者具备哪些技能，他如果提到某项技术的话，你需要对这个技术的原理提前了解，理论基础在面试之前一定要提前梳理一下，以便更好地应对面试。

工程能力

其次，会考察你的工程能力，考察工程能力最直接的方式就是看一看面试者以前做过的或参与过的项目，所以面试官一定会问你以前的工作履历。可能会问你之前是否用过 XGBoost，LightGBM，也可能会问你如何防止过拟合等问题。这一部分也建议大家自己进行复习。也许你会说自己的工作还要复习吗？即使是自己从事过的工作也是需要复习的，因为面试官必问的问题就是你拿分的问题，所以需要你提前做一下项目经历的梳理和优化。

业务理解

最后，考察你的业务理解，业务理解更多的会涉及到面试官所在公司的业务。假设他们公司在做的事情与股票相关，他可能会问预测股票价格走势一般都会出现严重的过拟合现象的原因等问题。假设他们公司当前核心战略是 AutoML 产品，那么面试官可能会问你之前有没有了解过或使用过 AutoML。

面试基本上会涉及到理论、工程、业务这三个环节，除此之外，还有一点更容易让你从一众面试者中脱颖而出，那就是你的影响力。如果你的面试压力比较大，竞争也比较激烈，面试官可能还希望你能有一点影响力。比赛就是一个最直接的体现你的影响力的方式，比如说你打过比赛，并在比赛中取得了不错的名次，在你的理论基础、过程能力和业务理解都不错的情况下，更容易打败其他面试者并被录用的。因为比赛实际上是具有大量参赛选手作为基数的，如果有 1 万个人参加比赛，你在这 1 万人里面排名第 10，那么就是你的一个非常有价值的地方。

5. AI Offer 4步法

那么，如何去准备 AI 面试更有益于取得 Offer 呢？我们希望大家遵循以下四个环节。

Step1，知识储备（必备知识）

HR考核：相关知识点是否有具备 => 关键知识点 Cover 90%

丰富你的知识储备，在正式面试前应尽可能积累相关技术的理论知识，关键知识点的考核会占到面试分数的 90% 左右。

Step2，工程力（上手能力）

HR考核：给你一个题目，能否在1小时内完成，计算复杂度如何

之前是否有相关项目经验 => 积累项目简历

关于工程能力的考察，我们发现一些大厂会给面试者一道题目，让你去进行测试，看看你能否通过。这个题目很有可能跟你的工作关系不大，原因是无论是第一步知识储备的考核还是第二步工程力的考核，都是大厂筛选人才的主要手段，而到了第三步业务能力，才会真正地对你的实战能力进行考核。

Step3，业务力

对大厂的核心业务，未来战略是否了解，是否match

=> 大厂之间的交流，参加峰会

Step4，影响力

开源社区影响力

业务场景的能力和你的影响力，是你能够战胜一众面试者并获得 Offer 的关键因素，如果你能拿到一个比赛的冠军，或在权威期刊发表过你的文章等等，这都会是一个非常有利的标签。

你可能感兴趣的:(人工智能,面试,big,data)

WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
uniapp map组件自定义markers标记点以对_ uni-app学习记录 uni-app javascript 前端
需求是根据后端返回数据在地图上显示标记点，并且根据数据状态控制标记点颜色，标记点背景通过两张图片实现控制{{item.options.labelName}}exportdefault{data(){return{storeIndex:0,locaInfo:{longitude:120.445172,latitude:36.111387},markers:[//标点列表{id:1,//标记点idin
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
vue + Element UI table动态合并单元格我家媳妇儿萌哒哒 element UI vue.js 前端 javascript
一、功能需求1、根据名称相同的合并工作阶段和主要任务合并这两列，但主要任务内容一样，但要考虑主要任务一样，但工作阶段不一样的情况。（枞向合并）2、落实情况里的定量内容和定性内容值一样则合并。（横向合并）二、功能实现exportdefault{data(){return{tableData:[{name:'a',address:'1',age:'1',six:'2'},{name:'a',addre
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，