Big_quant

入行AI，脚踏实地

引言

AI原本是一个专业领域，没什么特别的。作为码农一枚，笔者的工作内容正好在这个领域。

近来这一年左右时间里，连续发生了多件事情，使得笔者不得不抬起原本一直低着敲代码的头，看看这个为AI狂欢的世界。

【Case 1】
居然在一个月里碰到两位在相对传统行业创业的亲友，来打听将AI技术应用到他们所在行业上的问题，例如：是聊天机器人是否可以代替人工客服。

两位亲友居然都动了雇佣一位算法工程师的念头。其中一位真的已经开始物色了。

颇费周折找到一位某非 985 院校专业对口的博士，友人有点动心想要聘用，奈何人家开口就要100万年薪。

创业企业虽然已经拿了两轮融资，还是不敢烧钱作死，故而多方打听“算法”这东西的用处。

【Case 2】
笔者所在公司今年的校园招聘，本人照例作为 interviewer 参加，面试了几个来自不同 985 院校的学生（明年毕业）。顺便又和几位今年刚入职的应届生聊了聊。

结果发现，所有 interviewee（至少是我碰到的），全都是人工智能或机器学习方向的学生，所有交流过的新同事，在学校里做的也全部都是机器学习 or 深度学习算法。

而且，每一个人对于入职后工作的期望都是做算法。

人工智能，已经跌入到两三年前大数据风口上，全民皆“数据科学家”的套路里了。

到底做什么，算是入行AI？

这个话题其实在笔者之前的几个chat里面已经反复提到过了，在此再说一遍：工业界直接应用AI技术的人员，大致可以分为三个不同角色：算法、工程，和数据。

现在各种媒体上，包括 GitChat 中有大量的文章教大家怎么入行AI，怎么成为具体某个领域的工程师，告诉大家要在某领域内发展需要掌握的技术栈是什么，等等……

我们不说怎么能够成为XXX，我们先来看看成为XXX之后要做什么事情，而做这些事情，需要什么样的能力，在拥有了这些能力、做上了这件事情之后，又能向什么方向发展。

换言之，本文中，我们将从直观的角度，管窥承担不同角色工作所需要具备的素质，日常工作的状态，和职业发展路径。

做算法

1.1 日常工作

所有人都想做算法，那么，说到底，在工业界做算法倒是干什么？
真正的算法工程师（也有公司叫科学家），最基本的日常工作其实是：读论文&实现之——确认最新论文中的阐述是否真实可重现，进一步确认是否可应用于本企业的产品，进而将其应用到实践中提升产品质量。

1.2 必备能力

既然日常工作首先是读别人论文。那么，必不可少，作为算法工程师得具备快速、大量阅读英语论文的能力。

有一个网站，所有有志于算法的同学必须要知道：https://arxiv.org ——这里有多个学科（包括computer science）大量的最新论文。

现在许多科学家、学者、研究人员和博士生在论文刚刚完成，尚未在正式期刊会议上发表时就先将论文发布在此处，为的是在尽量短的时间延误下对外传播自己的成果。

传统的正规渠道，从论文完成到正式发表之间存在短则三四个月，长则一年半载的延迟。这对一些传统学科，还勉强可以接受。

但计算机科学，尤其是人工智能、机器学习、深度学习这几个当今世界最热门的主题，大家都在争分夺秒地抢占制高点，几个月的耽搁根本不能容忍。

因此，对于AI的学术性文献而言，arxiv.org 实际上已经成为了当前的集大成之地。

如果要做算法，平均而言，大致要保持每周读一篇最新论文的频率。

也许这就是为什么，到目前为止，笔者所听闻和见过的算法工程师都是名校相关专业博士的原因。

经过几年强化学术研究训练，这些博士们，就算英语综合水平不过 CET-4，也能读得进去一篇篇硬骨头似的英语论文！

1.3 自测“算法力”

但当然不能说硕士、学士或者其他专业的有志之士就做不成算法了。人都不是生而知之，不会可以学嘛。

但是到底能不能学会，其实也并不需要三年五载的时间，花费几万十几万金钱在各种培训或者付费阅读上才能够知道。

有个很简单的验证方法：现在就去https://arxiv.org找一篇论文（比如这篇：Dynamic Routing Between Capsules），从头到尾读一遍。

现在不懂没关系，至少先试试在不懂的情况下能不能把它从头到尾一字不漏的读完，有不认识的字查字典。

如果这都做不到，还是当机立断和“算法”分手吧。既然注定无缘，何必一味纠缠？

1.4 学术实践能力

如果，碰巧你喜欢读论文，或者就算不喜欢也有足够强大的意志力、专注力压迫自己去强行阅读论文。那么恭喜你，你已经跨上了通往算法山门的第一级台阶。

下面一级是：读懂论文。

既然要读论文，读最新论文，而且阅读的目的是指导实践，那么自然要读懂。拿起一篇论文就达到懂的程度，至少需要下面这三种能力：

1.4.1 回溯学习能力

一篇论文拿来一看，一大堆名词术语不懂，它们互相之间是什么关系也不知道。怎么办？去读参考文献，去网上搜索，去书籍中查找……总之，动用一切资源和手段，搞清不明概念的含义和联系。

这种能力是学术研究的最基础能力之一，一般而言，有学术背景的人这一点不在话下。

如果现在没有，也可以去主动培养，那么可能首先需要学习一下学术研究方法论。

1.4.2 数学能力

如果只是本着学习的目的读经典老论文，那么只要清楚文中图表含义，看公式推导明白一头一尾（最开始公式成立的物理意义，以及结束推导后最终形式所具备的基本性质）也就可以了。

但读最新论文就不同。因其新，必然未经时光检验，因此也就没人预先替你验证的它的正确性。

在这种情况下，看公式就得看看推导了。否则，外一是数学推导有错，导致了过于喜人的结果，却无法在实践中重现，岂不空耗时力？

如果目前数学能力不够，当然也可以学。但就与后面要说的做工程用到什么学什么的碎片化学习不同，做算法，需要系统学习数学。

微积分、线性代数、概率统计，是无法回避的。如果在这方面有所缺乏，那还是先从计算机系的本科数学课开始吧，个人推荐北师大教材。

1.4.3 理论联系实际，将学术论述与产品、业务结合的能力

一般来说，在大企业里做到真正的算法工程师/科学家，也就不需要自己去动手开发产品了。但做 demo/prototype 还是不能避免的。

算法工程师，可不是用别人写好的工具填几个参数去运行就可以的，需要负责实际业务问题到数学模型的抽象，并能够将他人最新成果（敲黑板——那些论文！！！）应用到业务数据上去。

说得更通俗一点，就算是用别人写的工具或框架，做算法的，也得是i）第一拨、最前沿那批试用者，或者ii）工具最新玩法的发明者。

1.5 创新型人才

算法工程师，即使自己不发明新的算法，不提出新的算法优化方法，也得去尝试最新算法的使用或者把已有算法用出新花样来。

毋庸置疑，这是一个有着必然创新性的角色。因此，这个角色必然不适合绝大多数人！

做工程

2.1 日常工作

相对于算法的创新和尖端，做工程要平实得多。

这一角色比较有代表性的一种岗位就是：机器学习工程师（或戏称调参工程师）——他们使用别人开发的框架和工具，运行已有算法，训练业务数据，获得工作模型。

其间可能需要一些处理数据、选取特征或者调节参数的手段，不过一般都有据可循，并不需要自己去发明一个XXXX。

做工程也得读论文，不过和做算法不同，做工程读论文的一般目的不是尝试最新方法，而是用已知有效的方法来解决实际问题。

这就导致了，做工程的，读的经常是“旧”论文，或者相对学术含量低一些（不那么硬）的论文。

而且在阅读时，主要是为了直接找到某个问题的处理方法，因此，可以跳读。

对于其中的数学公式，能够读懂头尾也就可以了。论文阅读频率和学术深度的要求，都比做算法低得多。

TIP：很多title写的是“人工智能/机器学习/深度学习算法工程师”的招聘岗位，其实招的是做工程的人。不要执着于辞藻，看清楚具体职责和工作内容。

2.2 软件工程师的分支

说到底，机器学习工程师，是广义的软件工程师（或云程序员）的一个分支。AI产品开发，是广义软件开发的一个领域。

说起来，每一个程序员都有一个领域。不过，不同领域在不同时期热度不同，发展趋势不同。

若干年前，做底层的程序员在程序界睥睨群雄。写协议栈的、开发驱动的、实现各种系统接口的程序员，站在鄙视链的最顶端。

如今，风水轮流转，昨日黄花已谢，轮到AI封神了。

但说到底，开发人工智能产品的程序员，也还是程序员。不过是需要懂一定程度的领域内理论知识而已，和以前开发 PCI 协议栈要懂 PCI 协议，写网卡 driver 要懂 TCP/IP 的道理是一样的。

2.3 程序员的基本素质

既然是程序员，首先就不能丢掉程序员的基本素质：编码能力，和基础算法能力（不是前面说的那种算法，而是链、树、图的构建、删除、遍历、查找、排序等数据结构里讲的那种算法），是最起码要求。

其实，在AI成为潮流的今天，只要能找到一个在AI方面相对比较前沿的企业，进去做一名普通程序员。

那么即使本来开发的产品不属于AI范畴，未来通过在旧产品上应用新的AI技术，或者在公司内部 transfer 到做 AI 产品的 team，都可能获得入行的机会。

甚至具体知识的掌握，都可以在入职后慢慢积累——对于大多数AI工程人员，这可能才是一条自然的入行之路。

但这一切的前提是：此人首先得是一个合格的程序员！

而不是本末倒置，虽然花功夫学了几个模型、算法，却连最基本的编程面试题都做不对。

2.4 做工程，「机器学习」学到多深够用

以下部分摘自我的达人课【机器学习极简入门】内容

当然，既然是有领域的程序员，在专业上达到一定深度也是必要的。

虽然做工程一般要使用现成技术框架，但并不是说，直接把算法当黑盒用就可以做一名合格的“调参”工程师了。

把算法当黑盒用的问题在于：黑盒能够解决问题的时候，使用方便，而一旦不能解决问题，或者对质量有所要求，就会感觉无所适从。

作为程序员、工程人员，想用机器学习算法解决实际问题，就得对算法有一定程度的掌握，此外对于数据处理和模型验证，也需具备相应知识。

2.4.1 算法

仅从使用角度而言，掌握算法，大致可分为如下由浅入深的几步：

【1】简单使用：了解某个算法基本原理，应用领域，功能和局限。
•该算法的应用问题域是什么？（e.g. 分类、回归、聚类……）
•该算法的应用目标是什么？（e.g. 判别算法、生成算法……）
•该算法适合应用在怎样的数据集，它能对数据造成怎样的影响？（e.g. 适用少量高维稀疏数据……）
•能够主动获取该算法的函数库，调用该算法生成模型。

【2】模型调优：对所采用算法和对应模型的数学公式有所了解。
•知道调用函数中各个参数的意义（e.g. 迭代次数，对应到公式中参数的含义……），能够通过调节这些参数达到优化结果的目的。
•能够通过加约束条件（e.g. L0, L1, L2 ……）来优化算法。
•了解在当前问题域，目标和输入数据确定的情况下，还可以用哪些其他模型可替换现有模型，并进行尝试。
•能够将多个弱模型加权组成强模型（e.g. adaboost）。

【3】运行效率优化：对模型本身的数学推导过程和模型最优化方法有所掌握，对于各种最优化方法的特点、资源占用及消耗情况有所了解。
•了解算法在当前数据集上的运行效率（e.g. 需要进行哪些运算，是否易于被分布式等）。
•了解在其他语言、平台、框架的工具包中有否同等或近似功能但在当前应用场景下效率更高的算法。
•能够针对具体场景，通过转换模型的最优化方法（optimizer）来改进运行效率。

2.4.2 数据

仅仅只有算法，并不能解决问题。算法和数据结合，才能获得有效的模型。

对于数据，需要从：i）. 具有业务含义的信息，和ii）.用于运算的数字，这两个角度来对其进行理解和掌握。

【1】特征选取：从业务角度区分输入数据包含的特征，并认识到这些特征对结果的贡献。
•对数据本身和其对应的业务领域有所了解。
•能够根据需要标注数据。
•知道如何从全集中通过划分特征子集、加减特征等方法选取有效特征集。

【2】向量空间模型（VSM）构建：了解如何将自然语言、图片等人类日常使用的信息转化成算法可以运算的数据。
•能够把文字、语音、图像等输入转化成算法所需输入格式（一般为实数空间的矩阵或向量）。
•能够根据信息熵等指标选取有效特征。

【3】数据清洗和处理：对直接的业务数据进行筛选并转换为模型可处理形式。
•能够运用统计学方法等ETL手段清洗输入数据。
•能够对数据进行归一化（normalization），正则化（regularization）等标准化操作。
•能够采用bootstrap等采样方法处理有限的训练/测试数据，以达到更好的运算效果。

2.4.3 模型验证

算法+数据就能够得到模型。但是，
•这个模型的质量如何？
•这个模型和那个模型比较，哪个更适合解决当前问题？
•在做了如此这般的优化之后得出了一个新的模型，怎么能够确认它比旧的模型好？

为了解答这些问题，就需要掌握度量模型质量的方法。为此，需要做到：
•i）了解 bias，overfitting 等基本概念，及针对这些情况的基本改进方法。
•ii）了解各种模型度量指标（e.g. Accuracy, Precision,Recall, F1Score……）的计算方法和含义，及其对模型质量的影响。
•iii) 能够构建训练集、测试集，并进行交叉验证。
•iv) 能够运用多种不同的验证方法（e.g. 2-Fold cross-validation,K-Fold cross-validation, Leave-One-Out cross-validation……）来适应不同的数据集。

做数据

此处说得做数据并非数据的清洗和处理——大家可以看到做工程的岗位，有一部分工作内容就是 ETL 和处理数据。此处说的做数据是指数据标注。

3.1 标注数据的重要性

虽然机器学习中有无监督学习，但在实践领域被证明有直接作用的，基本上还都是有监督模型。

近年来，深度学习在很多应用上取得了巨大的成功，而深度学习的成功，无论是图像、语音、NLP、自动翻译还是AlphaGo，恰恰依赖于海量的标注数据。

无论是做ML还是DL的工程师（算法&工程），后者有甚，都共同确认一个事实：现阶段而言，数据远比算法重要。

3.2 数据人工标注的必要性

很多人误以为 AlphaGo Zero 100：0大胜 AlphaGo 是无监督学习的胜利。

其实，之所以有这样的结果，恰恰是因为 Zero 利用围棋严格完备而明晰的规则，自己制造出了巨大量的标注数据——这些标注数据的数量远超其前辈 AlphaGo 的输入，而且可以随时造出更多。

围棋是一个人为定义的在19x19点阵范围内，按完备无二义性规则运行的游戏，因此计算机程序才能依据规则自动产生标注数据。

真实人类世界的事情，基本没有完全按矩而行无意外的情况。因此，对人类真正有用的模型，还是需要人工标注的训练数据。

固然，目前有多种技术用以在标注的过程中辅助人工，以减小工作量及降低人工标注比例。但至今没有能在应用领域完全自动化标注的技术出现。

换言之，在看得见的未来之内，人工标注数据仍然是AI落地的必要和主流。

3.3 人工智能的“勤行”

3.3.1 什么叫做标注

举个很简单的例子说明一下什么是数据标注：

在开发聊天机器人的时候，我们需要训练意图判定和实体识别模型，因此也就需要标注用户问题的意图和出现的实体。

这是用户问题原始数据：“00183号商品快递到伊犁邮费多少？”

这样一句话，很显然问它的用户是想知道某一种商品发往某地的邮费。邮费是商品的一个属性，我们把所有查询商品属性的意图都定义为“商品查询”。

因此，这样一句话的意图是“商品查询”。其中有包含了几个实体，分别是商品Id，目的地和商品属性。

这句话被标注出来以后，就是下面这个样子：

[00183]<-{商品Id}号商品快递到[伊犁]<-{目的地}[邮费]<-{商品属性}多少？||商品查询

具体格式不必纠结。核心一点：标注就是将原始数据内全部或者部分内容，按照业务需求打上定义好的标签。

3.3.2 数据标注的日常工作

简单说：数据标注的日常工作就是给各种各样的数据（文本、图像、视频、音频等）打上标签。

【好消息】：数据标注工作几乎没有门槛。一般任何专业的大学毕业生，甚至更低学历，都能够胜任。上手不需要机器学习之类的专业知识。

【坏消息】：这样一份工作，是纯粹的“脏活累活”，一点都不cool，起薪也很低。

打个不太恰当的比喻：

做算法是屠龙，仗剑江湖，天外飞仙；
做工程是狩猎，跃马奔腾，纵酒狂歌；
做数据是养猪，每天拌猪食清猪粪，一脸土一身泥。

所以，虽然这是一件谁都能干的工作，但是恐怕，没几个人想干。

3.3.3 数据标注的难点

就单个任务而言，数据标注是一项很简单的工作。它的难点在于数据的整体一致性，以及与业务的集合。

【1】数据一致性是指：所有数据的标注原则都是一样的。

当数据很多的时候，一致性是相当难以保证的，尤其是在有精标需求的情况下。

如果一份 raw data 由多个人同时标注，就算是反复宣讲标注原则，每个人也都有自己的理解和侧重，很难保证一致，很可能一句话在某个人看来是“查询商品”，而在另一个人看来就是“要求售后”。（即使是将所有数据交给一个人，也可能在不同时间段理解不同。）

出于对数据标注工作的不重视（正好与对算法的过分重视相映成趣），很多公司外包了数据标注工作。

对于数据标注的不一致性，则采取一种暴力解决方案：让多个人（比如3个）同时标注同一份数据，一旦出现不一致，就采用简单多数法，取最多人一致认定的那种结果（比如：3个人中两个都选“查询商品“，则选定”查询商品“为最终 label）。

这种方案对于粗标数据还可以起到一定作用，但如果是精标，则往往连多数人一致的情况都难以出现。

如果三个人所标结果完全不一样，那么这条数据也就失去了标注价值。

在现实中，经常会出现同一份数据因为质量过低，被要求重复标注的情况出现，费时费力。

【2】与业务的集合是数据标注面对的另一个挑战。

这一点在目前还不是很明显。因为：目前人工智能的落地点还比较有限，真正的商业化领域也就是语音和图像处理的少数应用；

owner 都是大公司，有自己的标注团队，或者雇佣有长期合作关系的第三方标注公司，标注人员都相对有经验；

业务要求也相对稳定，所需数据标注又相对通用化，普通人都不难理解数据含义和标注原则。

一旦未来人工智能的落地点在各个领域全面铺开，很可能需要的是针对具体企业、具体业务，不断变更的标注需求。

标注这件事情看似容易，但是一旦标注原则有所改变，就要整个重新来过。以前的标注不但不是积累，反而是累赘。

如何应对快速变更的业务需求，同步更新标注结果，将是一个在AI真正服务于大众时全面爆发的问题。偏偏现阶段还未引起足够重视。

3.3.4 数据标注的潜力

就目前而言，数据对模型的影响远胜于算法。一群年薪百万起步的算法工程师耗费经年的成果，对于模型质量直接的影响甚至比不上一个靠谱标注团队一两个月的精心标注。对模型的影响尚且如此，更何况是商业价值。

此时此刻，AI 在风口浪尖，大公司、拿了巨额风投的独角兽 startup，一个个拿出千金市马骨的气概，将不可思议的高薪狠狠砸向 AI 领域的顶尖学者，顺便捧起了一批年轻的博士，也引来了世人的垂涎。

这种情形能维持多久？商业企业能承受多少年不挣钱只烧钱？待潮涌过后，行业回归理性，模型还是要用来挣钱的。

到了那个阶段，大小企业不会去算成本收益吗？他们会意识不到将资源投入数据和算法的不同产出比吗？

企业为了创造利润应用AI技术，算法工程师不是刚需，而数据标注这个人工智能领域的“勤行”，人工智能蓝领，一定是刚需！

一切标注工作的难点和潜藏的风险，也就是这项工作的潜力和从事这项工作未来职业发展的可能性所在。

认清形势，脚踏实地

近来一段时间，能明显感到，想入行AI的人越来越多，而且增幅越来越大。

为什么这么多人想入行AI呢？真的是对计算机科学研究或者扩展人类智能抱着无限的热忱吗？说白了，大多数人是为了高薪。

人们为了获得更高的回报而做出选择、努力工作，原本是非常正当的事情。关键在于，找对路径。

寻求入行的人虽多，能真的认清市场当前的需求，了解不同层次人才定位，并结合自己实际寻找一条可行之路的人太少。

人人都想“做算法”，却不想想：大公司里的研究院养着一群高端科学家，有得是读了十几二十年论文始终站在AI潮头的资深研究人员。

想要与他们为伍做算法，须有可以与之并列的成就：要么有足够分量的学术成果，要么解决过大用户量产品的实际业务问题——你占哪一条呢？

仅仅是学过课程，做过练习或实习性质的小项目，是不足以去做算法的。

谁在自己的想象世界里不是屠龙的剑客？但现实当中能屠龙的人又有几个？留给人去屠的龙又有几条？养猪虽然没那么高大上，有猪肉吃是实实在在的。

好高骛远只会虚掷光阴，脚踏实地才能实现理想——这也是笔者写作此文的初衷。

你可能感兴趣的:(机器学习,AI入门)

深入探索C++ STL：从基础到进阶
目录引言一、什么是STL二、STL的版本三、STL的六大组件容器（Container）算法（Algorithm）迭代器（Iterator）仿函数（Functor）空间配置器（Allocator）配接器（Adapter）四、STL的重要性五、如何学习STL六、STL的缺陷总结引言在C++的世界里，标准模板库（STL）是一项极为强大的工具。它不仅为开发者提供了可复用的组件库，更是一个融合了数据结构与算
学习笔记(39):结合生活案例，介绍 10 种常见模型宁儿数据安全 #机器学习学习笔记生活
学习笔记(39):结合生活案例，介绍10种常见模型线性回归只是机器学习的“冰山一角”！根据不同的任务场景（分类、回归、聚类等），还有许多强大的模型可以选择。下面我用最通俗易懂的语言，结合生活案例，介绍10种常见模型及其适用场景：一、回归模型（预测连续值，如房价）1.决策树（DecisionTree）原理：像玩“20个问题”游戏，通过一系列判断（如“面积是否>100㎡？”“房龄是否0.5就判为“会”
详细介绍一下OpenAI的API使用方法 alankuo 人工智能
以下是详细的OpenAIAPI使用方法：获取API密钥访问OpenAI官方网站（https://platform.openai.com/）并注册账号.登录后，点击右上角的个人资料名称或图标，选择“ViewAPIKeys”.在API密钥页面，点击“Createnewsecretkey”来创建新的API密钥，将其妥善保存，因为此密钥仅在生成时显示一次.安装OpenAI库在命令行中使用pipinstal
基于R、Python的Copula变量相关性分析及AI大模型应用梦想的初衷~ 环境气象人工智能 r语言 python
在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，皮尔逊相关系数只能反映变量间的线性相关，而秩相关则更多的适用于等级变量。大多数情况下变量间的相关性非常复杂，而且随着变量取值的变化而变化，而这些相关系数都是全局性的，因此无法提供变量间
光纤HDMI vs 普通HDMI线：区别对比及适用场景全解析
1.引言：HDMI线的重要性HDMI（HighDefinitionMultimediaInterface）作为目前最主流的高清音视频传输接口，广泛应用于显示器、电视、投影仪、游戏主机、PC等设备。然而，市面上的HDMI线种类繁多，尤其是光纤HDMI和普通铜芯HDMI，它们的性能差异大，适用场景也不同。本文将从传输原理、带宽、距离、抗干扰、价格等多个维度对比两者的区别，并给出选购建议，帮助你在不同场
HDMI、DisplayPort、USB-C 不同版本对比：带宽、刷新率、协议版本详解 TESmart碲视 KVM切换器领域相关技术电脑计算机外设智能硬件物联网
一、接口概览：HDMI、DP接口、USB-C到底是干嘛的？接口名称主要功能常见设备支持传输内容HDMI（High-DefinitionMultimediaInterface高清多媒体接口）专为高清音视频传输设计电视、显示器、显卡、游戏主机视频+音频DP（DisplayPort显示端口）高性能视频输出接口显卡、显示器、扩展坞视频+音频USB-C（带DPAlt模式支持DP替代模式）多功能数据传输接口笔
嵌入式单片机开发实战指南：从RISC-V到TinyML全栈技术 CodeMicro 单片机单片机 risc-v 嵌入式硬件
前言：嵌入式单片机的2025年技术浪潮2025年，嵌入式系统正经历开源架构与边缘智能的双重革命。RISC-V指令集打破ARM垄断，国产芯片如兆易创新GD32VF103、先楫HPM6750实现工业级可靠性；TinyML技术让STM32L4系列在1MB内存下运行神经网络；低功耗设计使物联网节点电池寿命突破10年。本文将从架构选型→开发环境→核心技术→实战项目，全方位拆解嵌入式开发的热门技术，带你从入门
【vLLM 学习】Encoder Decoder Multimodal HyperAI超神经 vLLM vLLM KV缓存大语言模型推理加速内存管理开源项目在线教程
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/*在线运行vLLM入门教程：零基础分步指南源码examples/offline_inference/encoder_decoder_multimodal.py#SPDX-License-Identifier:Apach
LLM系统性学习完全指南（初学者必看系列） GA琥珀 LLM 学习人工智能语言模型
前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发，逐步剖析自然语言处理（NLP）的经典范式，深入探究引发革命的Transformer架构，并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后，我们将探讨如何将这些强大的基础模型转化为实用、安全的应用，涵盖对齐
野兽的呼唤~26 爱机车的异乡人
Andhesawnexttohim,nottheIndiancook,butanotherman,amanwithshorterlegs,andlongerarms.他看见身边并不是那个印第安厨子而是另一个人。Thismanhadlonghairanddeepeyes,anddeepeyes,andmadestrangenoisesinhisthroat.Hewasveryfrightenedof
关于市场主流大模型的系统性整理和分析（必看系列，附汇总表格） GA琥珀 LLM 人工智能语言模型
一、旗舰专有模型生态系统在生成式AI的高端市场，几家公司凭借其强大的研发实力和资本支持，构建了以旗舰专有模型为核心的生态系统。它们通过API和订阅服务提供最先进的功能，引领着技术发展的方向。1.1OpenAI：在位的创新者OpenAI作为行业的先行者，其战略核心是建立一道“性能护城河”。通过持续发布性能领先（且价格高昂）的模型，锁定那些愿意为顶级能力支付溢价的用户和企业。其快速的迭代周期旨在使其始
20250718-2-Kubernetes 应用程序生命周期管理-Pod对象：基本概念(豌豆荚)_笔记 Andy杨 CKA-专栏 kubernetes 容器笔记
二、Kubernetes应用程序生命周期管理1.课程内容概述主要内容：Pod资源共享实现机制管理命令应用自修复（重启策略+健康检查）环境变量Initcontainer静态Pod2.Pod对象介绍1）Pod基本概念定义：Pod是Kubernetes创建和管理的最小单元，一个逻辑抽象概念组成：由一个或多个容器组成特点：可理解为一个应用实例容器始终部署在同一个节点上容器间共享网络和存储资源设计灵
react native学习record one month jjjjjjjjj¢ react native react native 学习 react.js
ReactNative开发主要面向“跨平台原生App开发”一、基础能力JavaScript/TypeScript•熟练掌握ES6+（async/await、Promise、Map、Set等）•熟悉TypeScript类型系统（常用类型定义、接口、联合类型、泛型）React核心•函数组件+Hook（useState、useEffect、useCallback、useRef等）•状态管理（Contex
python automl_自动化的机器学习(AutoML)：将AutoML部署到云中
编辑推荐:在本文中，将介绍一种AutoML设置，使用Python、Flask在云中训练和部署管道；以及两个可自动完成特征工程和模型构建的AutoML框架。本文来自于搜狐网，由火龙果软件Alice编辑、推荐。AutoML到底是什么？AutoML是一个很宽泛的术语，理论上来说，它囊括从数据探索到模型构建这一完整的数据科学循环周期。但是，我发现这个术语更多时候是指自动的特征预处理和选择、模型算法选择和超
(05-29) textView和textField设置光标后移 shushuzhen
//这里设置光标位置，让光标位置后移10textField.leftView=[[UIViewalloc]initWithFrame:CGRectMake(0,0,10,0)];textField.leftViewMode=UITextFieldViewModeAlways;//这里设置光标位置，让光标位置后移10textView.textContainer.lineFragmentPadding
谷歌云(GCP)入门指南：从零开始搭建你的第一个云应用 AI云原生与云计算技术学院 AI云原生与云计算 perl 服务器网络 ai
谷歌云(GCP)入门指南：从零开始搭建你的第一个云应用关键词：谷歌云、GCP、云应用搭建、入门指南、云计算摘要：本文旨在为初学者提供一份全面的谷歌云（GCP）入门指南，详细介绍如何从零开始搭建第一个云应用。通过逐步分析推理，我们将涵盖背景知识、核心概念、算法原理、数学模型、项目实战、实际应用场景、工具资源推荐等多个方面，帮助读者深入理解GCP的使用方法和搭建云应用的流程，为后续的云计算实践打下坚实
【AIGC工具箱】AIGC重塑生活神器
【AIGC工具箱】AIGC重塑生活神器（一）数字人（1）Sonic（腾讯）（2）HUMVA（二）视频生成（1）HumanDiT（字节跳动）（2）AnimateAnyone2（阿里巴巴）（3）Recraft（4）MIMO（阿里巴巴）（5）Wan2.1（阿里巴巴通义万象）（三）代码辅助（1）Cursor（2）Trae（字节跳动）（3）Qwen2.5-Coder(32B)（阿里巴巴）（4）Roo-Cli
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
react native 之自定义顶部导航栏，实现标题居中可控铁柱同学 React Native react native基础讲解 react-native 导航栏标题居中
本来一直用的都是RN自带的组件react-navigation，但是后面需求有变，需要顶部导航栏目的标题可以自己控制，同一页面的标题根据数据库查出来的内容变化。因此自定义了一个导航栏目，实现需求。关于RN自带的顶部导航栏以及底部导航栏目，请看我的另一篇博客，地址：http://blog.csdn.net/ljfphp/article/details/77940284一、背景1、根据需求，要求点击列
RAID的介绍和实战操作
一RAID的介绍RAID（RedundantAarryofIndependentDisks）：廉价磁盘冗余阵列是一种通过将多个物理磁盘组合成一个逻辑单元来提高数据存储性能、可靠性或两者兼顾的技术。作用：提高性能：通过并行读写（数据分块）加速数据访问。增强容错能力：通过冗余数据（如镜像或校验）防止磁盘故障导致的数据丢失。扩展存储容量：将多个磁盘合并为更大逻辑单元。（简单说就是提高容错以及读写速率）类
React Native打开相册选择图片或拍照 -- react-native-image-picker
官方文档：https://www.npmjs.com/package/react-native-image-picker场景：点击按钮打开相册选择图片或者点击按钮拍照import{launchCamera,launchImageLibrary}from'react-native-image-picker';//...{//调相册选择图片const{assets}=awaitlaunchImageL
最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
STC15单片机实战笔记一未来电子机械工程师单片机STC15实战单片机
新建工程一、新建工程前的准备1、添加型号与头文件到keil第一次新建STC工程时，需要将STC的型号与头文件添加到keil软件中。打开STC-ISP下载工具，切换至keil仿真设置栏，按提示添加即可。2、新建工程文件夹①、在新建工程目录下新建软件开发文件夹用于存放工程文件；②、在软件开发目录下新建user文件夹，用于存放main，public等文件；③、在软件开发目录下新建app文件夹，用于存放应
js运行，控制台显示乱码 wangsrc javascript linux 开发语言
"code-runner.executorMap":{ "javascript":"C:\\ProgramFiles\\nodejs\\node.exe" //node.js的安装路径}参考文章：https://blog.csdn.net/m0_63785629/article/details/129432129
AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界 AI专题精讲强化学习人工智能强化学习 AI技术应用
温馨提示：本篇文章已同步至"AI专题精讲"CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界摘要中等规模的大型语言模型（LLMs），如参数量为7B或13B的模型，在机器翻译（MT）任务中展现出良好性能。然而，它们仍未能达到最先进的传统编码器-解码器翻译模型，或是如GPT-4（OpenAI,2023）等更大规模LLM的表现。在本研究中，我们致力于弥合这一性能差距。我们首先评估了在机器翻译任
git 入门格林姆大师
git入门学习笔记----3个入门命令：gitinit、gitadd、gitcommit-v学习场景（首次在github上创建newrepository）：…orcreateanewrepositoryonthecommandlineecho"#blog-02">>README.mdgitinitgitaddREADME.mdgitcommit-m"firstcommit"gitremoteadd
view的初始化及控件的懒加载 lifeLL
@implementationPGIndexBannerSubiew-(instancetype)initWithFrame:(CGRect)frame{self=[superinitWithFrame:frame];if(self){[selfaddSubview:self.mainImageView];[selfaddSubview:self.coverView];}returnself;}-
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n