闪闪·Style

（英国剑桥大学）部署机器学习中的挑战：案例研究综述（中）中文译文 Challenges in Deploying Machine Learnings: a Survey of Case Studies

论文原文：https://arxiv.org/pdf/2011.09926.pdf

翻译：闪闪·Style

前一篇文章：（英国剑桥大学）部署机器学习中的挑战：案例研究综述（上）中文译文

（5）模型验证

模型验证阶段的目标是多方面的，因为机器学习模型应该很好地推广应用于看不见的输入，证明对边缘情况的合理处理和整体的健壮性，并且满足所有的功能需求。在本节中，我们将讨论模型验证的三个步骤：需求编码、形式化验证和基于测试的验证。

（5.1）需求编码

定义机器学习模型的需求是测试活动的一个重要先决条件。通常情况下，模型性能的提高并不能转化为业务价值的增加，如Booking.com在将150个模型投入生产后所发现的那样[44]。因此，需要定义和衡量更具体的指标，例如：KPI与其他业务驱动的度量。在Booking.com的案例中这些指标包括客户转化率、客户服务订票或订票取消。甚至需要跨学科的努力来定义这样的度量，因为需要从建模、工程和业务角度进行理解。一旦定义好，这些度量就用于对生产环境的监控和对模型更新的质量控制。

此外，简单地测量机器学习模型的精度不足以了解其性能。从本质上讲，绩效指标应该反映受众的优先级。例如，Sato等人[45]建议验证模型的偏差和公平性，而在Wagstaff等人[31]描述的情况下，控制航天器资源的消耗至关重要。

（5.2）形式化验证

形式化验证步骤验证模型功能是否符合项目范围内定义的需求。这种验证可以包括正确性的数学证明或输出误差边界的数值估计，但正如Ashmore等人[14]指出的那样，这在实践中很少发生。更常见的是，质量标准是通过广泛的监管框架正式制定的。

机器学习解决方案必须遵守法规的一个例子是银行业[46]。这一要求是在全球金融危机之后制定的，因为业界意识到有必要加强对模型的审查。因此，对于定义模型如何构建、批准和维护的过程，现在应用了更高级别的监管控制。例如，英国审慎监管局（Prudential Regulation Authority）和欧洲央行（European Central Bank）[48]已经发布了官方指南。这些指导原则要求为所有业务决策解决方案准备好模型风险框架，这些框架的实现要求开发人员拥有广泛的测试套件，以理解他们开发的机器学习模型的行为。在这种情况下，形式化验证步骤意味着确保模型符合相应法规规定的所有标准。

监管框架与全国性政策有相似之处，我们将在第7.1节中详细讨论。

（5.3）基于测试的验证

基于测试的验证旨在确保模型能够很好地推广应用于以前看不到的数据。虽然收集验证数据集通常不是问题，因为它可以通过拆分训练数据集派生而来，但对于生产部署来说，这可能还不够。

在理想的场景中，测试是在真实的环境中进行的，在这种环境中可以观察到业务驱动的度量，正如我们在第5.1节中讨论的那样。由于各种安全、保证和规模原因，真实环境中的全尺度测试具有挑战性，并且常常被模拟测试所取代。自动车辆控制模型就是这样[26]。模拟的成本更低，运行速度更快，并且提供了创建现实生活中很少遇到的情况的灵活性。由于这些优点，模拟在这一领域变得越来越普遍。然而，重要的是要记住，基于模拟的测试依赖于模拟开发人员所做的假设，因此不能被视为真实世界测试的完全替代品。即使仿真与真实世界之间的微小变化也会对系统行为产生剧烈的影响，因此作者得出结论：对于自主车辆来说，仅对模型和仿真环境进行验证是不够的。强化学习领域的经验进一步强调了这一点[25]，其中使用模拟是训练代理的事实标准。

此外，数据集本身也需要不断验证，以确保数据错误不会蔓延到流水线中，也不会影响整体质量。Breck等人[49]认为，当数据中的问题不被注意时，最常见的场景之一是数据生成与机器学习流水线相互分离。出现这样的问题可能有多种原因，包括代码中的错误、反馈循环、数据依赖关系的更改。数据错误可以在流水线的不同阶段传播和表现出来，因此必须通过在机器学习流水线中包含数据验证例程来尽早捕捉到它们。

（6）模型部署

在生产中运行的机器学习系统是一个复杂的软件系统，必须随着时间的推移进行维护。这给开发人员带来了另一组挑战，其中一些挑战是与运行常规软件服务共有的，还有一些是机器学习特有的。

工程中有一个单独的学科叫做DevOps，它专注于成功维护和支持现有生产系统所需的技术和工具。因此，有必要将DevOps原理应用于机器学习系统。然而，尽管DevOps的一些原则直接适用，但在已投入生产的机器学习方面也存在一些独特的挑战。Dang等人[50]详细讨论了这一点，他们将术语AIOps用于机器学习系统的DevOps任务。还提到一些挑战，包括：缺乏高质量遥测数据以及缺失采集这些数据的标准方法、获取标签的难度（使得有监督学习的方法不适用）、缺少关于掌控机器学习模型的一致最佳实践等。在本节中，我们将讨论与模型部署中的三个步骤有关的问题：集成、监控和更新。

（6.1）集成

模型集成步骤由两个主要活动组成：构建运行模型的基础设施与用可以使用和支持的形式实现模型本身。前者是一个几乎完全属于系统工程的主题，因此不在本文的范围之内，后者是我们研究的兴趣所在，因为它揭示了机器学习和软件工程交叉的重要方面。事实上，软件工程中经常使用的许多概念现在正在机器学习上下文中被重新发明。

代码重用是软件工程中的一个常见主题，而机器学习可以从采用相同的思维方式中获益。数据和模型的重用可以直接转化为对时间、精力或基础设施的节省。一个说明性的例子是Pinterest所采用的面向学习图像嵌入的方法[51]。在Pinterest内部使用了三个模型，它们都有着相似的嵌入方法，为了使它们能够独立地进行迭代，它们一开始是彻底分开进行维护的。然而，这带来了工程上的挑战，因为处理这些嵌入方法的每一个努力都必须乘以三。因此，团队决定研究学习通用嵌入集的可能性。结果证明这是可能的，这种重用最终简化了它们的部署流水线，并提高了单个任务的性能。

Sculley等人[52]给出了机器学习从业者现在面临的被广泛选择的工程问题。它们大多被认为是工程上的反模式（anti-patterns），但目前广泛存在于机器学习软件中。其中一些问题，例如抽象边界侵蚀（abstraction boundaries erosion）和校正级联（correction cascades），是由于在软件必须明确依赖于外部数据的情况下使用机器学习造成的。其他的，如胶水代码（glue code）或流水线丛林（pipeline jungles），源于该领域开发通用软件包的普遍趋势。本文讨论的另一个问题来源是配置债务，这是由于除了常规软件系统可能需要的所有配置之外，机器学习系统还添加了大量必须设置与维护的机器学习特定配置内容。

研究人员和软件工程师经常发现他们在同一个项目上一起工作，目的是用机器学习的方法来达到商业目标。从表面上看，似乎有一个明确的职责划分：研究人员开发模型，工程师构建运行模型的基础设施。实际上，在考虑开发过程、模型输入和输出以及性能度量时，它们关注的领域通常是重叠的。这两种角色的贡献者通常使用相同的代码。因此，将研究人员循环（loop）到整个开发过程中是有益的，确保他们与工程师一起拥有产品代码库，使用相同的版本控制并参与代码评审。尽管存在明显的入职和启动缓慢的挑战，但这种方法被视为在产品交付的速度和质量方面带来了长期收益[12]。

（6.2）监控

监控是由Sculley等人[52]报告的与维护机器学习系统相关的问题之一。社区正处于了解要监视的数据和模型的关键指标以及如何基于它们进行报警的早期阶段。监测机器学习模型不断变化的输入数据、预测偏差和总体性能是一个开放的问题。本文强调的另一个特定于数据驱动决策的维护问题是反馈回路。生产中的机器学习模型可以通过定期的再训练来影响它们自己的行为。在确保模型保持最新状态的同时，还可以创建反馈循环，在这个循环中，对模型的输入进行调整以影响其行为。这可以是有意的，也可以是无意中发生的，这是运行实时机器学习系统时的一个独特挑战。

Klaise等人[53]指出了异常值检测的重要性，它是一个关键工具，用以标记不能在生产环境中使用的模型预测值。作者列举了两个导致这种预测发生的原因：模型无法在训练数据集之外进行泛化，以及由于校准不当而对正常分布外实例的预测过于自信。异常值检测器的部署本身就是一个挑战，因为标记的异常值数据很少，检测器的训练常常成为一个半监督甚至无监督的问题。

Ackermann等人[54]提供了有关监控机器学习系统的更多信息。本文描述了美国两个警察部门的早期干预系统（EIS）。从表面上看，他们的监控目标似乎完全是标准的：数据完整性检查、异常检测和性能指标。人们希望能够使用开箱即用的工具来完成这些任务。然而，作者解释说，为了保持良好的模型性能，他们必须从头开始构建所有这些检查。例如，数据完整性检查意味着验证某个输入表的更新以及历史记录的校验和，性能指标是根据前k项（top k）输出中的变化次数定义的，异常情况则是随着时间的推移通过秩序相关性（rank-order correlations）来跟踪的。所有这些监测工具都需要大量的调查和实施。这突出了当前可用的端到端机器学习平台的一个常见问题：最终的机器学习解决方案通常对问题的细节非常敏感，以至于现成的工具不能很好地满足他们的需求。

最后，我们要注意的是，在选择监控和验证的指标之间存在重叠。后者在第5.1节中讨论。

（6.3）更新

一旦模型的初始部署完成，通常需要能够在以后更新模型，以确保它始终反映数据和环境的最新趋势。有多种技术可以使模型适应新数据，包括有计划的定期再训练和持续学习[55]。然而，在生产环境中，模型更新也会受到实际考虑的影响。

直接影响模型更新过程质量和频率的一个特别重要的问题是概念漂移。机器学习中的概念漂移被理解为在联合分布p（X，y）中观察到的变化，其中X是模型输入，y是模型输出。如同在Jameel等人[56] 针对分类问题的研究中，或在Celik和Vanschoren[57]在自动机器学习（AutoML）上下文的研究中所看到的那样，这种现象可能会对模型性能产生重大的不利影响。概念漂移的产生有多种原因。例如，正如Masegosa等人[58]所解释的那样，随着2008年金融危机的发展，金融业面临着动荡的变化，如果能采用先进的检测技术，它可以为当前的危机提供更多的见解。如Langenkämper等人[59]所述，无法避免数据收集过程中的波动也会导致数据的变化，该论文研究了海洋图像采集设备和位置的细微变化对深度学习模型性能的影响。正如Zenisek等人[60]在他们关于工业机械磨损的预测性维护的研究中所显示的那样，即使是在微观尺度上，数据变化也会产生显著的后果。尽管概念漂移已经被认识了几十年[61]，但这些例子表明，它仍然是当今机器学习应用的一个关键问题。

除了何时重新训练模型以使其保持最新状态的问题之外，还有一个关于如何将模型工件交付到生产环境的基础架构问题。在软件工程中，这类任务通常通过连续交付（continuous delivery）来解决，这是一种通过构建自动流水线来构建、测试和部署软件变更用以加快开发周期的方法。用于机器学习解决方案的连续交付很复杂，因为与常规软件产品中只在代码中发生更改不同，机器学习解决方案经历了三个轴向的变化：代码、模型和数据。Sato等人[45]中可以看到，将机器学习的连续交付作为一个独立的学科来制定。这项工作描述了在构建完整流水线的每个步骤中所涉及的部分和可以使用的工具。一个完整的连续交付流水线可以给现实生活中的机器学习解决方案带来的好处可以在Wider and Deger[62]的研究中找到。

（7）横切特征（cross-cutting aspects）

在本节中，我们将描述机器学习项目必须考虑的另外三个方面：伦理、最终用户的信任与安全。部署流水线的各个阶段都会受到影响。

（7.1）伦理

伦理考虑应始终对数据收集活动产生影响。正如艾伦图灵研究所（Alan Turing Institute）发表的关于伦理人工智能的报告[63]所述，“在整个人工智能项目交付工作流程中建立一个持续的人的责任链是至关重要的”。如果研究人员和开发人员不遵循这一建议，可能会因为各种原因出现复杂情况：违反政府法规、不合理的结果、现有问题的恶化等等[63]。

许多国家都制定了保护个人数据权利的法规。从个人那里收集的信息越敏感，对其使用的规定就越严格。当然，处理一些最敏感信息的行业是医疗保健行业。根据Han等人[64]的研究，许多国家都有严格的法律来保护患者的数据，这使得在医疗保健中采用机器学习尤其困难。此类法规的例子包括欧盟的一般数据保护法规[65]和亚洲国家的伦理筛查法[66]。一方面，毫无疑问，这些规则是绝对必要的，以确保人们对使用他们的数据感到满意。另一方面，所需的大量审查、软件更新和数据收集/注释周期使得跟上机器学习的技术进步异常困难，正如Han等人[64]根据他们在日本医疗保健部门部署机器学习解决方案的经验所解释的那样。

公司不应该只关注解决方案的技术方面，正如DeepMind和皇家免费NHS基金会信托基金会（Royal Free NHS Foundation Trust）在研究Streams时发现的那样，Streams是一种在严重情况下自动审查测试结果的应用程序[67]。他们最初的合作在患者数据的使用和患者参与方面不够具体，这引发了对他们遵守数据保护法规的调查。修订后的合作协议更加全面，包括患者和公众参与策略，以确保数据的使用符合伦理要求。

由于机器学习模型使用以前看到的数据来做出决策，它们可能会使数据中已经存在的问题恶化。奥尼尔详细讨论了刑事司法领域的这种影响[68]。“计算犯罪风险的方法”通常是用“人的偏见”来计算的。然而，他们使用看似中立的人口统计信息，而这些信息往往最终成为一种代理（proxy）。结果，人们因种族或收入而处于不利地位。

同样，Soden等人[69]提到通过使用有偏见的训练数据集会加剧社会不平等，这是将机器学习应用于灾害风险管理（DRM）领域的主要关注点之一。此外，有人认为，机器学习通过组合先前不同的数据集，在脆弱性、冲突和暴力环境中引起隐私和安全问题。专家和公众的作用被降低也被数字版权管理专业人士视为一个伦理问题。其中一些问题属于机器学习的分支研究领域，在机器学习中被称为公平性[70]。我们将在第7.3节讨论相关的跨领域安全问题。

Anantrasirichai和Bull[71]讨论了在创造性艺术领域中使用机器学习的一个有趣的伦理特征。当一个经过训练的模型被用来创作一件视觉艺术作品时，它的作者身份并不完全清楚。因此，独创性问题需要特别注意。与这个问题密切相关的是，越来越多的人担心使用机器学习生成虚假内容，这些内容很容易被用于错误的目的[72]。

机器学习遇到的另一个伦理问题是基于数据的决策。随着机器学习工具在关键决策过程中的应用，伦理问题也随之增加。Muthiah等人做了说明性批注[73]。他们的预测内乱的系统被称为EMBERS，被设计用来作为一种预测和交流工具，然而作者指出，它也有可能被政府滥用，可能是由于对其在社会中的作用的误解，或者是故意而为之的。

（7.2）最终用户的信任

最终用户通常会谨慎对待机器学习[74]、[3]、[75]。就其自身的协议而言，模型提供的解释很少，这使得很难说服最终用户使其相信这些模型的实用性[64]。为了说服用户信任基于机器学习的解决方案，必须投入时间来建立这种信任。在本节中，我们将探讨如何在实践中做到这一点。

如果一个应用程序有一个定义明确的可访问的受众，那么让这些人尽早参与项目是培养他们对最终产品的信心的有效方法。这种方法在医学中非常常见，因为最终产品通常针对的是定义明确的医疗工作者群体。一个例子是名为“败血症观察”的项目[76]。在这个项目中，我们的目标是建立一个模型来估计病人患败血症的风险。这并不是第一次尝试实现预测的自动化，由于之前的尝试被认为是失败的，医务人员对败血症观察的最终成功表示怀疑。为了克服这种怀疑，团队将建立信任作为首要任务，方法是：

建立强有力的沟通渠道；
与利益攸关方分享在制定目标方面取得的进展，而不是展示技术进步；
建立公共和外部问责机制；
在项目的早期阶段让一线临床医生和企业级决策者参与进来。

这项工作的一个关键信息是，模型的可解释性作为一个建立信任的工具是有局限性的，并且应该考虑用其他方法来获得最终用户的高可信度。虽然这听起来可能有争议，但事实上它与“Project explAIn”项目的结论一致，后者发现人工智能决策解释的相对重要性因上下文而异[77]。

Soden等人[69]也提出了类似的观点，他们探讨了机器学习对灾害风险管理（DRM）的影响。由于部署的机器学习解决方案越来越复杂，公众越来越难以参与，也越来越难以信任基于机器学习的灾害风险管理服务，例如洪水面积估计或飓风造成的损失预测。作为一种缓解措施，作者建议可以将模型描绘的所在地区的居民意见视为一种“风险”，并尽可能依赖开放软件和数据，使这些解决方案的开发尽可能透明。

构建值得信赖的产品的一个合理方法是在具有定制用户体验的专业用户界面上投入时间。Firebird[22]是一个帮助确定美国亚特兰大市消防检查重点目标的系统，其开发人员发现，引入机器学习解决方案替代以前使用的纸笔法的最佳方法是开发一个用户界面，表明以最终用户（消防人员与消防部门的检查员）的方式展示建模结果是最有用和最清楚的。Ackermann等人[54]也报道了类似的经验。

在拉丁美洲，EMBERS[73]是一个预测人口水平事件（如抗议）的系统，其作者注意到他们的用户有两种使用该系统的模式：（a）高召回率：获取大多数事件，然后使用其他方法过滤它们；（b）高精度：关注特定区域或特定假设。为了改善用户体验，从而增加他们对产品的信心，用户界面进行了改进，以方便地支持这两种模式。这个案例研究强调了上下文感知个性化对机器学习系统接口的重要性，这是Project explAIn[77]提出的一个重要观察结果。

Budd等人[24]指出，接口设计直接影响为收集未标记数据而构建的应用程序的质量。他们讨论了一系列收集医学图像标签的项目，这些项目都得益于设计良好的用户界面。作者的结论是，最终用户界面在注释应用程序的总体成功中起着很大的作用。

最后，当目标受众对机器学习有经验和良好理解的时候，基于其决策可以被解释的模型解决方案是首选的。Bhatt等人[11]分析了可解释性作为机器学习模型在企业内部部署的一个特征，发现这是大多数利益相关者必须具备的要求，包括管理人员、机器制造工程师、监管者等。此外，他们的调查显示，与公平性和稳健性的衡量标准一样，可解释性得分是一个理想的模型指标。

（7.3）安全

机器学习在整个机器学习部署工作流程中开辟了新的威胁向量，如Kumar等人[78]所述。针对机器学习的专门对抗性攻击可以发生在模型本身，用于训练的数据以及由此产生的预测。对抗性机器学习领域正在研究这种攻击对机器学习模型的影响以及如何防范它们[79,80]。Kumar等人最近的研究发现，行业从业者没有能力保护、检测和响应对其机器学习系统的攻击[81]。在本节中，我们将描述实践中报告的会影响已部署的机器学习模型的三种最常见的攻击：数据中毒、模型窃取和模型反转。我们特别关注对抗性机器学习，同时认为在部署系统时其他相关的一般安全问题，如：访问控制和代码漏洞，超出我们的工作范围。

在数据中毒中，对抗性攻击的目标是在训练阶段故意破坏模型的完整性，以操纵产生的结果。中毒攻击在机器学习模型不断更新新的输入训练数据的情况下尤其相关。Jagielski等人报告说，在使用线性模型的医疗环境中，在训练集中引入中毒率为8%的特定恶意样本导致半数患者的剂量不正确[82]。

数据中毒也可能发生在利用我们在6.2节中讨论过的反馈循环的集体努力的结果，就像微软的Twitter机器人程序Tay[83]一样。Tay的目的是随着时间的推移提高对语言的理解，但很快被大量故意恶意的推文淹没。在发布后的16小时内，Tay令人不安的消息中有一部分是辱骂性的或攻击性的，因而这个机器人程序就被关闭了。

另一种类型的对抗性攻击是通过查询已部署模型的输入（例如通过公共预测API）并监视其输出，对其进行反向工程。为了训练一个替代模型，对抗性查询被精心设计来最大限度地提取关于模型的信息。这种类型的攻击被称为模型窃取。简而言之，这种攻击会导致知识产权的损失，这可能是防御者的一个关键商业优势。Tramèr等人[84]已经证明，可以通过一系列的机器学习算法（包括：logistic回归、决策树、支持向量机和神经网络）复制Google、Amazon和Microsoft提供的机器学习服务在生产中部署的模型。在他们的工作中，他们报告了从650次到4013次的查询数量，以提取一个等价的模型，时间范围从70秒到2088秒。

一种相关的攻击是模型反转攻击，其中对抗性攻击的目标是恢复私人训练集的一部分，从而破坏其机密性。Fredrikson等人已经证明，他们可以利用模型来恢复训练数据，这些模型报告了他们预测的置信值[85]。Veale等人[86]强调了防止模型反转攻击的重要性，把它作为遵守数据保护法（如GDPR）的关键一步。

（未完待续）

下一篇文章：（英国剑桥大学）部署机器学习中的挑战：案例研究综述（下）中文译文

【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
【机器学习|学习笔记】组合特征（Feature Combinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记人工智能神经网络深度学习
【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。文章目录【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达
R语言的软件开发工具纪霁然包罗万象 golang 开发语言后端
R语言的软件开发工具引言R语言因其强大的数据分析能力和丰富的统计包，自发布以来便广受欢迎。随着数据科学和分析的迅猛发展，R语言也逐渐成为数据分析、机器学习和统计建模领域的重要工具。为了更好地利用R语言进行软件开发，许多软件开发工具和环境应运而生。本文将深入探讨R语言的主要开发工具，帮助开发者更高效地进行数据处理和分析。1.R和RStudio基础R语言本身是一个用于统计计算和图形绘制的编程语言，而R
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Jupyter安装指南及Python配置 CodeWG python jupyter ide Python
Jupyter是一个非常流行的交互式计算环境，广泛用于数据分析、机器学习和科学计算等领域。本文将详细介绍如何安装Jupyter并配置Python环境。步骤1：安装Python首先，我们需要安装Python。请按照以下步骤进行操作：打开Python官方网站（https://www.python.org）并下载适用于您操作系统的最新版本的Python。运行下载的安装程序，并按照向导的指示进行安装。在安
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

（英国剑桥大学）部署机器学习中的挑战：案例研究综述（中）中文译文 Challenges in Deploying Machine Learnings: a Survey of Case Studies

（5）模型验证

（6）模型部署

（7）横切特征（cross-cutting aspects）

你可能感兴趣的:(机器学习)