昇思MindSpore

【AI工程论文解读】03-DevOps for AI-人工智能应用开发面临的挑战

作者：王磊
更多精彩分享，欢迎访问和关注：https://www.zhihu.com/people/wldandan

DevOps（研发运营一体化）：是 Development 和 Operations 的组合词，它是一组过程、方法与系统的统称，用于促进开发（应用程序/软件工程）、技术运营和质量保障（QA）部门之间的沟通、协作与整合。研发运营一体化是将应用的需求、开发、测试、部署和运营统一起来，基于整个组织的协作和应用架构的优化，实现敏捷开发、持续交付和应用运营的无缝集成，在保证稳定的同时，快速交付高质量的软件及服务，灵活应对快速变化的业务需求和市场环境。

在上一篇《【AI工程】06-CD4ML-机器学习的持续交付（上）》文中，我们介绍了如何实现机器学习的持续交付。最近阅读了《DevOps for AI – Challenges in Development of AI-enabled Applications》，本篇文章主要介绍了将DevOps和ML工作流结合的解决方案和实践。

近年来，随着AI相关技术快速演进，AI应用也广泛的出现在人们的日常生活中。然而，由于机器学习系统本身的复杂性—ML核心是通过大量训练迭代来找到最佳的预测模型，导致开发包含机器学习组件的软件系统时，开发过程会变得异常复杂。现代软件开发过程中，如DevOps，已经被广泛采用，用于应对频繁的开发迭代和软件变更的持续交付。尽管最新的软件开发技术可以解决构建基于ML的软件系统所面临的一些问题，但目前还没有一个关于如何将它们与ML工作流结合起来的既定流程。在《DevOps for AI – Challenges in Development of AI-enabled Applications》文章中，作者结合工业案例指出了包括ML组件在内的复杂软件系统开发中会面临的挑战，然后讨论了由DevOps和ML工作流流程结合驱动解决挑战的可能解决方案。

概述

ML是近十年来发展迅速、最有前途的技术，几乎应用于所有商业领域和研究领域。在许多领域（如医疗诊断），与传统应用程序相比，ML在提供结果方面表现出优势，并在某些活动中表现出优于人类智慧。这些趋势引发了对数据、AI科学家以及软件开发人员的巨大需求。

早期研究表明，构建算法(即开发ML模型)只是成功开发并运行基于AI的软件系统所需全部工作的一小部分。ML软件实现与传统软件的区别在于，它们的逻辑不是显式编程的，而是通过从数据中学习自动创建的。因此，基于ML的软件系统的开发过程涉及到不同的活动，包括数据收集、数据准备、定义ML模型(如深度网络模型)、进行训练的过程以量化模型参数并获得预期的结果。这个过程被称为ML工作流。ML工作流需要一套复杂的工具和活动的支持，而获得一个高效的流程本身就是一个挑战。

然而，ML工作流并不涵盖整个软件开发过程。它并没有解决如何高效地进行软件开发的问题，这就引申出一个问题，即ML工作流和软件开发过程应该如何关联起来，或者作为一个更普遍的问题：包含AI组件的软件系统的开发过程是什么？

在本文中，作者探讨了包含ML组件在内的软件开发过程的新要求。总结了ML组件需求带来的一些新的挑战，并提出了可用于开发、运行和演进基于ML的软件系统的软件开发模型。

现代软件开发过程应用了敏捷原则，最常用的敏捷过程之一是DevOps，它将开发和运营集成到一个通用过程中，使开发人员能够快速反馈应用程序性能及其使用情况。具体来说，本文讨论了ML工作流与DevOps的集成。

ML工作流

机器学习工作流描述了开发基于ML的软件系统时通常执行的开发阶段和活动。如图1所示，ML工作流包含的阶段：模型需求、数据收集、数据清洗、数据标签、特征工程、模型训练、模型评估、模型部署和模型监测。

图1：ML开发工作流阶段

对上述阶段进一步分组：（1）数据管理、（2）ML建模和（3）模型运营。数据管理过程包括数据的收集及数据准备。数据管理过程可以与ML建模分开执行—数据通常存储在企业数据仓库或开放式存储，提供给不同的ML应用程序使用。

ML建模过程相当于一个简单组件的开发，即创建模型、调整数据、训练模型，最后评估模型。此过程是高度迭代的，并由结果驱动，如模型精度、准确率或ML模型训练期间使用的其它质量属性。模型的部署和监测属于模型运营过程—模型在软件系统中的集成及其性能。监测ML组件被视为ML工作流的一个组成部分，其有助于向ML建模提供反馈，可能会导致使用新数据集重新训练模型，或者使用新的特征和新的模型架构重新设计模型。

在实际环境中，由于各种原因，使得开发ML系统具有挑战性。例如用于构建模型的数据存在大量的数据质量问题，并且在训练模型之前需要花费大量的精力来准备数据，因为通常这些数据不能轻易地作为模型的输入。此外，在ML建模阶段，手动和临时程序的使用也会使模型试验结果难以重现，降低了试验的效率。

尽管模型的开发存在挑战，但其仍然是构成整个ML系统的一小部分。一旦数据科学家选择了最终的模型，就需要将其部署并集成到最终用户应用程序中。对于复杂的系统，模型的集成和部署需要考虑与软件系统相关的大量需求。基于ML的应用程序还需要持续监测，以便检测预测结果和数据中的错误（例如，训练服务偏差），并重新训练模型。

DevOps流程

DevOps是一种软件开发方法，强调软件开发和运营之间的协作，以便运营软件系统并加快软件变更的交付。在持续部署（CD）的背景下，其有助于创建一个可重复、可靠的流程，以便在生产环境中频繁发布变更软件版本。基于敏捷软件开发方法，DevOps的一个重要原则是构建、测试、部署和运营流程的自动化（如图2所示），同时确保所有的软件artifacts都有版本控制。因此，DevOps在部署管道中的实践涉及软件部署过程的自动化，包括环境的自动配置，旨在最大限度地减少从软件开发团队到运营团队的移交债务。在软件开发实践中，部署管道是整个软件过程的技术表现，包括从版本控制到最终用户看到软件变更的所有阶段。部署管道中的自动化通常由基础架构团队完成，其将更具优势。

图2. DevOps工作流程

虽然DevOps方法也有一些非技术的实践，用于软件开发人员之间的有效协作，但大部分的重点都集中在技术实践上。在基于在线的应用程序中，部署机制被纳入到持续集成（CI）系统中，并与定义的一些触发器相结合，用于促使验收测试或生产环境变更时的自动部署。作为部署过程的一部分，配置管理工具用于有新的变更时，根据选定的部署策略（如蓝绿部署或者滚动升级），自动调配、配置和升级现有环境。在其他领域，如信息物理系统，或嵌入式系统，由于运营环境不同于开发环境，DevOps过程会包括额外的活动。可能为了提高开发周期的效率，会建立很多的模拟实验。

集成ML工作流和软件系统生命周期的挑战

ML工作流（如图1）定义了构建ML模型的端到端过程，但它忽略了软件开发过程。ML模型始终是应用程序或软件系统的一部分。软件系统的开发有另一种逻辑和过程（如图2左侧所示），运营和开发过程是相互反馈循环紧密相连（如图2右侧所示），但并没有很好的定义如何与ML工作流连接。这就导致执行ML工作流和DevOps时会面临很多挑战。本节介绍了推动ML工作流和DevOps集成的许多挑战。

多环境：假设ML训练有一个用于构建ML模型的数据存储。在ML工作流中，大多数与数据处理相关的活动都可以和其他活动解耦。ML模型训练对算力要求很高，大型模型通常需要分布式方式增加高性能的算力资源来训练，以加快训练速度。因此，开发环境需要交互式软件开发工具来调度本地或者分布计算单元的训练，通常是CPU和GPU的组合。另一方面，由于有限的计算和存储资源可能会上云，因此运行环境和传统的软件可能类似(例如基于web的应用程序)，也可能完全不同(例如自动驾驶系统)。
与传统软件开发相比，ML软件开发的主要挑战是如何处理数据和ML模型，而不仅仅是代码。用于跟踪和管理代码的工具，如Git，不足以确保有效跟踪和管理ML组件（代码、数据、模型）的版本依赖关系。类似地，持续集成（CI）工具不仅是测试代码，还用于测试和验证用于训练模型的数据。虽然一般使用CI工具来协调ML模型开发，但在分布式训练的背景下，他们不足以确保在专用硬件（如GPU）上有效训练模型。除了不同的工具，ML软件开发过程还需要拥有不同的专业知识的开发者——数据科学家、AI专家和软件工程师。以上这些在环境、工具、流程和专业知识方面差异，对ML软件开发提出了新的挑战：（1）如何确保成功管理多个开发环境？（2）如何确保组件之间无缝的相互通信和交互？（3）如何确保多学科专业知识，并实现领域专家之间的高效协作？
互补需求：现代软件开发流程将传统的需求管理与利益相关者的结果/数据反馈结合起来，最近还使用人工智能来增强系统运营的反馈。与用户验收相关的软件系统特性通常通过A/B测试进行评估。在许多领域，与质量属性相关的非功能性需求是开发过程的主要关注点。例如，与可靠性（safety、security、可靠性、健壮性等）、资源（实时性、性能、能耗、计算和存储约束）、用户界面（可用性）相关的属性。与ML工作流的要求不同：数据质量、数据管理的有效性（数据准备、标签）、训练过程的有效性（CPU训练时间）以及训练过程中所需的资源。关于ML模型的质量，有一组指标可以显示预测的质量：准确性、精确度和召回等。在特征工程中，特征选择及其处理(归一化、转换等)的质量、有效性与预测质量有关。
在集成过程中，主要的挑战在于理解软件系统需求和ML需求之间的关系。例如，系统特征与数据集特征之间的关系。显然，这些并不相同，但它们可能是相关的——当将特性指定为系统需求时，哪些特性应该包括在ML模型中？另一个例子：为了实现系统的可靠性，我们是否需要确保ML模型的精度达到一定的水平？性能要求也存在类似的问题：ML模型性能对系统性能的影响是什么——例如实时性要求？上述例子可以总结为一个共同的挑战：（1）如何将ML需求与软件系统需求联系起来？（2）如何从系统需求中得出ML需求？
系统验证VS. ML评估：ML评估的目标是提高预测质量——首先找到指定代价函数的最小值，然后以准确性等ML指标评估结果。这些指标的度量在开始时是未知的，需要通过多次迭代、调整ML模型和输入数据集来寻求最优值。该过程没有预定的目标，也没有过程的预判（比如时间和资源）。软件系统有规范去度量其正确性。正确性可以是二进制类型(正确/失败)，也可以是和非功能属性(如可靠性)相关的一种方式。在验证过程中，由于系统不应该被更改/调整，因此验证过程通常不是一个迭代过程。这种验证通常通过测试或者分析（静态/动态、正式/经验）。
这里又有一个问题，即这些过程是如何关联的？我们能使用ML评估指标来分析系统的正确性吗？如果系统中集成了不同的AI模型，那么这个问题就尤为重要。或者反过来，我们能从系统验证中得出ML模型不够准确或精确的结论吗？那么，软件系统验证与ML评估如何相关？
系统演进VS. ML模型演进：软件的持续变化促成了像DevOps等开发流程的出现，这些流程明确地支持持续集成、持续部署、自动验证和生产中特定类型的测试，如A/B测试。软件评估包括新功能和改进功能的变更以及内部基础结构的变更。这些更改会影响ML模块的更改请求，包含功能和非功能属性。ML工作流侧重于另一种类型的演进：（1）由于数据集变化引起的重新训练需求而演进，来自新环境的新数据可能需要通过再训练来重新建模。（2）模型本身的变化/优化产生的演进，但使用相同的数据集训练。虽然连续的软件演进会以一种可控的方式映射到ML模型的演进(尽管这需要建立程序)，但模型的数据输入的变化，可能会以不受控和意外的方式发生，这可能会直接影响ML模型的准确性和性能。上下文的变更可能需要使用新的数据集重新训练ML模型。然而，重新训练的模型可能会在新的上下文中正常工作，但它的性能在旧的环境中依然会下降。因此，衍生出新的挑战：（1）软件的演进如何影响ML模型的演进？（2）如何控制环境变化对ML模型性能和模型演进的需求？（3）如何控制ML模型的演进以实现对软件系统演进同样的控制水准？
运营和反馈循环：ML工作流和DevOps本身被设计为独立的迭代过程，但它们也相互依赖。数据管理包括数据收集，收集的数据用于在开发的初始阶段为训练提供数据。然而，在许多情况下，新数据是在系统运营期间收集的，尤其是新数据覆盖现有环境数据时，ML模型必须重新训练。ML模型必须部署在开发环境中，才能在开发过程中使用，并需要与可执行系统一起部署。在运营中，系统必须提供有关系统性能和用户对开发环境的接受程度信息，以便为系统的进一步演进提供反馈。系统还需要监控已部署的ML模型，以便检查其在当前环境中的性能。要获得成功和高效的端到端流程，必须不断交换不同类型的信息。这里面临的挑战：（1）流程之间应交换哪些信息？（2）信息交换的触发机制是什么，信息交换的频率是什么？

集成ML工作流和DevOps流程

最终的目的，通过 ML工作流和DevOps流程的集成能够实现在生产中快速、迭代和持续地开发、部署和运营基于AI的软件系统。集成流程期望在基于AI的系统开发中实现所有流程步骤内和跨流程步骤的自动化，包括构建、测试、部署和基础设施管理。所有对构建基于AI的系统重要的工件（代码、数据和模型）都是可复现的，能够适应并以小增量可靠地发布。集成过程特别适用于基于新的流数据或ML模型参数优化（如更改超参数）重新训练部署ML模型的场景。整个基于AI的系统生命周期将ML工作流和DevOps集成到四个不同的流程中，即数据管理(DM)、ML建模（Mod）、软件开发（Dev）和系统运营（Ops），如图3所示。

图3. ML工作流和DevOps流程集成

数据管理(DM)

数据管理阶段通过建立活动和系统，来收集数据、选择数据、增加标签和策划将用于训练ML模型的特征。标准化活动和系统有助于以最优化的格式提取和存储数据，便于在ML建模阶段使用，同时加强数据的适当安全访问控制。生成的数据集可以作为代码和原始数据的连接器，以便从中选择和提取数据样本。在附录案例A中，所有销售代表与潜在客户之间的邮件通信数据都存储在数据库中，从数据库中选择少量的数据样本进行标注。然而，提取涉及一系列不同的编码，以获取电子邮件文本、提取实体和构建实体周边关系。在附录案例B中，通过从包含日志文件和日志分析（由外部工具执行）的大型数据收集存储中提取数据，实现数据采集服务来构建数据集。

ML建模（Mod）

一旦在ML建模阶段提供了新的数据集进行训练，就需要提供训练环境以方便模型训练和评估。ML模型实验可以在ML平台上进行，该平台由内部开发或作为开源工具获取，提供分析数据集和训练ML模型的能力。在每个ML模型实验运行的阶段，数据集、训练模型(包括模型配置)和评估结果都被存储起来，以便与历史基线（例如当前正在生产的模型）进行比较。为了方便在ML模型实验成功完成后跟踪工件依赖关系，开发人员需要显式地将工件及其依赖关系(数据集、模型和代码)指定并注册到依赖关系跟踪系统中，该系统将实验运行历史数据存储在数据库中。对于每个工件，开发人员指定其元数据（名称、版本号、注册日期）和依赖关系信息，这些信息包含对工件依赖的其他元素的引用。例如，数据集依赖关系信息可以是（1）数据源，例如日志ID，（2）用于从原始数据中提取数据集的代码的Git哈希，（3）版本化的数据标签集和（4）提取脚本的入口点等。对于存储工件及其依赖关系信息来说，重要的是它应该具有不变性，即能够每次重新创建/再现完全相同的工件。版本化的工件和它们的依赖信息可以被其他系统从外部访问，例如，通过简单的API调用构建系统。在模型实验阶段结束时，选择最终的训练模型，并验证该模型在与其他ML组件隔离的情况下工作正常。附录中案例A使用外部开发的AI平台来构建和部署名为Databricks的模型。使用该工具，案例A将执行ML模型实验步骤的整个流程存储为单个存档文件，并将结果模型存储在一个版本控制的存储库中。在附录案例B中，在案例B中，ML建模阶段涉及数据挖掘、模型训练和评估等人工步骤。在成功训练一个模型之后，模型连同元数据信息(名称、版本、分类器、特性)也存储在模型注册表中。

软件开发（Dev）

当部署经过训练的模型时，首先要验证它与系统的其他部分(即其他组件)是否正确运行。构建系统在大型测试集上执行系统范围的集成和验证，以给出系统所有部分在不同组件之间如何执行的整体视图。此外，由于构建系统可以访问工件依赖信息和功能，例如使用代码(数据集生成代码、模型训练代码、评估度量生成代码)对工件进行版本控制和存储，因此构建系统可以以这样的方式实现，即它具有定期编排和运行整个模型训练作业的功能。在后者的情况下，重新训练模型将是自动化的，构建过程将被指定为失败、中止或成功。使用最佳模型成功构建—新模型性能优于生产模型—已在模型注册表中注册。如果构建失败或中止，开发人员可以选择使用优化的参数集重新构建模型。CI系统执行的历史构建还可以用来识别和分析由于模型更新而在其他组件中出现的bug。最后，只有在成功构建后，包括通过定期集成和系统测试，才会将经过验证的模型的最新注册版本发布/推广到后续的验收环境或生产环境从而保证质量。定期测试包括测试不同输入的AI组件，以确保适当的响应。在附录中案例A，可以通过重新运行包含Databricks工具生成的整个模型管道步骤的单个存档文件来重新生成训练过的模型。附录中案例B还计划纳入CI系统，以帮助处理由于时间压力而积累的技术债务，这些债务要求团队快速向利益相关者交付系统。例如，正在实施单元测试，以帮助捕获数据摄取服务引起的问题。

系统运营（Ops）

一旦ML系统组件在生产环境中运行(包括训练过的模型)，系统将被持续监视，以检测性能下降等问题。部署到生产环境可以是手动、半自动化或自动化的过程，部署一般在开发流程中的预生产环境中成功执行测试之后进行。Ops阶段还通过提供预测来确保AI组件的实时测试，同时遵守严格的延迟要求。在此步骤中，开发人员还根据实时数据收集模型的执行情况信息。这些信息可以用来触发模型的再训练。

结论

在本文中，作者演示了ML工作流和DevOps流程的集成，以帮助系统地构建基于人工智能的软件系统。在开发基于ML的软件系统时，该方法还有助于解决一些已确定的挑战。特别是ML模型实验和部署期间的手动步骤，包括解决ML工件的版本控制和依赖管理问题。本文也希望通过进一步的讨论，以解决基于人工智能系统发展中的许多挑战。

参考案例

案例A：外出（OOO）回复检测。OOO回复检测系统是基于web的销售合作平台中的一个人工智能组件，用于优化销售代表和潜在客户之间的沟通。AI组件从OOO电子邮件回复中提取信息，如联系人和日期，并自动提示销售代表采取相关操作，如添加联系信息，在返回日期暂停和恢复销售行动的自动顺序。

案例B：退回电信硬件中的故障分类系统。退回的电信硬件故障分类系统。人工智能组件根据无线网络的日志数据对返回硬件中的问题(故障)进行分类。筛选操作员作为最终用户，将返回的硬件与AI组件连接起来，并获得分数，以判断它是软件相关故障、硬件相关故障还是无故障。如果硬件良好（没有故障），则将其送回客户；但如果硬件损坏，则将其送去维修。

参考资料

Lucy Ellen Lwakatare, Ivica Crnkovic, Jan Bosch, DevOps for AI – Challenges in Development of AI-enabled Applications
中国信通院《中国DevOps现状调查报告（2022年）》

JDK 21 中的虚拟线程与 Future 马小跳在飞 jdk21虚拟线程 java 开发语言虚拟线程
在JDK21中，虚拟线程与Future的结合为异步编程提供了更强大和高效的解决方案。Future代表了异步计算的结果，通过它可以获取计算的状态和最终的结果。当与虚拟线程一起使用时，可以更灵活地管理和协调异步任务。例如，在一个数据处理的场景中，需要从多个数据源获取数据并进行合并处理。可以使用虚拟线程来并发地从不同数据源获取数据，并将每个获取任务的结果封装在Future中。以下是一个示例代码：impo
Langchain本地知识库部署 MaxCode-1 langchain
本地部署（Docker+LangChain+FAISS）1.概述本地部署LangChain-Chatchat可以为企业提供高效、安全、可控的AI知识库方案。本方案基于Docker、LangChain和FAISS进行本地化部署，适用于企业内部知识库问答、私有化AI应用等场景。2.技术选型2.1LangChainLangChain是一个开源的LLM（大语言模型）应用开发框架，支持多种模型和数据源，适用
鸿蒙开发黑科技“stack叠层”替代customdialog taopi2024 Harmony harmonyos
前一篇提到的问题，本篇博文提出了一个解决方案：arkui-xLongPressGesture触发customdialog踩坑记录-CSDN博客前一段时间遇到的这个问题，通过排除法观察，锁定为customdialog组件有bug，极为容易挂死。不论如何调整使用方法，都还是会触发挂死。反馈给arkui团队，说是在最新版本里解决这个问题，但是最新版本什么时候出来不清楚，而项目开发还要继续。后来甲方工程师
iOS swift 后台运行应用尝试失败 taopi2024 iOS ios swift xcode
最近需要制作一个能够后台长期运行的移动应用。该应用需要调用摄像头周期性捕获数据，然后对数据处理过后，实时反馈结果。支持android和ios平台。主要有下面几点：1、摄像头实时捕获2、能够适配多款不同机型的处理算法3、能在后台以服务形式常驻运行，不影响用户使用其他应用4、根据数据处理结果，给用户提醒，通常用户这时在使用其他应用在安卓平台上，已经通过多款不同型号的手机，验证了方案与算法，包括用户易用
android模拟点击 taopi2024 Android android
模拟点击两套方案：1、使用InstrumentationnewThread(()->{Instrumentationinst=newInstrumentation();longcurTime=SystemClock.uptimeMillis();inst.sendPointerSync(MotionEvent.obtain(curTime,curTime,MotionEvent.ACTION_DO
华为OD机试Python - 微服务的集成测试 steven_my 华为OD机试 Python 华为od python java c++javascript 华为OD机试算法
微服务的集成测试前言：本专栏将持续更新互联网大厂机试真题，并进行详细的分析与解答，包含完整的代码实现，希望可以帮助到正在努力的你。关于大厂机试流程、面经、面试指导等，如有任何疑问，欢迎联系我，wechat：steven_moda；email：[email protected]；备注：CSDN。题目描述现有n个容器服务，服务的启动可能有一定的依赖性（有些服务启动没有依赖），其次服务自身启动加载会消
C++ 包装器与绑定器的应用之如何取代虚函数 __雨夜星辰__ C++学习之路 c++开发语言学习笔记
C++虚函数在执行过程中会跳转两次（先查找对象的函数表，再次通过该函数表中的地址找到真正的执行地址），这样的话，CPU会跳转两次，而普通函数只跳转一次。CPU每跳转一次，预取指令要作废很多，所以效率会很低.为了管理的方便（基类指针可指向派生类对象和自动析构派生类），保留类之间的继承关系。使用基类指针指向派生类对象时,基类的析构函数应是虚函数,否则释放基类指针所指的对象时只会调用基类的析构函数.代码
大数据治理实战指南：数据质量、合规与治理架构一ge科研小菜鸡大数据大数据
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着企业数字化转型的加速，大数据已成为驱动业务决策的核心资产。然而，数据治理的缺失或不完善，可能导致数据质量问题、合规风险以及业务价值的流失。大数据治理的目标在于确保数据的可用性、完整性、安全性和合规性，支撑企业的智能化发展。本教程将系统讲解大数据治理的关键概念、技术方法，并提供实际应用案例，帮助企业构建高效的数据治理体系。1.大数据治理概述
java语言学习（5） memorycx Javase 学习历程 java 学习开发语言
第九章目录类变量和类方法理解main方法语法代码块单列设计模式final关键字抽象类接口类变量/静态变量该变量最大的特点就是会被本类的所有对象实例共享，类变量可以通过类名来访问分析代码，探讨内存的分配classChild{privateStringname;publicstaticintcount=0;//这个叫类变量或者叫静态变量publicChild(Stringname){this.name
java语言学习（6） memorycx Javase 学习历程 java 学习 python
十章类部类枚举和注解自定义实现枚举enum关键字实现枚举JDK内置的基本注解类型元注解：对注解进行注解补充：类的五大成员属性方法构造器代码块内部类内部类定义：一个类的内部又完整的嵌套了另一个类结构。被牵头的类称为内部类，嵌套其他类的类称为外部类，内部类最大的特点就是可ui直接访问私有属性，并且可以体现类与类之间的包含关系局部内部类（有类名）基本语法*classOuter{//外部类classInn
在Linux系统上使用nmcli命令配置各种网络（有线、无线、vlan、vxlan、路由、网桥等） m0_74823983 面试学习路线阿里巴巴 linux 网络服务器
1、更新于2024/5/13，新增VethPair配置2、更新于2024/5/19，修复NetworkManager接管网络配置无效的错误3、更新于2024/5/20，新增Ubuntu两种版本下NetworkManager接管网络的配置目录一、配置NetworkManager接管网络（选）安装Network-Manager并启动netplan管理网络的系统ifupdown管理网络的系统二、nmcl
C++11新特性之可调用对象包装器和绑定器 is-zq C++c++开发语言算法
一、可调用对象C++中可调用对象有六种.1.普通函数普通函数类型可以声明函数,定义函数指针和引用,但是不能定义函数的实体.usingFun=void(int,conststring&);//普通函数类型的别名。Funshow;//声明普通函数。intmain(){show(1,"我是一只傻傻鸟。");//直接调用普通函数。void(*fp1)(int,conststring&)=show;//声明
BPMN.js详解 GISer_Jinger Javascript 前端基础项目 javascript 开发语言 ecmascript
bpmn.js是一个基于JavaScript的开源库，它允许开发者在Web应用程序中创建、查看和编辑BPMN2.0流程图。以下是对bpmn.js的详细解析：一、基本概念与功能定义：bpmn.js是bpmn-io团队开发的一个JavaScript库，它专注于BPMN（业务流程模型和标记法）2.0标准的实现。主要功能：渲染BPMN图表：bpmn.js能够将BPMN2.0的XML文件渲染成SVG格式的图
【Python科研数据爬虫】基于国家标准查询平台和能源标准化信息平台的海上风电相关行业标准查询信息爬取及处理 lys_828 python科研数据处理及绘图 python 爬虫能源行业标准国家标准
基于国家标准查询平台和能源标准化信息平台的海上风电相关行业标准查询信息爬取及处理1背景2标准检索平台2.1能源标准化信息平台2.2全国标准信息公共服务平台3标准信息数据的爬取与处理3.1能源标准化信息平台的信息爬取3.2全国标准信息公共服务平台的信息爬取3.3标准信息处理1背景在进行项目背景介绍时，有时需要使用到有关标准进行背书，因此查询某一行业领域的标准信息就是第一步操作。接下来就是以海上风电相
Java 21 探讨虚拟线程锁在哪里？幻想多巴胺技术论文 java 开发语言
介绍Netflix在广泛的微服务架构中一直将Java作为主要编程语言。随着我们使用更新版本的Java，JVM生态系统团队会寻找可以改善我们系统的人机工程学和性能的新语言特性。在最近的一篇文章中，我们详细描述了当我们迁移到Java21并将代际ZGC作为默认垃圾收集器时，我们的工作负载如何受益。虚拟线程是我们在此次迁移中兴奋采用的另一项功能。对于虚拟线程的新手，它们被描述为“轻量级线程，大大减少了编写
点云从入门到精通技术详解100篇-基于卷积和注意力机制的3D点云特征提取格图素书 3d
目录知识储备点云获取技术分类一、图像衍生点云二、LiDAR三、RGB-D深度图像传感器基于3D激光slam的点云特征提取为什么要进行点云特征提取特征提取理论与代码编写点云特征提取主体类sample_and_groupfarthest_point_samplequery_ball_pointindex_points前言国内外研究现状卷积神经网络三维卷积神经网络稀疏卷积[21]基于3D点云数据的目标分
Python的未来 future模块 gftygff
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！转载：http://omencathay.itpub.net/post/30163/414347简单介绍一下python未来将会支持的一些语言特点,虽然Ibm的网站上也有介绍.但是太凌乱了.而且中翻译过后,代码的
【Django】settings（django中settings设置） SX-干 Python-Web框架
分类：Django（129）目录(?)[+]转自：http://blog.csdn.net/feng88724/article/details/7221973作者:Django团队译者:[email protected]翻译开始日期:2006-04-04翻译完成日期:2006-04-04修订日期:2006-05-06原文版本:2789Djangosettings文件包含你的Django安
sklearn模型评估全景：指标详解与应用实例 2402_85758936 scala 开发语言人工智能
sklearn模型评估全景：指标详解与应用实例在机器学习中，模型评估是衡量算法性能的关键步骤。scikit-learn（简称sklearn）提供了一套全面的模型评估工具，帮助开发者量化模型的准确性、健壮性和其他重要特性。本文将详细介绍sklearn中的模型评估指标，并通过代码示例展示如何应用这些指标。模型评估的重要性模型评估指标是理解和改进模型性能的基础。它们可以提供以下信息：准确性：模型预测的准
7、知识库内容更新与自动化 MaxCode-1 自动化运维知识库
1知识库内容更新与自动化企业级知识库的内容随着业务发展不断增长，涉及政策法规、内部文档、技术规范、FAQ、产品手册等多个领域。如果完全依赖人工维护，成本高、效率低，且容易造成信息滞后。因此，企业需要借助自动化工具、智能算法、订阅机制，构建高效、动态的知识更新体系，确保知识的实时性、准确性和可追溯性。本节将介绍自动化知识更新的最佳实践，并探讨数据版本管理与历史溯源，以确保知识库的高效运营。1.1自动
【HarmonyOS Next NAPI 深度探索2】N-API 的工作机制与架构轻口味 HarmonyOS Next NAPI 深度探索 harmonyos napi c C++harmonyos next harmonyos-next
【HarmonyOSNextNAPI深度探索2】N-API的工作机制与架构如果你听说过N-API，但还不太了解它的作用和背后的工作机制，那这篇文章会帮你捋清楚它的结构和原理。N-API是Node.js提供的一个强大工具，专门用于开发高性能、可维护的原生模块。接下来，我们一起看看N-API是如何工作的，它的架构是怎样的。什么是N-APIN-API，全称是Node.jsNativeAPI，是一个用来开
AI学习指南Ollama篇-Ollama简介俞兆鹏 AI学习指南人工智能 ollama
一、定义大语言模型（LLM）是一种基于深度学习的自然语言处理模型，能够生成文本、回答问题、翻译语言、撰写代码等。这些模型通过海量的文本数据进行训练，学习语言的模式和结构，从而能够生成自然流畅的文本内容。随着技术的不断进步，大语言模型在各个领域都展现出了巨大的潜力。二、应用场景大语言模型的应用场景非常广泛，以下是一些常见的例子：聊天机器人：通过自然语言理解与生成，为用户提供智能对话服务。内容创作：帮
个人KPI与GTD之间为什么怎么像小Mie不吃饭 KPI 指标 GTD gtd kpi
目录KPI的定义GTD的定义KPI与GTD的关系目标一致性相互补充应用场景实际应用示例KPI（关键绩效指标）和GTD（GettingThingsDone，完成每一件事）是两种不同的管理工具，它们在个人和组织管理中有着各自的作用和应用场景，但也存在一定的联系。KPI的定义KPI是关键绩效指标，通过对组织内部流程的关键参数进行设置、取样、计算、分析，衡量流程绩效的一种目标式量化管理指标。KPI的主要作
创建自定义全局指令 yqcoder 前端 javascript 开发语言
1.创建文件夹mycli、mycli/bin2.创建文件mycli/bin/index.js3.在mycli文件目录下运行命令npminit-y生成package.json{ "name":"mycli", "version":"1.0.0", "main":"index.js", "bin":{ "mycli":"bin/index.js" }, "scripts":{ "test":"ec
云计算如何与物联网（IoT）结合？云上的阿七云计算物联网
今天我们来聊一个既酷炫又实用的话题：云计算如何给物联网插上腾飞的翅膀。智能时代的技术密码想象一下，你家的冰箱会自动帮你订购即将用完的牛奶，工厂的机器能预测何时需要维修，城市的路灯会根据实时交通流量调整亮度。这些看似科幻的场景，正是云计算与物联网完美融合的魔法。架构师视角下的技术融合我深知这不仅仅是简单的技术叠加，而是一场深度革命。云计算为物联网提供了超级加速器：弹性计算：像变形金刚一样随时调整计算
linux下使用vscode和cmake高效管理c++项目简明教程 zeeq_ Ubuntu C++vscode vscode linux c++
安装vscode及c++环境配置可以参见：https://blog.csdn.net/fangshuo_light/article/details/123635576 首先，创建工程目录，并在vscode中打开该文件夹，在里面创建如下文件夹：include：用于存放.h文件src：用于存放.cpp文件build：cmake生成文件的存放路径CMakeLists.txt：cmake配置文件
java线程间如何通信一只爪子 java jvm 开发语言
Java线程之间可以通过以下方式进行通信：使用wait()和notify()方法，这需要使用同步代码块或同步方法。在同步代码块或同步方法中，线程可以调用wait()方法阻塞，并在其他线程调用notify()方法后恢复执行。使用CountDownLatch，它是一个同步辅助类，可以让一个线程等待其他线程的完成。使用CyclicBarrier，它也是一个同步辅助类，可以让多个线程在某个点上等待，直到所
Node CLI 之 Commander.js (1) 史一试脚手架 javascript 开发语言 ecmascript
官网地址：https://github.com/tj/commander.js/blob/f1ae2db8e2da01d6efcbfd59cbf82202f864b0c1/Readme_zh-CN.mdCommander.js是node.js命令行界面的完整解决方案开始新建一个node工程执行npminstallcommanderpackage.json中新增代码添加#!/usr/bin/envn
【由浅入深认识Maven】第2部分 maven依赖管理与仓库机制 Suwg209 由浅入深认识maven maven java
文章目录第二篇：Maven依赖管理与仓库机制一、前言二、依赖管理基础1.依赖声明2.依赖范围（Scope）3.依赖冲突与排除三、Maven的仓库机制1.本地仓库2.中央仓库3.远程仓库四、版本管理策略1.固定版本2.版本范围五、总结第二篇：Maven依赖管理与仓库机制一、前言后端研发同学经常面临项目中需要依赖大量第三方库的情况。这些依赖库通常是我们工作中的基础工具，例如Spring、Log4j、J
《Effective Java》学习笔记——第7部分并发 Suwg209 Effective Java最佳实践笔记 java 学习笔记
文章目录一、前言二、并发最佳实践1.优先使用现有的并发库2.避免共享可变数据3.最小化锁的持有时间4.使用合适的同步策略5.使用volatile变量来避免缓存问题6.避免死锁7.使用ExecutorService管理线程8.优先使用无锁并发工具三、小结一、前言《EffectiveJava》第7部分“并发”介绍了如何编写高效、安全的多线程程序。随着多核处理器的普及，Java的并发编程变得更加重要。本
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>