ygtu2018

MLOps 综合指南

介绍

近年来，ML 模型发展迅速，企业越来越依赖它们来自动化和优化运营。但是，管理 ML 模型可能具有挑战性，尤其是当模型变得更加复杂并且需要更多资源来训练和部署时。这导致了 MLOps 的出现，作为标准化和简化 ML 工作流的一种方式。MLOps 强调需要在 ML 工作流中进行持续集成和持续部署（CI/CD），确保实时更新模型以反映数据或 ML 算法的变化。这种基础设施在准确性、可重复性和可靠性至关重要的领域很有价值，例如医疗保健、金融和自动驾驶汽车。通过实施 MLOps，组织可以确保其 ML 模型持续更新且准确，从而帮助推动创新、降低成本并提高效率。

什么是 MLOps？

MLOps 是一种结合 ML 和 DevOps 实践的方法，用于简化 ML 模型的开发、部署和维护。MLOps 与 DevOps 共享几个关键特征，包括：

CI/CD：MLOps 强调需要在 ML 工作流中连续更新代码、数据和模型。这种方法需要尽可能自动化，以确保一致和可靠的结果。
自动化：与 DevOps 一样，MLOps 强调自动化在整个 ML 生命周期中的重要性。自动执行 ML 工作流中的关键步骤（例如数据处理、模型训练和部署）可生成更高效、更可靠的工作流。
协作和透明度：MLOps 鼓励在开发和部署 ML 模型的团队之间建立协作和透明的共享知识和专业知识的文化。这有助于确保简化流程，因为交接期望将更加标准化。
基础结构即代码（IaC）：DevOps 和 MLOps 采用“基础结构即代码”方法，其中基础结构被视为代码并通过版本控制系统进行管理。此方法使团队能够更高效、更可重复地管理基础结构更改。
测试和监视：MLOps 和 DevOps 强调测试和监视的重要性，以确保一致且可靠的结果。在 MLOps 中，这涉及随着时间的推移测试和监视 ML 模型的准确性和性能。
灵活性和敏捷性：DevOps 和 MLOps 强调灵活性和敏捷性，以响应不断变化的业务需求和要求。这意味着能够快速部署和迭代 ML 模型，以满足不断变化的业务需求。

最重要的是，ML的行为有很多可变性，因为模型本质上是一个用于生成一些预测的黑匣子。虽然 DevOps 和 MLOps 有许多相似之处，但 MLOps 需要一套更专业的工具和实践来解决数据驱动和计算密集型 ML 工作流带来的独特挑战。ML 工作流通常需要超越传统软件开发的广泛技术技能，并且可能涉及专门的基础设施组件，例如加速器、GPU 和集群，以管理训练和部署 ML 模型的计算需求。尽管如此，采用 DevOps 的最佳实践并将其应用于整个 ML 工作流将显著减少项目时间，并提供 ML 在生产中有效所需的结构。

MLOps 在现代商业中的重要性和优势

ML 彻底改变了企业分析数据、制定决策和优化运营的方式。它使组织能够创建强大的数据驱动模型，揭示模式、趋势和见解，从而实现更明智的决策和更有效的自动化。但是，有效地部署和管理 ML 模型可能具有挑战性，这就是 MLOps 发挥作用的地方。MLOps 对现代企业变得越来越重要，因为它提供了一系列好处，包括：

更快的开发时间：MLOps 使组织能够加速 ML 模型的开发生命周期，缩短上市时间，并使企业能够快速响应不断变化的市场需求。此外，MLOps 可以帮助自动执行数据收集、模型训练和部署中的许多任务，从而释放资源并加快整个过程。
更好的模型性能：借助 MLOps，企业可以持续监控和改进其 ML 模型的性能。MLOps 有助于 ML 模型的自动测试机制，从而检测与模型准确性、模型漂移和数据质量相关的问题。组织可以通过尽早解决这些问题来提高其 ML 模型的整体性能和准确性，从而转化为更好的业务成果。
更可靠的部署：MLOps 允许企业在不同的生产环境中更可靠、更一致地部署 ML 模型。通过自动执行部署过程，MLOps 可降低在生产环境中运行时出现部署错误和不同环境之间不一致的风险。
降低成本并提高效率：实施 MLOps 可以帮助组织降低成本并提高整体效率。通过自动执行数据处理、模型训练和部署中涉及的许多任务，组织可以减少对手动干预的需求，从而实现更高效、更具成本效益的工作流程。

总之，MLOps 对于希望利用 ML 的变革力量来推动创新、在竞争中保持领先地位并改善业务成果的现代企业至关重要。通过实现更快的开发时间、更好的模型性能、更可靠的部署和更高的效率，MLOps 有助于释放利用 ML 进行商业智能和战略的全部潜力。利用 MLOps 工具还将允许团队成员专注于更重要的事务和业务，从而节省拥有大型专门团队来维护冗余工作流的费用。

MLOps 生命周期

无论是创建自己的 MLOps 基础结构还是从各种可用的联机 MLOps 平台中进行选择，确保基础结构包含下面提到的四个功能对于成功至关重要。通过选择解决这些重要方面的 MLOps 工具，你将创建一个从数据科学家到部署工程师的连续循环，以便在不牺牲质量的情况下快速部署模型。

持续集成（CI）

持续集成（CI）涉及不断测试和验证对代码和数据所做的更改，以确保它们满足一组定义的标准。在 MLOps 中，CI 将新数据和更新集成到 ML 模型和支持代码中。CI 可帮助团队在开发过程的早期发现问题，使他们能够更有效地协作并维护高质量的 ML 模型。MLOps 中的 CI 做法示例包括：

自动数据验证检查，以确保数据的完整性和质量。
模型版本控制，用于跟踪模型体系结构和超参数中的更改。
自动对模型代码进行单元测试，以便在代码合并到生产存储库之前捕获问题。

持续部署（光盘）

持续部署（CD）是将软件更新自动发布到生产环境，例如 ML 模型或应用程序。在 MLOps 中，CD 侧重于确保 ML 模型的部署无缝、可靠且一致。CD 降低了部署期间出错的风险，并简化了维护和更新 ML 模型以响应不断变化的业务需求。MLOps 中的 CD 做法示例包括：

使用持续部署工具（如 Jenkins 或 CircleCI）的自动化 ML 管道，用于集成和测试模型更新，然后将其部署到生产环境中。
使用 Docker 等技术对 ML 模型进行容器化，以实现一致的部署环境，减少潜在的部署问题。
实施滚动部署或蓝绿部署可最大限度地减少停机时间，并允许轻松回滚有问题的更新。

持续训练（CT）

持续训练（CT）涉及在新数据可用或现有数据随时间变化时更新 ML 模型。MLOps 的这一重要方面可确保 ML 模型在考虑最新数据并防止模型漂移时保持准确和有效。使用新数据定期训练模型有助于保持最佳性能并实现更好的业务成果。MLOps 中的 CT 实践示例包括：

设置触发模型重新训练以保持最新准确性的策略（即准确性阈值）。
使用主动学习策略优先收集有价值的新数据进行培训。
采用集成方法组合在不同数据子集上训练的多个模型，允许持续改进模型并适应不断变化的数据模式。

连续监测（CM）

持续监控（CM）涉及不断分析 ML 模型在生产环境中的性能，以识别潜在问题，验证模型是否符合定义的标准，并保持整体模型的有效性。MLOps 从业者使用 CM 来检测模型漂移或性能下降等问题，这些问题可能会影响预测的准确性和可靠性。通过定期监控其模型的性能，组织可以主动解决任何问题，确保其 ML 模型保持有效并产生预期的结果。MLOps 中的 CM 做法示例包括：

跟踪生产中模型的关键绩效指标（KPI），例如精度、召回率或其他特定于域的指标。
实施模型性能监视仪表板，以实现模型运行状况的实时可视化。
应用异常检测技术来识别和处理概念漂移，确保模型能够适应不断变化的数据模式并随着时间的推移保持其准确性。

MLOps 如何使 ML 生命周期受益？

管理和部署 ML 模型可能既耗时又具有挑战性，这主要是由于 ML 工作流的复杂性、数据可变性、迭代试验的需求以及部署模型的持续监控和更新。当 MLOps 未正确简化 ML 生命周期时，组织将面临以下问题：由于数据质量变化而导致结果不一致、手动流程成为瓶颈而部署速度变慢，以及难以足够快地维护和更新模型以对不断变化的业务条件做出反应。MLOps 带来了效率、自动化和最佳实践，可促进 ML 生命周期的每个阶段。

考虑这样一种情况：没有专用 MLOps 实践的数据科学团队正在开发用于销售预测的 ML 模型。在这种情况下，团队可能会遇到以下挑战：

由于缺乏标准化实践或自动化数据验证工具，数据预处理和清理任务非常耗时。
由于模型架构、超参数和数据集的版本控制不足，实验的可重复性和可追溯性存在困难。
手动和低效的部署过程会导致将模型发布到生产环境的延迟，并增加生产环境中出错的风险。
手动部署还可能会在跨多个服务器在线自动扩展部署时增加许多故障，从而影响冗余和正常运行时间。
无法根据数据模式的变化快速调整部署的模型，这可能会导致性能下降和模型漂移。

ML 生命周期有五个阶段，可通过下面提到的 MLOps 工具直接改进。

数据收集和预处理

ML 生命周期的第一阶段涉及数据的收集和预处理。组织可以通过在此阶段实施最佳实践来确保数据质量、一致性和可管理性。数据版本控制、自动数据验证检查和团队内部协作可提高 ML 模型的准确性和有效性。示例包括：

数据版本控制，用于跟踪用于建模的数据集中的更改。
自动数据验证检查，以保持数据质量和完整性。
团队内的协作工具，用于有效共享和管理数据源。

模型开发

MLOps 可帮助团队在模型开发阶段遵循标准化做法，同时选择算法、功能和优化超参数。这减少了效率低下和重复工作，从而提高了整体模型性能。实施版本控制、自动试验跟踪和协作工具可显著简化 ML 生命周期的这一阶段。示例包括：

实现模型体系结构和超参数的版本控制。
建立自动实验跟踪的中央枢纽，以减少重复实验并鼓励轻松比较和讨论。
可视化工具和指标跟踪，可在开发过程中促进协作并监控模型的性能。

模型训练和验证

在训练和验证阶段，MLOps 确保组织使用可靠的流程来训练和评估其 ML 模型。组织可以通过在训练中利用自动化和最佳实践来有效地优化其模型的准确性。MLOps 做法包括交叉验证、训练管道管理和持续集成，以自动测试和验证模型更新。示例包括：

交叉验证技术，用于更好的模型评估。
管理培训管道和工作流程，以实现更高效、更简化的流程。
持续集成工作流，用于自动测试和验证模型更新。

模型部署

第四阶段是模型部署到生产环境。此阶段的 MLOps 做法可帮助组织更可靠、更一致地部署模型，从而降低部署过程中出现错误和不一致的风险。使用 Docker 的容器化和自动化部署管道等技术可将模型无缝集成到生产环境中，从而促进回滚和监视功能。示例包括：

使用 Docker 实现容器化，以实现一致的部署环境。
自动化部署管道，无需手动干预即可处理模型发布。
回滚和监视功能，用于快速识别和修复部署问题。

模型监控和维护

第五阶段涉及在生产中持续监控和维护 ML 模型。在此阶段利用 MLOps 原则，组织可以根据需要一致地评估和调整模型。定期监视有助于检测模型漂移或性能下降等问题，这些问题可能会影响预测的准确性和可靠性。关键性能指标、模型性能仪表板和警报机制可确保组织能够主动解决任何问题并保持其 ML 模型的有效性。示例包括：

用于跟踪生产中模型性能的关键性能指标。
用于实时可视化模型运行状况的模型性能仪表板。
警报机制，用于通知团队模型性能的突然或逐渐变化，从而实现快速干预和补救。

MLOps 工具和技术

采用正确的工具和技术对于成功实施 MLOps 做法和管理端到端 ML 工作流至关重要。许多 MLOps 解决方案提供许多功能，从数据管理和试验跟踪到模型部署和监视。在播发整个 ML 生命周期工作流的 MLOps 工具中，应期望以某种方式实现这些功能：

端到端 ML 生命周期管理：所有这些工具都旨在支持 ML 生命周期的各个阶段，从数据预处理和模型训练到部署和监控。
试验跟踪和版本控制：这些工具提供了一些用于跟踪试验、模型版本和管道运行的机制，从而实现可重现性并比较不同的方法。某些工具可能会使用其他抽象显示可重现性，但仍然具有某种形式的版本控制。
模型部署：虽然工具之间的细节不同，但它们都提供一些模型部署功能，以帮助用户将其模型过渡到生产环境，或提供快速部署终结点以使用请求模型推理的应用程序进行测试。
与流行的ML库和框架集成：这些工具与流行的ML库（如TensorFlow，PyTorch和Scikit-learn）兼容，允许用户利用他们现有的ML工具和技能。但是，每个框架的支持量因工具而异。
可扩展性：每个平台都提供了横向、垂直或两者兼而有之的扩展工作流的方法，使用户能够处理大型数据集并有效地训练更复杂的模型。
可扩展性和自定义性：这些工具提供不同的可扩展性和自定义性，使用户能够根据其特定需求定制平台，并根据需要将其与其他工具或服务集成。
协作和多用户支持：每个平台通常都支持团队成员之间的协作，允许他们共享资源、代码、数据和实验结果，从而在整个 ML 生命周期中促进更有效的团队合作和共同理解。
环境和依赖项处理：这些工具中的大多数都包含解决一致且可重现的环境处理的功能。这可能涉及使用容器（即 Docker）或虚拟环境（即 Conda）进行依赖关系管理，或者提供预装流行数据科学库和工具的预配置设置。
监视和警报：端到端 MLOps 工具还可以提供某种形式的性能监视、异常情况检测或警报功能。这有助于用户维护高性能模型，识别潜在问题，并确保其 ML 解决方案在生产中保持可靠和高效。

尽管这些工具提供的核心功能存在大量重叠，但它们独特的实现、执行方法和重点领域使它们与众不同。换句话说，在纸上比较MLOps产品时，从表面上判断MLOps工具可能很困难。所有这些工具都提供了不同的工作流体验。

在以下部分中，我们将展示一些值得注意的 MLOps 工具，这些工具旨在提供完整的端到端 MLOps 体验，并重点介绍它们如何处理和执行标准 MLOps 功能的差异。

MLFlow

MLflow 具有独特的功能和特征，使其与其他 MLOps 工具区分开来，使其对具有特定要求或首选项的用户具有吸引力：

模块化：MLflow 最显著的优势之一是其模块化体系结构。它由独立的组件（跟踪、项目、模型和注册表）组成，可以单独或组合使用，使用户能够根据他们的精确需求定制平台，而无需被迫采用所有组件。
语言不可知：MLflow 支持多种编程语言，包括 Python、R 和 Java，这使得具有不同技能集的广泛用户可以访问它。这主要有利于其成员更喜欢不同编程语言的 ML 工作负载的团队。
与流行库集成：MLflow 旨在与流行的 ML 库（如 TensorFlow、PyTorch 和 Scikit-learn）配合使用。这种兼容性允许用户将 MLflow 无缝集成到其现有工作流中，利用其管理功能，而无需采用全新的生态系统或更改其当前工具。
活跃的开源社区：MLflow 拥有一个充满活力的开源社区，有助于其开发，并使平台与 MLOps 领域的新趋势和要求保持同步。这种活跃的社区支持确保 MLflow 始终是尖端且相关的 ML 生命周期管理解决方案。

虽然 MLflow 是一种用于管理 ML 生命周期各个方面的多功能模块化工具，但与其他 MLOps 平台相比，它有一些局限性。MLflow 不足的一个值得注意的领域是它需要集成的内置管道编排和执行功能，例如 TFX 或 Kubeflow 管道提供的功能。虽然 MLflow 可以使用其跟踪、项目和模型组件构建和管理管道步骤，但用户可能需要依靠外部工具或自定义脚本来协调复杂的端到端工作流并自动执行管道任务。因此，寻求对复杂管道业务流程提供更简化、开箱即用的支持的组织可能会发现 MLflow 的功能需要改进，并探索替代平台或集成来满足其管道管理需求。

Kubeflow

虽然 Kubeflow 是一个全面的 MLOps 平台，其中包含一套量身定制的组件以满足 ML 生命周期的各个方面，但与其他 MLOps 工具相比，它有一些局限性。Kubeflow 可能不足的一些领域包括：

更陡峭的学习曲线：Kubeflow 与 Kubernetes 的强耦合可能会为需要更熟悉 Kubernetes 概念和工具的用户带来更陡峭的学习曲线。这可能会增加加入新用户所需的时间，并且对于没有 Kubernetes 经验的团队来说，这可能是采用的障碍。
有限的语言支持：Kubeflow 最初主要关注 TensorFlow，尽管它扩展了对 PyTorch 和 MXNet 等其他 ML 框架的支持，但它仍然对 TensorFlow 生态系统有更实质性的偏见。使用其他语言或框架的组织可能需要额外的努力来采用 Kubeflow 并将其集成到他们的工作流程中。
基础设施复杂性：Kubeflow 对 Kubernetes 的依赖可能会为没有现有 Kubernetes 设置的组织带来额外的基础设施管理复杂性。不需要 Kubernetes 全部功能的小型团队或项目可能会发现 Kubeflow 的基础设施需求是不必要的开销。
较少关注实验跟踪：虽然 Kubeflow 确实通过其 Kubeflow Pipelines 组件提供了实验跟踪功能，但它可能不像 MLflow 或 Weights & Biases 等专用实验跟踪工具那样广泛或用户友好，这是另一个端到端 MLOps 工具，重点是实时模型可观测性工具。非常注重实验跟踪和比较的团队可能会发现，与其他具有更高级跟踪功能的 MLOps 平台相比，Kubeflow 的这一方面需要改进。
与非 Kubernetes 系统的集成：Kubeflow 的 Kubernetes 原生设计可能会限制其与其他非基于 Kubernetes 的系统或专有基础设施的集成能力。相比之下，更灵活或不可知的 MLOps 工具（如 MLflow）可能会提供与各种数据源和工具的更易于访问的集成选项，而不考虑底层基础结构。

Kubeflow 是一个 MLOps 平台，旨在作为 Kubernetes 的包装器，简化部署、扩展和管理 ML 工作负载，同时将它们转换为 Kubernetes 原生工作负载。与 Kubernetes 的这种密切关系提供了优势，例如复杂 ML 工作流的高效编排。尽管如此，它可能会给缺乏 Kubernetes 专业知识的用户、使用各种语言或框架的用户或拥有非基于 Kubernetes 的基础设施的组织带来复杂性。总体而言，Kubeflow 以 Kubernetes 为中心的特性为部署和编排提供了显著的好处，组织在评估 Kubeflow 的 MLOps 需求时应考虑这些权衡和兼容性因素。

Saturn Cloud

土星云是一个 MLOps 平台，提供轻松扩展、基础设施、协作和 ML 模型的快速部署，专注于并行化和 GPU 加速。土星云的一些关键优势和强大的功能包括：

资源加速重点：土星云强调为ML工作负载提供易于使用的GPU加速和灵活的资源管理。虽然其他工具可能支持基于 GPU 的处理，但 Saturn Cloud 简化了此过程，以消除数据科学家使用此加速的基础设施管理开销。
Dask 和分布式计算：Saturn Cloud 与 Dask 紧密集成，Dask 是 Python 中用于并行和分布式计算的流行库。这种集成允许用户毫不费力地横向扩展其工作负载，以便在多节点集群上使用并行处理。
托管基础架构和预构建环境：Saturn Cloud 在提供托管基础架构和预构建环境方面更进一步，减轻了用户的基础架构设置和维护负担。
轻松的资源管理和共享：Saturn Cloud 允许用户定义所有权和访问资产权限，从而简化了 Docker 映像、机密和共享文件夹等资源的共享。这些资产可以由单个用户、组（用户集合）或整个组织拥有。所有权决定了谁可以访问和使用共享资源。此外，用户可以轻松地克隆完整的环境，以便其他人在任何地方运行相同的代码。
基础设施即代码：土星云采用配方JSON格式，使用户能够使用以代码为中心的方法定义和管理资源。这促进了一致性、模块化和版本控制，简化了平台对基础设施组件的设置和管理。

土星云虽然为许多用例提供了有用的特性和功能，但与其他 MLOps 工具相比可能存在一些限制。以下是土星云可能受到限制的几个领域：

与非Python语言集成：土星云主要针对Python生态系统，广泛支持流行的Python库和工具。但是，任何可以在Linux环境中运行的语言都可以使用土星云平台运行。
开箱即用的实验跟踪：虽然土星云确实促进了实验记录和跟踪，但它对扩展和基础设施的关注比其实验跟踪功能更广泛。但是，那些在MLOps工作流程的跟踪方面寻求更多自定义和功能的人会很高兴地知道土星云可以与包括但不限于Comet，Weights & Biases，Verta和Neptune等平台集成。
Kubernetes-Native Orchestration：尽管 Saturn Cloud 通过 Dask 提供可扩展性和托管基础设施，但它缺乏 Kubeflow 等工具提供的 Kubernetes-native 编排。在 Kubernetes 上投入巨资的组织可能更喜欢具有更深入 Kubernetes 集成的平台。

TensorFlow Extended （TFX）

TensorFlow Extended （TFX）是专为 TensorFlow 用户设计的端到端平台，为管理基于 TensorFlow 的 ML 工作流程提供了全面且紧密集成的解决方案。TFX在以下领域表现出色：

TensorFlow Integration：TFX最显著的优势是它与TensorFlow生态系统的无缝集成。它提供了一套为 TensorFlow 量身定制的完整组件，使已经投资 TensorFlow 的用户能够更轻松地构建、测试、部署和监控其 ML 模型，而无需切换到其他工具或框架。
生产就绪性：TFX 在构建时考虑了生产环境，强调稳健性、可扩展性和支持任务关键型 ML 工作负载的能力。它处理从数据验证和预处理到模型部署和监视的所有内容，确保模型可用于生产，并且可以大规模提供可靠的性能。
端到端工作流程：TFX 提供了广泛的组件，用于处理 ML 生命周期的各个阶段。通过支持数据摄取、转换、模型训练、验证和服务，TFX 使用户能够构建端到端管道，确保其工作流程的可重复性和一致性。
可扩展性：TFX的组件是可定制的，允许用户在需要时创建和集成自己的组件。这种可扩展性使组织能够根据其特定要求定制TFX，整合其首选工具，或针对其在ML工作流程中可能遇到的独特挑战实施自定义解决方案。

然而，值得注意的是，TFX对TensorFlow的主要关注对于依赖其他ML框架或更喜欢与语言无关的解决方案的组织来说可能是一个限制。虽然TFX为基于TensorFlow的工作负载提供了一个强大而全面的平台，但使用PyTorch或Scikit-learn等框架的用户可能需要考虑其他更适合其需求的MLOps工具。TFX强大的TensorFlow集成，生产准备和可扩展组件使其成为对TensorFlow生态系统投入巨资的组织具有吸引力的MLOps平台。组织可以评估其当前工具和框架的兼容性，并确定TFX的功能是否与管理ML工作流程的特定用例和需求完全一致。

Metaflow

Metaflow是由Netflix开发的MLOps平台，旨在简化复杂的现实世界数据科学项目。Metaflow 在几个方面大放异彩，因为它专注于处理现实世界的数据科学项目和简化复杂的 ML 工作流程。以下是Metaflow擅长的一些领域：

工作流管理：Metaflow 的主要优势在于有效地管理复杂的真实 ML 工作流。用户可以使用内置的版本控制、依赖项管理和基于 Python 的域特定语言来设计、组织和执行复杂的处理和建模训练步骤。
可观察：Metaflow 提供了在每个管道步骤后观察输入和输出的功能，从而可以轻松跟踪管道各个阶段的数据。
可扩展性：Metaflow 可以轻松地将工作流从本地环境扩展到云，并与 AWS Batch、S3 和 Step Functions 等 AWS 服务紧密集成。这使用户可以轻松地大规模运行和部署其工作负载，而无需担心基础资源。
内置数据管理：Metaflow 通过自动跟踪工作流使用的数据集，提供高效的数据管理和版本控制工具。它可确保不同管道运行之间的数据一致性，并允许用户访问历史数据和工件，从而有助于实现可重复性和可靠的实验。
容错和弹性：元流旨在处理实际 ML 项目中出现的挑战，例如意外故障、资源限制和不断变化的需求。它提供自动错误处理、重试机制以及恢复失败或停止步骤的功能等功能，确保工作流在各种情况下都能可靠、高效地执行。
AWS 集成：随着 Netflix 开发 Metaflow，它与 Amazon Web Services （AWS）基础设施紧密集成。这使得已经投资于 AWS 生态系统的用户更容易在由 Metaflow 管理的 ML 工作负载中利用现有的 AWS 资源和服务。这种集成允许无缝数据存储、检索、处理和控制对 AWS 资源的访问，从而进一步简化 ML 工作流的管理。

虽然元流有几个优势，但与其他 MLOps 工具相比，它在某些方面可能缺乏或不足：

有限的深度学习支持：Metaflow 最初开发的目的是专注于典型的数据科学工作流程和传统的 ML 方法，而不是深度学习。这可能使其不太适合主要使用深度学习框架（如TensorFlow或PyTorch）的团队或项目。
实验跟踪：元流提供了一些实验跟踪功能。它对工作流程管理和基础设施简单性的关注可能使其跟踪功能不如MLflow或Weights & Biases等专用实验跟踪平台全面。
Kubernetes-Native Orchestration：Metaflow 是一个多功能平台，可以部署在各种后端解决方案上，例如 AWS Batch 和容器编排系统。但是，它缺乏 Kubeflow 等工具中的 Kubernetes 原生管道编排，它允许将整个 ML 管道作为 Kubernetes 资源运行。
语言支持：Metaflow主要支持Python，这对大多数数据科学从业者来说是有利的，但对于在ML项目中使用其他编程语言（如R或Java）的团队来说可能是一个限制。

ZenML

ZenML 是一个可扩展的开源 MLOps 框架，旨在使 ML 可重现、可维护和可扩展。ZenML旨在成为一个高度可扩展和适应性强的MLOps框架。它的主要价值主张是，它允许您轻松地将各种机器学习组件、库和框架集成和“粘合”在一起，以构建端到端管道。ZenML的模块化设计使数据科学家和工程师更容易混合和匹配不同的ML框架和工具，以完成管道中的特定任务，从而降低集成各种工具和框架的复杂性。

以下是ZenML擅长的一些领域：

ML 管道抽象：ZenML 提供了一种干净的 Python 方法来使用简单的抽象来定义 ML 管道，从而可以轻松创建和管理 ML 生命周期的不同阶段，例如数据摄取、预处理、训练和评估。
可重现性：ZenML 强烈强调可重现性，确保管道组件通过精确的元数据系统进行版本控制和跟踪。这保证了 ML 实验可以一致地复制，从而防止与不稳定的环境、数据或依赖项相关的问题。
后端编排器集成：ZenML支持不同的后端编排器，如Apache Airflow，Kubeflow等。这种灵活性使用户可以选择最适合其需求和基础架构的后端，无论是在本地机器、Kubernetes 还是云环境中管理管道。
可扩展性：ZenML提供了一个高度可扩展的架构，允许用户为不同的管道步骤编写自定义逻辑，并轻松与他们喜欢的工具或库集成。这使组织能够根据其特定要求和工作流程定制 ZenML。
数据集版本控制：ZenML 专注于高效的数据管理和版本控制，确保管道可以访问正确版本的数据和工件。这种内置的数据管理系统允许用户在各种管道运行中保持数据一致性，并提高 ML 工作流程的透明度。
与ML框架的高度集成：ZenML提供了与流行的ML框架的平滑集成，包括TensorFlow，PyTorch和Scikit-learn。它能够使用这些 ML 库，使从业者能够利用他们现有的技能和工具，同时利用 ZenML 的管道管理。

总之，ZenML 擅长提供干净的管道抽象、促进可重现性、支持各种后端业务流程协调程序、提供可扩展性、维护高效的数据集版本控制以及与流行的 ML 库集成。它对这些方面的关注使 ZenML 特别适合寻求提高其 ML 工作流程的可维护性、可重现性和可扩展性的组织，而无需将太多的基础设施转移到新工具上。

什么是适合我的工具？

有这么多可用的 MLOps 工具，你怎么知道哪一个适合你和你的团队？在评估潜在的 MLOps 解决方案时，有几个因素在起作用。以下是选择针对组织的特定需求和目标定制的 MLOps 工具时要考虑的一些关键方面：

组织规模和团队结构：考虑数据科学和工程团队的规模、他们的专业水平以及他们需要协作的程度。较大的组或更复杂的层次结构可能会受益于具有强大协作和通信功能的工具。
ML 模型的复杂性和多样性：评估组织中使用的算法、模型架构和技术的范围。一些 MLOps 工具迎合特定的框架或库，而其他工具则提供更广泛和通用的支持。
自动化和可伸缩性级别：确定数据预处理、模型训练、部署和监视等任务需要自动化的程度。此外，请了解组织中可伸缩性的重要性，因为某些 MLOps 工具为纵向扩展计算和处理大量数据提供了更好的支持。
集成和兼容性：考虑 MLOps 工具与现有技术堆栈、基础结构和工作流的兼容性。与您当前系统的无缝集成将确保更顺畅的采用过程，并最大限度地减少对正在进行的项目的干扰。
自定义和可扩展性：评估 ML 工作流所需的自定义和可扩展性级别，因为某些工具提供了更灵活的 API 或插件架构，可以创建自定义组件以满足特定要求。
成本和许可：请记住 MLOps 工具的定价结构和许可选项，确保它们符合组织的预算和资源限制。
安全性和合规性：评估 MLOps 工具满足安全性、数据隐私和合规性要求的程度。这对于在受监管行业运营或处理敏感数据的组织尤其重要。
支持和社区：考虑文档的质量、社区支持以及在需要时提供专业帮助。在应对挑战或寻求最佳实践时，活跃的社区和响应迅速的支持可能很有价值。

通过仔细检查这些因素并将其与组织的需求和目标保持一致，可以在选择最能支持 ML 工作流并启用成功的 MLOps 策略的 MLOps 工具时做出明智的决策。

MLOps 最佳做法

在 MLOps 中建立最佳做法对于希望开发、部署和维护高质量 ML 模型的组织至关重要，这些模型可以推动价值并对其业务成果产生积极影响。通过实施以下实践，组织可以确保其 ML 项目高效、协作且可维护，同时最大限度地降低因数据不一致、模型过时或开发缓慢且容易出错而产生的潜在问题的风险：

确保数据质量和一致性：建立强大的预处理管道，使用工具进行自动化数据验证检查，如远大期望或 TensorFlow 数据验证，并实施定义数据存储、访问和处理规则的数据治理策略。缺乏数据质量控制可能导致模型结果不准确或有偏差，从而导致决策不力和潜在的业务损失。
数据和模型的版本控制：使用 Git 或 DVC 等版本控制系统跟踪对数据和模型所做的更改，从而改善协作并减少团队成员之间的混淆。例如，DVC 可以管理不同版本的数据集和模型实验，从而可以轻松切换、共享和复制。通过版本控制，团队可以管理多个迭代并重现过去的结果以供分析。
协作和可重现的工作流程：通过实施清晰的文档、代码审查流程、标准化数据管理以及 Jupyter Notebooks 和 Saturn Cloud 等协作工具和平台来鼓励协作。支持团队成员高效协作有助于加速高质量模型的开发。另一方面，忽略协作和可重现的工作流程会导致开发速度变慢、错误风险增加并阻碍知识共享。
自动化测试和验证：通过将自动化测试和验证技术（例如，使用 Pytest 的单元测试、集成测试）集成到您的 ML 管道中，采用严格的测试策略，利用 GitHub Actions 或 Jenkins 等持续集成工具定期测试模型功能。自动化测试有助于在部署之前识别和修复问题，从而确保在生产环境中获得高质量和可靠的模型性能。跳过自动化测试会增加未检测到问题的风险，从而损害模型性能并最终损害业务成果。
监控和警报系统：使用 Amazon SageMaker 模型监视器、MLflow 或自定义解决方案等工具来跟踪关键性能指标并设置警报以及早检测潜在问题。例如，在检测到模型偏移或超出特定性能阈值时在 MLflow 中配置警报。如果不实施监视和警报系统，则会延迟对模型漂移或性能下降等问题的检测，从而导致基于过时或不准确的模型预测做出次优决策，从而对整体业务绩效产生负面影响。

通过遵循这些 MLOps 最佳做法，组织可以高效地开发、部署和维护 ML 模型，同时最大限度地减少潜在问题并最大限度地提高模型有效性和整体业务影响。

MLOps 和数据安全

数据安全在成功实施 MLOps 中起着至关重要的作用。组织必须采取必要的预防措施，以确保其数据和模型在 ML 生命周期的每个阶段都保持安全和受到保护。确保 MLOps 中的数据安全的关键注意事项包括：

模型稳健性：确保您的 ML 模型能够承受对抗性攻击或在嘈杂或意外条件下可靠地执行。例如，可以合并对抗性训练等技术，这些技术涉及将对抗性示例注入训练过程，以提高模型对恶意攻击的复原能力。定期评估模型稳健性有助于防止可能导致错误预测或系统故障的潜在利用。
数据隐私和合规性：为了保护敏感数据，组织必须遵守相关的数据隐私和合规性法规，例如《通用数据保护条例》（GDPR）或《健康保险流通与责任法案》（HIPAA）。这可能涉及实施强大的数据治理策略、匿名敏感信息或利用数据屏蔽或假名化等技术。
模型安全性和完整性：确保 ML 模型的安全性和完整性有助于保护它们免受未经授权的访问、篡改或盗窃。组织可以实施模型工件加密、安全存储和模型签名等措施来验证真实性，从而最大限度地降低外部各方泄露或操纵的风险。
安全部署和访问控制：将 ML 模型部署到生产环境时，组织必须遵循快速部署的最佳实践。这包括识别和修复潜在漏洞，实施安全通信通道（例如HTTPS或TLS），以及实施严格的访问控制机制，以仅限制授权用户的模型访问。组织可以使用基于角色的访问控制和身份验证协议（如 OAuth 或 SAML）来防止未经授权的访问并维护模型安全性。

在 MLOps 周期中让红队等安全团队参与进来也可以显著增强整体系统安全性。例如，红队可以模拟对模型和基础设施的对抗性攻击，帮助识别可能被忽视的漏洞和弱点。这种主动安全方法使组织能够在问题成为威胁之前解决问题，确保符合法规并增强其 ML 解决方案的整体可靠性和可信度。在 MLOps 周期内与专门的安全团队合作可培养强大的安全文化，最终有助于 ML 项目的成功。

MLOps 在工业领域

MLOps 已在各个行业中成功实施，推动了效率、自动化和整体业务绩效的显著提高。以下是展示 MLOps 在不同部门的潜力和有效性的真实示例：

医疗保健与CareSource

CareSource是美国最大的医疗补助提供商之一，专注于对高危妊娠进行分类，并与医疗服务提供者合作，积极提供挽救生命的产科护理。但是，需要解决一些数据瓶颈。CareSource的数据孤立在不同的系统中，并不总是最新的，这使得访问和分析变得困难。在模型训练方面，数据并不总是采用一致的格式，这使得清理和准备分析变得困难。

为了应对这些挑战，CareSource 实施了一个 MLOps 框架，该框架使用 Databricks Feature Store、MLflow 和 Hyperopt 来开发、调整和跟踪 ML 模型以预测产科风险。然后，他们使用 Stacks 帮助实例化用于部署的生产就绪模板，并及时将预测结果发送给医疗合作伙伴。

ML 开发和生产就绪部署之间的加速过渡使 CareSource 能够在为时已晚之前直接影响患者的健康和生活。例如，CareSource更早地发现了高危妊娠，从而为母亲和婴儿带来了更好的结果。他们还通过防止不必要的住院治疗来降低护理成本。

使用Moody's Analytics进行金融分析

Moody's Analytics是财务建模领域的领导者，它遇到了一些挑战，例如对工具和基础设施的访问有限、模型开发和交付中的摩擦以及分布式团队之间的知识孤岛。他们开发并利用ML模型用于各种应用，包括信用风险评估和财务报表分析。为了应对这些挑战，他们实施了多米诺数据科学平台，以简化其端到端工作流程，并实现数据科学家之间的高效协作。

通过利用多米诺，穆迪分析加快了模型开发，将九个月的项目缩短为四个月，并显著提高了其模型监控能力。这种转变使公司能够有效地开发和交付定制的高质量模型，以满足客户的需求，如风险评估和财务分析。

与Netflix一起娱乐

Netflix 利用 Metaflow 简化了各种应用程序的 ML 工作负载的开发、部署和管理，例如个性化内容推荐、优化流媒体体验、内容需求预测和社交媒体参与的sentiment analysis。通过培养高效的 MLOps 实践并为内部工作流程量身定制以人为中心的框架，Netflix 使其数据科学家能够快速进行实验和迭代，从而实现更灵活、更有效的数据科学实践。

根据Netflix机器学习基础设施前经理Ville Tuulos的说法，实施Metaflow将从项目构思到部署的平均时间从四个月减少到一周。这种加速的工作流程突出了 MLOps 和专用 ML 基础设施的变革性影响，使 ML 团队能够更快、更高效地运营。通过将机器学习集成到其业务的各个方面，Netflix 展示了 MLOps 实践的价值和潜力，以彻底改变行业并改善整体业务运营，为快节奏的公司提供实质性优势。

MLOps 经验教训

正如我们在上述案例中看到的那样，MLOps 的成功实施展示了有效的 MLOps 实践如何推动业务不同方面的实质性改进。由于从这样的实际经验中吸取了经验教训，我们可以深入了解 MLOps 对组织的重要性：

标准化、统一的 API 和抽象，以简化 ML 生命周期。
将多个 ML 工具集成到一个连贯的框架中，以简化流程并降低复杂性。
解决可重复性、版本控制和实验跟踪等关键问题，以提高效率和协作。
开发一个以人为本的框架，以满足数据科学家的特定需求，减少摩擦并促进快速实验和迭代。
监控生产中的模型并维护适当的反馈循环，以确保模型保持相关性、准确性和有效性。

从 Netflix 和其他实际 MLOps 实施中吸取的经验教训可以为希望增强自身 ML 功能的组织提供有价值的见解。他们强调了制定深思熟虑的策略并投资于强大的 MLOps 实践的重要性，以开发、部署和维护高质量的 ML 模型，这些模型可以在扩展和适应不断变化的业务需求的同时推动价值。

MLOps 的未来趋势和挑战

随着 MLOps 不断发展和成熟，组织必须始终了解他们在实施 MLOps 做法时可能面临的新兴趋势和挑战。一些值得注意的趋势和潜在障碍包括：

边缘计算：边缘计算的兴起为组织提供了在边缘设备上部署 ML 模型的机会，从而实现更快的本地化决策、减少延迟并降低带宽成本。在边缘计算环境中实现 MLOps 需要新的模型训练、部署和监视策略，以应对有限的设备资源、安全性和连接约束。
可解释的 AI：随着 AI 系统在日常流程和决策中发挥着越来越重要的作用，组织必须确保其 ML 模型是可解释的、透明的和公正的。这需要集成用于模型可解释性、可视化和技术的工具，以减轻偏差。将可解释且负责任的 AI 原则纳入 MLOps 实践有助于提高利益干系人的信任、遵守法规要求并维护道德标准。
复杂的监视和警报：随着 ML 模型的复杂性和规模的增加，组织可能需要更高级的监视和警报系统来保持足够的性能。异常检测、实时反馈和自适应警报阈值是一些有助于快速识别和诊断模型漂移、性能下降或数据质量问题等问题的技术。将这些高级监视和警报技术集成到 MLOps 实践中可以确保组织能够在出现问题时主动解决问题，并在其 ML 模型中始终保持高级别的准确性和可靠性。
联邦学习：此方法支持在分散的数据源上训练 ML 模型，同时保持数据隐私。组织可以通过实施 MLOps 实践来实现多个利益干系人之间的分布式培训和协作，而无需公开敏感数据，从而从联合学习中受益。
人机交互过程：人们越来越有兴趣将人类的专业知识融入许多 ML 应用程序中，尤其是那些涉及主观决策或无法完全编码的复杂上下文的应用程序。在 MLOps 工作流中集成人机交互流程需要有效的协作工具和策略，以无缝结合人类和机器智能。
量子ML：量子计算是一个新兴领域，在解决复杂问题和加速特定ML流程方面显示出潜力。随着这项技术的成熟，MLOps 框架和工具可能需要不断发展，以适应基于量子的 ML 模型，并处理新的数据管理、训练和部署挑战。
稳健性和弹性：确保 ML 模型在面对对抗性情况（例如嘈杂输入或恶意攻击）时的稳健性和弹性是一个日益受到关注的问题。组织需要将健壮 ML 的策略和技术纳入其 MLOps 实践中，以保证其模型的安全性和稳定性。这可能涉及对抗性训练、输入验证或部署监视系统，以在模型遇到意外输入或行为时识别和发出警报。

结论

在当今世界，实施 MLOps 对于希望释放 ML 的全部潜力、简化工作流并在模型的整个生命周期中维护高性能模型的组织来说至关重要。本文探讨了 MLOps 做法和工具、各行各业的用例、数据安全的重要性，以及随着该领域的不断发展，未来的机遇和挑战。

回顾一下，我们讨论了以下内容：

MLOps 生命周期的各个阶段。
可部署到所选基础结构的常用开源 MLOps 工具。
MLOps 实现的最佳做法。
不同行业的 MLOps 用例以及宝贵的 MLOps 经验教训。
未来趋势和挑战，例如边缘计算、可解释且负责任的 AI 以及人机交互流程。

随着 MLOps 格局的不断发展，组织和从业者必须及时了解最新的实践、工具和研究。强调持续学习和适应将使企业能够保持领先地位，完善其MLOps战略，并有效应对新出现的趋势和挑战。

ML 的动态特性和技术的快速发展意味着组织必须准备好使用其 MLOps 解决方案进行迭代和发展。这需要采用新技术和工具，在团队中培养协作学习文化，共享知识，并从更广泛的 MLOps 社区寻求见解。

采用 MLOps 最佳实践、高度关注数据安全和道德 AI 并保持敏捷以应对新兴趋势的组织将更有能力最大化其 ML 投资的价值。随着各行各业的企业利用 ML，MLOps 在确保成功、负责任和可持续地部署 AI 驱动的解决方案方面将变得越来越重要。通过采用强大且面向未来的 MLOps 策略，组织可以释放 ML 的真正潜力并推动各自领域的变革。

原文链接：MLOps 综合指南 (mvrlink.com)

你可能感兴趣的:(人工智能,linux,大数据,机器学习操作,MLOps)

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu