数据派THU

终结谷歌AutoML的真正杀手！Saleforce开源TransmogrifAI

来源：AI前线

本文共4739字，建议阅读10分钟。

本文我们介绍了 TransmogrifAI 的工作流程并讨论其背后的设计决策。

[ 导读 ]尽管机器学习在过去十年中取得了巨大进步，但构建生产就绪的机器学习系统仍然很难。三年前，我们开始着手为 Salesforce 平台搭建机器学习系统，也因此了解到构建企业级机器学习系统是有多么困难。为了解决我们遇到的问题，我们构建了 TransmogrifAI，一种自动化的端到端结构数据机器学习库, 并在近日将它开源了。

如今，大多数自动化机器学习解决方案要么只专注于整个机器学习工作流程的一小部分，要么专为图像、语音和语言的同质非结构化数据而构建。但我们更需要一种能够为大规模异构结构化数据快速生成模型的解决方案，TransmogrifAI 就是这样一个解决方案。如果说前不久美国德州农工大学开源的 AutoKeras 相比谷歌 AutoML 主要赢在开源，那么 TransmogrifAI 的优势则更加明显，或许它才是真正的 AutoML“杀手”。

在为消费级产品构建机器学习时，数据科学家通常会关注一些易于理解的用例和数据集。然而，企业的数据和用例存在多样性，因此为企业产品构建机器学习成为一种完全不同的挑战。在 Salesforce，我们的客户希望能够预测一系列结果——从客户流失、销售预测和潜在客户转换，到电子邮件营销、网购、设备故障、延迟付款等等。对于企业客户而言，保护好数据不让它们与其他组织或竞争对手共享是至关重要的。这意味着我们必须为特定的用户需求构建特定的机器学习模型。我们能够构建全局模型，但这样做是毫无意义的，因为每个客户的数据都是唯一的，具有不同的模式、不同的形状和不同的业务流程引入的不同偏差。为了让机器学习能够真正为我们的客户带来价值，我们必须构建和部署数千个机器学习模型，它们都是针对每个客户的不同用例并基于每个客户自己的数据训练得出的。

要在不聘请大量数据科学家的情况下实现这一目标，唯一方法就是进行自动化。如今，大多数自动化 ML 解决方案要么只专注于整个机器学习工作流程的一小部分，要么专为图像、语音和语言的同质非结构化数据而构建。但我们需要一种能够为大规模异构结构化数据快速生成模型的解决方案。在词典中，Transmogrification 的意思是“以令人惊讶或神奇的方式进行转换”，这也正是 TransmogrifAI 为 Salesforce 所做的事情——让数据科学团队能够将客户数据转换为有意义的预测。如今，整个平台已经部署了数千个特定的机器学习模型，每天为超过 30 亿次预测提供支持。

在本文中，我们将介绍 TransmogrifAI 的工作流程，讨论其背后的设计决策。

TransmogrifAI 工作流程

构建机器学习模型通常涉及大量的研发工作。数据准备、特征工程和模型训练是一个迭代的过程，要对它们进行成熟的自动化，需要数周甚至数月的时间。

TransmogrifAI 是一个基于 Scala 和 SparkML 构建的库，就是为了完成这项任务应运而生的。数据科学家只需几行代码就可以自动完成数据清理、特征工程和模型选择，从而获得一个高性能的模型，并在后续进一步的探索和迭代。

TransmogrifAI 封装了机器学习过程的五个主要组件：

特征推理

机器学习管道的第一步通常是进行数据准备。数据科学家收集所有相关数据，并扁平化、连接和聚合不同的数据源，提取可用于预测的原始信号。然后，提取的信号被填充到一种灵活的数据结构中，通常称为 DataFrame。虽然这些数据结构简单易用，但它们不能让数据科学家免受下游错误的影响，例如对数据类型或空值的错误假设。因此，数据科学家可能通宵达旦运行一个管道却以失败告终，因为她试图将两个字符串相乘。

在 TransmogrifAI 中，我们允许用户为他们的数据指定模式，并自动将原始预测变量和响应信号提取为“特征”，以此来解决这个问题。特征是强类型的，TransmogrifAI 还支持丰富且可扩展的特征类型层次结构。这种层次结构超越了原始类型，支持更细化的类型，例如地理位置、电话号码、邮政编码等。除了允许用户指定类型之外，TransmogrifAI 还可以自行推断类型。例如，如果它检测到具有低基数的文本特征实际上是伪装的分类特征，就会对它进行编目和适当的处理。强类型特征可以让开发人员在编译时而不是在运行时捕获大多数错误。它们也是对机器学习管道中常见的特定类型处理进行自动化的关键。

Transmogrification（也就是自动化特征工程）

虽然强类型特征有助于大量推理数据，并最大限度地减少下游错误，但所有特征最终仍然需要转换为数字表示，以便暴露出数据的规律性，这样机器学习算法才能轻松地利用这些数据。这个过程称为特征工程。有无数种方法可用于转换上图中所示的特征类型，选择正确的方法是一门数据科学艺术。

举个例子，如何将美国的州（例如 CA、NY、TX 等）转换成数字？一种方法是将每个州与 1 到 50 之间的数字映射起来。这种方法的问题在于它无法保留有关州的地理接近度信息。但在模拟用户购物行为时，接近度可能是一个重要特征。我们可以尝试另一种方法，就是使用州中心与美国中心之间的距离。这样可以解决第一个问题，但仍然不包含一个州是否位于美国的北部、南部、西部或东部的信息。这还只是一个简单的特征——想象以下数百或数千个特征！这个过程之所以如此具有挑战性，是因为还不存在一种万能的正确方法，因为成功的方法在很大程度上取决于具体的问题。

将一组不同的特征类型自动转换成数字向量，这也正是 TransmogrifAI 名称的由来。TransmogrifAI 为所有受支持的特征类型提供了大量的技术支持，从电话号码、电子邮件地址、地理位置到文本数据。TransmogrifAI 不仅仅是将数据转换为算法可以使用的格式，它还对转换进行优化，让机器学习算法更容易从数据中学习。例如，它可能会将年龄转换成适合某个特定问题的年龄段——时尚行业的年龄段可能与财富管理的年龄段不同。

但即使具备上述所有功能，特征工程仍然是一趟没有终点的旅程。因此，除了提供默认技术之外，我们还投入了大量精力，让共享特征工程技术变得更容易，这样开发人员就可以对默认值进行定制和扩展。

自动特征验证

特征工程可能会出现数据维度的爆炸性增长。高维数据经常会出问题！例如，数据的特定字段可能会出现漂移，而且基于这些字段训练的模型可能在新数据上表现不佳。另一个（通常被忽略的）问题是事后偏见或数据泄漏。当在预测时没有出现的信息泄漏到训练样本中时就会发生这种情况。结果就是看起来很好的模型在实际当中就完全没有用。假设我们有一个包含交易信息的数据集，我们的任务是预测密集交易。想象一下，这个数据集中有一个字段叫作“已结算交易金额”，这个字段只在交易结束后才有。一个盲目的机器学习算法会认为这个字段具有高度的可预测性，因为所有已完成的交易都具有非零的“已结算交易金额”。实际上，对于仍在进行中的交易，这个字段永远不会有值，所以会导致机器学习模型表现不佳！在 Salesforce，这种后见之明的偏见也很成问题，因为未知和自动化的业务流程通常会填充大部分客户数据，很容易让数据科学家混淆因果关系。

TransgmogrifAI 提供了可用于执行自动特征验证的算法，用来删除几乎没有预测能力的特征——随着时间的推移而发生漂移的特征、呈现零方差的特征，或者在训练样本中的分布与预测时的分布显著不同的特征。这些算法对于处理可能充满事后偏见的高维和未知数据特别有用。它们应用了一系列基于特征类型的统计测试，并利用特征沿袭来检测和丢弃数据中的偏见。

自动模型选择

流程的最后阶段涉及将机器学习算法应用于准备好的数据上，并构建出预测模型。他们可以尝试许多不同的算法，每种算法都有相应的调节参数。找到正确的算法和参数设置就可以获得高性能的模型。

TransmogrifAI 模型选择器在数据上运行几种不同的机器学习算法，并基于平均验证错误自动选择最佳的算法。它还会对数据进行采样并重新校准预测来自动处理不平衡数据问题。数据科学家训练得出的最佳和最差模型的性能通常存在显著差距，而探索模型空间对于避免错过更好的模型来说是至关重要的。

超参数优化：上述所有阶段的基础是超参数优化。在现今的机器学习社区，超参数指的是机器学习算法上的可调节参数。然而现实情况是，上述所有阶段都带有各种重要的调节参数。例如，在特征工程阶段，我们可以调整从分类预测器输出的二元变量的数量。处理不平衡数据的采样率是另一个可以调整的参数。调整所有这些参数对于数据科学家来说可能是个很大的负担，但这样可以让好的模型跟差的模型之间拉开差距。这就是为什么 TransmogrifAI 提供了一些自动调整这些超参数的技术和一个可扩展到更高级调优技术的框架。

在 Salesforce，自动化将模型训练所需的总时间从几周和几个月缩短到几个小时。封装所有这些复杂性的代码非常简单，只需几行代码就可以搞定上述的自动化特征工程、特征验证和模型选择：

// 读取交易数据
val dealData = DataReaders.Simple.csvCase[Deal](path = pathToData).readDataset().toDF()

// 抽取特征
val (isClosed, predictors) = FeatureBuilder.fromDataFrame[RealNN](dealData, response = "isClosed")

// 自动化特征工程
val featureVector = predictors.transmogrify()

// 自动化特征验证
val cleanFeatures = survived.sanityCheck(featureVector, removeBadFeatures = true)

// 自动化模型选择
val (pred, raw, prob) = BinaryClassificationModelSelector().setInput(isClosed, cleanFeatures).getOutput()

// 建立工作流并开始训练模型
val model = new OpWorkflow().setInputDataset(dealData).setResultFeatures(pred).train()

设计决策

TransmogrifAI 的设计目标是提高机器学习开发人员的工作效率——不仅对机器学习进行自动化，还提供了一组 API 来实现编译时类型安全、模块化和重用。以下是我们的一些设计决策。

Apache Spark

出于多种原因，我们选择在 Apache Spark 之上构建 TransmogrifAI。首先，我们需要能够处理各种大小的数据量。我们的一些客户和用例需要数千万条经过聚合或连接的数据记录来训练模型，但也有一些客户和用例只需要几千条记录。Spark 提供了连接和聚合分布式大数据的原语，这对我们来说很重要。其次，我们需要能够按照批量和流式的方式提供机器学习模型。Spark Streaming 可以让 TransmogrifAI 在这两种模式下工作。最后，基于一个活跃的开源库构建 TransmogrifAI，就可以充分利用这个库持续改进的特性，而无需为所有东西重新发明轮子。

特征抽象

SparkML Pipelines 引入了 Transformer 和 Estimator 的抽象，用于转换 DataFrame。TransmogrifAI 建立在这些抽象的基础之上（上面的特征转换、特征验证和模型选择，都由 Estimator 提供），此外，还引入了特征抽象。特征本质上是一个类型安全的指向 DataFrame 列的指针，它包含了所指列的所有信息——它的名称、它包含的数据类型，以及它的沿袭信息。

特征是开发人员主要的交互原语，定义和操作特征变得更像是在编程语言中使用变量，而不是操作 DataFrame 中的列。特征也是可共享的，可在开发人员之间重用。此外，TransmogrifAI 还提供了用于定义复杂时间序列聚合和连接的结果的能力。

类型安全

特征是强类型的，所以 TransmogrifAI 可以在整个机器学习工作流程中进行类型检查，确保尽早捕获错误，而不是在数小时后进入管道之后才发现。类型安全还与开发人员生产力的其他细节有关，比如智能 IDE 代码建议。你可以在下面看到可以对数字进行的所有可能转换，并选择其中一个。

类型安全还可以提高机器学习工作流程每个阶段预期输入和输出的透明度，这反过来又大大减少了部落知识的数量，这些知识不可避免地在足够复杂的机器学习工作流程中积累起来。

最后，特征类型对于下游的处理（特别是自动化特征工程和特征验证）而言至关重要。

可定制性和可扩展性：开发人员可以利用自动 Estimator 快速获得高性能模型，而对于需要更多控制的用户，每个开箱即用的 Estimator 都可以被参数化，并可以直接设置和调整这些参数。此外，用户也可以指定要在管道中使用的自定义 Transformer 和 Estimator。指定自定义 Transformer 就像定义 lambda 表达式一样简单，TransmogrifAI 负责处理所有用于序列化和反序列化 Transformer 的样板代码。

val lowerCaseText = textFeature.map[Text](_.value.map(_.toLowerCase).toText)

伸缩性和性能

通过自动化特征工程，数据科学家很容易就让特征空间膨胀，最终得到 Spark 都难以处理的 DataFrame。TransmogrifAI 工作流通过推断实现特征所需的整个转换 DAG 来解决这个问题。另外，因为 TransmogrifAI 是建立在 Spark 之上，所以可以直接从 Spark DataFrame 的优化改进中获益。

结果是，我们可以将自动化机器学习技术应用于具有数百万行和数百列的数据上，将特征空间扩展到数万个列。

TransmogrifAI 为每一个人赋能

对我们来说，TransmogrifAI 就像一场巨变，让我们的数据科学家能够以最少的手动调整生成数千种模型，并将训练高性能模型的平均时间从几周缩短到几个小时。这种自动化水平对于我们为企业提供服务来说至关重要，我们也相信，如今的每个企业的机器学习场景一定多过他们的数据科学家的数量，而自动化是实现机器学习能力的关键。

Salesforce 一直是 Apache Spark 的用户和贡献者，我们很高兴继续与社区一起构建 TransmogrifAI。机器学习有可能改变企业的运营方式，我们认为只有通过公开交换思想和代码才能降低采用障碍。通过公开合作，我们可以将不同的观点汇集在一起，继续推动技术的发展，惠及每一个人。

英文原文：

https://engineering.salesforce.com/open-sourcing-transmogrifai-4e5d0e098da2

python keyerror列名报错_keyerror weixin_39870199 python keyerror列名报错
ValueError：传入参数不是调用者所期望的(从书上所得，输入的参数不是数字而是字母)TypeError：传入参数的类型不符合IndexError：传入的参数个数不满足AttributeError：访问对象的某属性无效KeyError：访问字典的无效关键字IOError：无法打开文件最近接到一个使用python写一个解析yaml文件，并根据内容配置指定对应的shell来执行(比如bat、pow
微信小程序|系统配送员如何登陆抢单？同城配送、预约服务惠惠软件数据恢复专辑微信小程序微信小程序
系统中有多个功能有有配送端，最主要的是同城配送，和预约服务两个功能，首先介绍一下同城配送的配送员登录（扩展的同城配送需要开启）第一步，设置模板消息，配送员通过微信模板消息接收配送信息，需要在平台——微信公众号——模板消息设置（注：已认证服务号才能开通模板消息功能，在公众平台(mp.weixin.qq.com)[功能]-[添加功能插件]-[模板消息]中申请开通所在行业选择：IT科技/互联网|电子商务
linux环境下快速输出电脑的系统/硬件/显卡/网络/已安装软件等信息 Tipriest_ Ubuntu linux 电脑网络信息输出
在Linux环境下，可以通过以下命令快速获取系统和硬件信息。最后将这些命令整合成一个脚本（如`sysinfo.sh``），一键输出所有信息。1.系统信息#内核信息uname-a#发行版信息lsb_release-a2>/dev/null||cat/etc/*release*#系统启动时间uptime#环境变量echo"PATH:$PATH"2.硬件信息#CPU信息lscpucat/proc/cpu
C++中map和set的详解黑猫Teng c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
玩转 Vue 3：自定义指令让页面魔法随心而动代码剑客588 vue.js javascript 前端
玩转Vue3：自定义指令让页面魔法随心而动玩转Vue3：自定义指令让页面魔法随心而动什么是自定义指令？全局注册示例：高亮效果指令注册自定义指令在组件中使用局部注册与高级用法局部注册示例小结玩转Vue3：自定义指令让页面魔法随心而动在Vue3中，自定义指令为我们提供了在模板中直接操作DOM的能力，不仅可以让我们的页面效果更炫酷，还能将一些通用逻辑抽离出来，做到代码复用。本文将带你了解Vue3自定义指
MySQL慢SQL优化方案详解：从诊断到根治的完整指南代码剑客588 mysql sql ffmpeg
MySQL慢SQL优化方案详解：从诊断到根治的完整指南一、慢SQL的致命影响当数据库响应时间超过500ms时，系统将面临三大灾难链式反应：用户体验崩塌页面加载超时率上升37%用户跳出率增加52%核心业务转化率下降29%系统稳定性危机连接池耗尽风险提升4.8倍主从同步延迟突破10秒阈值磁盘IO利用率长期超90%运维成本飙升DBA故障处理时间增加65%硬件扩容频率提高3倍夜间告警量激增80%通过监控系
基于等级保护梳理服务器安全合规基线 - 副本程序员鬼鬼服务器安全 php 网络安全 web安全开发语言计算机网络
背景作为运维，当对新上架的服务器装完操作系统后，第一步就是对操作系统进行初始化配置来保证配置合规，此时你可能就会有疑问：我们应该初始化哪些参数，有没有相关标准参考呢？要想真正了解进行初始化配置的目的，我们先来科普一下相关法律：网络安全重磅福利：入门&进阶全套282G学习资源包免费分享！《中华人民共和国网络安全法》第二十一条规定，国家实行网络安全等级保护制度。网络运营者应当按照网络安全等级保护制度的
ionic5+capacitor+angular 人生如游戏--- Cordova Ionic angular
ionic更新到5之后。创建项目会默认使用capacitor容器。是ionic自己开发的一套类似cordova的东西。使用起来也比较简单。慢慢的会替代cordova，变成自己的东西吧。官方地址https://capacitor.ionicframework.com/docs/basics/running-your-app之前使用的是ioniccordova来操作现在使用npxcap来操作安装ion
HTML CSS样式齐尹秦 HTML学习笔记前端学习
CSS(CascadingStyleSheets)用于渲染HTML元素标签的样式。如何使用CSSCSS是在HTML4开始使用的,是为了更好的渲染HTML元素而引入的.CSS可以通过以下方式添加到HTML中:内联样式-在HTML元素中使用"style"属性内部样式表-在HTML文档头部区域使用元素来包含CSS外部引用-使用外部CSS文件最好的方式是通过外部引用CSS文件.内联样式当特殊的样式需要应用
基于MATLAB的齿轮箱振动信号分析代码编织匠人 matlab 开发语言数学建模
基于MATLAB的齿轮箱振动信号分析齿轮传动是工业生产中常见的机械传动方式，但是在长期运转过程中会产生振动现象，这种振动会影响齿轮传动的精度、寿命以及稳定性。因此，对齿轮箱振动信号的分析就显得非常重要。MATLAB是一款功能强大的数学软件，可以用于对齿轮箱振动信号进行分析和处理。本文就将介绍如何利用MATLAB对齿轮箱振动信号进行分析。一、齿轮箱振动信号获取首先，我们需要获取齿轮箱振动信号。通常可
Java常用集合与映射的线程安全问题深度解析 misschen888 java 安全开发语言
Java常用集合与映射的线程安全问题深度解析一、线程安全基础认知在并发编程环境下，当多个线程同时操作同一集合对象时，若未采取同步措施，可能导致以下典型问题：数据竞争：多个线程同时修改数据导致结果不可预测状态不一致：部分线程看到集合的中间状态内存可见性：线程本地缓存与主内存数据不同步死循环风险：特定操作引发无限循环（如JDK7的HashMap扩容）二、典型非线程安全集合问题分析1.ArrayList
Java常用集合与映射的线程安全问题深度解析 longdong7889 java 安全开发语言
Java常用集合与映射的线程安全问题深度解析一、线程安全基础认知在并发编程环境下，当多个线程同时操作同一集合对象时，若未采取同步措施，可能导致以下典型问题：数据竞争：多个线程同时修改数据导致结果不可预测状态不一致：部分线程看到集合的中间状态内存可见性：线程本地缓存与主内存数据不同步死循环风险：特定操作引发无限循环（如JDK7的HashMap扩容）二、典型非线程安全集合问题分析1.ArrayList
混合开发（ionic+cordova+angular）小黑阿泽 angular.js gradle 前端
相关网址：ionic、cordova、angular三者的关系：https://blog.csdn.net/xiaolinlife/article/details/73548938ionic官网：https://ionicframework.comionic中文网：http://www.ionic.wangcordova中文官网：http://cordova.axuer.com/#getstart
NFS,Nginx综合实验小何学计算机云原生 nginx 运维
1.实验要求配置NFS服务器作为ngxin服务的存储目录，并在目录中创建index.html文件，当访问http://你的IP地址时，可以成功显示index.html文件的内容。|角色|软件|IP|主机名|系统||NFS服务器|nfs-utils|192.168.72.7|server|RHEL9||WEB服务|nfs-utils,nginx|192.168.72.8|web|openEuler|
基于IBM Tivoli TSM系统构建某局备份系统实施方案 jaminwm 项目日志
本实施TSM的关键字解释文件备份：指文件级别的数据备份，基于操作系统的文件系统进行备份。数据库备份：指数据库基本的备份。在数据库处于open状态下，对数据库数据进行备份，并保持备份数据的一致性。离线备份：也叫冷备份或脱机备份，一种备份方法，在离线备份中，正在备份的数据在备份过程中不能被应用程序访问。通常用于普通文件备份。在线备份：也叫热备份或联机备份，一种备份方法，在线备份一般使用即时技术来构造原
CSS3：深度解析与实战应用扣得A艾 css3 css 前端
CSS3：深度解析与实战应用详解1.选择器增强2.盒模型扩展3.渐变和背景4.转换和动画总结CSS3是CSS（层叠样式表）的最新版本，它引入了许多新的特性和功能，使得网页的样式设计更加灵活、丰富和具有动态效果。在本文中，我们将深入解析CSS3的一些关键特性和实战应用，并通过代码样例展示其强大之处。1.选择器增强CSS3增加了许多新的选择器，如属性选择器、伪类选择器等，使得我们能够更精确地选择页面元
【MySQL】B树和B+树的区别？MySQL为什么选用B+树作为索引数据结构？熏鱼的小迷弟Liu 数据结构 mysql b树
B树和B+树的区别：结构方面：1.节点存储内容：B树：节点同时存储索引和数据。B+树：只有叶子节点存储数据记录或指向数据记录的指针，非叶子节点只存键值，用于索引。B+树的非叶子节点可以存储更多的键值，从而拥有更宽的分支。2.叶子结点关系：B树：叶子节点之间没有特定的顺序或指针连接，它们是独立的，查找不同叶子节点中的数据时可能需要多次随机访问磁盘。B+树：所有叶子节点通过双向链表，这种结构使得范围查
遨游科普：三防平板是哪三防？有哪些应用场景？ AORO_BEIDOU 电脑智能手机安全 5G 信息与通信
在工业智能化与数字化转型的浪潮中，电子设备的耐用性和环境适应性成为关键需求。普通消费级平板电脑虽然功能强大，但在极端环境下往往“水土不服”。而三防平板凭借其独特的防护性能，正逐步成为“危、急、特”场景的核心工具。AOROP300Ultra三防平板那么，“三防”究竟是哪“三防”？“三防”是电子设备领域对防尘、防水、防摔三大防护能力的统称，但这并非简单的功能叠加，而是通过材料、结构、工艺三重创新实现的
无人自助空间智能管理系统解决方案（深度优化版） ALLSectorSorft 大数据人工智能网络自动化小程序 uni-app android
无人自助空间智能管理系统解决方案（深度优化版）一、行业痛点与系统价值传统管理依赖人工：人工管理模式下，易出现人为失误，如计费错误、资源分配不当等。同时，人工操作效率低下，在高峰时段难以快速响应客户需求。且夜间运营需额外安排人力，增加运营成本，导致夜间运营困难。资源利用率不透明：由于缺乏有效的数据监测与分析手段，空间资源的空置率难以实时掌握，造成资源浪费。这也使得收益难以准确预测，不利于商家制定合理
【python】Python中常见的KeyError报错分析景天科技苑 python 开发语言 python报错 KeyError
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，linux，shell脚本等实操
fastapi+angular实现菜鸟驿站系统勘察加熊人 typescript fastapi angular.js 前端
说明：我计划用fastapi+angular实现菜鸟驿站系统userid和stationid暂时先写死全部写成1也就是用户1驿站1这样就可以简化流程1.新增包裹入库增加一个添加入库的按钮然后填写信息然后入库2.新增包裹取件按钮post请求，弹窗填写取件码，取件成功需要刷新包裹状态3.获取超时列表比如有些包裹严重超时我需要查看超时包裹的信息和位置4.还需要取件记录表用弹窗每次用户取件都必须有一条取件
手机零部件三维光学测量解决方案 yy229382036 人工智能 3d 光学成像算法
在移动互联网时代，智能终端深受市场追捧，而智能手机占据了第一大移动智能终端的地位。市场的火热造就了手机厂商白热化的竞争，继CPU、屏幕、摄像头等硬件配置大战之后，以外观、设计、质量为切入点的设计及功能竞争，也日趋激烈。在手机设计、质量检测中，无论是手机中框还是屏幕，利用三维光学测量技术，有助于优化从原型和模具构建、首件检验报告到装配分析等环节的质量控制，并有效节省检测时间，快速推进新产品上市。另外
C++内存管理秘籍：深入解析与实战代码示例萱萱199504 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
全自动文章生成发布构建 PyAIGCMaster 我的学习笔记 python
单机版、定时生成文章和分平台发布，以下是优化后的解决方案及代码示例：---###**推荐方案：APScheduler+内置调度逻辑**选择**APScheduler**是最佳方案，原因：1.**轻量级**：纯Python实现，无需额外服务（如Redis/CeleryWorker）。2.**精准调度**：支持Cron式定时任务（如每天3点生成、8点发布）。3.**单机友好**：直接嵌入代码中，适合打
Ubuntu 显卡NVIDIA-smi提示错误 DoubleImage 深度学习 ubuntu
Ubuntu长时间正常工作，但是重启后显卡工作异常执行NVIDIA-SMI提示如下问题：NVIDIA-SMIhasfailedbecauseitcouldn'tcommunicatewiththeNVIDIAdriver.MakesurethatthelatestNVIDIAdriverisinstalledandrunning.一、问题原因主要是由于系统自动更新了内核，新内核的版本与显卡驱动不匹
Ubuntu系统中NVIDIA-SMI 报错：NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver. QuietNightThought Linux linux python
文章目录一、介绍二、解决办法一：安装必要的内核头文件三、解决办法二：使用DKMS重新安装内核的NVIDIA驱动程序(我用这个方法解决了问题)四：解决办法三：安装NVIDIA驱动程序一、介绍当服务器未安装NVIDIA驱动程序，或驱动程序版本与显卡不匹配时，或者安装了某些系统软件或系统更新了内核时，服务器重启后可能无法连接到NVIDIA驱动程序。错误消息如下：$nvidia-smiNVIDIA-SMI
CSS3：深度解析与实战应用 my1121716951 css3 css 前端
CSS3：深度解析与实战应用详解1.选择器增强2.盒模型扩展3.渐变和背景4.转换和动画总结CSS3是CSS（层叠样式表）的最新版本，它引入了许多新的特性和功能，使得网页的样式设计更加灵活、丰富和具有动态效果。在本文中，我们将深入解析CSS3的一些关键特性和实战应用，并通过代码样例展示其强大之处。1.选择器增强CSS3增加了许多新的选择器，如属性选择器、伪类选择器等，使得我们能够更精确地选择页面元
Vue 3 事件总线详解：构建组件间高效通信的桥梁 love729234ming vue.js 前端 javascript
Vue3事件总线详解：构建组件间高效通信的桥梁为什么需要事件总线？使用mitt实现事件总线1.安装mitt2.创建事件总线3.在组件中使用事件总线发送端组件（例如ComponentA.vue）接收端组件（例如ComponentB.vue）自定义实现事件总线总结在复杂的前端应用中，组件之间的通信往往需要一种灵活且解耦的方式。传统的Vue2中，我们常使用全局事件总线来实现这种通信，但在Vue3中，由于
Java常用集合与映射的线程安全问题深度解析 jiajia651304 java 安全开发语言
Java常用集合与映射的线程安全问题深度解析一、线程安全基础认知在并发编程环境下，当多个线程同时操作同一集合对象时，若未采取同步措施，可能导致以下典型问题：数据竞争：多个线程同时修改数据导致结果不可预测状态不一致：部分线程看到集合的中间状态内存可见性：线程本地缓存与主内存数据不同步死循环风险：特定操作引发无限循环（如JDK7的HashMap扩容）二、典型非线程安全集合问题分析1.ArrayList
Spring Boot中@Valid 与 @Validated 注解的详解 jiajia651304 spring boot 后端 java
SpringBoot中@Valid与@Validated注解的详解引言@Valid注解功能介绍使用场景代码样例@Validated注解功能介绍使用场景代码样例@Valid与@Validated的区别结论引言在SpringBoot应用中，参数校验是确保数据完整性和一致性的重要手段。@Valid和@Validated注解是SpringBoot中用于参数校验的两个核心注解。本文将详细介绍这两个注解的用法
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

终结谷歌AutoML的真正杀手！Saleforce开源TransmogrifAI

你可能感兴趣的:(终结谷歌AutoML的真正杀手！Saleforce开源TransmogrifAI)