韫秋

美团一站式机器学习平台

文章目录

- - - 1、业务背景
    - 2、美团配送机器学习平台演进过程
    - - 2.1、为什么建设一站式机器学习平台
      - 2.2、MVP阶段
      - 2.3、平台化阶段
    - 3、图灵平台
    - - 3.1、离线训练平台
      - 3.2、模型管理平台
      - 3.3、离线特征平台
      - 3.4、实时特征平台
      - 3.5、AB实验平台
    - 4、总结与展望

本文转载自：https://www.jianshu.com/p/d40d6861694f。

本文来自美团技术研究院

AI是目前互联网行业炙手可热的“明星”，

无论是老牌巨头，

还是流量新贵，

都在大力研发AI技术，

为自家的业务赋能。

配送作为外卖平台闭环链条上重要的一环，

配送效率和用户体验是配送业务的核心竞争力。

随着单量上涨、骑手增多、配送场景复杂化，

配送场景的各种算法在

更快（算法需要快速迭代、快速上线）、

更好（业务越来越依赖机器学习算法产生正向的效果）、

更准（算法的各种预测如预计送达时间等，需要准确逼近真实值）

的目标下也面临日益增大的挑战。

算法从调研到最终上线发挥作用，

需要有一系列的工程开发和对接，

由此引发了新的问题：

如何界定算法和工程的边界，各司其职，各善其长？

如何提升算法迭代上线的速度和效率？

如何快速准确评估算法的效果？

本文将为大家分享美团配送技术团队在

建设一站式机器学习平台过程中的一些经验和探索，

希望对大家能有所帮助或者启发。

1、业务背景

2019年7月份，

美团外卖的日订单量已经突破3000万单，

占有了相对领先的市场份额。

围绕着用户、商户、骑手，

美团配送构建了全球领先的即时配送网络，

建设了行业领先的美团智能配送系统，

形成了全球规模最大的外卖配送平台。

如何让配送网络运行效率更高，

用户体验更好，

是一项非常有难度的挑战。

我们需要解决大量复杂的机器学习和运筹优化等问题，

包括

ETA预测
智能调度
地图优化
动态定价
情景感知
智能运营

等多个领域。

同时，我们还需要在

体验
效率
成本

之间达到平衡。

2、美团配送机器学习平台演进过程

2.1、为什么建设一站式机器学习平台

如果要解决上述的机器学习问题，

就需要有一个功能强大且易用的机器学习平台来辅助算法研发人员，

帮助大家脱离繁琐的工程化开发，

把有限的精力聚焦于算法策略的迭代上面。

目前业界比较优秀的机器学习平台有很多，

既有大公司研发的商用产品，

如

微软的Azure
亚马逊的SageMaker
阿里的PAI平台
百度的PaddlePaddle
腾讯的TI平台

也有很多开源的产品，

如

加州大学伯克利分校的Caffe
Google的TensorFlow
Facebook的PyTorch
Apache的Spark MLlib

等。

而开源平台大都是机器学习或者深度学习基础计算框架，

聚焦于训练机器学习或深度学习模型；

公司的商用产品则是基于基础的机器学习和深度学习计算框架进行二次开发，

提供一站式的生态化的服务，

为用户提供从

数据预处理
模型训练
模型评估
模型在线预测

的全流程开发和部署支持，

以期降低算法同学的使用门槛。

公司级的一站式机器学习平台的目标和定位，

与我们对机器学习平台的需求不谋而合：

为用户提供端到端的一站式的服务，帮助他们脱离繁琐的工程化开发，把有限的精力聚焦于算法策略的迭代上面。

鉴于此，美团配送的一站式机器学习平台应运而生。

美团配送机器学习平台的演进过程可以分为两个阶段：

MVP阶段：灵活，快速试错，具备快速迭代能力。
平台化阶段：
- 业务成指数级增长，需要机器学习算法的场景越来越多
- 如何既保证业务发展，又能解决系统可用性、扩展性、研发效率等问题。

2.2、MVP阶段

初始阶段，大家对机器学习平台要发展成什么样子并不明确，很多事情也想不清楚。

但是为了支撑业务的发展，必须快速上线、快速试错。

因此，在此阶段，各个业务线独自建设自己的机器学习工具集，

按照各自业务的特殊需求进行各自迭代，

快速支持机器学习算法上线落地应用到具体的业务场景，

也就是我们所熟知的“烟囱模式”。

此种模式各自为战，非常灵活，

能够快速支持业务的个性化需求，

为业务抢占市场赢得了先机。

但随着业务规模的逐渐扩大，

这种“烟囱模式”的缺点就凸显了出来，

主要表现在以下两个方面：

重复造轮子：
- 特征工程
- 模型训练
- 模型在线预测
- 都是各自研发，从零做起，算法的迭代效率低下。
特征口径混乱：
- 各个业务方重复开发特征，相同特征的统计口径也不一致，导致算法之间难以协同工作。

2.3、平台化阶段

为了避免各部门重复造轮子，

提升研发的效率，

同时统一业务指标和特征的计算口径，

标准化配送侧的数据体系，

美团配送的研发团队组建了一个算法工程小组，

专门规整各业务线的机器学习工具集，

希望建设一个统一的机器学习平台，

其需求主要包括以下几个方面：

该平台底层依托于Hadoop/Yarn进行资源调度管理，集成了
- Spark ML
- XGBoost
- TensorFlow
- 三种机器学习框架，并保留了扩展性，方便接入其它机器学习框架，
- 如美团自研的MLX
  - 超大规模机器学习平台
  - 专为搜索、推荐、广告等排序问题定制
  - 支持百亿级特征和流式更新
通过对Spark ML、XGBoost、TensorFlow机器学习框架的封装，
- 我们实现了可视化离线训练平台，
- 通过拖拉拽的方式生成DAG图，
- 屏蔽多个训练框架的差异，
- 统一模型训练和资源分配，
- 降低了算法RD的接入门槛。
模型管理平台
- 提供统一的模型注册、发现、部署、切换、降级等解决方案，
- 并为机器学习和深度学习模型实时计算提供高可用在线预测服务。
离线特征平台
- 收集分拣线下日志，计算提炼成算法所需要的特征，并将线下的特征应用到线上。
实时特征平台
- 实时收集线上数据，计算提炼成算法所需要的特征，并实时推送应用到线上。
版本管理平台
- 管理算法的版本以及算法版本所用的模型、特征和参数。
AB实验平台
- 通过科学的分流和评估方法，更快更好地验证算法的效果。

3、图灵平台

平台化阶段，我们对美团配送机器学习平台的目标定位是：

一站式机器学习平台，给算法同学提供一站式服务，覆盖算法同学

调研
开发
上线
评估算法效果

的全流程，

包括：

数据处理
特征生产
样本生成
模型训练
模型评估
模型发布
在线预测和效果评估

为了响应这个目标，

大家还给平台取了个大胆的名字——Turing，

中文名称为图灵平台，

虽然有点“胆大包天”，

但是也算是对我们团队的一种鞭策。

1）首先在获取数据阶段，支持在线和离线两个层面的处理，分别通过
- 采样
- 过滤
- 归一化
- 标准化
- 等手段生产实时和离线特征，并推送到在线的特征库，供线上服务使用。
2）模型训练阶段，支持分类、回归、聚类、深度学习等多种模型，并支持自定义Loss损失函数。
3）模型评估阶段，支持多种评估指标，如AUC、MSE、MAE、F1等。
4）模型发布阶段，提供一键部署功能，支持本地和远程两种模式
- 分别对应将模型部署在业务服务本地和部署在专用的在线预测集群。
5）在线预测阶段，支持AB实验，灵活的灰度发布放量，并通过统一埋点日志实现AB实验效果评估。

3.1、离线训练平台

离线训练平台的目标是：

搭建可视化训练平台，屏蔽多个训练框架的差异，降低算法RD的接入门槛。

为了降低算法RD进入机器学习领域的门槛，

我们开发了带有可视化界面的离线训练平台，

通过各种组件的拖拉拽组合成DAG图，

从而生成一个完整的机器学习训练任务。

目前支持的组件大致分为：

输入
输出
特征预处理
数据集加工
机器学习模型
深度学习模型

等几大类，

每种类别都开发了多个不同的组件，

分别支持不同的应用场景。

同时为了不失去灵活性，

我们也花费了一番心思，

提供了多种诸如

自定义参数
自动调参
自定义Loss函数

等功能，

尽量满足各个不同业务方向算法同学各种灵活性的需求。

我们的离线训练平台在产出模型时，

除了产出模型文件之外，

还产出了一个MLDL（Machine Learning Definition Language）文件，

将各模型的所有预处理模块信息写入MLDL文件中，

与模型保存在同一目录中。

当模型发布时，

模型文件连带MLDL文件作为一个整体共同发布到线上。

在线计算时，

先自动执行MLDL中的预处理逻辑，

然后再执行模型计算逻辑。

通过MLDL打通了离线训练和在线预测，

贯穿整个机器学习平台，

使得线下和线上使用同一套特征预处理框架代码，

保证了线下和线上处理的一致性。

在发布模型时，

我们还提供了模型绑定特征功能，

支持用户把特征和模型的入参关联起来，

方便在线预测时模型自动获取特征，

极大地简化了算法RD构造模型输入时获取特征的工作量。

3.2、模型管理平台

前面介绍了，

我们的图灵平台集成了Spark ML、XGBoost、TensorFlow三种底层训练框架，

基于此，

我们的训练平台产出的机器学习模型种类也非常多，

简单的有

LR
SVM，

树模型有

GBDT
RF
XGB

等，

深度学习模型有

RNN
DNN
LSTM
DeepFM

等等。

而我们的模型管理平台的目标就是提供统一的

模型注册
发现
部署
切换
降级

等解决方案，

并为机器学习和深度学习模型提供高可用的线上预测服务。

模型管理平台支持本地和远程两种部署模式：

本地：模型和MLDL统一推送到业务方服务节点上，同时图灵平台提供一个Java的Lib包，嵌入到业务方应用中，业务方通过本地接口的方式调用模型计算。
远程：图灵平台维护了一个专用的在线计算集群，模型和MLDL统一部署到在线计算集群中，业务方应用通过RPC接口调用在线计算服务进行模型计算。

对于超大规模模型，单机无法装载，需要对模型进行Sharding。
- 鉴于美团配送的业务特性，可以按照配送城市/区域进行分区训练，每个城市或区域产出一个小模型，
- 多个分区模型分散部署到多个节点上，解决单节点无法装载大模型的问题。
- 分区模型要求我们必须提供模型的路由功能，以便业务方精准地找到部署相应分区模型的节点。
同时，模型管理平台还收集各个服务节点的心跳上报信息，维护模型的状态和版本切换，确保所有节点上模型版本一致。

3.3、离线特征平台

配送线上业务每天会记录许多骑手、商家、用户等维度的数据，

这些数据经过ETL处理得到所谓的离线特征，

算法同学利用这些离线特征训练模型，

并在线上利用这些特征进行模型在线预测。

离线特征平台就是将存放在Hive表中的离线特征数据生产到线上，

对外提供在线获取离线特征的服务能力，

支撑配送各个业务高并发及算法快速迭代。

最简单的方案，

直接把离线特征存储到DB中，

线上服务直接读取DB获取特征Value。

读取DB是个很重的操作，

这种方案明显不能满足互联网大并发的场景，

直接被Pass掉。

第二种方案，

把各个离线特征作为K-V结构存储到Redis中，

线上服务直接根据特征Key读取Redis获取特征Value。

此方案利用了Redis内存K-V数据库的高性能，

乍一看去，好像可以满足业务的需求，

但实际使用时，

也存在着严重的性能问题。

典型的业务场景：

比如我们要预测20个商家的配送时长，

假设每个商家需要100个特征，

则我们就需要20*100=2000个特征进行模型计算，

2000个KV。

如果直接单个获取，满足不了业务方的性能需求；

如果使用Redis提供的批量接口Mget，如果每次获取100个KV，则需要20次Mget。

缓存mget的耗时TP99约5ms，20次Mget，TP99接近100ms，也无法满足业务方的性能需求（上游服务超时时间约50ms）。

因此，我们需要对离线特征从存储和获取进行优化。

我们提出了特征组的概念，

同一维度的特征，

按照特征组的结构进行聚合成一个KV，

大大减少了Key的数目；

并且提供了相对完善的管理功能，

支持对特征组的动态调整（组装、拆分等）。

3.4、实时特征平台

相比于传统配送，

即时配送无论是在位置信息、骑手负载，

还是在当前路网情况，

以及商家出餐情况等方面都是瞬息变化的，

实时性要求非常高。

为了让机器学习算法能够即时的在线上生效，

我们需要实时地收集线上各种业务数据，

进行计算，

提炼成算法所需要的特征，

并实时更新。

3.5、AB实验平台

AB实验并不是个新兴的概念，

自2000年谷歌工程师将这一方法应用在互联网产品以来，

AB实验在国内外越来越普及，

已成为互联网产品运营精细度的重要体现。

简单来说，

AB实验在产品优化中的应用方法是：

在产品正式迭代发版之前，

为同一个目标制定两个（或以上）方案，

将用户流量对应分成几组，

在保证每组用户特征相同的前提下，

让用户分别看到不同的方案设计，

根据几组用户的真实数据反馈，

科学的帮助产品进行决策。

互联网领域常见的AB实验，

大多是面向C端用户进行流量选择，

比如基于注册用户的UID或者用户的设备标识（移动用户IMEI号/PC用户Cookie）进行随机或者哈希计算后分流。

此类方案广泛应用于搜索、推荐、广告等领域，

体现出千人千面个性化的特点。

此类方案的特点是实现简单，

假设请求独立同分布，

流量之间独立决策，

互不干扰。

此类AB实验之所以能够这样做是因为：

C端流量比较大，

样本足够多，

而且不同用户之间没有相互干扰，

只要分流时足够随机，

即基本可以保证请求独立同分布。

即时配送领域的AB实验是围绕用户、商户、骑手三者进行，

用户/商户/骑手之间不再是相互独立的，

而是相互影响相互制约的。

针对此类场景，

现有的分流方案会造成不同策略的互相干扰，

无法有效地评估各个流量各个策略的优劣。

鉴于上述的问题，

我们将配送侧的AB实验分为三个阶段：

事前的AA分组
事中的AB分流
事后的效果评估。
AA分组
- 将候选流量按照既定的规则预先分为对照组和实验组
- 基于数理统计的理论确保对照组和实验组
- 在所关注的业务指标上没有显著差异。
AB分流
- 将线上请求实时分到对照或者实验版本。
效果评估
- 根据对照组和实验组的数据对比评估AB实验的效果。

由于即时配送的场景较为特殊，

比如按照配送区域或城市进行AB实验时，

由于样本空间有限，

很难找到没有差异的对照组和实验组，

因此我们设计了一种分时间片AB对照的分流方法：

支持按天、小时、分钟进行分片，

多个时间片进行轮转切换，

在不同区域、不同时间片之间，

对不同的策略进行交替切换进行AB分流，

最大限度减少线下因素的影响，

确保实验科学公正。

4、总结与展望

目前图灵平台支撑了

美团配送
小象
LBS平台

等BU的算法离线训练、在线预测、AB实验等，

使算法RD更加关注算法策略本身的迭代优化，

显著提高了算法RD的效率。

未来我们会在以下方面继续深入探索：

1）加强深度学习的建设。
- 加强深度学习的建设，
- 全面支持深度学习，
- 实现深度学习相关组件与机器学习组件一样
- 在可视化界面可以和任意组件组合使用。
- 离线训练支持更多常用深度学习模型。
- 支持直接写Python代码自定义深度学习模型。
2）在线预测平台化，进一步解耦算法和工程。
- 简化图灵平台SDK
- 剥离主体计算逻辑
- 建设在线预测平台。
- 在线预测平台动态加载算法包
- 实现算法、业务工程方、图灵平台的解耦。
作者简介
艳伟
美团配送技术团队资深技术专家。

你可能感兴趣的:(人工智能,算法,人工智能,自动驾驶)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod