GarfieldEr007

美团O2O排序解决方案——线上篇

美团的愿景是连接消费者和商家，而搜索在其中起着非常重要的作用。随着业务的发展，美团的商家和团购数正在飞速增长。这一背景下，搜索排序的重要性显得更加突出：排序的优化能帮助用户更便捷地找到满足其需求的商家和团购，改进用户体验，提升转化效果。

和传统网页搜索问题相比，美团的搜索排序有自身的特点——90%的交易发生在移动端。一方面，这对排序的个性化提出了更高的要求，例如在“火锅”查询下，北京五道口的火锅店A，对在五道口的用户U1来说是好的结果，对在望京的用户U2来讲不一定是好的结果；另一方面，我们由此积累了用户在客户端上丰富准确的行为，经分析获得用户的地理位置、品类和价格等偏好，进而指导个性化排序。

针对美团的O2O业务特点，我们实现了一套搜索排序技术方案，相比规则排序有百分之几十的提升。基于这一方案，我们又抽象了一套通用的O2O排序解决方案，只需1-2天就可以快速地部署到其他产品和子行业中，目前在热词、Suggestion、酒店、KTV等多个产品和子行业中应用。

我们将按线上和线下两部分分别介绍这一通用O2O排序解决方案，本文是线上篇，主要介绍在线服务框架、特征加载、在线预估等模块，下篇将会着重介绍离线流程。

排序系统

为了快速有效的进行搜索算法的迭代，排序系统设计上支持灵活的A/B测试，满足准确效果追踪的需求。

美团搜索排序系统如上图所示，主要包括离线数据处理、线上服务和在线数据处理三个模块。

离线数据处理

HDFS/Hive上存储了搜索展示、点击、下单和支付等日志。离线数据流程按天调度多个Map Reduce任务分析日志，相关任务包括：

离线特征挖掘
产出Deal（团购单）/POI（商家）、用户和Query等维度的特征供排序模型使用。
数据清洗标注 & 模型训练
数据清洗去掉爬虫、作弊等引入的脏数据；清洗完的数据经过标注后用作模型训练。
效果报表生成
统计生成算法效果指标，指导排序改进。
特征监控
特征作为排序模型的输入是排序系统的基础。特征的错误异常变动会直接影响排序的效果。特征监控主要监控特征覆盖率和取值分布，帮我们及时发现相关问题。

在线数据处理

和离线流程相对应，在线流程通过Storm/Spark Streaming等工具对实时日志流进行分析处理，产出实时特征、实时报表和监控数据，更新在线排序模型。

在线服务（Rank Service）

Rank Service接到搜索请求后，会调用召回服务获取候选POI/Deal集合，根据A/B测试配置为用户分配排序策略/模型，应用策略/模型对候选集合进行排序。

下图是Rank Service内部的排序流程。

L1 粗粒度排序（快速）
使用较少的特征、简单的模型或规则对候选集进行粗粒度排序。
L2 细粒度排序（较慢）
对L1排序结果的前N个进行细粒度排序。这一层会从特征库加载特征（通过FeatureLoader），应用模型（A/B测试配置分配）进行排序。
L3 业务规则干预
在L2排序的基础上，应用业务规则/人工干预对排序进行适当调整。

Rank Service会将展示日志记录到日志收集系统，供在线/离线处理。

A/B测试

A/B测试的流量切分是在Rank Server端完成的。我们根据UUID（用户标识）将流量切分为多个桶（Bucket），每个桶对应一种排序策略，桶内流量将使用相应的策略进行排序。使用UUID进行流量切分，是为了保证用户体验的一致性。

下面是A/B测试配置的一个简单示例。

{
    "search": {
        "NumberOfBuckets": 100,
        "DefaultStrategy": "Base",
        "Segments": [
            {
                "BeginBucket": 0,
                "EndBucket": 24,
                "WhiteList": [123],
                "Strategy": "Algo-1"
            },
            {
                "BeginBucket": 25,
                "EndBucket": 49,
                "WhiteList": [],
                "Strategy": "Algo-2"
            }
        ]
    }
}

对于不合法的UUID，每次请求会随机分配一个桶，以保证效果对比不受影响。白名单（White List）机制能保证配置用户使用给定的策略，以辅助相关的测试。

除了A/B测试之外，我们还应用了Interleaving[7]方法，用于比较两种排序算法。相较于A/B测试，Interleaving方法对排序算法更灵敏[9]，能通过更少的样本来比较两种排序算法之间的优劣。Interleaving方法使用较小流量帮助我们快速淘汰较差算法，提高策略迭代效率。

特征加载

搜索排序服务涉及多种类型的特征，特征获取和计算是Rank Service响应速度的瓶颈。我们设计了FeatureLoader模块，根据特征依赖关系，并行地获取和计算特征，有效地减少了特征加载时间。实际业务中，并行特征加载平均响应时间比串行特征加载快约20毫秒。

FeatureLoader的实现中我们使用了Akka[8]。如上图所示，特征获取和计算的被抽象和封装为了若干个Akka actor，由Akka调度、并行执行。

特征和模型

美团从2013年9月开始在搜索排序上应用机器学习方法（Learning to Rank[1]），并且取得很大的收益。这得益于准确的数据标注：用户的点击下单支付等行为能有效地反映其偏好。通过在特征挖掘和模型优化两方面的工作，我们不断地优化搜索排序。下面将介绍我们在特征使用、数据标注、排序算法、Position Bias处理和冷启动问题缓解等方面的工作。

特征

从美团业务出发，特征选取着眼于用户、Query、Deal/POI和搜索上下文四个维度。

用户维度
包括挖掘得到的品类偏好、消费水平和地理位置等。
Query维度
包括Query长度、历史点击率、转化率和类型（商家词/品类词/地标词）等。
Deal/POI维度
包括Deal/POI销量、价格、评价、折扣率、品类和历史转化率等。
上下文维度
包括时间、搜索入口等。

此外，有的特征来自于几个维度之间的相互关系：用户对Deal/POI的点击和下单等行为、用户与POI的距离等是决定排序的重要因素；Query和Deal/POI的文本相关性和语义相关性是模型的关键特征。

模型

Learning to Rank应用中，我们主要采用了Pointwise方法。采用用户的点击、下单和支付等行为来进行正样本的标注。从统计上看，点击、下单和支付等行为分别对应了该样本对用户需求的不同的匹配程度，因此对应的样本会被当做正样本，且赋予不断增大的权重。

线上运行着多种不同类型模型，主要包括：

Gradient boosting decision/regression tree（GBDT/GBRT）[2]
GBDT是LTR中应用较多的非线性模型。我们开发了基于Spark的GBDT工具，树拟合梯度的时候运用了并行方法，缩短训练时间。GBDT的树被设计为三叉树，作为一种处理特征缺失的方法。

选择不同的损失函数，boosting tree方法可以处理回归问题和分类问题。应用中，我们选用了效果更好的logistic likelihood loss，将问题建模为二分类问题。
Logistic Regression（LR）
参考Facebook的paper[3]，我们利用GBDT进行部分LR特征的构建。用FTRL[4]算法来在线训练LR模型。

对模型的评估分为离线和线上两部分。离线部分我们通过AUC（Area Under the ROC Curve）和MAP（Mean Average Precision）来评价模型，线上则通过A/B测试来检验模型的实际效果，两项手段支撑着算法不断的迭代优化。

冷启动

在我们的搜索排序系统中，冷启动问题[6]表现为当新的商家、新的团购单录入或新的用户使用美团时，我们没有足够的数据用来推测用户对产品的喜好。商家冷启动是主要问题，我们通过两方面手段来进行缓解。一方面，在模型中引入了文本相关性、品类相似度、距离和品类属性等特征，确保在没有足够展示和反馈的前提下能较为准确地预测；另一方面，我们引入了Explore&Exploit机制，对新商家和团单给予适度的曝光机会，以收集反馈数据并改善预测。

Position Bias

在手机端，搜索结果的展现形式是列表页，结果的展示位置会对用户行为产生很大的影响。在特征挖掘和训练数据标注当中，我们考虑了展示位置因素引入的偏差。例如CTR（click-through-rate）的统计中，我们基于Examination Model[5]，去除展示位置带来的影响。

总结

本文主要介绍了美团搜索排序系统线上部分的结构、算法和主要模块。在后续文章里，我们会着重介绍排序系统离线部分的工作。

一个完善的线上线下系统是排序优化得以持续进行的基础。基于业务对数据和模型上的不断挖掘是排序持续改善的动力。我们仍在探索。

参考文献

Learning To Rank. Wikipedia
Friedman, J. H. (2001). Greedy function approximation: a gradient boosting machine. Annals of statistics, 1189-1232.
He, X., Pan, J., Jin, O., Xu, T., Liu, B., Xu, T., ... & Candela, J. Q. (2014, August). Practical lessons from predicting clicks on ads at facebook. In Proceedings of 20th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (pp. 1-9). ACM.
McMahan, H. B., Holt, G., Sculley, D., Young, M., Ebner, D., Grady, J., ... & Kubica, J. (2013, August). Ad click prediction: a view from the trenches. In Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 1222-1230). ACM.
Craswell, N., Zoeter, O., Taylor, M., & Ramsey, B. (2008, February). An experimental comparison of click position-bias models. In Proceedings of the 2008 International Conference on Web Search and Data Mining (pp. 87-94). ACM.
Cold Start. Wikipedia
Chapelle, O., Joachims, T., Radlinski, F., & Yue, Y. (2012). Large-scale validation and analysis of interleaved search evaluation. ACM Transactions on Information Systems (TOIS), 30(1), 6.
Akka: http://akka.io
Radlinski, F., & Craswell, N. (2010, July). Comparing the sensitivity of information retrieval metrics. In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval (pp. 667-674). ACM.

from: http://tech.meituan.com/meituan-search-rank.html

你可能感兴趣的:(算法,美团,O2O,排序,解决方案)

OpenCV相机标定与3D重建(63)校正图像的畸变函数undistort()的使用 jndingxin OpenCV opencv 3d
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述转换图像以补偿镜头畸变。该函数通过变换图像来补偿径向和切向镜头畸变。此函数仅仅是initUndistortRectifyMap（使用单位矩阵R）和remap（使用双线性插值）的组合。有关执行的具体变换详情，请参阅前者函数。对于在源图像中没有对应像素的目的图像中的像
数据结构与算法（六）——循环队列的顺序存储结构（超详解，附动图+代码） fs站在远方看童年数据结构与算法队列指针算法数据结构
上一篇最后我们分析了队列的利弊，故我们这里对队列进行优化。就有了这一篇，循环队列。队列的问题主要便是入队的时间复杂度O(1).出队的时间复杂度0(n)。还有就是当进行插入和删除操作后，线性表的开始空间可能会被空出来，会浪费且占用空间。所以我们这里让队列首位相连变成了一个环，但是如何相连，相连之后入队和出队又是如何操作呢，相连以后会不会出现问题呢，出现问题又该如何解决呢，大家跟我一起往下看吧。优化（
使用 Babylon.js 开发时如何通过 CSS 实现 UI 自适应 ttod_qzstudio Babylon JavaScript Babylon.js
本文将介绍如何在Babylon.js开发中，通过预先定义的CSS文件实现UI的自适应布局，确保UI能够根据Canvas元素的尺寸动态调整。场景描述假设我们已经使用HTML和CSS构建了Babylon.js的UI界面，并且所有样式都定义在CSS文件中。现在，我们需要让这些UI元素能够根据Canvas的尺寸动态调整，以实现自适应的效果。解决方案1.使用CSS变量（推荐）CSS变量（CustomProp
【leetcode100】二叉搜索树中第k小的元素 SsummerC leetcode100 算法数据结构 leetcode python
1、题目描述给定一个二叉搜索树的根节点root，和一个整数k，请你设计一个算法查找其中第k小的元素（从1开始计数）。示例1：输入：root=[3,1,4,null,2],k=1输出：12、初始思路2.1思路使用中序遍历（左根右）进行遍历，遍历结果为从小到大的排序，进而可以输出第k小的元素。#Definitionforabinarytreenode.#classTreeNode:#def__init
搜索广告召回技术在美团的实践 ? 思维导图-java架构用心去追梦 java 架构开发语言
搜索广告召回技术在美团这样的大型互联网公司中扮演着至关重要的角色，它直接影响到广告的展示效果、用户体验以及商家的营销成效。通过有效的召回机制，可以确保用户看到的相关性和个性化的广告内容，从而提高点击率和转化率。以下是关于搜索广告召回技术在美团实践中的思维导图结构，特别关注Java架构师可能关心的技术细节：搜索广告召回技术在美团的实践│├───概述│├───定义与重要性││└───召回是指从大量候选
谈谈游戏中数据一致性你一身傲骨怎能输网络同步数据一致性
在多用户环境中，确保数据一致性确实是一个复杂且具有挑战性的任务，尤其是在实时游戏中。以下是对数据一致性挑战的深入分析，以及您提到的解决方案的详细说明和其他可能的解决方案。数据一致性挑战并发更新：多个玩家可能同时对同一数据进行操作（例如，攻击同一目标、拾取同一物品），这会导致数据冲突和不一致。网络延迟：网络延迟可能导致某些客户端的状态更新滞后，导致不同客户端看到的数据状态不一致。数据包丢失：在网络传
速通 AI+Web3 开发技能: 免费课程+前沿洞察 OpenBuild.xyz 人工智能 web3 区块链去中心化
AI正以前所未有的速度重塑各行各业，从生成式模型到大规模数据处理，AI逐渐成为核心驱动力。与此同时，Web3去中心化技术也在重新定义信任、交易和协作方式。当这两大前沿技术相遇，AI+Web3的融合已不再是理论，而是未来趋势，有望催生出颠覆性的创新应用和商业模式。AI提供智能化工具和算法支持，Web3则为数据和应用赋予了去中心化的灵魂，二者结合将开创全新的技术生态。无论是智能合约中的AI决策，还是链
QVector从小到大排序卢一涵 qt
QVectorvector{5.1,3.8,9.1,4.6,1.7};std::sort(vector.begin(),vector.end());//从小到大排序。qDebug()<<vector;如上代码所示，执行完以后，得到排序后的列表。
有哪些常见的 Vue 错误？涔溪 vue vue.js 前端 javascript
在使用Vue.js开发应用时，开发者可能会遇到各种错误。以下是一些常见的Vue错误以及如何避免它们：为了更详细地解释常见的Vue.js错误，我们可以深入探讨每个类别，并提供更多的背景信息和解决方案。以下是针对常见错误的扩展说明：1.数据响应性问题a.未声明的响应式数据问题：在Vue实例创建之后动态添加的数据属性不会自动成为响应式的。解决方案：使用Vue.set()或者this.$set()方法来添
PDF的全能工具箱，你必不可少的办公助手 Ag大雨 pdf
PDFgear是一款集合了多种PDF处理工具的软件套装它包括PDF阅读、编辑、转换、合并和签署等功能。这款软件提供了全面的PDF处理解决方案，使用户能够轻松地完成各种与PDF文件相关的任务。功能特点多功能性：支持多种与PDF相关的操作，包括但不限于编辑、转换、合并和签署。这为用户提供了一个一站式的解决方案，可以满足各种与PDF文件处理相关的需求。文本编辑：支持编辑PDF文本，允许用户添加、替换甚至
华为OD机试E卷 --最多获得的短信条数--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述某云短信厂商，为庆祝国庆，推出充值优惠活动。现在给出客户预算，和优惠售价序列，求最多可获得的短信总条数。输入描述第一行客户预算M，其中0≤M≤10^6第二行给出售价表，P1,P2,…Pn,其中1≤n≤100,Pi为充值i元获得的短信条数。1≤Pi≤1000,1≤n≤100输出
小波变换算法详解（附Python和C++代码）卢一涵算法人工智能机器学习 c++
小波变换算法是将初始数据分解为低频和高频的两组数据，再由这两组数据重新构造初始数据的算法（与傅里叶变换算法类似）。一般来说小波变换常用于数据降噪领域，也可以用于对数据进行压缩、数据特征提取、特征增强等方面。小波算法很难理解对不对，博主也觉得难理解，不过，算法本身并没有特别复杂，简单说就使把数据分解然后再重构这两个步骤。只要知道这两个步骤，剩下的就是顺水推舟，容易理解多了。小波分解：分解的步骤其实就
面向服务架构（SOA）设计及其应用详解一休哥助手架构架构
目录什么是面向服务架构？SOA的核心理念与设计原则服务解耦服务重用服务自治SOA架构的常见组件服务注册中心服务提供者与消费者消息总线（ESB）面向服务架构的实现方式SOAP与RESTful服务微服务架构与SOA的关系SOA的应用场景与优势SOA设计中的挑战与解决方案结语1.什么是面向服务架构？**面向服务架构（SOA）**是一种软件设计方法论，其核心思想是将应用程序的功能通过一系列松耦合的服务（S
蓝桥杯算法|基础笔记（1）幼稚鬼？算法蓝桥杯笔记
**时间复杂度**一、概念理解时间复杂度是用来衡量算法运行时间随输入规模增长而增长的量级。它主要关注的是当输入规模趋向于无穷大时，算法执行基本操作的次数的增长趋势，而不是精确的运行时间。二、分析代码中的基本操作确定关键操作在一段代码中，首先要找出对整体运行时间影响最大的操作。例如，在一个循环中，如果循环体主要是进行简单的算术运算，那么这些算术运算就是基本操作。对于排序算法，比较元素大小和交换元素位
蓝桥杯算法日常|枚举[*找到最多的数] 幼稚鬼？ 25/1/8寒假蓝桥杯练习日志专栏算法蓝桥杯哈希算法
**找到最多的数**重点疑问总结：1、数组输入输出c++一般会采用那种方便的方式？？用的就是我想的那种，就是用的最大范围定义的。2、怎样方便给数组中每个数出现的次数计数？？刚开始想的是：每个数把全部的数比较一下子最后发现最佳方法是：哈希表，这里用了一个数组，数组下标表示统计的哪个数，数组的值是该数出现的次数。题目截图解题思路：遍历矩阵，将每个数字及其出现次数存储在一个哈希表（这里使用数组模拟哈希表
操作系统的算法调度的平均时间5-24 yaoyaoyao可爱呀
最短作业优先调度算法平均等待时间例：三个作业J1，J2，J3一起到达，分别对应的执行时间为24，3，3，则最短作业优先调度算法调度的平均等待时间为3假设一起到达：先做最短的J2或J3周转时间等待时间=周转时间-运行时间0-3J23-0=3303-6J36-0=6636-30J130-0=30306平均等待时间=（0+3+6）/3=3
企业里Win10 开启BitLocker锁定磁盘，如何备份系统，当系统出现问题又如何恢复，快速恢复又兼顾系统安全玩人工智能的辣条哥企业信息数据安全保护 bitlocker 磁盘加密数据安全
环境：Win10专业版SGIMINI4.8.126.0联想E14Gen2问题描述：Win10开启BitLocker锁定磁盘，如何备份系统，当系统出现问题又如何恢复解决方案：一、bitlocker加密加锁后备份系统1.C盘开启bitlockermanage-bde-onc:将C盘密钥密码存在E盘manage-bde-protectors-addc:-rp-rke:\2.D盘开启bitlockerma
python md5加密列表_python生成md5加密的方法 weixin_39637646 python md5加密列表
MD5消息摘要算法(英语：MD5Message-DigestAlgorithm)，一种被广泛使用的密码散列函数，可以产生出一个128位(16字节)的散列值(hashvalue)，用于确保信息传输完整一致。MD5是最常见的摘要算法，速度很快，生成结果是固定的128bit字节，通常用一个32位的16进制字符串表示。hashlib介绍Python的hashlib提供了常见的摘要算法，如MD5，SHA1等
python md5加密解密_python md5加密解密 weixin_39589394 python md5加密解密
md5加密以后的字符串长度我下了一段用JAVA实现MD5加密的算法，不管输入字符串多长，加密后的字符加密后为128位（bit），按照16进制（4位一个16进制数）编码后，就成了32个字符。MD5并不是加密算法zhidao，而是摘要算法。加密算法是可逆的，摘要算法是理专论上不可逆的，详细步骤：md5算法主要应用在密码领域,为了防止明文传输密码的危险Python怎么对用户密码进行MD5加密，或者是单向
基于FPGA的简易RLC测量仪设计与实现耄先森吖
本文还有配套的精品资源，点击获取简介：RLC测量仪用于检测电路中电阻、电感和电容参数，对于电子工程和电路设计至关重要。本文将详细探讨简易RLC测量仪的设计与实现，特别关注其自动换档测量技术和采用的FPGA技术。FPGA提供并行处理能力和高速运算，能够快速响应测量信号并调整测量范围。本文还提供了测量仪的硬件逻辑设计、测量算法和软件实现，以及技术文档说明，对于理解RLC测量仪的实现细节和使用方法具有重
VMD（变分模态分解）详解 DuHz 波的分析方法现代谱分析方法音频处理数据挖掘信号处理人工智能信息与通信数学建模
VMD（变分模态分解）详解目录前言背景及发展VMD原理与数学基础问题的提出变分框架与能量最小化中心频率与带宽定义目标函数及约束拉格朗日乘子法频域迭代更新公式VMD与EMD/EEMD/CEEMDAN等方法比较VMD算法流程主要参数的选择与影响优点与不足实际应用中需要注意的问题示例代码代码简要解读参考资料前言在信号处理、时频分析、故障诊断等诸多领域，如何将一个复杂信号进行多分量分解，进而提取到其中所包
蓝桥杯试题算法训练最小距离 ( C++ ) ghost_him 蓝桥杯练习算法蓝桥杯 c++
最小距离最小距离算法题目算法代码算法的核心思路最小距离算法题目资源限制时间限制：1.0s内存限制：256.0MB最小距离问题描述数轴上有n个数字，求最近的两个数，即min(abs(x-y))输入格式第一行包含一个整数n。接下来一行，表示n整数。输出格式一个整数表示最小距离样例输入673411917样例输出1样例说明取3和4数据规模和约定n#includeusingnamespacestd;cons
Md5sum与aide的使用入眼皆含月 linux 运维安全知识图谱
一、Md5sum1、概述md5sum是一个用于计算和校验文件MD5哈希值的工具。MD5（Message-DigestAlgorithm5）是一种广泛使用的哈希算法，它可以产生一个128位（16字节）的哈希值，通常用32位的十六进制字符串表示。md5sum命令可以生成文件的MD5校验和，并与原始校验和进行比较，以判断文件是否被篡改。2、Md5sum的用途（1）验证文件完整性：在文件传输或备份后，使用
CRM系统用户满意度调查：哪些品牌最受欢迎
随着国内CRM市场的快速发展，众多厂商纷纷推出各具特色的产品，以满足不同企业的需求。然而，面对琳琅满目的CRM系统，企业如何选择最适合自己的解决方案成为了一个亟待解决的问题。为了帮助企业更好地了解国内CRM市场的用户满意度情况，我们特别发起了本次调研，旨在揭示哪些品牌在市场上表现突出，赢得用户的广泛认可。本次调查通过问卷调查、用户访谈以及市场数据分析等多种方式，收集了来自不同规模、行业和地区的企业
SVC函数介绍浊酒南街 #机器学习算法人工智能
目录前言函数介绍示例前言SVC（SupportVectorClassification）是支持向量机（SVM）的一种实现，主要用于分类问题。支持向量机是一种监督学习算法，其基本原理是找到一个最优的超平面来将不同类别的数据分开。SVC在小样本和高维空间中表现良好，且能够处理非线性分类问题。函数介绍SVC(C=1.0,kernel=‘rbf’,degree=3,gamma=‘auto’,coef0=0
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
用增结算数仓化改造：在/离线调度系统的构建与应用百度Geek说百度架构大数据重构
导读移动运营推广平台（OPS）承载着百度内部移动应用/移动搜索业务的用户增长预算的全流程结算线上化管控功能，为了解决用增业务发展规模扩大、原有技术架构老旧、无离线数仓系统等一系列的问题，针对全域结算数据启动了整体的架构改造。为了解决业务中存在的问题，本文深入探讨并提出了一类在线、离线结合的任务调度解决方案，完成了结算业务架构更新换代，更好地服务于业务发展。01背景简述1.1业务/技术背景移动运营推
Kafka 迁移 AutoMQ 时 Flink 位点管理的挑战与解决方案 AutoMQ 云计算云原生 Kafka 消息计算大数据 AWS AutoMQ 阿里云腾讯云 GCP
编辑导读：AutoMQ是一款与ApacheKafka100%完全兼容的新一代Kafka，可以做到至多10倍的成本降低和极速的弹性。凭借其与Kafka的完全兼容性可以与用户已有的Flink等大数据基础设施进行轻松整合。Flink是重要的流处理引擎，与Kafka有着密切的关系。本文重点介绍了当用户需要将生产Kafka集群迁移到AutoMQ时，如何处理好Flink的位点来确保整体迁移的平滑过渡。引言在云
AI产品经理还不会数据挖掘❓看完这篇就够了脱泥不tony 人工智能产品经理数据挖掘 python tensorflow 开发语言 llama
前言在数字化时代的浪潮中，AI产品经理正成为推动科技与商业融合的重要力量。然而，面对海量的数据，如何从中挖掘出有价值的信息，为AI产品的开发提供有力支持？这已成为AI产品经理必须面对的挑战。今天，我们就来探讨一下数据挖掘在AI产品经理工作中的重要性，以及如何通过掌握数据挖掘方法论，打造卓越的AI产品。一、数据挖掘：AI产品经理的必备技能在AI产品的世界中，大数据是构建一切的基础。无论是算法组件、知
HTTPS keytool工具使用(高频) 笑锝没心没肺 Linux #网络安全 https 网络协议 http
keytool是Java平台的一个密钥和证书管理工具，它用于管理JavaKeystore(JKS)文件，这些文件用于存储密钥和证书。以下是keytool命令的一些常用选项及其详解：基本语法keytool[options]选项列表生成密钥库-genkeypair:生成密钥对。-alias:密钥库条目的别名。-keyalg:密钥算法，例如RSA或EC。-keysize:密钥大小（位数）。-validi
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n
操作日期和时间的工具类 vipbooks 工具类
大家好啊，好久没有来这里发文章了，今天来逛逛，分享一篇刚写不久的操作日期和时间的工具类，希望对大家有所帮助。 /* * @(#)DataFormatUtils.java 2010-10-10 * * Copyright 2010 BianJing,All rights reserved. */ package test; impor

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他