架构师小秘圈

阿里巴巴电商搜索推荐实时数仓演进之路

分享嘉宾：张照亮阿里巴巴高级技术专家

编辑整理：郑银秋

出品平台：DataFunTalk

导读：今天分享的内容是阿里搜索推荐数据平台研发团队在实时数仓的一些探索，围绕着团队在数仓上基于Flink + Hologres的演进过程及最佳实践。

业务背景

阿里巴巴电商搜索推荐实时数据仓库承载了阿里巴巴集团淘宝、淘宝特价版、饿了么等多个电商业务的实时数仓场景，提供了包括实时大屏、实时报表、实时算法训练、实时A/B实验看板等多种数据应用支持。

1. 数据的价值

我们认为数据处于阿里巴巴搜索推荐的大脑位置，这体现在算法迭代、产品运营和老板决策等多个方面。那么数据是怎样在搜索推荐业务场景中流转的呢？首先是信息采集，用户在使用手机淘宝的搜索和推荐功能时，会触发到服务端上的埋点信息；接下来会经过离线和实时的ETL加工，再装载到产品引擎里面；然后我们会基于引擎来构建分析系统，帮助算法、产品做分析决策；形成一次决策之后，会有一些新的内容上线，用户可以看到算法模型产出的一些业务形态；这样就产生了一轮新的数据采集、加工、装载和分析的过程。这样一来就可以利用数据形成一个完整的业务链路，其中每个环节都非常重要。

2. 搜索推荐典型场景

实时数据在电商搜索推荐中有多种不同的应用场景，如实时分析、算法应用和精细化人群运营等。

① 实时分析和算法应用场景

在实时分析和算法应用场景中，我们利用实时数据仓库搭建分析报表、实时大屏、训练算法模型以及打造其他类型的数据产品。实时数据的需求搜索推荐场景下主要有以下特点：

数据量大：单日PB级存储
单表总条数：千亿+
QPS高：峰值写入RPS 6500W+
峰值查询QPS：200+
数据灵活性要求高，分析场景多样化，固定条件高频分析、非固定条件多维查询

② 精细化人群运营场景

在电商运营中，经常会有针对不同人群采用不同运营策略的需求。传统方式使用离线数据对人群进行活动投放，但一般需要到第二天才能看到前一日的活动运营效果。为了更高效地观测、提升运营效果，实时的人群投放、人群画像成为必不可少的需求。

实时数仓将会把实时数据以实时大屏、实时报表的形式，为活动运营提供实时的人群行为效果数据，如不同地区、不同年龄段人群的实时UV、实时成交额等。此外，还需要将实时数据与离线数据进行关联对比计算，提供实时的环比、同比数据。

典型实时数仓诉求

综合以上背景，在实时数仓建设的过程中，我们总结了以下几类典型的实时数仓诉求：

1. 分组横截面

例如分行业指标展示，通常是在SQL中用group by进行查询；

2. 多维过滤

场景过滤、用户过滤、商品过滤、商家过滤等，通常使用array字段进行属性值的过滤；

3. 聚合

基于明细数据聚合计算实时指标，如SUM、COUNT_DISTINCT计算等；

4. A/B Test

通过解析日志埋点中的分桶字段，计算测试桶与基准桶之间的实时Gap数据；

5. 指定Key

在排查问题或观测核心商家指标时，经常需要指定商家ID、商品ID查询实时指标，需要基于明细实时表中的id字段过滤后进行聚合计算；

6. 流批一体

由于实时数仓仅保留最近2天的数据，在面对计算同比、环比等需求时，就需要读取离线数据与实时数据进行关联计算，这样产品/运营在看上层报表展现时就能直观看到今年实时数据和去年同期的对比表现。

实时数仓架构

基于上诉典型实时数仓诉求，我们抽象出了如下图所示的典型实时数仓架构。

实时采集的业务日志经过实时计算Flink清洗过滤，将结果写到OLAP引擎里面，OLAP引擎既要支持多维的交互式查询、还要支持KV查询和流批一体查询，来满足我们各种各样的业务诉求，同时OLAP引擎还需要对接上层构建的各种业务应用，提供在线服务。

基于这个典型的实时架构，下面则是我们搜索推荐场景下的实时架构演进过程。

1. 实时数仓架构 1.0版

首先是实时数仓架构1.0版，如下图所示，这个版本主要是由3个板块组成：

数据采集

在数据采集层，我们将上游实时采集的数据分为用户行为日志和商品维表、商家维表、用户维表等，为什么会有维表呢？因为每个业务在埋点时不会将所有信息全部埋在日志里面，如果所有信息都由用户行为日志承载，灵活性将会特别差，所以维表在业务上担任信息扩展的角色。

采集的用户行为日志将会实时写入实时计算Flink，用户维表、商品维表等维表数据统一归档至MaxCompute中，在初步计算后将会通过数据同步工具（DataX）同步至批处理引擎中。

数据处理

在数据处理层中，流处理部分，由Flink对实时写入的用户行为日志数据做初步处理，具体的处理包括数据解析、清洗、过滤、关联维表等。

批处理部分，为了在数据查询和服务中根据属性查询、筛选数据，需要在Flink作业中将用户的实时行为和维表做关联计算，这就需要批处理系统能够支持高QPS查询，当时搜索业务的单表QPS最高达6500万，经过多方调研，选择了HBase作为维表的批处理引擎。

Flink作业中基于用户ID、商品ID、商家ID等关联HBase维表中的属性数据，输出一张包含多个维度列的实时宽表，再输出到OLAP引擎。为了简化Flink实时作业，降低实时计算的压力，我们没有在Flink中使用窗口函数做指标的聚合工作，只是对实时日志简单过滤、关联后直接输明细数据到下游，这就要求下游引擎需要提既要支持KV查询、OLAP多维交互式查询，还要支持流批一体查询。

数据查询和服务

在第一版架构中我们使用的是Lightning引擎来承载Flink输出的实时明细数据，并基于Lightning实现查询流批一体，再对上层应用提供统一的实时数据查询服务。

但是Lightning的局限性也是非常明显的：第一是查询方式是非SQL类型不够友好，若是写SQL需要二次封装。第二是Lightning采用的是公共集群，多用户资源不隔离，当需要查询大量数据时，容易出现性能波动和资源排队等问题，使得查询耗时较久，在实际业务场景使用中有一定的限制。

2. 实时数仓架构 2.0版

基于Lightning的限制，我们希望能找到一款替代产品，它的能力要在Lightning之上，支撑OLAP的交互式查询以及高QPS的维表校验查询。于是在2.0版的实时数仓架构中，我们开始接入Hologres。

最开始，我们只是用Hologres替代Lightning提供KV、OLAP查询能力，解决了Lightning所带来的局限性。这样的架构看起来很好，但因为还需要经过HBase存储维表，随着数据量的增长，数据导入至HBase的时间也越长，实际上浪费了大量资源，并且随着线上服务实时性要求增加，HBase的弊端也越来越明显。

而Hologres的核心能力之一是加速离线数据，尤其是针对MaxCompute的数据，在底层与其资源打通，能加速查询。所以我们就萌生了将Hologres替代HBase的想法，以Hologres为统一的存储，数据也无需再导入导出，保证了一份数据一份存储。

于是，最终的实时数仓架构2.0版如下：

数据处理阶段直接将用户维表、商品维表、商家维表以行存模式存储到Hologres中，以此替代Hbase存储。Flink中的作业可以直接读取Hologres的维表，与行为日志进行关联。
在数据查询和服务阶段，我们将Flink处理输出的实时明细数据统一存储至Hologres，由Hologres提供高并发的数据实时写入和实时查询。

基于Hologres的最佳实践

实时数仓2.0版本因为Hologres的接入，既精简了架构，节约了资源，也真正实现了流批一体。这个架构也一直使用至今，下面是Hologres基于此架构在搜索推荐具体多个业务场景中的最佳实践。

1. 行存最佳实践

Hologres支持行存和列存两种存储模式，行存对于key-value查询场景比较友好，适合基于primary key的点查和 scan，可以将行存模式的表看作是一张类似于Hbase的表，用不同的表存储不同实体的维度信息。在Flink实时作业中可以高效地从Hologres行存表中读取维表数据，与实时流中的实体进行关联。

2. 列存最佳实践

Hologres中默认表的存储模式是列存，列存对于OLAP场景较为友好，适合各种复杂查询。

基于Hologres的列存模式，我们搭建了搜索、推荐业务的实时数据查询看板，在实时看板上可以支持数十个不同维度的实时筛选过滤。在最高峰值每秒写入条数（RPS）超过500万的同时仍然可以秒级查询多个维度筛选下的聚合指标结果。

同时Hologres表支持设置表数据TTL的属性，一般我们将一张实时表的生命周期设置为48小时，超过48小时的数据会被自动删除，在实时看板中支持用户对最近两天内的实时数据进行查询，避免了不必要的资源浪费。

3. 流批一体最佳实践

Hologres不仅支持基于实时明细的数据的即席分析查询，也支持直接加速查询MaxCompute离线表，因此我们利用这一特性，实现流批一体的查询（实时离线联邦分析）。

在天猫大促活动中，我们利用Hologres的联邦分析能力搭建了核心商家的目标完成率、去年同期对比看板，为运营算法决策提供了有效的数据支撑。

其中目标完成率看板开发借助实时离线联邦分析变得更为简单，即通过Hologres实时查询大促当天的指标，并用实时表的当天指标除以离线表中设定的目标指标，从而让运营能够看到实时更新的核心商家当天目标的完成情况。

去年同期对比实时看板的计算逻辑也是类似的，可以在SQL中将实时表与去年的离线表JOIN后进行关键指标的同比计算。

所有的计算都可以在Hologres中完成，通过SQL表达计算逻辑即可，无需额外的数据开发工作，一份数据一套代码，降低开发运维难度，真正实现流批一体。

4. 高并发实时Update

在一些场景下，我们不仅需要向OLAP引擎实时增量写入数据，还需要对写入的数据进行更新操作（update）。

例如，在订单成交归因时，Flink实时作业会将订单提交数据流与进度点击数据流进行双流JOIN，并且在还需要取订单提交前的最后一次点击事件进行关联。当有多条点击事件先后到达时，我们就需要更新订单归因明细数据，此时需要利用Hologres的update支持，通过数据的主键更新原有数据，保证成交归因的数据准确性。在实践中Hologres的update写入峰值能达50W，满足业务高并发实时更新需求。

未来展望

我们希望未来基于Hologres引擎持续改进现有的实时数仓，主要的方向主要有：

1. 实时表JOIN

Hologres现阶段支持百亿级表与亿级表之间的JOIN，秒级查询响应。基于这个特性，期望将原本需要在数据处理阶段由Flink实时作业完成的维表关联工作，可以改为在查询Hologres阶段实时JOIN计算。例如表1是明细数据表，表2是用户维表，在查询阶段的JOIN可以通过筛选用户维表，然后与明细数据表关联，达到筛选过滤数据的目的。这样的改进将带来几个好处：

减少Hologres中的数据存储量，避免实时表中存储大量的数据冗余（如：同一个商品ID的数据会重复存储）；
提升实时数据中维度属性的时效性，在查询阶段实时JOIN维表数据后进行计算，可以使得我们在通过维度筛选数据的时候，始终用的是最新的维度属性。

2. 持久化存储

我们未来将探索如何将常用维度的实时数据，利用Hologres的计算和存储能力，将计算结果持久化存储。

嘉宾介绍：

张照亮

阿里巴巴 | 高级技术专家

张照亮，阿里花名"士恒"，阿里巴巴搜索事业部高级技术专家，目前主要负责搜推大数据解决方案迭代演进和部分业务侧数据产品架构设计和研发工作。

特别推荐一个分享架构+算法的优质内容，还没关注的小伙伴，可以长按关注一下：

长按订阅更多精彩▼

如有收获，点个在看，诚挚感谢

从宇树科技机器人 G1 爆火，看机器人发展现状与未来 zhz5214 AI 算法机器人人工智能 AI写作
近日，科技圈被一则重磅消息点燃：宇树科技的机器人G1迅速走红，不仅现身美国街头自由“漫步”，与外国友人亲切互动握手，更是以7万美刀（折合人民币约49万元）的价格出口美国，引发全球科技爱好者和行业专家的高度关注。这一现象不仅成为科技领域的热门话题，更如同一束强光，照亮了机器人产业正在经历的深刻变革之路。今天，就让我们一同深入剖析机器人的当下发展态势与未来走向。宇树科技机器人G1，缘何能在市场中脱颖而
Python----数据结构----链表----双向链表一盏偏灯 Python学习数据结构链表算法 python
Python学习之路，点击有全套Python笔记双向链表一种更复杂的链表是“双向链表”或“双面链表”。每个节点有两个链接：一个指向前一个节点，当此节点为第一个节点时，指向空值；而另一个指向下一个节点，当此节点为最后一个节点时，指向空值。步骤：is_empty()链表是否为空length()链表长度travel()遍历链表add(item)链表头部添加append(item)链表尾部添加insert
大规模GPU集群的进阶之路卢旗人工智能
大家好，我是卢旗。今天来聊聊GPU。GPU，全称GraphicProcessingUnit，即图形处理器。它的并行处理能力非常强大，能够同时处理多个任务和数据，因此被广泛用于图形渲染、视频处理、深度学习、科学计算等领域。研发团队在负责制定硬件选型策略并设计优化下一代大规模GPU集群的软硬件架构时，我们需要关注GPU技术的最新进展、重点研究问题以及潜在的技术突破。一、GPU在重点研究的问题算力提升与
[js高手之路] dom常用API【appendChild,insertBefore,removeChild,replaceChild,cloneNode】详解与应用 nqxcwl 前端 javascript appencchild insertbefore clonenode replacechild removechild
本文主要讲解DOM常用的CURD操作，appendChild(往后追加节点),insertBefore(往前追加节点),removeChild(移除节点),replaceChild(替换节点),cloneNode(克隆节点)的语法与实战应用一、appendChild:向元素的内部最后面增加一个节点，或者移动一个现有的节点到元素的内部最后面用法:someNode.appendChild(newNod
深入解析美团外卖Flutter-架构演进之路（上篇），2021Android研发必问高级面试题 m0_65321095 程序员架构移动开发 android
全局变量和静态成员变量，这些变量不会在热刷新时更新。修改了main函数中创建的根控件节点，Flutter在热刷新后只会根据原来的根节点重新创建控件树，不会修改根节点。某个类从普通类型转换成枚举类型，或者类型的泛型参数列表变化，都会使人刷新失败。热刷新无法实现更新时，执行一次热重启（HotRestart）就可以全量更新所有代码，同样不需要重启App，区别是restart会将所有Dart代码打包同步到
基于eBPF的智能诊断平台：实现云原生系统的自愈型运维体系桂月二二云原生运维
引言：从被动运维到预测性自愈的进化当某电商平台通过eBPF实时诊断系统提前48小时预测到MySQL集群的锁竞争风暴时，其核心是千万级指标粒度的内核状态分析与AI驱动的根因定位算法的结合。运维数据显示，该平台将平均故障恢复时间（MTTR）从23分钟压缩到71秒，并自动修复了87%的异常事件。通过动态注入修复策略，集群CPU毛刺现象减少了94%，开创了智能运维的新纪元。一、传统可观测性工具的桎梏1.1
AI日报 - 2025年02月16日 - 推特版訾博ZiBo AI日报人工智能
今日概览（60秒速览）▎AGI突破|阿里巴巴发布Qwen2.5-VL视觉语言模型，支持多模态交互新模型评测榜性能提升30%▎商业动向|NVIDIABlackwell超级芯片网络研讨会将聚焦生成式AI创新预计推动算力市场增长15%▎政策追踪|印度总统宣布AI国家战略升级，聚焦半导体与算法研发计划未来3年投入50亿美元一、今日热点(HotTopic)1.1阿里巴巴发布Qwen2.5-VL系列视觉语言模
如何有效防止TikTok多店铺入驻时IP关联问题？ IPdodo全球网络服务网络
随着TikTok在全球电商领域的崛起，越来越多的商家选择在平台上开设多个店铺，扩大品牌的曝光和销售。然而，随着店铺数量的增加，如何避免因IP关联而导致店铺被封禁或处罚，成为商家们的一大难题。IP关联问题是指在TikTok平台上，多个店铺在后台系统中被识别为同一设备或同一网络下运营，从而被认为是“同一运营主体”进行多个店铺的管理。这种情况可能导致平台对店铺的运营进行限制或封禁，从而影响商家的正常运营
【Python爬虫(15)】从0到1：Python爬虫实战攻克电商网站动态数据堡垒奔跑吧邓邓子 Python爬虫 python 爬虫开发语言电商网站动态数据
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、准备工作2.1环境搭建2.2目标电商网站分析三、攻克登
深度求索（DeepSeek）：中国AGI领域的新锐探索者 .猫的树 AGI-通用人工智能 AGI 人工智能深度学习
文章目录引言：当AGI照进现实一、DeepSeek技术亮点解析1.1模型架构创新1.2性能对标国际巨头二、开源生态建设2.1开源全家桶2.2开发者友好设计三、应用场景展望3.1智能编程助手3.2企业级解决方案四、AGI之路的挑战与思考结语：中国AI的新范式讨论话题：引言：当AGI照进现实在ChatGPT掀起全球AI热潮的今天，一家名为深度求索（DeepSeek）的中国公司正以独特的技术路径冲击AG
跨境电商平台如何借助API接口实现无缝支付集成 Elijah Laam 跨境电商人工智能大数据
随着全球化的加速和互联网技术的不断进步，跨境电商平台已经成为国际贸易的重要组成部分。在跨境电商平台的运营中，支付环节是至关重要的一环。为了提升用户体验，简化支付流程，跨境电商平台需要借助API（ApplicationProgrammingInterface，应用程序编程接口）接口实现无缝支付集成。本文将深入分析跨境电商平台如何借助API接口实现这一目标，并探讨其带来的诸多优势。一、API接口的基本
DeepSeek系列模型：高效能推理与多模态处理的技术突破与实践路径张3蜂人工智能开源技术选型人工智能开源机器人
目录引言一、高效能推理的核心技术路径二、多模态处理的技术创新三、技术协同与落地实践四、未来技术演进方向结论引言背景与挑战AI模型规模化趋势下，推理效率与多模态融合成为关键瓶颈。DeepSeek系列模型的定位：平衡性能、效率与多模态能力的技术创新者。核心命题如何通过架构设计与算法优化实现高效推理？如何突破模态边界实现跨模态语义理解与生成？一、高效能推理的核心技术路径轻量化模型架构设计动态稀疏注意力机
HarmonyOS Next 界面开发新特性与技巧 harmonyos
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中界面开发相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、ArkUI框架在HarmonyOSNext中的演进（一）发展历程ArkUI框架从最初的版本一路走来，在HarmonyOSNext中实现
玩转网页交互：用JavaScript打造灵动手风琴特效 skyksksksksks 综合个人杂记 javascript 交互 jquery html5 css 前端
一、手风琴特效：网页中的魔法折叠术想象一下你在音乐厅看到的手风琴演奏——轻轻一拉，风箱便如波浪般起伏展开。在网页世界中，手风琴特效正是这种优雅互动的数字化身！当用户点击某个标题时，对应的内容就像被施了魔法般缓缓展开，其他内容则默契地折叠收起。这种设计不仅节省空间，更能让用户像探索藏宝图一样，逐步揭开内容的奥秘。在电商网站的商品详情页，在知识平台的问答专区，甚至在个人作品集网站，手风琴特效都扮演着重
菜鸟的成长之路东风吹破了青花瓷计算机数据结构与算法基础篇入门
菜鸟的成长之路基础能力数据结构与算法数据结构链表数组栈队列字典bitset树堆完全二叉树平衡二叉树二叉查找树B树红黑树lsm树图通用算法排序十种排序算法查找二分查找深度广度优先搜索分治贪心回朔动态规划网络协议OSITCP/IP状态转移拥塞控制可靠工作原理socket编程HTTP/HTTPSIO模型同步IOreactor阻塞IO非阻塞IOIO多路复用信号驱动异步IOC10K问题长链接短链接编译原理l
Assembly语言的正则表达式夏梓蕙包罗万象 golang 开发语言后端
Assembly语言的正则表达式：深入解析引言在计算机科学领域，正则表达式（RegularExpressions，简称为Regex）被广泛应用于字符串处理和模式匹配。它是一种高效的文本处理工具，能够帮助开发者在复杂字符串中找出特定模式。随着编程语言和开发环境的不断演进，正则表达式的实现也逐步渗透到了不同的语言之中，包括低级且强大的Assembly语言。本文将深入探讨Assembly语言中的正则表达
推动AI云产业向深向实，云·AI·算力创新发展大会即将启幕科技云报道云计算 AI 云计算
近年来，以AIGC为代表的新兴技术正加速演进，全球站在智能化变革的起点，人工智能与云计算的深度融合，也驱动云计算进入第三次发展浪潮，迎来前所未有的机遇。伴随AI的快速发展，2024年《政府工作报告》明确提出，制定支持数字经济高质量发展政策，深化大数据、人工智能等研发应用，开展“人工智能+”行动。这意味着AI正在成为产业创新的核心抓手和驱动新质生产力的关键引擎，而云计算作为基础底座将在其中扮演至关重
深度学习下的图像分割人工智能大讲堂深度学习人工智能
在之前写的文章[图像分割演进之路]中，讲述了图像分割的发展历程，从传统图像分割算法到人工智能，分割算法百花齐放，但最终的佼佼者当属人工智能，但即使是人工智能领域，图像分割也五花八门，今天就让我们看几种基于学习的图像分割方法。基于学习的图像分割算法主要依赖于深度神经网络，经典的深度神经网络分为如下几种：2.1卷积神经网络CNN：卷积神经网络是图像处理领域应用最为广泛的网络，其权值共享，局部连接等特性
BabyAGI：开创智能自动化新时代，赋能人工智能的下一次飞跃 gs80140 基础知识科谱 AI 人工智能自动化运维
目录BabyAGI：开创智能自动化新时代，赋能人工智能的下一次飞跃什么是BabyAGI？BabyAGI的核心功能BabyAGI的应用领域BabyAGI与传统AI系统的区别BabyAGI的挑战与未来发展BabyAGI的未来展望结语BabyAGI：开创智能自动化新时代，赋能人工智能的下一次飞跃随着人工智能（AI）的不断演进，机器学习和自我优化系统已经逐步渗透到各个行业，从医疗健康到金融服务，从零售到制
博客搭建之路：next主题数学公式问题后端
next主题数学公式问题我写的都是一些编程相关的文章，有些文章里是存在数学公式的，我在Typora软件中写的时候显示的是对的，但是hexo将markdown转为html后在页面上就没有数学公式的格式了。查找next配置发现有一个渲染数学公式的配置math:#Default(true)willloadmathjax/katexscriptondemand.#Thatisitonlyrendertho
博客搭建之路：hexo增加搜索功能后端
hexo增加搜索功能hexo版本5.0.2npm版本6.14.7next版本7.8.0作为一个博客，没有搜索功能，如何在大批文章中找到自己想要的，那在hexo中如何增加搜索功能呢？search:path:search.jsonfield:post在博客目录下安装npminstallhexo-generator-search--save，此时使用hexocl&&hexog就会在博客public目录下
咱们一起学C++ 第二百零三篇：之C++中protected关键字与私有继承的深入探究一杯年华@编程空间咱们一起学习C++java 算法开发语言
咱们一起学C++第二百零三篇：之C++中protected关键字与私有继承的深入探究大家好！C++作为一门强大的编程语言，有着丰富多样的特性，今天咱们来深入学习protected关键字以及私有继承相关的知识。希望通过这次学习，我们能更好地掌握C++的类继承机制，在编程之路上共同进步！一、private继承的详细剖析在C++中，私有继承是一种特殊的继承方式。当一个类私有继承另一个类时，基类的所有成员
Oracle Alert 日志频繁告警 12170 TNS-12535/TNS-00505，我看看怎么个事儿？ Lucifer三思而后行 DBA 实战系列 oracle 数据库
大家好，这里是公众号DBA学习之路，致力于分享数据库领域相关知识。目录前言问题描述问题重现解决方案调整防火墙调整Oracle参数治标不治本写在最后前言节后巡检一套Oracle11GR2的库，发现alert日志很大，于是看看alert日志里都记录了啥？好家伙，一打开日志发现全是告警TNS-12170/12535/12560/00505，一眼刷不到头：*************************
Dart语言的云计算沈雲澈包罗万象 golang 开发语言后端
Dart语言的云计算探索引言在信息时代，云计算已经成为一种必不可少的技术，它为企业和个人提供了灵活、高效的计算能力以及存储解决方案。随着技术的不断演进，编程语言的发展也开始朝着适应云计算的方向前进。Dart语言作为一种现代编程语言，其独特的特性和优势为云计算应用的发展提供了新的可能性。本文将探讨Dart语言在云计算中的应用、优势、以及如何利用Dart构建云应用。一、什么是Dart语言Dart是一种
DeepSeek对AI领域的变革性影响分析报告芝士AI吃鱼人工智能 DeepSeek OpenAI
一、引言近年来，人工智能（AI）技术加速演进，而中国开源大模型DeepSeek的崛起，标志着全球AI竞争进入新阶段。其凭借低成本、高性能、开源生态三大核心优势，迅速成为行业焦点。本报告从技术、产业、投资、就业及未来趋势等维度，全面解析DeepSeek对AI领域的深远影响，为集团战略布局提供参考。二、技术突破：算法效率与成本革命架构创新：MOE与MLA技术优化DeepSeek采用混合专家系统（MoE
企业知识管理体系怎么搭建和运营？小炮独家内容运营产品运营运维
企业本身的业务需求、外部各类标准规范的要求、数字化转型趋势带来的便利，让更多的企业开始搭建知识库，开始试图通过知识管理去提升组织的效率和创新能力。KMCenter的研究也显示了，从二十一世纪的20年代开始，大部分机构都会开始知识管理之路，知识库和知识管理正在成为现代化企业的标准配置和元能力。企业为什么需要知识管理？在谈论这个问题之前，我们先来看看一些在企业中常见的问题。你给员工的培训是不是都培训的
用AI提升电商平台的客户体验：从个性化推荐到智能客服 Echo_Wish 人工智能前沿技术人工智能
用AI提升电商平台的客户体验：从个性化推荐到智能客服随着电商行业的竞争日益激烈，如何在海量商品中脱颖而出，吸引和保持客户的关注，成为平台生存和发展的关键。而在这场竞争中，人工智能（AI）正在发挥着越来越重要的作用。AI不仅可以优化电商平台的后台操作，还能在前端提供更为个性化、智能化的客户体验，让消费者感受到前所未有的便捷与高效。本文将从个性化推荐、智能客服、智能搜索等方面，详细探讨如何通过AI技术
transformer概述沉墨的夜 transformer 深度学习人工智能
Transformer架构的提出，不仅在自然语言处理（NLP）领域掀起了革命，也在多个深度学习任务中获得了广泛应用。自2017年由Vaswani等人提出以来，Transformer经历了多次优化和扩展，成为深度学习领域的基石。以下是Transformer架构的演进历程、作用和意义、架构详情以及未来发展趋势的详细阐述。Transformer架构的演进历程(1)Transformer的起源（2017年
计算机网络之路由算法（层次路由算法） DKPT #计算机网络计算机网络网络网络协议学习笔记
一、基本思想层次路由算法的基本思想是将大规模网络划分为多个层次或区域，每个区域内部的路由器运行相同的路由协议，并维护该区域内的路由信息。区域之间的路由器则负责将数据包从一个区域转发到另一个区域，而无需了解整个网络的拓扑结构。这种分层结构可以降低路由器的路由表大小，提高路由算法的效率和可扩展性。二、工作原理区域划分：将整个网络划分为多个区域（或自治系统AS），每个区域内部包含一组路由器。区域之间的路
【微服务】spring状态机模式使用详解小码农叔叔 springboot 入门到精通 spring springboot相关 spring状态机模式 spring状态机使用 spring状态机
一、前言在很多系统中，通常会涉及到某个业务需要进行各种状态的切换操作，例如在审批流程场景下，某个审批的向下流转需要依赖于上一个状态的结束，再比如电商购物场景中，一个订单的生命周期往往伴随着不同的状态，比如待支付，支付完成，已发货等等，状态的存在，让一个业务的完整流程得以串联，所以状态在真实的场景中具有重要的意义。二、spring状态机介绍在开始学习spring状态机之前，有一些概念需要弄清楚，弄清
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

阿里巴巴电商搜索推荐实时数仓演进之路

你可能感兴趣的:(阿里巴巴电商搜索推荐实时数仓演进之路)