阿里云开发者

PAI和Hologres的个性化推荐最佳实践

简介：常见的个性化推荐系统包括日志收集，数据加工，召回，排序，离在线效果评估等诸多环节，对于中小客户存在技术门槛高，搭建周期长等问题。计算平台基于 PAI，Hologres，MaxCompute，DataWorks 平台产品，可以帮助客户快速搭建个性化推荐解决方案。本次分享，主要从计算平台的推荐系统整体解决方案出发，重点介绍基于 PAI 的向量召回算法和 Hologres 向量检索的整体架构，以及该架构在某社交APP的落地案例和效果分享。

本文内容来自于

由达摩院领航举办的3月20日向量检索专场Meetup讲师演讲内容

讲师介绍

天邑
阿里云计算平台高级算法工程师。主要从事基于PAI平台的召回和排序算法研发，及基于云产品的推荐系统解决方案研发，赋能客户个性化推荐解决方案落地。

内容简要：

一、云上个性化推荐

二、向量召回

三、最佳实践

01 云上个性化推荐

解决方案简介

（一）个性化推荐 - 核心能力

个性化推荐核心价值是要做到千人千面，实现用户需求和资源的最佳匹配，从而提升流量到业务目标的转化效果。

个性化推荐流程一般分召回和排序两个部分，我们要从海量的数据中来精准的筛选出几个到几十个Item给用户推荐过去。

（二）个性化推荐 – 常见方案痛点

常见推荐方案一：运营经验制定推荐策略

需要有推荐经验的产品设计或运营人员，通过积累的个人经验，制定业务推荐策略，并结合数据分析，调整推荐方案，通常在业务规模比较小的企业，冷启动阶段使用，有明显的效果弊端：

推荐方案及效果，受到人为影响而不可控。
方案难以实时结合业务发展快速更新，迭代速度慢。
数据计算能力有限，大规模数据分析时候困难。
缺少算法人员搭建企业推荐系统，影响企业提升市场竞争

常见推荐方案二：开源框架自建推荐系统

越来越多的企业选择结合AI技术实现企业推荐系统，但使用开源框架自建推荐系统，也存在诸多问题，影响业务发展：

成本高需要企业采购大量机器用于支持数据计算，不仅一次性投入资金多，且大部分企业都会存在机器资源闲置的浪费问题
工程化工作量大需要适配主流开源框架，存在巨大的工程化工作，以实现不同业务场景最优推荐效果，或实现支持多部门模型需求。
运维难承载海量数据、多任务运行，日常运维难度很大。
效果不理想。

（三）个性化推荐 – 云上方案

在云上我们可以利用云上的工程基建和算法基建来减缓这部分的成本。在云上提供了两种的推荐方案，一种是黑盒化的，一种是白盒化的，黑盒化的解决方案低门槛易上手。白盒化的解决方案，整个算法流程是工程师全部自主可控的，它适合于有一定规模的，日处理数据百万起的团队，可以支持推荐算法的快速迭代。

（四）云上个性化推荐 – 白盒解决方案

这是整个白盒化的推进解决方案的架构图，我们从下往上看，最下层是数据处理模块，MaxCompute和Dataworks的负责离线的特征处理，得到一些离线训练样本和用户的特征数据物料数据，而Flink是支持实时的特征处理，有了特征样本数据，会流入到PAI-Studio一体化的建模平台中。

其中PAI-EasyRec负责推荐算法，由GraphLearn和Alink负责一些图算法和传统机器设计算法。有了这一些算法，一般会产出两部分的模型，召回模型和排序模型。召回模型我们可以例行部署到Hologres上，部署成各种基础索引表，向量召回的话会部署成向量表，这边图不太好画，user部分向量也可以在EAS上进行实时推理。排序模型的话，我们会部署成在线的模型推理服务来进行在线的打分推理。

有了基础索引表向量表和模型的推理服务，我们再往上层就是整个推荐服务的引擎，我们称之为PAI-Rec推荐服务引擎，PAI-Rec直接接受用户的推荐请求，串联了多路召回、过滤、排序和冷启动模块来给出TopN推荐列表。

PAI-Rec之外，我们有PAI-ABTest来做ab实验，它主要负责科学流量划分和指标的分析，支持我们云上推荐的效果的快速迭代。

（五）云上个性化推荐 – PAI-EasyRec算法框架

我们重点来看一下其中的几个模块，首先是PAI-EasyRec的整个推荐算法框架，可以支持多样化的数据源，比如说OSS、OdpsTable、HDFS、Kafka等等，有了这样的特征数据，我们会进入一个离在线一致的特征处理模块，这里面可以支持IdFeature 、RawFeature 、SeqFeature等等的特征处理。最中间的是ModelZoo，包含很多PAI精心沉淀的排序模型、召回模型和多目标模型，当然也支持算法工程师来基于此自定义自己的算法。整体上看，EasyRec能在PAI上提供万亿样本、千亿特征的超大规模分布式训练、分布式的评估能力，还支持自动超参搜索和知识蒸馏等调优效果的功能。

（六）云上个性化推荐 – PAI冷启动方案

除了通用的推荐算法之外，我们还提供了PAI冷启动方案，我们为什么需要冷启动？

因为常见的推荐算法对新物品和新用户是不太友好的，

新物品在很大程度上是常常会被低估的。

冷启动问题处理不好会影响内容创造者的积极性，进而影响平台生态的健康发展

我们PAI上的冷启动方案分为用户冷启动和物品冷启动两部分。用户冷启动主要是基于用户的基本画像，基于社交关系，基于用户兴趣的一些热门推荐，U2U的推荐。物品的冷启动的算法的则比较丰富了，有基于内容理解的，有基于快速试探强化学习的，基于不同场景间迁移学习的，此外，少样本学习、知识图谱的算法，我们也在逐步的研发上线中。

（七）云上个性化推荐 – PAIRec推荐引擎

PAIRec推荐引擎从上往下看，分为接口层、召回层、过滤层、排序层、重排层，这些模块它端到端的串联起了整个推荐服务的各个流程，并且其中的一些内置模块是可以简单的通过config文件来配置化使用的。

当然为了满足各种各样场景定制化的需求，我们也支持在各个层便捷的注册各种定义的实现来满足灵活性的要求。

（八）云上个性化推荐 – PAI-A/BTest

PAI-A/BTest是我们保障快速做推荐迭代效果很重要的一环，我们首先来看一下A/B Test是什么，我们会在同一时间维度将用户划分成两组，在保证用户特征相同的情况下，让用户看到不同的两个ab方案的设计，然后根据最后数据的好坏来决定到底选择哪个方案，最终把哪个方案来推全，他要走的更进一步，可以满足各多样化的A/B Test的需求。

推荐场景为例，我们可以支持这种普通的流量划分，还可以支持分层的流量划分，分层流量划分有什么好处？

推荐场景我们分为召回、排序、重排的这些模块，这些流量是完全可以正交复用的，我们可以在很小的流量场景之下就可以上很多的实验上去帮助我们快速的迭代，PAI-A/BTest还支持在实验室上设置各种各样的条件，比如区分新用户和老用户，来满足各种各样多样化的ab的需求。

02 向量召回

PAI召回算法 & HOLO向量检

（一）向量召回 – 简介

召回是在整个推荐系统中很重要的一环，它是在整个推荐系统最前线的部分，决定了整个推荐系统算法效果的上限。

传统的召回算法，如 CF、Swing等，他们虽然是简单高效的，但是他们完全基于用户的历史行为来进行推荐，没有结合用户的画像信息，物品的属性信息来产出推荐结果，这导致了整个推荐效果发现性很弱，会导致越推越窄。

而向量召回是将User、Item都嵌入到一个向量空间中去，一定程度上缓解了发现性的问题。一般向量召回分为 U2I和I2I两种。U2I的向量召回主要代表性的如 DSSM、MIND、YoutubeDNN 等，思想很简单，将User侧和Item侧都抽取到向量空间中去，用User的向量在Item的向量集合中查出最临近的TopK个Item出来。

I2I的如Node2Vec、Metapath2Vec等向量算法，它不同之处是需要Trigger Item，基于用户的历史行为来选择这些Trigger，然后通过Trigger Item的向量，在Item的向量集合中查询出TopK个临近的Item。

（二）向量召回 – PAI向量召回

在PAI上我们提供了丰富的召回算法，在PAI-Studio中我们PAI-EasyRec有提供DSSM、YoutubeDNN、MIND等一系列深度的向量召回模型， GraphLearn提供的GraphSage、GAT、SEAL等基于图的向量召回模型，还有Alink提供Word2Vec、Node2Vec、Metapath2Vec等一系列向量召回模型。在PAI-Studio中，我们想把这些算法快速可视化搭建快速实验，进行离线效果测试和在线的部署，并且我们还支持AutoML自动化调参，有了这些算法基建，可以帮助我们在云上快速的迭代推进效果。

（三）向量召回 – Hologres向量检索

Hologres深度集成阿里达摩院自研的向量检索引擎Proxima，这款向量检索引擎具有超大规模索引构建和检索、高纬&高精度、高性能低成本等核心能力，能够帮助Hologres提供提供低延时、高吞吐的在线查询服务。并且Hologres是以SQL的查询接口来暴露给用户的，十分简单易用，它能很容易支持水平扩展，因为它是分布式构建向量索引的方式。

（四）向量召回 – Hologres向量检索

在具体的推荐业务场景中，很重要的一环是向量查询，Hologres不仅能支持全量item集合上的检索，面对复杂条件下的检索， holo也能用sql的形式来支持。例如有很多推荐场景需要查询最近活跃，当需要查询某个类目下的，此时写一个Where语句就能很容易的完成检索。

全量检索

select id, pm_approx_euclidean_distance(feature, '{0.1,0.2,0.3}')) as distance where data_time between '1990-11-11 12:00:00'  and '1990-11-11 13:00:00’  and tag in ('X', 'Y', ‘Z') from feature_tb order by distance asc limit 10;

*
复杂条件下检索
*

select id, pm_approx_euclidean_distance(feature, '{0.1,0.2,0.3}')) as distance where data_time between '1990-11-11 12:00:00'  and '1990-11-11 13:00:00’  and tag in ('X', 'Y', ‘Z') from feature_tb order by distance asc limit 10;

03 最佳实践

某社交APP首页推荐

（一）最佳实践 – 某社交APP首页推荐

我们以一个社交APP的首页推荐的场景来体感一下这整套解决方案是怎么运行的。这是一个社交APP首页推荐的场景，分为列表页、详情页和会话页，通过点击列表页，可以看到用户的具体详情，进而发起会话进行聊天。整个首页推荐的目标是要建立用户和用户之间的新联系，因此我们设计了UV回复转化率这个指标，就是必须用户回复，才算一个有效的会话。

（二）最佳实践 –首页推荐方案

我们来看一下整个首页推社交APP首页推荐问题的难点。

算法需具备发现性，能建立新联系；“有效回复”优化目标非常稀疏，这导致我们优化整个模型的难度也非常高。

下面是整个首页推荐的方案，我们有常见的多路召回、过滤、排序和用户的冷启动和最后会有一个重排。其中的重点是召回里面DSSM的向量召回和GraphSage的向量召回，还有新用户的冷启动，这保证了整体的算法具有发现性。然后另一块是排序这边做了一个多目标的模型，包括点击、关注、会话和回复，多个目标的层次递进的关系，解决了有效回复这个目标非常稀疏的问题。

（三）最佳实践 – 向量召回算法 PAI-EasyRec | DSSM

重点来看一下其中向量召回，我们以其中的DSSM为例，

它是一个典型的双塔架构，优势是能充分利用Side-Info ，能支持分布式训练时的负采样和负样本MiniBatch内的共享。

（四）最佳实践 – 向量召回算法 PAI-EasyRec | DSSM – 优化技巧

双塔架构上模型一个核心的问题点是怎么做负采样？负采样决定了整个召回模型效果的好坏，我们来看这个离线hitrate的曲线，可以看到随着负采量数的增加，基本上是一个稳步上涨的趋势，最高点是正负样本比例等于1:1W的时候最佳。所以当然随着负采样数的增加，特别是要达到1:1W的采样，对于存储的压力和计算压力都是非常大的。我们想要离线的去join出这个1:1W的正负样本来做存储基本是不太现实的。因此PAI-EasyRec支持在分布式训练时的实时的负采样，我们在存储的时候只存点击的正样本，在训练时分布式采样出相应的负样本来做训练。

下面是我们做分布式负采样的方案，其实是将用户的历史行为和用户的一些属性特征，以图结构形式存在参数服务器上，然后基于我们从参数服务器上进行实时的负采样，跟正样本join起来进行训练。1:1W正负样本对于我们的计算压力也是提出了很大的挑战。在PAI-EasyRec在里面我们做了一个优化， MiniBatch内负样本是共享的，不用将N*1W个负样本都计算一次，它只需要整体计算1W次，在做内积的时候以矩阵乘的方式展开，就可以达到简化共享负样本计算的效果。

（五）最佳实践 – HOLO向量检索

我们再来看一下工程系统在首页推荐上实践的HOLO向量检索，我们首先需要在Hologres中建立向量表，建表的语句也非常简单，其中重点是要在其中设置proxima的向量引擎和其他向量引擎所需要的检索参数，有了这样的向量表，我们就很容易的把MaxCompute上的外表数据来导入到Hologres中，这是一个异性推荐的场景，我们就可以在性别条件下进行向量的检索。

（六）最佳实践 – 首页推荐效果

推荐解决方案使得社交APP首页推荐的UV回复转化率提升了39%，UV会话转化率提升了30%，是一个很成功的案例。

（七）PAI上其他向量算法能力

PAI上其实还提供了很多其他的向量算法能力，包括图像的、文本的PAI-EasyVision、PAI-EasyTransfer，PAI-EasyTransfer已经在github上开源了，我们在PAI上还有人脸人脸匹配的能力、图片搜索能力、问答匹配的能力等等，都可以用到其中的向量引擎。欢迎大家来使用。

“ AI 检索技术博客”

由阿里巴巴达摩院系统 AI 实验室创立，

关注 “ AI 检索技术博客” 公众号，

获取更多技术干货文章、

AI 检索领域 Meetup 动态。

原文链接：https://developer.aliyun.com/article/783540?

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

MySQL 多表关联执行计划全面解析：从 N-LJ 到子查询优化
在实际企业开发中，多表关联查询更为常见，也是导致SQL执行效率低下的重要原因之一。今天，我们将系统性地解析MySQL多表关联查询的执行机制，重点包括：多表关联底层执行机制（N-LJ嵌套循环连接）为什么多表查询容易性能差，以及驱动表的选择有多重要多表查询执行计划分析与优化技巧（附实际案例）一、MySQL多表关联的执行机制：N-LJ嵌套循环连接在MySQL中，多表连接最常见的执行策略就是NestedL
MySQL 大数据量分页查询优化实战：从 90秒到 965毫秒的性能飞跃要阿尔卑斯吗. mysql 数据库分布式架构 java
在日常开发中，我们经常需要对数据库中的数据进行分页展示。特别是当表数据量达到几十万甚至上百万级时，传统的LIMIT分页方式会面临严重的性能瓶颈。今天，我将分享一个真实的性能优化案例，通过模拟大页码查询的现场，从90秒缩短到965毫秒，显著提升了查询效率。本篇文章将从问题出现的原因、索引原理、优化思路和最终实战效果等方面，为你全面讲解如何高效处理MySQL大数据分页查询问题。一、问题背景：大页码分页
.NET CORE 分布式事务(四) CAP实现最终一致性精神小伙就是猛 .netcore 分布式架构微服务
目录引言：1.0最终一致性介绍2.0CAP2.0架构预览3.0.NETCORE结合CAP实现最终一致性分布式事务3.1准备工作(数据库，本文使用的是MySql)3.1.1数据模型3.1.2DbContext3.1.3数据库最终生成3.2Nuget引入3.3appsettings.json3.4docker启动一个RabbitMQ3.5Program.cs3.6用户1API控制器3.7用户2API控
用SQLyog连接出现2058错误时处理方法 chilavert318 点点滴滴
win10系统更新安装Mysql8.0，连接SQLyog的时候出现下面错误1.打开cmd：mysql-uroot-p输入密码root2.进入mysql依次执行下面语句ALTERUSER'root'@'localhost'IDENTIFIEDBY'root'PASSWORDEXPIRENEVER;#修改加密规则ALTERUSER'root'@'localhost'IDENTIFIEDWITHmysq
如何清除 npm 缓存 BIBI2049 前端开发 Windows npm 缓存前端 node.js
清除npm缓存：利弊分析与操作指南在使用Node.js和npm进行项目开发时，我们经常会与npminstall命令打交道。这个过程中，npm会在本地建立一个缓存机制，用以存储已下载的包，从而显著提升后续安装的速度。然而，有时这个缓存也可能成为问题的根源。本文将探讨清除npm缓存的利弊，并提供清晰的操作指引。清除npm缓存的好处清除npm缓存主要能带来以下几点好处：解决依赖安装失败问题：当缓存中的包
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
MCP协议技术解析：AI时代的通信基础设施革命
MCP协议技术解析：AI时代的通信基础设施革命在AI从工具演变为协作伙伴的进程中，MCP协议正在成为连接智能体与现实世界的“数字神经系统”。当前人工智能技术正经历从孤立模型向生态系统协作的关键转型，而通信协议作为AI能力的“连接器”，其设计直接决定了智能系统的边界与效率。MCP协议（ModelContextProtocol）作为新一代AI通信基础设施，正在开发者社区引发一场静默革命。本文将从技术原
XC7A75T‑2FGG484I Xilinx Artix‑7 FPGA AMD
XC7A75T‑2FGG484I属于Xilinx28 nmArtix‑7FPGA内部包含约75,000个查找表（LUT）及相应触发器，对应数十万级组合逻辑和状态存储；它还集成了4.9 Mb的分布式BlockRAM，满足高速缓存与FIFO需求；240个DSP48E1乘加单元为数字信号处理、滤波器及乘法累加运算提供硬件加速。超网格（super‑net）布局与高效的路由交换矩阵，确保了内部时钟域频率可达
8、深入理解AWS认证解决方案架构师助理考试：设计与优化君子心理 AWS认证解决方案架构师弹性架构
深入理解AWS认证解决方案架构师助理考试：设计与优化1设计弹性架构的关键要素设计弹性架构是AWS认证解决方案架构师助理考试的重要组成部分。弹性架构不仅能够确保系统的高可用性和容错能力，还能在面对流量峰值时提供稳定的服务。以下是设计弹性架构的一些关键要素：1.1选择可靠和弹性的存储在设计弹性架构时，选择合适的存储解决方案至关重要。AWS提供了多种存储选项，如AmazonS3、AmazonEBS、Am
AWS Certified Cloud Practitioner 认证考试总结 DEMI0815 AWS aws 云计算
AWSCloudTrailLogs对您的AWS账户进行监管、合规性、操作审计和风险审计。AWSCloudTrail可用于记录您的AWS账户的AWSAPI调用和其他活动，并将记录的信息保存到您选择的AmazonSimpleStorageService（AmazonS3）存储桶中的日志文件中。默认情况下，CloudTrail传输到S3存储桶的日志文件使用具有AmazonS3托管密钥的服务器端加密（SS
你的博客为什么不更新了？
博客为什么不更新了很久没有写过博客了，为什么呢？因为工作了，成为了一名社畜因为没时间因为没有学习新的东西，所以无法分享因为不思进取…笔者写博客的初衷只是为了总结知识，让我学到的知识能从我这里输出出去，并且别人能看懂。如果结果能帮助更多人了解某个东西，那自然是最好的。三年前写了人生第一篇博客：SQL语句中，MySQL不支持的几种情况。反响平平，两千阅读。之后又陆续发表了几篇博客，数量不多，9篇文章。
aws rds mysql 连接_使用 Amazon RDS 代理连接到 Amazon RDS MySQL 数据库实例或 Aurora MySQL 数据库集群... 仁安同学 aws rds mysql 连接
如何使用AmazonRDS代理连接到我的AmazonRDSMySQL数据库实例或AuroraMySQL数据库集群？上次更新时间：2020年9月21日如何使用AmazonRDS代理连接到运行MySQL的AmazonRelationalDatabaseService(AmazonRDS)数据库实例或AmazonAurora数据库集群？简短描述您可以使用AmazonRDS代理来管理与应用程序之间的连接。
短剧小程序的「技术革命」：从「粗放生长」到「精准运营」 weixin_lynhgworld 小程序
随着短剧行业进入「存量竞争」阶段，技术能力正成为小程序的核心竞争力。从内容推荐到用户留存，从广告变现到IP开发，每一环节都需要数据驱动和算法优化。一、智能推荐：让「用户找到剧」变成「剧找到用户」传统短剧平台依赖标签匹配，而小程序通过多维度数据实现精准推荐：「情绪图谱」分析：记录用户观看时的快进、暂停、重复播放等行为，构建情绪波动曲线；「场景化推荐」：根据时间（如深夜）、地点（如地铁）、设备（如手机
AWS RDS MySQL是否能实现登录限制类需求 shiran小坚果 RDS aws 云计算 database mysql
问题描述：此类问题一般来说在等保中会频繁遇到：对于AWSRDSMySQL5.7和8.0的实例，能否做到如下限制和需求：1.一个连接到数据库的session，超过一段时间以后被RDSMySQL结束的功能：RDSMySQL5.7和8.0中，均可以通过更改参数组中wait_timeout和interactive_timeout参数来设置。当连接空闲并超过参数设置的时长，那么会导致RDSMySQL自动断掉
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
探索AWS基础服务：构建云端架构的基石
本文将深入介绍AWS的几种基础服务，包括弹性计算（EC2）、简单存储服务（S3）、关系数据库服务（RDS）等，助您构建高效、稳定的云计算架构。
深入理解Mysql索引底层数据结构与算法桑翔
一.索引的本质索引是帮助MySQL高效获取数据的排好序的数据结构二.索引数据结构1.二叉树2.红黑树3.Hash表4.B-Tree1.叶节点具有相同的深度,叶节点的指针为空2.所有索引元素不重复3.节点中的数据索引从左到右递增排序B-Tree5.B+Tree1.非叶子节点不存储data,可以放更多的索引2.叶子节点包含所有索引字段3.叶子节点用指针连接,提高区间访问的性能(体现在做范围查询的时候)
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
C语言基础学习_数组 LiuKai~ c语言
数组的概念数组是相同类型的变量的有序集合inta[10];/**该数组包含10个int类型的数据*a代表数组第一个元素的地址，即数组的首地址*a还是此段内存空间的名字，a[0],a[1]都是数组种的元素，而不是这些元素的名字，数组中的元素没有名字*每个元素类型相同都为int*/数组在一片连续的内存空间中存储元素数组元素的个数可以显示或隐式指定inta[10]={1,2};/*1.显式指定,初始化的
AWS-rds 表主从不一致如何解决与数据交流的路上 AWS mysql mysql sql 数据库
一、背景因为某些修改造成了表的主从不一致，所以需要备份表恢复数据，物理机大家都有很多种做法，但是因为awsrds限制了账户的权限，所以这里用不到普通的办法，想了一阵想到一种可行性的方法，暂时没有发现隐患，或者更好的办法，如果有大佬知道的话，欢迎随时指教二、步骤1.查看主库二进制状态（主库执行）#记录当前的二进制和pos点,mysql-bin.123,111showmasterstatus2.等待一
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
借助 Amazon SageMaker Catalog 功能，简化从数据到洞察的路径
在数据驱动的时代，企业常陷于数据孤岛、特征重复开发、模型溯源困难等困境。AmazonSageMakerCatalog应运而生，作为统一的数据和特征治理中心，它能打通从原始数据到模型部署的全链路，显著加速数据科学项目落地。一、痛点：数据科学项目中的常见瓶颈数据发现困难：数据分散在S3、Redshift等不同存储中，缺乏统一视图特征管理混乱：特征工程脚本散落各处，无法复用和共享模型溯源缺失：无法追踪模
使用 Amazon RDS Proxy 提升应用程序可用性
AmazonRDSProxy的最大优势，在于显著缩短数据库故障转移之后的应用程序恢复时间。RDSProxy能够同时支持MySQL与PostgreSQL引擎，但在本文中，我们将单纯使用MySQL测试工作负载向大家展示RDSProxy如何在故障转移之后，将AmazonAuroraMySQL客户端的恢复时间缩短达79%，并将AmazonRDSforMySQL的故障恢复时间缩短达32%。本文还将阐述RDS
基于Python的Twitter Card数据爬取与分析实战：从入门到精通 Python爬虫项目 python twitter dreamweaver 自动化开发语言宽度优先爬虫
摘要本文详细介绍了如何使用Python最新技术栈构建一个高效的TwitterCard数据爬虫系统。我们将从TwitterCard的基本概念讲起，逐步深入到爬虫架构设计、反爬策略应对、数据解析与存储等核心环节。文章包含完整的代码实现，使用Playwright+Asyncio的高性能爬取方案，以及数据分析与可视化的实战案例。通过本文，读者将掌握大规模社交媒体数据采集的关键技术，并能够将这些技术应用于实
Python高级数据类型：字典（Dictionary） PythonicCC python 开发语言
字典是Python中非常重要且实用的数据结构，本文将全面详细地介绍字典的所有知识点，从基础概念到高级用法，帮助初学者彻底掌握字典的使用。1.字典简介1.1为什么需要字典？假设我们需要存储公司员工的姓名、年龄、职务和工资信息。使用列表可以这样实现：staff_list=[["tom",20,"teacher",6000],["rose",18,"hr",5000],["jack",20,"行政",4
从AWS MySQL数据库下载备份到S3的完整解决方案 AWS官方合作商数据库 aws mysql
本文将介绍两种主流方法将AWSRDSMySQL数据库备份下载到S3，适用于生产环境需求。方法一：通过RDS快照导出（AWS原生方案）适用场景：全量备份、大数据量、无需额外计算资源流程：创建数据库快照进入AWSRDS控制台→选择目标MySQL实例→点击"操作"→"拍摄快照"输入快照名称（如my-db-snapshot-2024）配置S3导出任务在RDS控制台左侧菜单选择快照→选择刚创建的快照点击"操
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
使用 Python 爬取网易云音乐歌单数据（完整教程） Python爬虫项目 python 开发语言 github selenium 爬虫
一、引言随着在线音乐平台的普及，网易云音乐（NetEaseCloudMusic）凭借其个性化的推荐算法和丰富的用户互动，吸引了大量用户。网易云音乐的歌单中包含了丰富的音乐数据，包括歌曲名、歌手、专辑、播放量、评论数等信息。通过爬取这些数据，可以对音乐流行趋势进行分析，挖掘音乐推荐策略，甚至训练个性化推荐模型。本教程将使用Python构建一个爬虫，解析网易云音乐的歌单接口，获取歌曲数据并进行数据分析
c#集合排序 zls365365 c#windows 开发语言
在C#中，集合排序是一种常见的操作，它可以帮助我们对集合中的元素进行排序。C#中提供了多种集合排序方法，包括Array.Sort、List.Sort、SortedList和SortedSet等。下面分别介绍一下这些集合排序方法的用法和注意事项：1.Array.SortArray.Sort是C#中的数组排序方法，可以对数组中的元素进行排序。Array.Sort方法可以使用默认的排序算法或者自定义的排
c#泛型集合（ArrayList和List、Dictionary的对比）
一、List集合1.基本概念泛型集合：只能存储指定类型的数据，类型安全。动态扩容：无需指定初始大小，自动调整容量。性能优势：避免装箱拆箱（相比ArrayList）。2.创建与初始化//空列表Listlist=newList();//带初始值的列表Listlist4=newList{"aaa","ccc","bbb"};3.常用属性与方法操作代码示例说明添加元素list.Add(100);在末尾添
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe