唐名威

联邦推荐系统综述

朱智韬^1,2, 司世景¹, 王健宗¹, 肖京¹

1平安科技（深圳）有限公司

2中国科学技术大学

摘要：在联邦学习范式中，原始数据被本地存储在独立的用户客户端中，而脱敏数据被发送到中心服务器中加以聚合，这给众多领域提供了一种新颖的设计思路。考虑到传统推荐系统的研究方向集中于提高推荐效果，在资源节约、跨领域推荐、隐私保护等方面还具有很大改进空间，如何将联邦学习与推荐系统结合以解决这些问题成为当前的一个研究热点。对近年来基于联邦学习的推荐系统进行了全面的总结、比较与分析，首先介绍了推荐系统的传统实现方式及面临的瓶颈；然后引入了联邦学习范式，描述了联邦学习在隐私保护、利用多领域用户数据两方面给推荐系统带来的增益，以及二者结合的技术挑战，进而详细说明了现有的联邦推荐系统部署方式；最后，对联邦推荐系统未来的研究进行了展望与总结。

关键词：联邦学习 ; 推荐系统 ; 隐私保护 ; 协同过滤 ; 深度学习

论文引用格式：

朱智韬, 司世景, 王健宗, 等. 联邦推荐系统综述[J]. 大数据, 2022, 8(4): 105-132.

ZHU Z T, SI S J, WANG J Z, et al. Survey on federated recommendation systems[J]. Big Data Research, 2022, 8(4): 105-132.

0 引言

伴随着互联网的快速发展，信息过载问题成为每个人的生活中一个愈发严重的阻碍。作为解决信息过载问题的有效解决方案，推荐系统（recommendation system，RS）在商业网站和信息分发应用中普遍存在。它们利用用户的各种知识和数据生成个性化推荐结果，是抵御客户无意义浏览和商家无用数据推送的利器。一般来说，推荐列表立足于格式化存储的三方面信息：用户喜好、项目属性、用户与项目的交互记录。此外，还可能使用其他附加信息，如时间和空间数。推荐系统服务的最终目标是提高营业额，根据不同的应用场景，服务提供者可能会采取不同的路径来实现这一目标，包括向目标用户推荐合适商品以直接增加销售量，以及推送匹配用户兴趣的娱乐内容以提高用户黏度，从而使广告获得更多的曝光率等。但毫无疑问，各种隐私保护法规的颁布对跟踪用户足迹的程序的要求将变得越来越严格。越来越多的大企业开始意识到隐私保护和数据安全合规的必要性，并出现了基于联邦学习（federated learning，FL）等机制的隐私保护措施。

本文对推荐系统、联邦学习以及两者的结合进行了概述。首先阐述推荐系统的作用机制，然后介绍联邦学习的发展源流，最终的目标是在不破坏数据隐私和遵守安全原则的前提下，探索最大限度地利用数据的联邦推荐方法。

1 推荐系统

在实践中，推荐系统已经被广泛应用于书籍和CD、音乐、电影、新闻、笑话和网页等推荐中。根据推荐机制的不同，传统推荐模型主要分为协同过滤式推荐系统、基于内容的推荐系统和混合推荐系统。而后深度学习方法的兴起为推荐系统的研究带来了新的机遇，本文也将举例说明其结合思想。

1.1 协同过滤推荐系统

协同过滤算法的核心思想是根据相似用户或相似物品来提供商品推荐或预测，其包括两个维度：基于邻域和基于模型。最初的邻域算法集中在用户之间的相似性上，被称为基于用户的协同过滤（user-based collaborative filtering， UCF）；基于项目的协同过滤（item-based collaborative filtering，ICF）方法则关注类似项目的评分。基于邻域的协同过滤推荐的关键是计算不同用户、不同项目之间的相似度。表1给出了比较常用的相似度度量方法。

基于邻域的协同过滤系统过去非常成功，得到了广泛使用，但受到可扩展性不足（最近邻算法需要的计算量随着用户数和项目数的增长而快速增长，不适合应用于数据量较大的场景）的限制。因此，有学者提出了一种基于模型的协同过滤（modelbased collaborative filtering，MCF）算法，利用机器学习或数据挖掘等算法，通过训练数据对复杂模式进行学习和识别，得到学习模型，然后根据学习模型对数据集进行智能预测。常用的模型协同过滤算法有隐语义协同过滤模型、隐因子模型等。

此外，还有其他路径的协同过滤推荐算法，如将推荐问题转化为节点选择问题的图模型推荐算法、模拟人类推理因果关系的不定性的贝叶斯网络协同过滤模型、聚焦用户属性特征的聚类协同过滤模型等。

作为目前使用非常广泛的推荐算法，协同过滤推荐系统工程实现简单，模型通用性强，效果显著，但始终面临着严重的数据稀疏（用户仅对数据库中可用项目的极少部分进行评分）与冷启动（新用户与新物品缺少评分数据作为可学习的历史信息）问题，并且通常使用的浅层模型无法学习到用户和项目的深层次特征。

1.2 基于内容的推荐系统

基于内容的推荐系统（content-based recommendation system，CB）算法通过寻找与用户已选择项目具有相似属性的物品进行推荐。Pazzani M J等人对基于内容的推荐策略架构进行了宏观介绍，这种推荐只需要两类信息，即对项目特征的描述和用户过去的偏好信息，不需要大量的用户评分历史来生成推荐列表（避免了评分数据稀疏问题）。实现的关键点在于对项目和用户偏好进行建模，并计算其相似性（此时提取新项目的特征即可进行冷启动）。Salton G等人提出的向量空间模型是非常常用的内容建模方法。基于内容的推荐系统可解释性强，可以更好地解决冷启动问题，对于小众领域也有较好的推荐效果，其缺点在于推荐精准度较低、无法挖掘用户深层次的潜在兴趣，导致推荐新颖度不高、较难分发长尾标的物，并且这种方法的有效性与可扩展性受到人工设计特征提取方法的严重制约，常常会遇到特征提取困难的问题。

1.3 混合推荐系统

类似于集成学习通过有效整合不同算法降低系统性误差的思想，混合推荐系统搭配使用不同的推荐算法给出最终的推荐结果，避免单一算法固有的问题，实现较任意单一算法更佳的推荐效果。此外，一些混合推荐算法融合了包括图像、音频、文本在内的多源异质辅助信息，能够有效解决数据稀疏和冷启动问题。但囿于辅助信息的复杂性（如异质性、多模态、数据提供方限制等），相关方法的研究仍然面临着严峻挑战。

值得一提的是，基于其他方法的推荐系统也各有千秋，如基于社交网络的、基于人口数据的、基于心理学的、基于大数据的，等等。每一种推荐算法都有其优缺点，本文篇幅有限，不做深入阐述。

1.4 基于深度学习的推荐系统

随着算力的跨越式提高，深度学习已经成为互联网人工智能的一个利器。神经体系结构在有监督和无监督学习任务中都获得了巨大的成功。自然地，深度学习也在推荐系统领域得到了广泛应用，并且得益于其在非线性转换、表征学习、序列模型以及灵活性方面的优势，成为当前的最优模型。

深度学习在推荐系统中的应用最早可以追溯到2007年Salakhutdinov R等人发表的一篇将受限玻尔兹曼机应用于推荐系统的文章。常用的深度学习模型有多层感知机、卷积神经网络（convolutional neural network，CNN）、循环神经网络（recurrent neural network，RNN）、注意力模型、自编码器、神经自回归分布估计、对抗网络、受限玻尔兹曼机、深度强化学习等，这些模型在推荐系统上得到了广泛的应用。

基于深度学习的推荐系统通常将与各类用户和项目相关的数据作为输入，利用深度学习模型学习用户和项目的隐表示，并基于这种隐表示为用户生成项目推荐。目前构建深度学习推荐算法最常见的一种范式是多层感知机，其可将非线性变换添加到现有的推荐系统方法中，如果需要整合附加信息（图像、文本、语音、视频等），则会采用CNN、RNN模型来提取相关信息。

而后根据所采用的神经网络的不同结构，演变出了不同的深度学习推荐模型。

通过增加深度神经网络结构的层数和复杂度，AutoRec引入了自编码器，如图1所示，利用单隐层神经网络模型，结合协同过滤的共现矩阵，得到用户/物品向量的自编码，后续生成用户对物品的预估评分并用于排序。

图1 自编码器深度推荐系统

通过丰富特征交叉方式演变出了神经协同过滤（neural collaborative filtering，NCF），图2中摈弃了矩阵分解中的简单内积操作，“多层神经网络+输出层”让用户/物品向量进行更充分的交叉，引入更多的非线性特征，增强对稀疏特征的学习能力。

图2 神经协同过滤

通过引入注意力机制，在嵌入层与多层感知机之间加入注意力层，演变出了深度兴趣网络（deep interest network， DIN），以及融合了序列模型以模拟用户喜好变化过程的深度兴趣进化网络（deep interest evolution network，DIEN）、使用胶囊网络提取用户的多样兴趣并引入基于标签的注意力机制的动态路径选择多兴趣网络（multi-interest network with dynamic routing，MIND）等。

而对于因子分解机模型的各种深度学习演化，克服了协同过滤对稀疏矩阵泛化能力不强的困难，包括神经因子分解机（neural factorization machine，NFM）应用神经网络改善因子分解机二阶交叉部分的特征交叉性能、因子分解机神经网络（factorization-machine supported neural network，FNN）利用因子分解机的结果初始化网络、注意力神经因子分解机（attention neural factorization machine，AFM）在双线性交互池化操作中引入注意力机制以提升模型的表示能力与可解释性。

对于图像、文本、音乐数据推荐任务，通过将CNN作为特征处理手段并应用到推荐系统中，可以实现对多种类推荐项目的处理，如基于文本与图像数据推荐微博标签、利用深度学习模型解决音乐推荐场景下的冷启动问题、使用比较深度学习（comparative deep learning，CDL）方法将用户和图像映射到同一隐空间中以推荐图像。

针对序列数据，一般为了捕捉用户行为间的相互依赖关系，可以使用RNN建模实现项目推荐和用户行为预测.可以利用的数据类型包括历史会话行为记录、用户行为的时间序列信息、注意力机制下的文本序列特征等。

2 联邦推荐系统

2.1 联邦学习

与许多机器学习算法一样，推荐系统也是“数据饥渴”的，但现实情况是，数据被置于不同组织的隐私保护下，且受到各种政策法规的限制，例如欧盟的《通用数据保护条例》（General Data Protection Regulation，GDPR）。数据不能简单地在机构之间共享，不同公司和组织间成为“数据孤岛”。由于每个“数据孤岛”中数据的大小或特征都有局限性，因此单个机构可能无法训练出一个高质量的推荐模型。

联邦学习是一种机器学习环境，由McMahan B等人首次提出，Kairouz E B P等人给出其严谨的定义：联邦学习是一种机器学习环境，在中央服务器或服务提供商的协调下，多个实体（客户端）协作解决机器学习问题。每个客户端的原始数据都存储在本地，不进行交换或传输；相反，旨在进行即时聚合的集中更新被用来实现学习目标。对于一个有效的联邦学习系统，只要求存在任何一个客户端能从联邦学习系统中获得更高的模型效用。

在联邦学习框架中，学习任务是由松散的参与方联邦（本文称之为客户端）共同完成的，如图3所示，原始数据被各自独立存储在本地，这些设备由一个中央服务器协调。最早的实践项目甚至在数千万部手机和边缘设备应用中部署了联邦学习。

图3 联邦学习框架

按照客户端是单一设备还是组织或公司，联邦学习可以分为跨设备联邦学习和跨孤岛联邦学习。而根据在不同参与方之间的训练数据特征空间和样本ID空间的分布情况，Yang Q等人将联邦学习划分为横向联邦学习、纵向联邦学习以及联邦迁移学习。

2.1.1 横向联邦学习

横向联邦学习也可被称为基于样本的联邦学习，它是在不同数据集之间特征空间重叠较多而用户重叠较少的场景下引入的。

这种联邦学习对金融机构最有吸引力。因为金融机构的用户群体通常被限制在各自的区域，业务种类相差不多，因此可以从用户维度对数据集进行划分，使用特征相同而用户不完全相同的双方部分数据共同训练。

2.1.2 纵向联邦学习

纵向联邦学习也叫基于特征的联邦学习，适用于数据持有者之间存在重叠的数据样本但数据特征不同的情形。纵向联邦学习的客户端通常由同区域不同业务的公司组成，其用户集包含了该地区的大部分居民，但错开了购买特征。应用纵向联邦学习可以拓宽双方的特征空间，预测最值得推销的商品。

虽然纵向联邦学习可以丰富用户特征，发现不同数据之间的隐藏关系，但不同数据特征的整合通常更具挑战性。

2.1.3 联邦迁移学习

联邦迁移学习考虑了数据方在用户空间或特征空间中仅有部分重叠的挑战性场景，不对数据进行切分，而是利用现有的迁移学习技术协作建立模型，以克服样本或标签不足的困难。

令第i方数据D_i的样本空间为X_i，特征空间为y，标签为I_i，则联邦学习的3种分类表示见表2。

显然，推荐系统的工作方式在个性化推荐收益与隐私保护之间形成了一种权衡。随着公众对大公司收集和使用个人数据的举措越来越感到不安，推荐系统如何在个性化和隐私保护之间寻求最优解变得愈发重要。另外，考虑到计算成本和数据的可扩展性，在推荐系统上应用联邦学习的尝试也是相当明智的。

当前联邦推荐系统的结合出发点多为增强隐私保护与促进多领域用户信息融合，而实际落地阶段往往面临数据异质性与通信成本增加的挑战。

2.2 联邦推荐系统的隐私保护手段

推荐系统的高性能建立在海量的数据挖掘基础之上，一方面，为了达到足够的可用性，推荐系统对用户历史数据的体量和具体程度有着严苛的要求；另一方面，用户的历史数据提供得越详实，其隐私信息泄露的风险越大。因此，如何解决推荐系统中的隐私保护问题，即在保护用户历史行为数据、推荐模型与推荐结果等隐私信息的前提下，达到推荐结果的可靠性与有效性等功能指标，是一个亟待解决且非常具有理论意义的问题。常用的隐私保护方法大致分为以下两个类别。

● 密码学方法。将输入数据隔绝于其他参与方或者不以明文传输的方式，使分布式计算过程不泄露隐私信息，如安全多方计算（包括不经意传输、秘密共享、混淆电路和同态加密）。

● 模糊处理。随机化、添加噪声或修改数据使传输数据拥有某一特定级别的隐私，如差分隐私方法。

传统基于内容的推荐系统隐私保护系统架构利用公钥全同态加密等技术，先在本地对用户历史数据训练集中的输入数据进行加密，而后由推荐服务器在密文域上建立预测模型，计算推荐结果，接着返回给授权用户，以解密推荐结果并验证其正确性。

而基于邻域的推荐系统隐私保护系统架构则先将与目标用户组相似用户的历史数据作为数据集，各推荐服务器在密文域上，通过安全多方计算等技术建立预测模型并计算推荐结果，并将安全多方计算得到的密文形式推荐结果与其正确性可验证证据共同返回给目标用户组的推荐服务器，随后分发给目标用户以解密验证结果。现有的做法通常是利用公钥全同态加密技术与混淆电路技术，在假定不存在合谋攻击的推荐服务器与密码服务提供商间通过安全多方计算实现。Kim S等人使用全同态加密技术部署隐私保护的矩阵分解推荐系统，针对加密后的用户评级数据输入，实施矩阵分解并输出加密结果。

上述工作均使用公钥（全）同态加密技术实现，虽然模型较为准确，但计算开销和密文长度随着用户数据集的扩大而急剧增大，给资源受限的用户端带来了难以承受的复杂度与通信开销。并且，基于公钥全同态加密技术与混淆电路的基于邻域的隐私保护协同过滤推荐系统更加难以抵御半可信或恶意环境下的推荐服务器攻击。

在保证推荐效果近似可用性的前提下，数据扰动技术已经被广泛应用于推荐系统。Agrawal R等人首次将加法扰动技术应用于数据挖掘领域，并验证了其在决策树等算法上的效果。通过在原始数据矩阵后加上一个扰动矩阵（各行由一个均值为0的均匀分布或高斯分布独立生成），达到使原始数据失真并且不改变计算结果统计均值的目的。设原始向量为A、B，扰动向量分别为R、V，则A、B的内积可由A′=A+R、B′=B+V 的内积近似表示：

在此基础上， Polat H等人与Herlocker J等人分别基于均匀分布扰动因子与高斯分布扰动因子构建了保护隐私的推荐系统。而后Chen K K等人利用隐私保护的欧几里得距离计算与隐私保护的内积计算技术，构建了基于乘法扰动的二分类隐私保护推荐系统。

基于前人的工作，Dwork C最早提出差分隐私（differential privacy，DP）的概念，提供了个人隐私泄露的数学定义，并根据应用场景的不同将差分隐私分为中心化差分隐私和本地化差分隐私，前者由可信的数据收集者添加噪声，后者由用户本地添加噪声。中心化差分隐私的典型噪声机制是拉普拉斯噪声机制和指数噪声机制，其中前者用来处理连续型数据，后者适用于离散型数据。本地化差分隐私则主要采取随机响应方法来保护隐私。

在差分隐私的定义下，攻击者无法通过查询结果的改变探知具体数据的内容，并且数据集依然保持可用于数据挖掘等操作的一些统计特性。虽然差分隐私技术基于数据扰乱添加噪声，使得原有的数据失真，但其加入的噪声量大小只与数据集的敏感度和隐私参数ε有关，而与数据集大小无关，因此对于大规模的数据集仍然可能不提出过高的性能要求。这使得差分隐私保护技术可以在确保数据可用性的前提下大幅度降低隐私泄露风险。其缺点在于，在复杂计算过程中，噪声累积有可能导致数据不可用。

为了保护推荐系统的差分隐私， McSherry F等人将差分隐私技术应用于协同过滤算法，通过在用户评分数据的计数与求和中添加采用拉普拉斯机制计算的噪声，得到了盲化的物品-物品协方差矩阵，实现了差分隐私保护的K近邻（K-nearest neighbor，KNN）与奇异值分解（singular value decomposition， SVD）推荐算法。Zhu T Q等人则对基于邻域的协同过滤推荐算法的邻居选择环节进行差分隐私保护，并对预测的评分值进一步添加拉普拉斯噪声以保护预测结果。Berlio z A等人则针对矩阵分解算法的3个环节（数据输入、矩阵分解进程、数据输出）分别应用差分隐私技术，并权衡了各方法在隐私保护力度与推荐准确度之间的取舍，如图4所示。

图4 矩阵分解机制的噪声添加策略

对于严格联邦定义下的推荐系统，最初的联邦学习认为，由于其中心服务器只从参与方采集梯度更新信息，这种分布式的模型更新方式已经能在一定程度上保护隐私，但Orekondy T等人与Wang Z B等人证明了没有隐私保护机制的简单联邦学习仍会遭受梯度信息反推攻击，从而泄露隐私信息；Melis L等人对参与人数较少的协同学习下非预期特征泄露情景进行了成员推理攻击与属性推理攻击，并提出了多种防御建议。

受到诸多隐私保护技术的启发，联邦学习广泛运用了安全多方计算、同态加密以及差分隐私等隐私保护技术，但是其在应用场景上与传统推荐系统的隐私保护方法有很大的不同。传统推荐系统的隐私保护致力于防止推荐服务提供商对单一客户端原始用户数据的探知，通过对推荐模型的原始输入进行加密传输，存储、计算资源受限的用户可以将推荐算法外包给资源庞大的推荐服务器；而联邦推荐系统的隐私保护则是针对不同的推荐服务提供商实体，在不交换各自本地数据的前提下，对推荐模型的梯度更新进行加密传输，以分摊计算开销，并且规避直接在原始数据密文域上训练全局模型的庞大计算开销，有效地降低了传统机器学习源数据聚合带来的许多隐私风险。相比于传统的一方提供数据、另一方提供计算服务的推荐范式，联邦学习使得原先的用户也成为潜在的推荐服务提供商，扩宽了推荐数据的来源，对于单一客户端而言可以有效提高推荐准确性。

Truex S等人开发了一种联邦训练方法，可以根据本地隐私预算对复杂模型参数更新执行基于本地化差分隐私（local differential privacy，LDP）机制的扰动，同时最大限度地降低噪声对联邦学习训练过程的影响，验证了使用压缩LDP协议部署的系统针对公共数据训练深度神经网络时的有效性。Liu R X等人提出了一个用于联邦随机梯度下降（federated stochastic gradient descent）的两阶段本地差分隐私框架FedSel，首先对本地客户端的梯度更新进行维度选择再执行数据扰动，证明了top-k梯度处理比已有的Top-1处理方法更优。Triastcyn A等人使用贝叶斯计数方法代替时刻计数方法，从理论分析与实验结果两方面证明了贝叶斯差分隐私联邦学习对客户端与具体实例的隐私保护的有效性。Bonawitz K等人运用秘密共享等技术，为用户向参数服务器上传参数的过程提供了隐私保证。Li T等人设计了一个执行差分隐私机制的联邦推荐系统。

在推荐系统无所不在的网络环境中，用户越来越强烈地意识到自己的数据是需要保密的。通过部署更先进的隐私保护推荐系统，消除参与方对隐私泄露的担忧，对于促进数字化实体合作，防范化解重大政策风险无疑至关重要。

2.3 联邦推荐系统的跨领域推荐能力

联邦学习可以在不破坏隐私安全的前提下打破“数据孤岛”，充分利用不同用户域的信息，因此其在跨领域推荐方面也有着天然的优势。

Liu S C等人通过部署不同领域的多个服务器，使用变分推理框架进行优化，最大限度地提高用户编码和所有交互域中特定领域的用户信息之间的互信息，提出了一种联邦跨领域推荐框架FedCT，在降低通信成本的同时，提出了一种不依赖于涉及域的数量、传输模型对其他领域不造成显著干扰的推理机制。此外，针对推荐系统中的冷启动问题，王健宗等人基于安全内积协议设计了一种联邦协同过滤的冷启动解决方案，在数据库中添加新用户或新物品时，利用安全内积方法，联合多方评分矩阵，求解多方数据的相似矩阵，从而完成新项目的推荐输出。Wang L等人则针对用户兴趣点推荐任务提出了跨领域的隐私保护联邦推荐算法，利用辅领域的用户数据对主领域用户进行兴趣分析，在用户评论分析任务上取得了较CNN更优的推荐效果，有效解决了冷启动难题。

基于跨模态的检索方法需要大量的训练数据，然而聚合、收集大量的数据将会产生巨大的隐私风险和高昂的维护成本。对此，Zong L L等人提出了一种联邦跨模态训练方法，使用各模态客户端的本地数据训练各自的公共空间，再由可信服务器聚合公共子空间，并指导服务器本地模型的公共子空间更新。此项工作为结合多种数据来源形式的联邦推荐系统奠定了基础，扩宽了可使用推荐数据的范围，降低了数据收集难度。而在特定的医学应用领域，Ma J等人提出了一种通信高效的联邦广义张量因子分解，以适合不同类型的实际数据，并且能够大幅度降低上行通信成本，此成果为联邦推荐在医疗领域的应用提供了基本方法。

联邦学习的引入为共同训练推荐系统的多方数据持有者提供了数据安全上的保证，以原始数据不出本地、共同利用梯度更新模型的训练方法，吸引了不同服务提供商分享不同存储形式的不同领域的用户数据，达到促进己方业务增长的目的。

2.4 联邦推荐系统的数据异质性挑战

现有的机器学习任务经常默认训练数据遵循独立同分布（independently and identically distributed，IID）假设，但是对于分布式计算而言，由于现实世界中的不同数字化实体往往服务于不同属性（如区域、爱好、财富等）的用户，其各项特征往往相差较大，存储方式也不尽相同，并且由于存在用户重合或有联系的情况，数据相关性几乎无处不在。若是只考虑IID数据，基于现有的机器学习算法和框架训练模型，会导致许多负面效果，比如模型准确度大幅降低、无法收敛等。解决异质问题对于解决推荐系统的用户数据稀疏问题也十分重要。挖掘其他数据可以有效提高推荐准确性，用户曾经发表的文本、图像、互动信息等数据是异质的，难以处理又关乎性能的异质性数据给算法带来了挑战。

近年来，推荐系统中的非独立同分布（non-independently and identically distribution，Non-IID）情况引起了学者的重视，其不仅包含用户信息与物品信息各自非独立同分布的情况，还包括用户与物品两两在不同层级上的耦合。Cao L B对推荐系统中不同的异质情况做了详细研究，并提出了判别推荐系统异质情况的理论框架。对于ICF中的物品相似度耦合，Wang C等人首先合并了耦合的物品相似度，引入一个耦合k模式算法来预测评分，随后在矩阵分解的目标函数中添加相似性度量，以学习不易察觉的用户与项目的关系矩阵。

联邦学习在分布式学习过程中保持对设备或用户个人信息的隔离，因此异质性数据对联邦学习推理性能的影响尤其严重。Wu Q等人将联邦学习在实际应用中面临的异质性问题总结如下：①各个客户端在存储容量、计算能力和通信速率方面存在设备异质性问题；②各个客户端所存储数据的非独立同分布状态导致的统计异质性问题；③各个客户端所处的不同应用场景导致的模型异质性问题。数据异质性问题又可分为特征分布偏斜（协变量偏移）、标签分布偏斜（先验概率偏移）、特征与标签在不同数据来源上的不匹配、数量偏斜或不平衡等问题。笔者认为在推荐系统这一具体应用场景，可以讨论能否适当放宽联邦学习对每一轮参与设备选择的严苛要求，以解决实际遇到的异质性难题。

对于减轻异质性带来的影响，一种有效的方法是设计个性化模型，分别针对设备、数据和模型级别的异质性进行不同的个性化处理。

Yang C X等人通过实证研究量化了设备异质性对联邦学习训练过程的影响。结果表明，异质性会导致联邦学习的性能下降，包括高达9.2%的准确率下降、2.32倍的训练时间延长，以及公平性遭到破坏。其中设备故障和参与者偏差是性能下降的两个潜在因素。针对设备异质性难题，Liu L M等人设计了一种客户机-边缘-云分层联邦学习架构，通过引入中间边缘服务器，同时减少模型训练时间和终端设备的能耗。Xie C等人则提出了一种新的异步联邦优化算法，并证明了该算法对于强凸问题以及一类受限的非凸问题具备逼近全局最优的线性收敛性。

针对统计异质性难题，McMahan B等人提出了一种基于迭代平均的深层网络联邦学习方法——联邦平均（federated averaging，FedAvg），FedAvg相比联邦随机梯度下降（federated stochastic gradient descent，FedSGD）算法在通信轮次上取得了较大改善；Li X等人从理论角度证明了FedAvg在处理Non-IID数据时可实现收敛，证明了此方法的有效性；Zhao Y等人则进一步分析和改进了FedAvg，为了衡量客户端存储的数据分布与中央服务器掌握的数据总体分布之间的差异，引入推土机距离（earth mover’s distance，EMD）来计算权重散度，表明可使用权重散度指标表示准确度下降的趋势，同时提出了一种数据共享策略，通过在初始化阶段将全局共享数据子集的随机部分分发给每个客户端，改进了 FedAvg的性能，实验证明，在不影响整体通信效率，也不增加隐私安全性漏洞的前提下，该方法可显著提高数据严重倾斜的情况的准确度。

针对模型异质性问题，Kulkarni V等人总结了如下几类模型异质性个性化学习方法构建策略：增加用户上下文、迁移学习、多任务学习、元学习、知识蒸馏、基本层与个性化层共同作用、混合全局和局部模型等，并在其综述中进行了详细介绍。

此外，Wu J Z等人考虑到用户本地数据通常包含公共信息（物品标签）与敏感信息（本地用户交互过的物品清单），提出了隐私异质性。相应地，为了解决隐私异质性问题，作者利用层次信息来划分公共数据和隐私数据，设计了包含公共组件与隐私组件的本地个性化模型GUM（可以实现模型的异质性），并对二者执行不同的聚合更新策略：客户端将公共组件直接发送给服务器，服务器将当前模型在本地验证集上的准确度进行加权聚合后得到新一轮的全局公共组件；而隐私组件则通过对客户端发送给服务器的本地聚类中心（视为本地用户表示的草图，不泄露本地用户数据）再进行一次聚类得到公共聚类中心，即可得到全局隐私组件，二者共同构成新一轮的全局模型。服务器更新并发送全局组件后，再由客户端以细粒度更新策略个性化更新本地模型（此方法可以解决统计异质性问题）。

2.5 联邦推荐系统的通信成本挑战

在联邦推荐系统中，特别是跨设备联邦学习设定下，联邦网络可能由大量的设备共同组成，因此每轮更新都需要进行大规模的通信，这对网络带宽与设备情况提出了较高的要求。因此，在不降低推荐准确度的前提下提升通信效率就显得尤为重要。通信开销的降低与学习效率的提升将为更大范围的工业化联邦推荐系统奠定基础。

当前设备在计算、内存和通信方面的资源有限，因此存在一些具有实用价值的不同通信优化目标。

● 压缩梯度信息。使用降维、梯度压缩等方法，减小从客户端到服务器通信对象的规模，该对象用于更新全局模型。例如Rothchild D等人提出了一种使用计算草图压缩客户端更新信息大小的方法FetchSGD，将动量与累计误差从本地客户端转移到服务器上进行聚合，该方法在稀疏客户端参与时仍能保证高压缩率和良好的收敛性。Reisizadeh A等人则采用周期平均和量化处理压缩客户端模型的更新信息，提出了FedPAQ（federated periodic averaging and quantization）方法，具体做法是客户端执行数次本地更新计算后，才使用量化算子向中心服务器发送此时本地结果与全局模型的差值的量化结果，并由中心服务器反量化解码后用于生成新的全局模型。该方法虽然能有效降低通信开销，但降低了收敛准确度，需要更多次训练迭代。

● 压缩广播模型。减小从服务器到客户端的全局模型广播的规模，客户端从该模型开始本地训练。例如Khan F K等人通过将强化学习中的多臂老虎机算法应用于负载优化，设计奖励函数，挑选奖励反馈为正反馈的物品向量进行更新，每次只广播全局模型的一部分，在高度稀疏的推荐数据集上减少了90%的模型负载。

● 减少本地计算。修改训练算法，使得本地训练过程在计算上更加高效。例如Malinovsky G等人从不动点方法的角度分析，将优化问题转化为梯度下降算子的不动点寻找问题，限制客户端的本地计算，从而突破通信开销瓶颈。

而由于联邦推荐传输的矩阵通常十分巨大，在通信成本上的考量更为关键。将参考文献[94]中提到的取子样本法或概率量化法移植到联邦推荐系统的用户矩阵上，对于大公司使用联邦推荐具有极大的吸引力。具体地，表3总结了联邦推荐系统对推荐社区的贡献与落地过程中遇到的挑战。

关于联邦优化的目标函数的研究在分散优化领域也产生了诸多成果。为了降低通信开销，Wang J Y等人提出了周期性去中心化SGD方法，该方法使用多个本地更新对中心化SGD进行联邦平均。随后Li X等人将该算法扩展到Non-IID数据来源中。Liang P P等人提出结合本地与全局的方式，降低联邦学习通信开销，提升学习效率，该方法在参与方拥有Non-IID数据的情况下仍然有效。针对特定的应用场景，Liu Y等人提出针对纵向联邦降低通信开销，进而提升学习效率的方法，该方法在理论分析与实验验证中被证明行之有效。马嘉华等人则针对节点数据分布差异给联邦学习算法性能带来不良影响的问题，提出了一个基于标签量信息的节点选择算法，降低了全局模型的权重偏移上界，从而提高算法的收敛稳定性。另外，随着5G基础设备的全面铺开，联邦推荐使用的边缘设备也将处于更优的网络环境中，可以从提高速率和带宽方面正面解决通信开销问题，突破通信瓶颈。

2.6 联邦推荐系统部署

2.6.1 联邦协同过滤框架

来自华为芬兰研发中心的Ammad ud-din M等人提出了第一个基于用户隐性反馈的联邦个性化推荐系统，并展示了该方法对基准数据集MovieLens和内部数据集的适用性。作者提出了一种联邦学习框架下的隐性反馈数据集的联邦协同过滤（federated collaborative filtering， FCF）方法。该方法具有通用性，可以扩展到各种推荐系统的应用场景。FCF在中央服务器上更新主模型Y（物品因子矩阵），并将其分发到每个客户端，每个用户规格模型X（用户因子矩阵）仍在本地客户端，利用本地用户数据和中央服务器的Y在客户端上进行更新。联邦协同过滤的基本架构如图5所示。

图5 联邦协同过滤的基本架构

FCF主要考虑隐性反馈的情况，用户u对物品i偏好得分的预测可以表示为：

引入一组二元变量来表示用户u对物品i的偏好：

在隐性反馈的情况下，rui=0可以有多种解释，比如用户u对物品i不感兴趣，或者用户u可能不知道物品i的存在等。为了解决这种不确定性问题，引入了一个确证参数：

得到所有用户u和物品i的优化目标函数：

其中，λ为正则化系数。式（6）显示了对x_u 的最佳估计，此项可直接在用户本地计算：

其中，C_u为用户u的置信参数列，p(u)为用户u的偏好程度。而后，为了得到物品因子 y_i的最佳估计值，需要知道用户因子向量x_i与物品的交互信息，因此 y_i的更新不能在客户端完成，必须在中心服务器上完成。但从保护用户隐私的角度出发，用户与物品的交互信息只能保存在客户端设备中，因此不能直接计算y_i。

为了解决这个问题，FCF提出了一种随机梯度下降的方法，在保护用户隐私的同时，允许y_i在中央服务器上更新。具体来说，它使用以下计算式更新中央服务器上的y_i：

并定义：

在每个客户端u上分别计算 f(u,i)，敏感评分信息不出本地。随后，所有客户端仅将 f(u,i)的值发送给中心服务器进行求和，从而更新主服务器上的y_i。

在通用电影推荐数据集MovieLens与其私有数据集上的实验结果表明，在不失通用性的前提下，可以认为FCF与中心化推荐方法的推荐性能表现是十分接近的。但是这一方法存在两个关键问题。一是，FCF要求每个用户和项目都参与到学习过程中来训练自己的向量，这在实际推荐场景中并不适用，因为有些用户受到设备、网络性能等限制，无法参与每一轮的模型训练，这也与联邦学习利用用户的闲置算力的初衷相违背。二是，FCF使用物品的ID来表示物品，而对于不断上架新物品的推荐系统，无法实时扩充标记。在推荐系统的实际应用场景中，这将会带来严重的冷启动问题。

此外，在安全性方面，Chai D等人指出，如果已知任意两步更新的梯度信息以及用户因子的更新计算式，可以通过求解高阶方程组推导出用户评分信息，即梯度信息有可能泄露用户隐私数据。为了解决这一问题，他们提出了一个矩阵因子分解模型——安全联邦矩阵分解（secure federated matrix factorization， SFMF）。通过对服务器与客户端之间的通信过程使用同态加密方法，杜绝了梯度泄露用户信息的可能。他们还提出了PartText传输策略：客户端只上传用户交互过的物品的梯度信息，如此在只泄露用户交互物品列表的情况下就能获得计算时间上的较大改善。Minto L等人则对隐反馈FCF加以改进，通过在客户端上传的物品更新梯度矩阵中加入本地差分隐私策略以及代理网络来得到不包含用户元数据的物品更新梯度矩阵，以获得更强的隐私保护力度，防止第三方获取物品更新梯度矩阵后实施重构攻击。

隐反馈数据在进行联邦化改造时具有天然优势：由于将所有与用户无交集的物品都当成负样本进行求导，服务器无法探知用户的交集物品列表。而FCF对显反馈数据的求导式子中只包含该用户评分过的物品，由此容易泄露用户交互记录。对于此弊端，Lin G Y等人提出将FedRec扩展到了显性反馈的推荐场景，在上传用户梯度时将随机采样的部分未评分物品一起上传到服务器以遮掩用户实际交互的物品信息，并且采用用户平均评分与混合评分机制来生成负采样物品的评分。但此举引入了额外的噪声，因此Liang F等人又进一步提出FedRec++，分配部分去噪客户端以隐私感知的方式消除噪声数据，获得了更优的推荐性能。

2.6.2 应用于新闻推荐任务的FCF

针对FCF无法处理新项目和具有梯度泄露风险的问题，Qi T等人对新闻推荐任务的FCF应用进行了改进，提出FedNewsRec方法，在去中心化存储条件下，基于用户行为数据训练了一个精确的新闻推荐模型。具体地，Qi T等人采用从低到高由词嵌入层、卷积神经网络、多头自注意力网络、注意力网络构成的4层新闻模型学习新闻表征，并使用参考文献中的用户模型学习用户的点击历史，如图6所示。

图6 FedNewsRec的新闻表征向量模型

在FedNewsRec框架中，每一轮更新时，一组随机选择的用户的局部梯度被上传到服务器，然后进一步聚合以更新服务器中的全局模型。提供新闻服务的服务器不记录或收集用户行为，这可以解决隐私问题，降低数据泄露的风险。此外，在客户端和中心服务器之间的通信过程中，额外引入本地差分隐私技术来保护上传梯度中的隐私信息（但这降低了聚合梯度模型的更新精度）。Qi T等人将FedNewsRec与当前主流的几种新闻推荐方法在新闻数据集Adressa和MSN-News上进行了比较，验证了FedNewsRec在个性化新闻推荐模型学习中的性能，其优于FCF而稍逊于中心新闻推荐模型。

相比于FCF，FedNewsRec可以处理新用户和新项目，并且不需要所有用户参与到训练中，但由于引入了新闻推荐模型， FedNewsRec 不适用于其他场景，不具备普适性。

2.6.3 联邦多视图推荐框架

针对FedNewsRec的适用性缺点， Huang M K等人结合深度结构化语义模型（deep structured semantic model，DSSM）与FCF，进一步提出了一个基于内容的通用联邦多视图推荐框架FL-MV-DSSM（federated learningmulti view-deep structured semantic model），该框架通过使用应用的信息训练一个共享的用户子模型，从而实现更好的物品推荐性能。

FL-MV-DSSM可以处理现有的FedRec冷启动问题，通过将一般的深度结构化语义模型转变成联邦学习环境，FLMV-DSSM可以将用户和物品映射到一个共享的语义空间中，进一步实现基于内容的推荐。在此基础上，从多个数据源学习联邦模型，以获得更丰富的用户级特征，提高了FL-MV-DSSM的推荐性能。此外， FL-MV-DSSM还提供了一种新的联邦多视图设置，所有视图都协同训练一个模型，且视图之间不存在原始数据交互，每个视图对物品子模型的贡献也受到保护，通过加密或对可信执行环境进行视图级别隔离，恶意视图无法通过监视其对共享局部物品子模型的更改，从梯度中推断出正常视图的原始数据。

2.6.4 基于元学习的联邦个性化推荐框架

FedNewsRec获取更丰富用户个性化信息的思想与元学习的思想不谋而合，相对应地，Lin Y J等人提出了一种联邦元学习推荐系统框架元矩阵分解MetaMF，针对不同的客户端，学习一个较小规模的个性化本地模型，在减少资源消耗的同时，获得高于基线方法的预测准确度，且对新用户的适应只需要几个更新步骤。此外，为了得到更优的推荐性能，还可以像参考文献那样使用更强大的深度因子分解机模型。

2.7 联邦推荐系统的优化

在原来的联邦推荐算法中，客户端的选择是随机的，更新梯度信息的聚合也只是简单的加权平均过程（称为FedAvg）。在提高收敛速度和减少带宽消耗上还有很大的改进空间。

Muhammad K等人提出了一种联邦学习算法FedFast，以提升FedAvg的效率，提高联邦推荐系统的表现。其核心创新点是提出了两种算法：①ActvSAMP可以基于聚类算法选择更具代表性的训练参与者；②ActvAGG对不同嵌入采取不同的聚合方式，合并训练模型，加速模型收敛。

ActvSAMP算法将K个参与者划分为p组，每轮选取m个参与者参加本轮训练。参考文献使用其他具有隐私保护属性的特征（如所处地区、设备类型等）进行聚类，将具有相似嵌入的参与者划分到同一个聚类中。随后从每个聚类中挑选出区别较大的客户端作为代表用户参与训练。

有别于常规的FedAvg仅对局部模型参数进行加权平均来更新全局模型的权重矩阵的做法，FedFast使用ActvAGG算法对3个部分的参数进行更新：用户嵌入、物品嵌入、模型权重矩阵。在用户嵌入的学习过程中，任何代表用户学习到的参数更新，都将在乘以大小随迭代轮次t 降低的折扣系数exp(-t)后应用到与其处于相同聚类的从属用户上。这样就可以在仅计算少量用户的梯度更新的前提下，有效加快最终收敛，减少单轮算力消耗。

但鉴于参考文献的基线算法只有FedAvg，比较意义有限。此外，该方法使用的聚类算法时间复杂度较高，影响了模型全局表现，且在通信轮次和每轮通信流量之间进行了权衡，这意味着更新时需要额外的网络开销。具体地，表4给出了联邦推荐系统部署实践的优劣势对比。

2.8 其他联邦推荐系统实际应用

针对推荐系统的另一个子课题排序学习（learning to rank，LTR），Kharitonov E设计了一个基于差分隐私的隐私保护联邦在线学习排名（federated online learning to rank，FOLtR）系统，用于对在线学习的效果进行评估，取得了接近基线方法的水准，且具备一定的处理噪声隐私信息的能力。

Trienes J等人提出在去中心化的社交网络上使用推荐算法，以解决大规模用户监视和滥用用户数据影响选举公平的问题。作者使用联邦环境社交网络收集大量无偏样本，分别结合协同过滤和拓扑图设计了相应的推荐器，并证实协同过滤方法优于拓扑方法。

更具实操性地，Tan B等人部署了一个实用的联邦推荐框架，实现了大量流行算法，支持各种在线推荐服务。该系统由数据层、算法层、服务层和接口层组成，支持内容推荐、产品推荐、在线广告等各种在线应用。算法层有通用矩阵因子化、SVD、因子化机、广度与深度学习等方法。在联邦学习的环境下，将算法层建立在FATE框架上，并发布在线内容推荐演示。

3 基于联邦学习的推荐系统研究方向展望

本文讨论了目前联邦学习与推荐系统的结合情况，并对基于联邦学习的实现方法进行了大致的分类梳理，在文献调研过程中，发现目前二者的结合工作还不是很紧密，主要集中于对传统的推荐模型（如协同过滤）进行联邦化改造上，联邦学习在推荐系统中的应用仍然处于起步阶段，实际应用层面需要更多的研究与讨论。

下面笔者对推荐系统场景下的联邦学习与传统技术的结合提出6个可能的研究方向。

（1）缺少部分用户数据时的可解释性问题

推荐系统的可解释性指在给予用户推荐结果的同时，展示对结果的支持论据或推荐解释，以降低用户反感度，增强推荐说服力。由于使用了其他参与方的数据共同生成推荐结果，传统的提高推荐系统解释性的方法不再适用，如何在缺少他方原始数据的情况下生成可信度高的解释结果，降低用户反感度，依然是比较冷门的研究方向。由于联邦推荐系统严格保护本地用户信息，无法直接基于用户特征生成可读性解释，可以考虑利用知识图谱等技术建立起本地用户特征与全局物品特征之间的关联关系，对用户进行推荐与解释。此外，由于联邦推荐系统在不同的客户端上可以采用个性化推荐模型，亟须设计与模型无关的可解释推荐框架，在不传输客户端敏感信息、不逐一设计解释方案的前提下，给出全局推荐说明，以提高传统的推荐系统可解释性增强方法的可扩展性。

（2）联邦推荐系统的安全性证明与维护设想

传统的安全攻击与防御方法可以应用于联邦推荐场景的不同进程当中，如Ribero M等人详细阐述了差分隐私算法在联邦推荐系统通信环节中的应用， Hu H S等人则在本地处理环节引入了局部敏感哈希。针对恶意参与方污染或攻击聚合环节，Blanchard P等人提出的Krum方法与Mhamdi E M E等人提出的Bulyan模型参数聚合方法可以有效防御拜占庭攻击，但均牺牲了收敛速度和准确率，对每轮参与者的数量以及计算复杂度也有更高要求。具体地，针对联邦推荐场景研究更有效的防御方法，对于增强参与方的互信具有重大现实意义，值得更多的研究者关注。

（3）对更多深度学习推荐系统的联邦化改造

深度学习技术在推荐系统上已经得到了十分广泛的应用，采用深层神经网络结构的推荐模型能够学习到更抽象、更稠密的用户与项目的表示，以及二者交互的非线性结构特征，产生更精准的推荐结果。但是具体到与联邦学习结合的场景，大部分工作仍停留于协同过滤等传统推荐算法，对于各种深度模型的结合效果，特别是不同神经网络的梯度传输与聚合，需要不同的标准重新进行评估，以及继续探索联邦深度推荐系统的可能性。Wang H等人针对各种现代神经网络（如卷积神经网络、长短期记忆网络）的联邦学习环境，提出了通过匹配和平均隐藏元素，以分层方式构建共享全局模型的训练方法FedMA。这一方法有望被应用于更多使用复杂神经网络的推荐系统的联邦化改造上。

（4）在保护隐私的前提下充分利用用户数据

现有的联邦推荐系统大多仅使用了用户的物品交互信息，并在“数据孤岛”模拟方式上采取了简单的比例分割法，而现实情况往往更加复杂，诸如需要多少数据量才能共同训练出较精准的推荐系统、数据在客户端间的不同分布情况会如何影响联邦推荐系统的性能、传统推荐器使用的额外数据（社交数据、时空数据等）在联邦推荐系统中是否仍然有效等问题仍未得到解答。

（5）制定符合实际的参与方贡献评估策略

由于联邦推荐系统使用多方数据共同产生推荐结果，不同客户端从这一联合训练过程中得到的收益并不相等，因此需要制定公平的定价策略，科学评估参与方的贡献，协调相关方的利益。传统的特征重要性评估方法只能评估全局特征的重要性，在联邦推荐系统上无法直接使用。最初的联邦推荐系统贡献评估方法多使用博弈论中的沙普利值（Shapley value， SV）作为衡量指标，但其计算复杂度过高，严重影响了模型收敛速度，增加了通信成本，并且其数值与使用的推荐模型强相关，同一参与用户在不同的模型下的SV也会不同。对于联邦推荐场景，至今仍缺少多数人认同的贡献评估策略，这对于联邦推荐系统的应用落地仍是巨大的阻碍，是值得学术界与工业界关注的研究方向。

（6）利用联邦学习进行跨领域信息融合的推荐

随着数据时代的到来，用户无时无刻不在多个领域产生数据，但现实中融合同一用户在不同平台上的数据进行跨领域推荐往往止步于平台间的不互信甚至对立，用户隐私保护法规往往也限制了多领域知识的融合。借助联邦学习打破“数据孤岛”的能力，并结合深度学习技术，可以将不同平台间的各类数据以嵌入式表示等方法构建深层预测模型，并共同训练产生令人满意的推荐结果。未来，如何更好地利用联邦学习融合跨领域信息，有效缓解数据稀疏问题与冷启动问题，将是联邦推荐系统的重点研究方向。

4 结束语

现有文献在发展联邦推荐系统方面已经付出了很多努力，对当前的联邦推荐系统进行完整的概述和总结是很有意义的。受以前的联邦系统的启发，笔者概述了基于联邦学习的推荐，讨论了几种最新的联邦推荐系统的独特属性和相关的挑战。在此基础上，还对现有的联邦推荐系统的特点和设计进行了比较，并对联邦推荐场景的研究方向做了展望。可以预见，在不久的将来，联邦推荐系统将打破壁垒，充分利用所有的数据，在保护各方数据安全的前提下进行准确的推荐，人们获取目标信息的效率将发生巨大的变化。

作者简介

朱智韬（1996-），男，中国科学技术大学硕士生，平安科技（深圳）有限公司算法工程师，中国计算机学会（CCF）会员，主要研究方向为人工智能、联邦学习和推荐系统等。

司世景（1988-），男，博士，平安科技（深圳）有限公司资深算法研究员，中国科学技术大学硕士生企业导师，CCF会员。发表机器学习、大数据和人工智能领域国际核心论文20余篇。

王健宗（1983-），男，博士，平安科技（深圳）有限公司副总工程师、资深人工智能总监。CCF理事、杰出会员，CCF大数据专家委员会委员，主要研究方向为联邦学习、深度学习、云计算、物联网和元宇宙。

肖京（1972-），男，博士，平安科技（深圳）有限公司首席科学家，深圳市政协委员，中国计算机学会深圳会员活动中心副主席，清华大学、上海交通大学、同济大学、香港中文大学、深圳大学、上海纽约大学客座教授，长期从事人工智能与大数据分析挖掘相关领域研究工作，发表计算机图形学、自动驾驶、3D显示、医疗诊断、联邦学习等领域国际核心论文230余篇，授权专利220余项。

联系我们:

Tel:010-81055448

010-81055490

010-81055534

E-mail:[email protected]

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

转载、合作：010-81055307

大数据期刊

《大数据（Big Data Research，BDR）》双月刊是由中华人民共和国工业和信息化部主管，人民邮电出版社主办，中国计算机学会大数据专家委员会学术指导，北京信通传媒有限责任公司出版的期刊，已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊，以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录，并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号，获取更多内容

你可能感兴趣的:(算法,大数据,dbcp,机器学习,人工智能)

分布式系统ID生成方案深度解析：雪花算法 vs UUID vs 其他主流方案可曾去过倒悬山算法后端
分布式系统ID生成方案深度解析：雪花算法vsUUIDvs其他主流方案在分布式系统中，如何高效生成全局唯一ID是一个关键挑战。本文将深入剖析雪花算法、UUID及多种主流ID生成方案，帮助开发者根据业务场景选择最佳方案。一、为什么需要分布式ID？在分布式系统中，传统数据库自增ID存在明显瓶颈：单点故障：依赖单数据库实例扩展困难：分库分表时ID冲突安全风险：连续ID暴露业务量性能瓶颈：高并发下成为系统瓶
电力行业 | 抽水蓄能场景下，百万测点数据如何统一采集与接入？ DolphinDB智臾科技物联网 dolphindb 数据库抽水蓄能电力数据采集数据接入
在电力行业，抽水蓄能是目前最成熟、已经大规模化应用、兼顾发电和储能的一项技术。为了保障电站的平稳运行，借助物联网、大数据等技术，对电站各类运行设备进行实时采集，如机组振动、油压波动、瓦温变化等生产监测数据，已成为电站稳定运维的重要技术手段。在之前的文章储能业|低成本部署！DolphinDB打造抽水蓄能一体化解决方案-CSDN博客中，我们介绍了DolphinDB在抽水蓄能场景中的全链路解决方案。今天
C#哈希加密：原理、实现与应用阿蒙Armon C#工作中的应用 c#哈希算法开发语言
C#哈希加密：原理、实现与应用在当今数字化时代，数据安全是每个应用程序都必须重视的问题。哈希加密作为一种重要的加密技术，在密码存储、数据完整性验证、数字签名等领域发挥着关键作用。本文将深入探讨C#中哈希加密的原理、常用算法以及实际应用，并通过代码示例展示如何在C#中实现哈希加密。一、哈希加密基础哈希加密（也称为哈希函数或散列函数）是一种将任意长度的输入数据转换为固定长度输出的算法。这个固定长度的输
java 学习底层代码算法好学且牛逼的马 java
#33写算法题黑马的视频争取简单的过一遍要考试啦密码的写底层代码秘密的底层代码有点长啊看不懂难找了几个视频课看看吧想看中文版jdkapi吧算了慢慢看先把几个顶级父类给看会了objectsystemstringstringbuilder算法单路递归packagecom.itheima.Recursion;publicclasssingleRecursion{ publicstaticvoidma
稳定币技术全解：从货币锚定机制到区块链金融基础设施 Ashlee_guweng22346 游戏区块链金融架构人工智能自动化 java
引言：稳定币的技术定位根据国际清算银行（BIS）2025年定义：稳定币是以法定资产或算法机制维持价值稳定的区块链代币，其本质是传统金融与加密技术的接口层。核心价值：解决加密货币波动性问题→成为DeFi生态的计价基准与结算工具第一章技术原理：稳定币如何实现“稳定”？1.1锚定机制的三类技术路径graphTBA[稳定币类型]-->B[法币储备型]A-->C[加密资产抵押型]A-->D[算法调控型]B-
Java 集合list 手搓底层源码好学且牛逼的马算法
#32Java八股集合基础用法掌握速通小林不是很全老韩详细底层byd课程质量一般八股文听书算法题不会写byd密码的还没开始看双指针技巧秒杀七道链表题目|labuladong的算法笔记等等熬夜看笔记实现底层代码后面非常长但是也只写到了list完map和set明天写collection这段代码展示了Java集合框架的核心接口层次结构。`Collection`是整个集合框架的根接口，定义了集合操作的基本
SQLite 数据库在大数据分析中的应用潜力数据库管理艺术数据库 sqlite 数据分析 ai
SQLite数据库在大数据分析中的应用潜力关键词：SQLite、大数据分析、轻量级数据库、嵌入式数据库、数据仓库、OLAP、性能优化摘要：本文深入探讨了SQLite这一轻量级嵌入式数据库在大数据分析领域的应用潜力。我们将从SQLite的核心架构出发，分析其在大数据场景下的优势和限制，并通过实际案例展示如何通过优化策略和扩展技术使SQLite能够处理大规模数据集。文章包含性能对比测试、优化技巧和实际
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
操作系统基本概念与进程管理：从入门到精通阿贾克斯的黎明软考软考
目录操作系统基本概念与进程管理：从入门到精通一、常见操作系统与计算机系统层次结构二、操作系统的概念、功能与特征三、操作系统的发展与分类四、进程管理（一）进程的状态与状态转换（二）前驱图（三）进程同步与互斥机制（四）信号量机制与PV操作（五）PV操作实现前驱关系（六）死锁（七）银行家算法在计算机的世界里，操作系统就像是一位幕后的“大管家”，默默管理着计算机的各种资源，协调着各种程序的运行。今天，咱们
C++快速排序算法详解与实现小小的博客排序算法 c++算法排序算法 c++排序算法
快速排序（QuickSort）是一种高效的排序算法，由英国计算机科学家东尼·霍尔（TonyHoare）于1960年发明。本文将详细讲解快速排序算法的原理和实现，并通过C++语言展示其代码实现。1.快速排序算法原理快速排序算法的基本思想是分治法（DivideandConquer），其核心步骤如下：1.选择一个基准元素（pivot），通常选择序列中的第一个或最后一个元素。2.将序列分为两部分，一部分是
使用LangChain构建智能应用：从入门到实战 afTFODguAKBF langchain python
引言在当今的人工智能时代，构建智能应用程序已经成为越来越多开发者的目标。LangChain是一个强大的工具，可以帮助我们快速开发基于大型语言模型（LLM）的应用。本篇文章将带你了解如何从零开始使用LangChain，构建一个简单的LLM应用程序，并逐步探索更复杂的功能。主要内容构建简单的LLM应用使用LangChain，我们可以快速构建一个简单的LLM应用程序。接下来，我将带你一步步实现。什么是L
Spring Cloud Ribbon核心负载均衡算法详解代码的余温 spring cloud ribbon 负载均衡
Ribbon作为SpringCloud生态中的客户端负载均衡工具，提供多种动态负载均衡算法，根据后端服务状态智能分配请求。其核心算法及适用场景如下：一、Ribbon负载均衡算法算法名称工作原理引用来源轮询(RoundRobinRule)按服务列表顺序依次分发请求，实现均匀分摊负载随机(RandomRule)从可用服务列表中随机选择一个实例处理请求加权响应时间(WeightedResponseTim
端侧开发详解初赛收官盛宴 | 2025高通边缘智能创新应用大赛第九场公开课来袭！阿加犀智能人工智能智能硬件
各位开发者、技术爱好者，2025高通边缘智能创新应用大赛即将迎来初赛阶段的最后一堂重磅公开课！诚邀大家于7月3日（星期四）晚8点，准时收看由瑞莎的嵌入式开发工程师张子烽（Morgan）带来的专题分享，共同探索端侧智能应用开发的创新技术路径。聚焦前沿平台掌握端侧智能开发流程本次课程将聚焦基于瑞莎DragonQ6A开发板的端侧人工智能应用开发。该开发板搭载高通跃龙™QCS6490平台（由阿加犀提供开发
后端技术：利用 MySQL 实现数据加密大厂资深架构师 Spring Boot 开发实战 mysql 数据库 ai
后端技术：利用MySQL实现数据加密关键词：MySQL数据加密、AES加密、数据库安全、数据保护、加密算法、密钥管理、SQL注入防御摘要：本文深入探讨如何在MySQL数据库中实现数据加密，保护敏感信息免受未授权访问。我们将从加密的基本原理出发，详细讲解MySQL支持的多种加密方式，包括AES、SHA等算法的实现方法。文章包含完整的代码示例和最佳实践，帮助开发者在实际项目中应用数据加密技术，同时讨论
【LeetCode】滑动窗口相关算法题在成都搬砖的鸭鸭 Golang刷LeetCode 算法 leetcode
目录1、介绍2、核心思想3、算法题【1】长度最小的子数组1、介绍滑动窗口算法是一种高效处理数组/字符串子序列化问题的技术，它通过维护一个动态的窗口来避免不必要的重复计算。2、核心思想1、窗口定义：使用两个指针表示当前考察的子序列2、窗口移动：右指针扩张，扩大窗口范围，包含新元素；左指针收缩，缩小窗口范围，排除旧元素3、状态维护：在窗口移动过程中维护关键状态信息3、算法题【1】长度最小的子数组Lee
快速排序（快排）实现及原理 hixiaoyang 排序算法算法 java
一、算法概述快速排序（QuickSort）是由TonyHoare在1960年提出的一种分治算法，平均时间复杂度为O(nlogn)，最坏情况下为O(n²)。它是目前实践中最高效的通用排序算法之一。核心思想：通过一趟排序将待排记录分隔成独立的两部分，其中一部分记录的关键字均比另一部分的关键字小，然后递归地对这两部分记录继续进行排序。二、算法原理1.基本步骤选择基准（pivot）：从数组中选择一个元素作
机器视觉_图像算法（六）——形状矩(Hu) 智能之心 #机器视觉_图像算法形状矩 opencv
图像形状矩：一个从一幅数字图形中计算出来的矩集，通常描述了该图像形状的全局特征，并提供了大量的关于该图像不同类型的几何特性信息，比如大小、位置、方向及形状等。一阶矩与形状有关，二阶矩显示曲线围绕直线平均值的扩展程度，三阶矩则是关于平均值的对称性的测量。由二阶矩和三阶矩可以导出一组共7个不变矩。而不变矩是图像的统计特性，满足平移、伸缩、旋转均不变的不变性，在图像识别领域得到了广泛的应用。一般由mom
重温经典第二弹（xdoj1175，xdoj1179） Owen_Q 搜索暴力枚举字符串
一转眼，记忆又来到了暑假。或许，这是一个这算是自己真正开始接触了解acm的一个时间点吧，各种算法数据结构，开始慢慢浮出水面。回顾当初，感慨万千。又找出了两道未ac之题，确实复杂度明显加强，思维性的进一步考验。Count思路：子串搜索问题，因为n和k大到2e5，因此，肯定是个单向处理不能回溯的问题，否则最坏n方的复杂度是难以接受的。对于单次搜索，考虑可以维护现有区间的元素，然后移位遍历向后搜索，对于
Golang数据结构与算法：实现经典算法的Go版本 Golang编程笔记 golang 算法开发语言 ai
Golang数据结构与算法：实现经典算法的Go版本关键词：Golang、数据结构、算法、经典算法、Go实现摘要：本文将带领大家深入探索在Golang中实现经典算法。我们会先介绍一些基础的数据结构和算法概念，然后用生动的故事和例子来解释这些概念，接着给出核心概念之间的关系。通过详细的代码示例，展示如何在Go语言里实现这些经典算法，还会介绍它们的实际应用场景、相关工具和资源，探讨未来的发展趋势与挑战。
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
目标跟踪存在问题以及解决方案选与握 #目标跟踪目标跟踪人工智能计算机视觉
3D跟踪一、数据特性引发的跟踪挑战1.点云稀疏性与远距离特征缺失问题表现：激光雷达点云密度随距离平方衰减（如100米外车辆点云数不足近距离的1/10），导致远距离目标几何特征（如车轮、车顶轮廓）不完整，跟踪时易因特征匹配失败导致ID丢失。典型案例：在高速公路场景中，200米外的卡车因点云稀疏（仅约50个点），跟踪算法难以区分其与大型货车的形状差异，导致轨迹跳跃或ID切换。技术方案：稀疏点云增强与特
AI原生应用领域反馈循环：助力应用持续进化 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native ai
AI原生应用领域反馈循环：助力应用持续进化关键词：AI原生应用、反馈循环、持续进化、数据驱动、用户体验摘要：本文围绕AI原生应用领域的反馈循环展开探讨。首先介绍了反馈循环在AI原生应用中的重要性，接着详细解释了反馈循环的核心概念及其相关要素。通过具体的算法原理和操作步骤展示了反馈循环如何在技术层面实现。以实际项目案例说明反馈循环在实际开发中的应用和效果。还探讨了反馈循环在不同场景下的应用，推荐了相
AI原生应用性能优化：混合推理的7个最佳实践 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 性能优化 ai
AI原生应用性能优化：混合推理的7个最佳实践关键词：AI原生应用、性能优化、混合推理、最佳实践、推理效率摘要：本文主要探讨了AI原生应用性能优化中混合推理的相关内容。首先介绍了文章的背景、目的、预期读者和文档结构等信息，接着对混合推理的核心概念进行了通俗易懂的解释，并阐述了各核心概念之间的关系，给出了核心概念原理和架构的文本示意图以及Mermaid流程图。详细讲解了核心算法原理和具体操作步骤，用数
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
c++STL库与快速排序浪子小院基础精讲 c++算法开发语言数据结构
什么是STL库STL=StandardTemplateLibrary，标准模板库，是一系列软件的统称。从根本上说，STL是一些“容器”的集合，这些“容器”有list,vector,set,map等，STL也是算法和其他一些组件的集合。前面已经学习过的中sort函数、中string类都是STL的内容。STL库还有很多内容，比如：向量（vector）、栈（stack）、队列（queue）、优先队列（p
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能自动驾驶 unix ai
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择关键词：AI伦理、自动驾驶、道德算法、电车难题、责任归属、技术监管、人机协作摘要：本文深入探讨自动驾驶技术发展过程中面临的伦理挑战，从经典的"电车难题"出发，分析AI决策系统在生死抉择中的道德困境。我们将剖析自动驾驶的伦理框架设计原则，探讨技术实现方案，并通过代码示例展示伦理算法如何嵌入自动驾驶系统。文章还将讨论法律责任划分、社会接受度等现实问题，最
利用大数据领域Doris提升企业数据决策效率大数据洞察大数据网络 ai
利用大数据领域Doris提升企业数据决策效率关键词：大数据、Doris、企业数据决策、数据处理、效率提升摘要：本文围绕利用大数据领域的Doris来提升企业数据决策效率展开。首先介绍了背景，包括目的、预期读者、文档结构和相关术语。接着阐述了Doris的核心概念、架构以及与其他系统的联系。详细讲解了Doris的核心算法原理和具体操作步骤，并给出Python代码示例。同时介绍了相关的数学模型和公式。通过
燕大《Python机器学习》实验报告：探索机器学习的奥秘温冰礼
燕大《Python机器学习》实验报告：探索机器学习的奥秘【下载地址】燕大Python机器学习实验报告下载这份实验报告是燕山大学软件工程专业的学生在进行机器学习实验时所编写的，内容详实，结构清晰，可以直接下载使用。报告中的实验数据和代码均经过验证，确保下载后可以直接应用于实际项目或作为学习参考项目地址:https://gitcode.com/Open-source-documentation-tut
Python 运用 Matplotlib 绘制动画图的流程 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib 开发语言 ai
Python运用Matplotlib绘制动画图的流程关键词：Python、Matplotlib、动画图、绘制流程、动画原理摘要：本文详细介绍了使用Python的Matplotlib库绘制动画图的完整流程。从背景知识入手，阐述了Matplotlib动画绘制的目的和适用读者群体，接着深入剖析了核心概念，包括动画的基本原理和架构。通过核心算法原理的讲解和Python源代码示例，展示了如何实现动画绘制。同
什么是 Paxos和Raft MonkeyKing.sun paxos raft
Raft和Paxos是两种经典的分布式一致性算法（ConsensusAlgorithms），广泛应用于数据库、分布式系统、微服务架构中，用来确保在多个节点中即使有部分节点故障，系统仍然可以就“某一值”达成一致（即：分布式共识）。它们不是区块链专属，但在联盟链、私有链或数据库复制系统中常被用来替代PoW、PBFT等共识机制。一、什么是Paxos？定义：Paxos是一种保证在部分节点失效或网络延迟时，
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理