京东数科技术说

一文读懂联邦学习的前世今生（建议收藏）

前言

联邦学习（Federated Learning）作为人工智能的一个新分支，为机器学习的新时代打开了大门。如果投票问人工智能和大数据应用领域有什么好玩又好用的新技术，“联邦学习”一定是排在前列的。

这项技术由谷歌在2016年首次提出，从2018年8月开始在国内快速发展和普及，截至2020年2月，有公开资料可查的联邦学习研究或应用单位已超过百家，阿里、微众、京东、腾讯、华为、平安等各领域的头部企业均在大力推进。身边做技术和业务的朋友都在说：忽如一夜春风来，联邦学习突然就在圈子里传播了，在聊天中不发表点联邦学习的看法都不好意思。

为什么联邦学习会突然冒出来、如此受欢迎呢？有以下几个重要的触发因素。

（1）国内外隐私保护法规的不断完善，使得移动互联网的企业决策者不得不重新规划未来的战略方向。这是因为移动互联网的生态价值在于其海量的用户数据，如果数据不能用于生产，整个行业将受到巨大损失和挫折。在谷歌提出联邦学习之前，欧盟就在探讨移动互联网的隐私数据保护问题，于2016年4月通过了《通用数据保护条例》，并于2018年5月强制实施，严格约束了个人隐私数据的收集、传输、保留和处理。才过半年，谷歌即被罚款5000万欧元，因为其收集和使用用户数据触犯了该条例。在中国，数据保护的法规也在不断完善。例如，全国信息安全标准委员会先后于2017年12月和2020年3月发布了两版《信息安全技术个人信息安全规范》，对个人信息收集、储存、使用作出了明确规定。大家应该还记得，在2019年10月份，几乎每个APP都在更新用户授权协议，令人不胜其烦，这就是因为相关法规趋严导致的。

（2）中国特色的市场环境促进了基于移动互联网的数字经济爆发式的发展，通过改善人们生产生活体验，数字经济获得快速增长并达到世界领先。例如，电商服务让我们足不出户买到生活物资，让购物更便捷、更省时间，特别是解决了出门难人群的采购难题；互联网金融实现了线上快速的风险评估和金融服务，解决了广大民众日常急用的借款需求；移动医疗使得远程问诊技术普惠大众，让患者可便捷地得到专家的指点，同时也极大地缩短了挂号、缴费等“排长队”流程的时间；个性化资讯、短视频、直播等新媒体内容极大地丰富了娱乐生活和社交，使得欢声笑语越来越多了。

2018年我国数字经济总量达31万亿，GDP占比达34.8%，数字经济已成为带动我国国民经济发展的核心组成。数字经济的关键在于数据和大数据分析技术。数据作为原料，大数据分析技术蒸馏出有价值的信息，进而帮助用户更快地找到需要的商品和媒体服务、为优质用户提供低息贷款、更准确的诊断疾病。在此次应对疫情的防控保卫战中，大数据正发挥着越来越大的作用，在科技助力下，相关部门可以尽早发现疑似病患、密切接触者，有助于及时隔离、切断传染源。然而，由于上述国内外数据隐私保护法规的推出，互联网数据分散在不同企业或者终端形成“数据孤岛”，不能直接共享或者交换，因此我们急需破解数据孤岛的技术。

在数据隐私安全保护需求和破解数据孤岛需求的背景下，联邦学习应时而生。它能够实现在不泄露隐私数据的情况下实现企业间的数据融合建模，成为解决上述问题的首选技术。

一、什么是联邦学习？

上面介绍了联邦学习的现状和用途，下面回答联邦学习是什么？与其他技术的区别在哪里？

从技术角度看，联邦学习是一种隐私保护的分布式机器学习技术，包括机器学习、分布式、隐私保护三个技术关键词。对这三种技术的研究已有几十年历史，但直到近年来，它们在工业实践中才做到真正结合并蓬勃发展。

1、机器学习

它是计算机从数据中寻找统计规律的过程，用于像人一样解决不确定性问题，比如在不同光照条件下判断出熟人及其名字（人脸识别）、依据对某人历史行为的评估决定是否借钱给他（风控准入建模）以及借多少（授信额度建模）等等。人的学习过程是从书本、老师以及实践探索中不断积攒经验，成为具有“智慧”的个体；机器学习与此略有不同，它的经验来源于大量的数据，接受某个领域的数据便可成训练成为该领域的“智能体”，例如，大量的人脸图像可以训练出人脸识别或身份认证系统。利用数据获得经验的过程称之为建模；利用经验对新数据做出估计或者预测的过程称之为推理。

机器学习可解决数字经济中的诸多问题，比如说克服因服务人员经历不足或情绪不佳影响产生的偏见和歧视。这是因为在大数据时代，机器学习可获得更加全面的数据和经验，据此提升社会服务的公正性。机器学习无需人工干预即可实现智能服务，因此还可以大幅提高生产效率。例如在618购物节中，京东智能客服7*24小时不间断地为数亿用户解答疑问，这是传统人工客服团队不可能做到的。

2、分布式

它指数据被分为若干份，各份数据的存储和计算都分布在不同位置。其中，不同位置包括不同的用户终端或者企业服务器。像手机、平板电脑这样的用户终端已逐渐成为人们生活的必需品，被广泛用于社交、获取新闻资讯、记录备忘、消遣消费等，其用户日均使用时长达到5小时（2018年移动互联网报告）。随着使用时间的增加，用户终端存储了大量的隐私数据，包括朋友聊天记录、浏览记录、日程安排、照片视频等。不夸张地说，这些数据从不同侧面展示了一个“数字化的你”。

数字化的好处在于让计算机更“懂你”，进而提供贴心的服务，例如推荐最想买的商品、找回遗忘的资料等。数字化的坏处在于隐私泄露，2019年央视3-15晚会就介绍了个人隐私信息通过手机App泄露的案例。因此，法规一般要求这些数据在非授权情况下只能存储在用户终端，或者授权情况下存储在对应的企业服务器，禁止泄露给第三方。在不传输隐私数据的前提下，分布式的机器学习可以使用存储在不同终端或者企业的数据，例如谷歌的GBoard移动键盘团队使用分布在150万用户终端的6亿个句子提升了手机输入法预测下一词的准确性，这让用户可以快速输入脑海中的字词，也能联想到新出现的流行词、缩写词等。通过这种分布式的方法，我们可以让用户享受大数据带来的良好体验，同时又能避免隐私数据的传输。

3、隐私保护

它是防止恶意攻击的盾牌。分布式的机器学习可以使用分布在不同终端或者企业的数据，虽然不会直接传输用户隐私数据，但是黑客（恶意的联邦成员）可以使用一些特殊的破解技术，利用建模阶段所需的大量中间值，推算出对应的原始数据，进而窃取联邦内的用户隐私。

隐私保护技术的主要思想是对训练过程的中间结果进⾏某种变换，以掩盖原始数据或改变其数据特性，⽐如连续性、分布规律等，从⽽使得恶意联邦成员的破解技术失效，同时还能保证诚实的联邦成员依然可以从数据中学习到经验。就相当于数据提供方将数据放入保险箱中进行传输，其他联邦成员无法打开箱子看到真实数据，但却可以在不解锁的情况下，对保险箱中的数据完成训练所需的操作；当训练完成后，数据提供方再开箱取出计算结果即可。这种理想的功能需要我们使用特殊的技术进行实现，其中常⽤技术包括差分隐私、同态加密等。简单来说，差分隐私对数据加上一定程度的随机噪声，例如将年龄从50改为46（-4）或者51（+1），这可使得某些破解技术失效；同态加密是将数据变换到另一个数域的技术，新数域的大小顺序、分布都会发生变化，所以不可能被破解出原始数据。

因此，联邦学习是机器学习、分布式、隐私保护三合一的交叉技术。与现有的分布式机器学习不同，联邦学习主要受制于原始数据分布在不同位置的严格约束，不能有任何泄露原始数据的风险，隐私保护技术是防止泄露的关键。

二、如何直观理解隐私保护技术？

这里我们以“百万富翁”设想为例，简单直观地说明隐私保护技术的需求和解决方案。这是个非常经典有名的案例，是由计算机界最有名的姚期智院士于1982年提出的数学难题。有意思的是，这个问题引发了更多的相关研究，并逐渐发展成为密码学的一个重要分支。“百万富翁问题”是这样的：两个争强好胜的富翁A和B在街头相遇，如何在不暴露各自财富的前提下比较出谁更富有？

这个问题的难点在于，两个富翁都不想暴露自己的财富数量，既不想直接告诉对方也不愿借助第三方机构的帮助。如何直观地解决这个问题？我们可以参考一种“变换”的方法。假设两个富翁（A和B）的财富都在 10 B$（100亿美元）以内，则我们可以简单地用十个盒子比较出A和B谁的财富更多。

首先，由A进行如下操作：给盒子贴上编号，并按照财富值放入水果，放置规则如下：如果编号等于财富值的盒子放入橙子，编号小于财富值的盒子放入苹果，编号大于财富值的盒子放入香蕉。假设A 的财富是3 B$，则放置结果如图所示。

然后，A给所有盒子上相同的锁（即要求开锁的钥匙是一样的，依靠钥匙不能辨别盒子的编号）。这里将财富值“变换”为锁在盒子里的水果，本质是一个加密过程。

接下来A下场、B上场，B知道A的操作是编号、放水果、上锁，但是不知道每个盒子装了什么水果。B要做的是选择与自己财富对应的盒子去除编号，并销毁其他盒子。这里去除编号的目的在于让A不知道B选择了哪个盒子,从而避免泄露B的财富数量。

最后，A和B同时上场，由A开锁打开剩下的无编号的盒子，这个盒子里对应的水果就能推断出谁更富有。这里基于水果推测结果，本质是一种解密过程。假设B的资产是5 B，则打开盒子获得香蕉，表明B更富有；假设B的资产是2 B，则获得苹果表明A更富有；假设B的资产是3 B$，则获得橙子表明A和B的财富是差不多的。通过这几个步骤，A和B都没有向任何人泄露自己的财富数量，但成功实现比较，这就是一种隐私保护的比较计算技术。

也许有读者会问，在这个解决方案中，B可以通过顺次比较的方式，最多9次就能破解A的财富是多少了。确实如此，这主要是因为这里只用到10个盒子，而我们可以通过增加盒子数量的方式增加破解的难度。在实际操作过程中，一般采用基于数论的密码学技术，这种技术的破解难度非常大，即使用最先进的计算机可能也需要数百年才能破解。

三、联邦学习效果如何?

在与其他团队进行技术交流时，我们发现很多朋友对联邦学习存在主观偏见：联邦学习的主要作用是合规地共享数据能力而不泄露用户隐私，依据经验和“没有免费的午餐”定律，隐私保护会损害机器学习的模型效果（例如预测准确性或排序性）。事实正好相反，联邦学习并不会损害模型效果，反而能够从如下两个方面提高业务模型的效果。

一方面，联邦学习理论上是可以获得最优解的，通过梯度下降迭代过程，可以实现联邦间的特征组合和交叉建模，从而解决如“异或”这样的非线性问题，这等价于把数据拼到一起后进行机器学习的效果。异或问题如下表所示：

表异或问题

传统的子模型法为了控制数据泄露的风险，往往只能带少量样本的标签（Label）到其他企业建模，然后融合双方子模型的输出分获得最终决策，这就如同盲人摸象每次只能看到一个侧面，效果难以达到最佳。对于上述异或问题，子模型发现无论特征（Feature）是“0”还是“1”，标签分别是“Bad”和“Good”的比例都是差不多的，因此子模型的判断准确率只有50%，这和扔硬币方式的猜测差不多。相比之下，联邦学习可以建立如下图所示的决策树模型，有效地解决异或问题的判断，准确率从50% 提高到100%。

图联邦决策树判别“异或”问题

另一方面，联邦学习由于能够保护数据隐私安全，因此无需限制建模样本的数量。也就是说，联邦学习可以使用更多的数据建模，因而能够基于大数据更有效地发现数据规律，提高模型效果。

上述两个方面从理论上表明，联邦建模效果优于传统子模型法。在行业实践的一个包含2家企业的联邦POC验证中，联邦学习相比于单侧模型的效果提升了13%，相比于传统子模型法也有4%的提升。也许有人质疑4%的相对提升并不高，但是，移动互联网市场环境表明，随着拓新增量市场见顶，流量红利耗尽，存量市场的竞争将变得异常激烈，对于存量市场的精细化运营成为企业赖以生存和发展的依靠，每一点提升都将具有重要意义。此外，这仅仅是2家企业联邦的效果，随着联邦成员数量增加，联邦模型具有更多、更互补的视角，效果将会获得更大的提升。

四、联邦学习的应用前景

广播、电视、互联网的相继出现，时空距离骤然缩短，世界紧缩成一个“地球村”，“连接”促成了生产效率的提升和社会经济的发展。例如，古有丝绸之路促进了中西方的经济文化交流，海上航线促进工业革命成果的传播和发展（19世纪前后），今有超过50亿用户的互联网推动着知识传播、技术进步和人机协作。联邦学习也是一种“连接”工具，用于连接联邦成员的大数据资产，具有非常广泛的应用价值。

医学研究需要这样的连接工具，这是因为医学研究往往需要大量的案例分析才能发现相关性和因果规律。例如笔者曾经研究的药物副作用挖掘项目，旨在发现在临床试验中未暴露的药物的副作用。一方面，该项目使用了一百万患者持续六年的就诊记录，但只能发现少量常用药物的副作用，对于那些不常用的药物，这个量级的数据还远远不够；另一方面，就诊记录属于患者隐私，医疗机构之间无法实现数据共享，这种医疗机构的“数据孤岛”阻碍了药物副作用的发现，这在事实上损害了患者的权益。

联邦学习有望在不泄露患者隐私的前提下，利用各个医疗机构的数据，加快发现药物副作用，从而减少对患者的损害。此外，医学影像标记与诊断、罕见疾病治疗、过敏源分析等，均有可能通过联邦学习获得更多的数据、找到更多的相关性，从而提高医学研究水平和疾病治疗效果。

移动互联网也需要这样的连接工具，因为用户往往希望APP能够提供更便捷的服务。例如，在使用搜索引擎时，我们希望一次找到“最佳匹配”的网站，希望在购买商品时得到“最合适”的推荐，在网上聊天时快速输入“热门”词汇，在浏览信息时获得“最需要”的新闻和视频，希望在换工作时能找到“最默契”的团队和职位。这种“懂你”的贴心服务往往需要利用多个方面的数据，包括社交、娱乐、消费、出行等，而这些数据属于用户隐私，存储于不同的用户终端或者企业。联邦学习能够在不泄露用户隐私的前提下，连接不同企业的数据，为用户提供更贴心的服务。

金融是联邦学习实现产业落地的重要场景，因为金融对大数据技术和创新需求非常大，占大数据市场规模的10%以上。由于基于信用卡的消费信贷模式单一，银行无法满足消费者和小微企业多样化的金融信贷需求。为了接近和理解用户，大型银行可以通过自建并运营移动互联网APP，提供购物、缴费、理财等生活服务，然后根据用户数据的规律不断迭代，提高综合服务水平。

然而，移动互联网APP的建立和运营需要大量的投资和快速的迭代，这对中小银行来说是一个挑战。与传统银行机构依据收支流水授信的方式不同，联邦学习能够综合利用银行收支流水和互联网大数据更好地分析用户“还款意愿”和“还款能力”，有效识别信誉不佳的用户，从而降低信贷坏账造成的成本，从而为更多的优质用户提供低息贷款，促进民众消费升级和小微企业的发展，实践国家号召的普惠金融。

目前，多家大型金融企业正在展开联邦学习技术的战略布局和应用，推出了具有行业影响力的行业解决方案和项目。例如，已有联邦学习开源项目吸引了大量开发者和应用者，在保险科技、信贷风控等场景下得到初步验证。这进一步加速了联邦学习的技术迭代和落地。

此外，从业务形态的角度来看，联邦学习的基础在于组建联邦，只有联邦的数据足够互补和完整才能形成规模效应，赢得市场竞争。联邦的关键在于信任，一方面，这依托于联邦学习技术本身的安全性，隐私数据不可能被恶意联邦成员破解；另一方面，这需要参与方有开放合作的态度，能够不断地宣传推广联邦学习技术以及业务价值，以便更多的人能理解和使用这项技术。就像区块链一样，用的人越多，价值就越大。如果这项技术能够得到参与者的积极宣传，“众人拾柴火焰高”将使得这项技术得以迅速推广。

五、应用部署难点和趋势

目前尚未出现大规模联邦学习商业化应用，原因在于以下几个方面的难点。

（1）网络带宽不足，用户终端或者企业之间的现有网络带宽难以满足联邦学习的需要。这是因为联邦学习需要非常大量的中间结果交互，在某些场景下需要超过100Mb/s的网络带宽才能在有效的时间内完成建模。例如，我们在与客户沟通时发现，某些银行仅支持2Mb/s的网络带宽，在样本量较大的情况下，这可能导致建模时间长达数月，无法满足业务的需求。不过我们认为，随着5G技术的发展和信息高速公路的建设，网络带宽问题将会很快解决。

（2）政府和行业协会尚未发布正式的标准和法规，企业和金融机构对新技术存在顾虑。正在立项过程中的联邦学习标准包括IEEE 3652.1, IEEE P2830，待其正式发布后将具有全球公认权威性。此外，京东等企业也在积极参与和推动中国的联邦学习相关的国家标准立项。随着技术标准的完善和实施，企业和金融机构不再有顾虑，联邦学习将如同RSA非对称加密等新技术的应用一样无处不在。

（3）技术门槛较高。虽然市面上已有联邦学习商业解决方案和开源项目，但其稳定性和准确性方面还存在不少异常问题和挑战，需要频繁的更新迭代。常见的移动互联网服务是面向C端消费者的，以企业自身的快速迭代为特征，因此对错误的容忍性较高。然而联邦学习需涉及多个企业，对应的解决方案需面向B端企业，并且需要企业间生成集群和研发人员进行配合，这使得联邦学习合作对异常问题的容忍度非常低。此外，企业需要投入较多的人力资源对联邦学习进行安全性审核、部署、调试和优化，这导致中小企业不能快速使用联邦学习。针对这个问题，包括京东在内的大型企业在投入大量资源研发简单易用的商业解决方案，技术门槛正在逐步降低。

（4）商业模式待探索。联邦学习能够解决数据孤岛问题并提升服务质量，进而产生社会价值和业务利润。然而，联邦学习仍处于探索中，还没有可供参考的大规模商业应用，如何评估各个成员对联邦的贡献、如何进行利润分配仍然是个开放的问题，需要联邦成员进行探索和协商。这一点将在互联网大数据业务需求的驱动下逐渐明朗。

综上所述，联邦学习当前仍面临很多难点，但是在巨大的应用前景的驱动下，正在快速化解。我们认为，联邦学习将利用互联网大数据浪潮，在不泄露用户隐私的前提下，为广大用户带来更优质的服务。

六、联邦学习技术实践方法

为了同时满足隐私保护和模型训练的需求，联邦学习具体是如何实施呢？

回顾联邦学习的概念，它是一种隐私保护的分布式机器学习。根据分布形式的不同，联邦学习可分为两种常见的应用类型：横向联邦学习和纵向联邦学习。横向联邦学习是指当样本分布在不同位置时，通过约束各个位置使用相同特征，分别建立同质模型并进行融合的建模方式；纵向联邦学习是指当特征分布在不同位置时，通过约束各个位置使用相同的样本，从而实现多个视角联合建模的方式。

例如，典型的纵向联邦学习技术的实施方法如下图所示。

这个联邦包括两个成员：企业A（左侧）和企业B（右侧）。从下往上看，对于每个共有用户，企业A提供某个视角的特征X1和标签Y，企业B提供补充视角的特征X2。为了利用双方特征建立模型，传统机器学习要求将双方将每个用户的特征拼接为（X1, X2, Y），但是这种方法能够见到对方用户的具体特征，从而造成用户隐私信息泄露。与传统机器学习不同，纵向联邦学习分别在企业A和企业B部署两个容器（此处简称为联邦模盒），双方分别将数据存放于联邦模盒之中，如上图中部所示。

在训练阶段，由包含标签Y的一方发起模型训练请求，通过基于同态加密中间计算结果的梯度下降算法实现建模。值得注意的是，这里传输的并非原始隐私信息，而是经过加权计算的中间结果，并使用同态加密技术进行双重保护，因此具有非常好的安全性。建模产生的模型被分布式地存储在两个联邦模盒之中，其中与企业A的特征相关的部分模型存储于联邦模盒A中，与企业B的特征相关的部分模型存储于联邦模盒B中。

在推理阶段（上图的上部所示），由包含标签Y的一方发起打分请求，双方依据各自的特征和部分模型计算某种形式的中间状态，并在企业A汇总形成最终得分。尽管模型分布式地存储在不同位置，但从结果上看，这与整合模型打分的准确性是一致的。同时由于打分过程中看不到对方的原始隐私信息，因此推理阶段也是安全的。

联邦学习是一种隐私保护的分布式机器学习技术。其中，隐私保护是联邦学习的关键，这是因为传统的分布式机器学习虽然可以实现联邦成员之间的大数据建模，但是容易被黑客破解，导致⽤⼾隐私泄露。密码技术是最常见、最有效的隐私保护方法，可以兼顾数据的可用性和隐私安全性。

七、密码技术的那些事儿

密码（crypto）的概念由来已久，但与我们的手机解锁“密码”或者WiFi“密码”不同。这些由我们自己设置、用来验证身份的数字或者字母的组合，并非真正意义上的密码，而是“口令”（password）。与简单的口令相比，密码技术则是指通信过程中的一种混淆技术，将明文的消息转变为第三方不可识别的消息，在通信过程被窃听时，防止消息的机密性被泄露。准确地来说，密码技术将明文消息加密成密文，发送给通信的接收方，接收方在收到密文后使用密钥进行解密，从而恢复明文。

然而，看似复杂的密码其实并不神秘，反而与我们的生活息息相关。

电影《唐伯虎点秋香》中的一首"我爱秋香"便是一种安全性较弱的“密码”，将真实含义（明文）隐藏在每句诗的头部，这种隐藏的逻辑便可视为密码系统中的“密钥”，不知道这个逻辑的人看到的只是一首刻画风景的诗（密文），从而起到了隐藏“话外之音”的作用。

我画蓝江水悠悠，爱晚亭上枫叶愁。秋月溶溶照佛寺，香烟袅袅绕经楼。

由此可见，密码对我们来说并不陌生。它源于人类生活中对隐私和机密性的需求，最终也发展成为了一门系统的科学，服务于人类的社会活动。纵观密码学的发展，可将其大致分为两个阶段：古典密码学和现代密码学。其中现代密码学又可分为两个分支：对称密码学和公钥密码学。

古典密码学的历史可以追溯到古罗马时期，凯撒大帝曾将简单的字母移位方法作为加密手段，用于军事活动中，保护战时通信的机密性。该方案被称为凯撒密码。由于凯撒密码中所有的字母移位的顺序和位数都是相同的，其破译难度较低，为了提高安全性，在凯撒密码的基础上演变出了维吉尼亚密码，在字母移位时，不同的字母进行不同数量的移位，从而降低了使用密文统计特性进行破译的风险。

图：凯撒密码轮盘

以凯撒密码和维吉尼亚密码为代表的移位密码体制，其构造都十分简单，但人工计算时难免容易出错，且效率较低。20世纪20年代，人们开始使用机械设备自动处理加密。比如二战时期德军使用的Enigma密码机，给盟军的密码破译工作带来了很大的难度。

图 Enigma密码机

随着人们对密码方法的研究逐渐深入，密码攻击手段也越来越多，另外由于计算机的出现以及人类计算能力的大幅提升，古典密码方法的安全性已经不能满足现代人类的需求。但是，古典密码学的不断发展，为密码学的进一步研究提供了思路。

1949年Shannon发表了《保密系统的信息理论》一文，这标志着密码学的研究进入了现代密码学阶段。从此，密码学不再是一门艺术，而成为了一门系统的科学进入了人们的视野。如上文所说，现代密码学又可以分为两个分支：对称密码学和公钥密码学。而1976年则是现代密码学发展过程中一个重要的时间节点。

1976年之前，现代密码学的研究主要集中在对称密码学方向。所谓“对称”，是指加密方和解密方使用的是同一个密钥。在对称密码学后续的研究中，出现了两个较为著名的对称密码方案，分别为DES密码体制和AES密码体制。由于计算能力的提升，目前暴力破解DES成为了可能，因此AES代替了DES成为了新的加密标准并沿用至今。

尽管以AES为代表的对称密码方案有着足够高的安全性，但由于加解密的双方使用共同的密钥，如何让双方在不安全的信道上共享这一密钥，是对称密码学面临的一个问题。1976年Diffie-Hellman密钥交换协议的提出，为这一问题提供了解决思路，同时标志着密码学的新方向——公钥密码学的诞生，将现代密码学的研究带入了一个全新的发展阶段。

公钥密码学又称为非对称密码学，顾名思义，加解密的双方不再使用同一个密钥。其中加密方使用公开的公钥对明文消息进行加密，在解密方收到密文后，使用私钥进行解密。由于私钥只有解密方持有，因此即使存在恶意敌手窃听到了密文，也无法获得明文的信息。典型的公钥密码方案包括RSA、Paillier等经典的方案，以及目前在学术界广受关注的基于格的后量子密码方案等等。

图对称加密和公钥加密对比

对称密码方案和公钥密码方案的区别不仅仅在于加解密的密钥是否相同。由于两类方案使用不同的加密体制，其应用场景也有着明显的区别。一般来说，由于对称密码方案加解密效率较高，经常应用于文件和数据的批量加密，而公钥密码方案通常有着密钥冗长和效率较低等特点，多应用于密钥分发和数字签名等功能性设计中。

另外，在公钥密码学的发展过程中，也出现了两个重要的分支，即全同态加密和安全多方计算。这两个密码学的分支不仅为传统的机器学习提供了新的发展方向，也为很多复杂业务场景的实现提供了思路。

八、联邦学习的加密原理

我们知道，机器学习一般使用梯度下降算法实现模型的最优化，联邦学习也是如此。梯度可表示（或者近似）为加法和乘法的混合运算，因此联邦学习的本质需求是加法和乘法运算进行保护。

如前所述，同态加密技术可满足该需求。具体来说，对数据进行同态加密所获得密文可进行加法和乘法操作，结果解密后与数据直接进行加法和乘法的结果是一致的。其中，同时满足加法和乘法的方法称为全同态加密，只能满足其中一种（加法或者乘法）的称为半同态加密。由于全同态加密计算复杂度特别高，联邦学习一般使用半同态加密，比较常见的是Paillier半同态加密，满足如下性质的加法同态：

其中：[·]表示Paillier加密操作，前者称为加法同态，后者称为数乘同态，数乘事实上是多个相同数值的加法。

有了这两个性质，就可以解决分布式学习所需的各种隐私保护计算了，例如基于梯度下降的迭代优化。以包含两个成员（A和B）的联邦线性回归场景为例， A方的梯度计算式核心部分如下：

上式包含加法和乘法两种运算，可使用加法同态和数乘同态实现。值得注意的是，这里的加密还具有非对称加密的性质，密码包括<公钥，私钥>，使用公钥加密的数据只能通过对应的私钥解密。表示用A的公钥加密，这个公钥会共享给联邦成员，联邦成员可以使用这个公钥对数据进行加密，得到的密文只能由A通过自己的私钥加密；同理，使用B的公钥加密得到的密文只能由B解密。

式子（3）可分级为如下步骤进行计算。

针对线性回归模型，联邦学习梯度下降算法的交互过程（A方）如下图所示。

在移动互联网时代，基于大数据的智能技术让我们的生活更便捷、娱乐更丰富、生产更高效，唯一不足在于潜在的隐私泄露。在隐私数据保护相关法规推动下，联邦学习如雨后春笋般在各大企业快速成长，成为解决隐私数据保护和数据共享矛盾的关键技术。

如果说大数据是互联网时代的燃料，那么联邦学习就是互联网时代的多缸发动机，促进互联网应用提供更优质的服务。

移动互联网时代的数据共享是一个博弈问题，一方面需要多方合作数据能力提升服务水平，另一方面又需要防止数据泄露造成法律责任和资产损失。密码和联邦学习提供了一种解决方案，通过技术手段提供足够的信任，完全不必猜疑，使得任意企业之间能够形成联邦合作。

你可能感兴趣的:(联邦学习,联邦学习,大数据,分布式机器学习,隐私保护技术,密码学)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少