a44267113

读论文：大数据计算环境下的隐私保护技术研究进展

标题: 大数据计算环境下的隐私保护技术研究进展
作者: 钱文君，沈晴霓，吴鹏飞，董春涛，吴中海

文章目录

==Abstract==
==Introduction==
==综述==
- 一、大数据计算环境现状及隐私问题
- - 1.1 大数据计算环境现状
  - 1.2 隐私问题、挑战与主要研究方向
  - - 1.2.1 敌手模型
    - 1.2.2 问题与挑战
    - 1.2.3 主要研究方向
- 二、基于数据分离的隐私保护
- - 2.1 基于敏感数据标记的分布式计算
- - 2.2 基于数据分离的联邦学习
  - 2.3 小结
- 三、基于数据干扰的隐私保护
- - 3.1 数据匿名技术
  - 3.2 差分隐私技术
  - - 3.2.1 基于 LDP 的隐私保护
    - 3.2.2 基于 CDP 的隐私保护
  - 3.3 小结
- 四、基于安全多方计算的隐私保护
- - 4.1 基于混淆电路的安全多方计算
  - 4.2 基于秘密共享的安全多方计算
  - 4.3 基于同态加密的安全多方计算
  - 4.4 小结
- 五、基于硬件增强的隐私保护
- - 5.1 基于硬件增强的大数据计算框架
  - 5.2 基于硬件增强的计算性能优化
  - 5.3 小结
- 六、基于访问模式隐藏的隐私保护
- - 6.1 基于ORAM的不经意计算
  - 6.2 基于不经意混洗的不经意计算
  - 6.3 小结
- 两种实现不经意计算的技术对比分析如下 (1)**ORAM**通过将每一次读或者写访问都随机地转换为一次读取和一次写回操作，使得攻击者无法区别数据的具体访问方式，从而隐藏了处理器访问内存的操作序列和地址序列访问模式。然而，由此带来的额外操作在实际应用中往往带来较高的计算开销，严重制约了其实际应用； (2)**不经意混洗**通过对数据的重排列使得攻击者无法关联输入数据和输出数据的分布，从而阻止攻击者判断计算过程中的访问模式。在基于 IntelSGX 硬件支持的条件下，采用不经意排序或者级联混合网络手段实现不经意混洗方法要比 ORAM 高效的多； ![](https://img-blog.csdnimg.cn/023cd8d0a4324424904c56408d7e82ac.png)
==总结==
==未来展望==

Abstract

批处理、流式计算和机器学习等分布式的大数据计算环境在云上的广泛部署与应用，给云用户带来许多前所未有的便利的同时，也使得信息泄露时间越来越频繁。如何在这种云上部署的大数据计算环境下保护数据隐私成为一个研究热点，而本文也正是针对这一话题来 对国内外的最新研究成果 来进行全面综述：本文从计算过程涉及的数据输入、计算和输出等三个环节出发，依据计算数据为明文、密文或可信硬件保护条件下可能存在的隐私泄露风险，总结了对应的 5 类主要研究方向 ：基于数据分离的隐私保护、基于数据干扰的隐私保护、基于安全多方计算的隐私保护、基于硬件增强的隐私保护和基于访问模式隐藏的隐私保护等；从隐私性、可用性、性能等方面对比分析了现有研究工作的优缺点；最后对于大数据环境下隐私保护技术的未来发展方向进行了一定的展望；

Key words: 大数据隐私保护；数据分离；数据干扰；安全多方计算；硬件增强；访问模式隐藏

Introduction

随着云计算与大数据技术的发展，现在许多云服务提供商都支持云端部署分布式存储和计算框架，主要包括：批量计算框架(针对⼤规模数据的批量处理)、流式计算框(针对流数据的实时计算处理)以及机器学习框架(针对构建机器学习模型)等，以上这些技术都为用户提供持续可靠、可扩展且高吞吐量的大数据存储和计算服务。
缺点：由于 数据所有权和使用权的分离 ，在计算过程涉及的 数据输入、计算和输出 等阶段都有可能发生隐私数据泄露的风险——>如何在大数据计算环境下保护敏感数据的隐私性（privacy），同时保证数据的可用性（utility）和计算的高效性（efficiency）成为大数据隐私保护领域的研究热点之一;
隐私泄露问题：数据输入阶段的原始数据（raw data）隐私泄露，计算过程中的隐私数据被攻击者窃取，以及不可信的数据消费者在结果输出阶段试图推断出数据隐私;
应对手段：
(1)在数据输入阶段，目前有效的保护隐私手段是采取数据分离/数据干扰等方法：数据分离方法主要考虑到隐私数据的位置，一般将数据所有者的 非敏感数据上传到公有云，敏感数据被分离到本地的私有云 ——>但是在实践中这种方法往往会增加两种云服务间的开销，并且其通信数据有被截胡的风险；数据干扰方法则采用了本地化差分隐私（Local Differential Privacy, LDP）技术，它通过对敏感信息进行本地化随机响应，达到干扰真实数据的效果——>在云端对失真数据（经过一系列操作后与真实数据有偏差的数据）进行分布式计算会严重地影响结果的准确性，而这也使如何在这一方面进行改进成为了热门问题；
(2)在数据计算阶段，通常会采用加密传输的方式来保证数据的机密性和计算隐私性，此外还要结合安全多方计算（SMC）、硬件增强或者访问模式隐藏等主流方法实现隐私计算。其中，设计SMC需要依赖需要依赖混淆电路（Garbled Circuits, GC）、秘密共享或者同态加密（Homomorphic Encryption, HE）等密码学技术，在互不信任的多个参与方之间协作计算时，SMC 保证任何一方都无法窃取其他各方的数据隐私。特别地，同态加密使得在密文上执行计算成为可能，即密文计算——>是在实际应用中，对于复杂的计算任务其执行效率较低且计算开销较高——>学术界一边对更加实用且高效的安全多方计算协议开展研究，另一方面依赖可信硬件保护提出“加密传输-明文计算”的优化策略，其中最有代表性的当属Intel SGX，这是一种硬件增强方法，它为明文计算提供了安全的可信执行环境(TEE)，这项技术既能保护数据的机密性和隐私性，也保证计算代码的安全执行，但是攻击者还是可以通过观察内存层的访问模式和网络层的访问模式，进一步地推测出数据隐私——>主流访问模式隐藏技术：不经意随机访问机（Oblivious RAM, ORAM）和不经意混洗（oblivious shuffle），他俩能够实现不经意计算，防止攻击者观察计算过程中的访问模式；
(3)在计算结果输出阶段，主要采用数据干扰方法来解决输出隐私问题，比如数据匿名和中心化差分隐私（Centralized Differential Privacy, CDP）技术——>但是干扰数据会影响数据的可用性，因此需要考虑隐私性和可用性权衡问题；

本文重点梳理了与大数据计算环境相关的隐私保护研究工作，如下图所示：

展示了不同隐私保护技术之间的联系与分类依据。文章于从计算过程涉及的数据输入、计算和输出等三个环节出发，依据计算数据为明文、密文或可信硬件保护等条件下可能存在的隐私泄露风险和技术挑战，将分离执行、联邦学习、差分隐私、安全多方计算、Intel SGX 等主流的隐私保护技术划分为 5 大类，包括基于数据分离的隐私保护、基于数据干扰的隐私保护、基于安全多方计算的隐私保护、基于硬件增强的隐私保护和基于访问模式隐藏的隐私保护等。每一类隐私保护技术侧重于解决不同阶段所面临的隐私问题，并依赖不同的解决思路

差分隐私通过 拉普拉斯、指数和随机响应 等扰动机制干扰数据，保证数据输入阶段或输出阶段隐私；
安全多方计算依赖 混淆电路、秘密共享和同态加密等密码学手段 ，设计协议保证计算过程中数据的机密性；
联邦学习通过 在本地联合训练模型 保护训练数据的隐私，但是已有研究表明联邦学习存在着参数泄露的风险，需要进一步地依赖差分隐私或者安全多方计算等技术保护训练阶段的模型隐私；
Intel SGX通过提供可信的执行环境保证数据以明文形式计算的安全性；

综述

一、大数据计算环境现状及隐私问题

1.1 大数据计算环境现状

经典的基于云的大数据计算环境的参与角色可以分为：数据所有者（data owner）、数据持有者（data holder）、云服务提供商、数据消费者（data consumer）。一般都吧前两者看作同一方，称为数据提供方。但是在实际场景中，他们仨往往都不是同一方，他们的关系是：

(1)数据所有者：生成和创建原始数据的实体，对原始数据具有所有权，负责控制其数据的生成、收集和共享；
(2)数据持有者：经过认证和授权持有数据的实体，一般情况下，能够生成或创建文件的数据持有者也被视为数据所有者，可以认为是同一个实体；
(3)云服务提供商：它以按需付费的形式为数据持有者或者数据消费者提供各种各样的资源和服务；
(4)数据消费者：也称为云用户，经过数据所有者授权对数据具有使用权；
而云服务提供商所提供的框架主要有如下几种：
(1)批量计算框架：批量计算的特点是数据存储后再集中离线计算，即计算跟着数据走，适合延时较高的静态数据处理场景；
(2)流式计算框架：流式计算的特点是数据流到来后直接在内存中实时计算，不再对流式数据进行永久化存储，即数据跟着计算走，适合低延时或实时的流数据处理场景；
(3)机器学习框架：它支持基于大规模数据集的模型训练和预测服务，适合集中式学习或者联邦学习场景；

1.2 隐私问题、挑战与主要研究方向

1.2.1 敌手模型

根据敌手角色的不同，可以分为不可信的云服务提供商和不可信的数据消费者，他们的攻击能力又可以分为恶意敌手(主动攻击)和半诚实敌手(被动攻击)；

1.2.2 问题与挑战

大数据计算环境下的隐私泄露问题：

数据输入阶段的原始数据隐私泄露，简称输入隐私问题；
计算过程中的机密数据被攻击者窃取，简称计算隐私问题；
不可信的数据消费者在结果输出阶段试图推断出隐私数据，简称输出隐私问题；

挑战问题以及对应解决方法：

数据输入阶段的隐私泄露：敏感数据保留在本地私有云进行存储及计算，而非敏感数据可以选择是否上传到公有云；
云服务提供商不可信：原始数据在本地去隐私即脱敏之后再到云平台进行计算；云服务提供商可信但是数据消费者不可信，计算结果需要在脱敏之后再发布给数据消费者；
计算过程中不可信的云服务提供商会窃取隐私数据：数据加密传输并被密文计算；
密文计算给大数据处理带来了计算开销和通信开销的性能瓶颈：更倾向于数据被加密传输但在 CSP 受信任的硬件环境高效地执行明文计算；
即使数据被加密传输且仅在可信环境下执行明文计算，攻击者也可以观察内存层的访问模式和网络层的访问模式：相应的隐私保护技术主要是基于ORAM 或者不经意混洗等技术隐藏访问模式

1.2.3 主要研究方向

文章调研了近年来发表在信息安全顶级会议/期刊上关于大数据计算环境下隐私保护技术的国内外研究进展，总结了 5 个研究方向：

(1)基于数据分离的隐私保护：考虑到敏感数据或者全部原始数据在本地或者私有云环境被处理的隐私保护需求，该类研究方向主要借助数据分离技术抵抗不可信的CSP，解决了输入隐私问题；
(2)基于数据干扰的隐私保护：考虑到数据需要去隐私后发布到不可信第三方的隐私保护需求，为了抵抗不可信的 CSP 或者不可信的数据消费者，该类研究方向主要是在数据输入或者计算结果发布之前，利用数据匿名或者差分隐私技术泛化、压缩或者随机扰动真实数据，解决输入隐私和输出隐私问题；
(3)基于安全多方计算的隐私保护：考虑到云服务提供商不可信，需要数据加密上传后并密文计算的隐私保护要求，该类研究方向主要借助安全多方计算协议允许互不信任的参与方安全地执行联合计算，同时也不泄露计算数据隐私；
(4)基于硬件增强的隐私保护：由于密文计算在实际应用中面临性能瓶颈，考虑数据被加密传输但在 TEE 环境下执行明文计算的隐私保护需求；
(5)基于访问模式隐藏的隐私保护：由于 IntelSGX 技术在实际应用中面临侧信道攻击，例如切换内存页会暴露内存层访问模式，计算节点间的通信流量会暴露网络层访问模式；

二、基于数据分离的隐私保护

定义： 根据数据的敏感性分离存储和计算数据，该方法保证了敏感数据在本地或者私有云环境被安全高效的处理，而不会被迁移到不可信的公有云环境

2.1 基于敏感数据标记的分布式计算

主要思想： 首先对原始数据中包含的敏感数据进行标记，将数据划分为敏感数据集和非敏感数据集；然后将在不同数据集上的相关计算任务也进行划分，并将非敏感数据及其相关的计算任务外包到公有云存储并计算，而小规模的敏感数据及其相关的计算任务保留在本地或者安全的私有云执行；
主要的挑战点：
(1)数据的敏感性标记：一方面需要依据数据所有者的隐私保护需求对原始数据集打标签，另一方面，对于大规模数据集而言，标记效率也是值得思考的问题；
(2)混合云中的分离执行：由于缺失支持混合云环境的计算框架，迫使编程人员需要手动分割并提交每个计算任务到公有云或私有云，这严重地妨碍了数据代码的重用；
解决方法：
(1)针对敏感性标记方法：使用两种不同标签将输入数据划分为敏感和非敏感两个部分，但是要在作业执行前手动标记，影响效率；于是就有其他学者提出了一种能够根据安全等级自动划分和执行任务的框架；但是数据在计算过程中的敏感度也会发生变化，就有科学家提出了相应的数据标记方法；
(2)混合云中的分离执行模型：使用了一种可以提供四种分离执行策略的安全计算框架，但是其效率低下并且开销较大；于是就有人提出了采用自动化分析和代码转换技术的方法，但是这又限制了其扩展性，不适用于处理复杂问题；为此，又有科研人员提出采用更细粒度的元组标记策略；

Map 混合：敏感数据的map 阶段在私有云中执行，非敏感数据的 map 阶段在公有云中执行；
水平分割：数据存储在私有云，map 阶段在私有云中执行，然后数据混洗后加密传输到公有云，执行 reduce 阶段，该执行模型适用于长期归档数据的应用场景；
垂直分割：敏感数据和非敏感数据分别独立地在私有云和公有云中执行map/reduce 阶段，不允许跨云传输数据；
混合：分别独立地在私有云和公有云中对敏感数据和非敏感数据执行 map阶段，混洗后跨云传输数据，然后在私有云和公有云中分别执行 reduce 阶段。

2.2 基于数据分离的联邦学习

允许在远程设备或者孤立的数据中心来训练机器学习模型

通用联邦学习架构：多个本地设备（数据持有者）与中央参数服务器之间经过本地训练、上传本地更新、服务器端安全聚合以及下载全局模型等步骤保证联合训练模型的一致性；
挑战问题及研究进展：
(1)通信开销：由于本地设备的带宽、电力和功率等资源有限，使得联邦学习中的通信可能比本地计算慢许多数量级。学术界主要从减少通信轮数以及每个轮传输的消息大小两个方面提高通信效率；
(2)系统异构：由于联邦学习中每个设备的硬件及网络等配置不同，因此系统特性存在很大差异。学术界主要采用异步通信、主动采样设备和容错等方式来解决系统异构性挑战;
(3)数据异构：由于本地设备的不同，它们经常生成和收集 Non-IID 数据，导致数据中包含设备之间的关系及相关分布。学术界主要从异构数据建模和相关训练过程的收敛分析两个方面展开研究；

2.3 小结

共同点是通过敏感数据集在本地或者私有云环境存储和计算，保证了原始数据集中敏感数据的输入隐私。但是，基于数据分离的隐私保护面临着通信开销较高的局限，以及联邦学习中本地设备与中央参数服务器之间的通信开销，未来还需要进一步地降低通信成本；
不同之处在于基于敏感数据标记的分布式计算将非敏感的数据分配到公有云环境，充分利用公有云的计算能力提高大数据处理效率，更适合处理敏感数据不密集的原始数据集；而基于数据分离的联邦学习要求所有数据在本地存储并训练，更适合处理敏感数据密集的原始数据集

三、基于数据干扰的隐私保护

相比其他的隐私保护方法，该方法会造成数据失真，通过牺牲数据的精度来增强隐私保护水平，因此隐私性和可用性的权衡问题一直是该研究方向的热点问题

3.1 数据匿名技术

主要思想：主要采用泛化、抑制、解剖、置换和扰动等五种类型的匿名化操作，限制准标识符与敏感信息之间的链接关系；
主要挑战：
(1)多维数据的匿名发布：在多维的大规模数据集上直接执行上述匿名化操作会严重地降低数据可用性，带来大量的信息损失；
(2)高效的大数据匿名并行处理：在大数据计算环境下，将上述匿名化操作直接应用到大规模数据匿名处理时，会带来扩展性和效率的挑战；
解决方法：
(1)多维静态数据的匿名化研究工作主要基于k-匿名算法展开，研究如何对原始数据集进行有效的匿名化，尽可能地实现匿名效果最好、数据可用性最高且时间空间开销最小的匿名算法；而多维数据流的匿名化主要基于扰动、树状结构、伪造值和聚类等方面展开研究；
(2)一种是借助主流的大数据计算框架实现分布式的匿名并行处理；另一种是将已有的匿名算法并行化，以适应大数据计算环境下的分布式处理特性。大多数研究工作基于第一种思路展开，它们充分利用了计算框架本身的扩展性和高效优势，在大数据计算环境下更加实用；

3.2 差分隐私技术

主要通过添加噪音干扰真实数据，能够抵抗攻击者实施的背景知识攻击和差分攻击

3.2.1 基于 LDP 的隐私保护

主要思想：原始数据在本地编码和扰动后，扰动数据被收集到云端进行聚合。由于本地客户端执行的随机扰动函数符合本地化差分隐私ε-LDP(其将数据隐私化的工作转移到每个用户，用户自己来处理和保护个人数据，极大地降低了隐私泄露的可能性)因此无论 CSP 内部攻击者具有怎样的背景知识，它都无法区分扰动元组的原始元组是哪个；

3.2.2 基于 CDP 的隐私保护

主要思想：原始数据被集中聚合后再添加适当的噪音，最终返回给用户隐私保证的聚合结果。因此，它能够抵抗恶意敌手的差分攻击，避免输出隐私泄露；

3.3 小结

数据匿名技术思想简单易理解，匿名算法更容易应用到主流的大数据计算框架中，执行高效的大规模数据匿名处理。但是，相比差分隐私技术，数据匿名技术在安全性方面较弱，仍然面临着背景知识攻击和差分攻击；
差分隐私技术基于更严格的隐私定义能够量化隐私保护水平，更适用于对隐私保护需求比较严格的大数据应用场景。相比其他的隐私保护技术，差分隐私技术应用到大数据计算环境时一般不会给复杂的计算任务带来过多额外的计算开销和通信开销，因此该技术具有较高的研究价值和应用前景。但是对于可用性要求比较高的机器学习应用，目前影响其在产业界实际应用的瓶颈是隐私性和可用性的合理权衡问题，未来还需要进一步地改善

四、基于安全多方计算的隐私保护

如果对于共享的数据不进行加密或去隐私处理，那么将会直接破坏共享数据的机密性和隐私性。要么在数据共享之前对其进行干扰，但是会严重制约联合分析的任务类型和数据可用性，不适用于复杂的联合计算任务。要么对数据集进行加密后传输

4.1 基于混淆电路的安全多方计算

主要思想：基于姚氏混淆电路的安全多方计算主要关注两方的场景，它使用布尔电路（boolean circuit）表述待计算函数，结合不经意传输（Oblivious Transfer, OT）技术设计安全多方计算协议；
为了使它们扩展到大数据计算中，许多研究工作从降低通信成本、缩减执行时间和减少电路门数等角度在一定程度上优化通信、优化执行和优化电路；
(1)关于通信优化，研究工作旨在减少计算过程中参与方之间必须要传输的数据量，达到降低通信成本的目的；
(2)关于执行优化，研究工作旨在减少执行相同数量的电路门所需要的计算时间，保证高效的大数据隐私计算；
(3)关于电路优化，研究工作旨在降低某个计算操作的电路门数，从而降低隐私计算的复杂度

——>综上分析可知，目前主要采取剪切和选择、并行处理以及预处理等手段从不同的角度优化基于混淆电路的安全多方计算协议，使其能应用到实际的大数据计算场景

4.2 基于秘密共享的安全多方计算

主要思想：算主要关注三方及以上的场景，它将每个敏感值分割为多个“秘密共享”，这样每个秘密共享都不能泄露任何有关原始值的信息，但是当重组时原始值被重构；
Sharemind SMC 框架：输入数据和指令被发送到多个计算参与方，数据库和堆栈中的数据在计算参与方之间秘密共享，即使存在妥协且合谋的参与方仍然能够提供安全计算和数据隐私保护；
然而，随着参与方数量的增加，基于秘密共享的安全多方计算在计算过程中会带来较高的通信成本，这限制了方案的可伸缩性。为了能够扩展到多个参与方，一些研究工作借助主流的大数据计算框架实施并行处理，这能够有效地减少通信开销。陆续实现了将Spark与Sharemind SMC 框架相结合以及建立在 TensorFlow 机器学习框架之上的安全多方计算开源库等诸多方法；

4.3 基于同态加密的安全多方计算

主要思想：允许计算参与方在加密数据上执行计算，同时能够保证公有云中数据隐私，其安全性和执行效率取决于底层同态加密方案的安全假设和加解密效率。为了使其能够应用到大数据计算环境下，一方面要设计能够支持大数据复杂操作的安全方案，另一方面需要重点解决加解密带来的高计算成本问题；
现状：学术界主要基于已有的同态加密方案构造支持大数据计算环境的安全多方计算协议，主要
挑战在于如何在多方之间安全地共享和管理密钥；
支持隐私计算的多方计算协议：是基于带门限的全同态加密所构建的，在每次计算阶段，所有计算参与方生成秘密密钥、公共密钥和评估密钥等系统参数，并以较低的通信成本进行多方计算和交互；
支持云上实时多方计算的安全协议：采用了多密钥参与的全同态加密满足大数据实时计算的
要求，在安全计算的过程中，每个计算参与方都有他们自己的长期公私密钥对；
保护 MapReduce 计算隐私的全同态加密优化方案：解决了当云服务提供商不可信时，密钥参数有可能会被恶意敌手获取，降低协议的安全性与隐私保证的问题；

虽然全同态加密具有较高的安全保证，但是其计算成本较高。

4.4 小结

(1)基于混淆电路的安全多方计算其安全性和复杂性在于设计混淆电路，它能够在参与方之间互不串通的假设下保证安全计算；
(2)基于秘密共享的安全多方计算能够更好地扩展到多方，即使大多数参与方被妥协或者参与方之间存在合谋时，它仍然能够执行安全计算并有效地保证数据的隐私性；
(3)基于同态加密的安全多方计算的架构简单，其应用到大数据计算环境的实用性依赖底层同态加密方案的执行效率

五、基于硬件增强的隐私保护

出于隐私性和高效性的权衡，研究学者提出了基于硬件增强的“加密传输，明文计算”思路，即数据被加密传输但在可信硬件支持下高效地执行明文计算；

Intel SGX基于安全硬件的最小可信计算基（Trusted Computing Base, TCB）提供了用户空间的安全隔离执行环境，同时能够兼容虚拟化及容器技术；
而AMD硬件虚拟化技术基于可信的特权软件提供了操作系统级别的安全隔离执行环境，其安全性依赖特权软件的安全性，特别是当特权软件被妥协时其安全性受到威胁；
TrustZone 技术通过 CPU 将系统划分为安全和非安全的两种隔离执行环境，其主要应用到嵌入式
平台；

5.1 基于硬件增强的大数据计算框架

Intel SGX：通过一组新的指令集扩展和内存访问机制，依靠受信任的硬件来保护用户级的代码和数据不受潜在的恶意特权软件的攻击。而后又有其他科研人员基于Intel SGX实现了各种其他功能：保护MapReduce分布式计算的安全系统的VC3系统、将Java代码划分为可信和不可信的部分并对于可信部分代码使用 Intel SGX 提供的应用程序接口将其重写为C/C++代码，同时采取不经意计算保护访问模式的Opaque系统等；

5.2 基于硬件增强的计算性能优化

由于 Intel SGX 需要对受保护的代码和数据提供机密性和完整性保证，因此数据加密和完整性验
证过程增加了系统性能开销。在实际应用中，考虑到大数据隐私计算的高效性要求，需要对基于硬件增强的大数据计算进行性能优化；
三种可选的 enclave 安全接口设计方案：

难点：如何合理划分程序
——>Glamdring将应用程序划分为可信和不可信两个部分：保护数据隐私性基于开发人员对于敏感数据的标记，执行静态数据流分析以检测所有访问敏感数据的函数；为了保证数据完整性，它采用静态向后切片来识别可能影响数据完整性的函数；
Drawbridge 沙箱机制提供了粗粒度地隔离执行应用程序的安全容器，将应用程序、标准库以及Windows 库操作系统都放入 enclave，保护未修改的应用程序抵御外部特权软件攻击或者物理攻击；
SCONE则是为多租户环境提供了一种安全容器机制，它也能保护未修改应用程序不受外部恶意特权软件的攻击，但是它在enclave 内放置修改的 C 标准库缩小了 TCB 大小；
Ryoan保护数据所有者的数据免受不可信 CSP 或用户的窃取，即使分布式计算平台不可信，仍然能够提供沙箱实例保护机密数据的隐私性，保证分布式计算隐私；

5.3 小结

从两个角度总结如何扩展 Intel SGX 应用保证安全且实用：
(1)将受保护的大数据应用程序放入 enclave中安全执行并非易事，在实际应用中仍面临着诸多问题。此外，对于复杂的大数据应用程序而言，划分敏感代码的开发量一般比较大，并且没有通用标准界定哪些代码应该被划分为敏感的代码；
(2)在 enclave 中执行明文计算可以在一定程度上降低系统开销。但是目前 IntelSGX 支持的 EPC 内存大小受限，当受保护的应用程序规模比较大时，特别是主流的大数据计算框架都支持内存密集型计算，enclave 需要频繁地换出/进页面以切换上下文，这也带来了较高的通信开销；

六、基于访问模式隐藏的隐私保护

尽管数据加密可以很好地隐藏数据的机密性，但是不能隐藏一些元数据，比如访问模式、数据来源和去向等。云平台内部攻击者可以利用这些元数据获得两种隐私信息，一种是根据访问模式推测出数据的相关属性，而另一种则是是根据数据来源和去向推测数据发送方和接收方的身份；

6.1 基于ORAM的不经意计算

现有工作指出 ORAM 协议具有一个对数级别的性能下界，因此将其应用在数据频繁访问的大数据计算场景中，它依然面临着性能较低的瓶颈;
挑战问题：安全方案设计和性能优化，研发人员指出攻击者可以从一个拼写检查应用程序的机密文档中提取数百 KB 的数据，甚至可以从一个运行在 enclave 内部的图像处理应用程序中提取出可辨别的图像轮廓。此外，许多代表性的框架都有着性能较低的问题；
ObliVM 系统：采用 ORAM 技术设计了通用的不经意计算平台，并提供了支持安全计算程序的编程框架。它旨在将程序编译成适用于安全计算要求的高效且遗忘式表示形式，并提供了一种功能强大且表现力较强的编程语言，以及用户友好型的隐蔽编程抽象；

通过以上分析，从安全性的角度，ORAM 技术能够保护读写操作的访问模式，并且具有可解释性。但是，在主流的大数据计算框架下，直接采用ORAM 实现不经意计算将会带来非常高的性能开销，严重地影响大数据分析的高效要求。因此，未来急需设计一种优化的分布式 ORAM 解决方案

6.2 基于不经意混洗的不经意计算

学术界提出了在大数据计算中采用不经意混洗技术来实现不经意的分布式计算以达到降低成本的目的；
实现方式：不经意排序和级联混合网络，它们试图产生具有足够可扩展性和效率的安全随机排列；
(1)不经意排序：主要以数据独立的方式选择不可预测的排列并对数据进行相应排序，其有效性取决于具体排序算法的复杂度；
(2)级联混合网络：主要通过执行 k 个串级混合步骤实现任意随机排列，其有效性取决于执行混合步骤的轮数；
已有研究基于以上方式在 Intel SGX 可信硬件支持下对访问的数据执行不经意混洗，既能够隐藏访问模式实现不经意计算，也能够保证数据和关键代码的隐私性：实现了隐私数据分析的不经意计算可并行化的墨尔本混洗算法、可以同时防止内存层和网络层的访问模式泄漏的Opaque 系统以及能够防止攻击者在不可信 CSP 的安全假设下实施网络层的访问模式泄露的M2R系统等；

6.3 小结

两种实现不经意计算的技术对比分析如下
(1)ORAM通过将每一次读或者写访问都随机地转换为一次读取和一次写回操作，使得攻击者无法区别数据的具体访问方式，从而隐藏了处理器访问内存的操作序列和地址序列访问模式。然而，由此带来的额外操作在实际应用中往往带来较高的计算开销，严重制约了其实际应用；
(2)不经意混洗通过对数据的重排列使得攻击者无法关联输入数据和输出数据的分布，从而阻止攻击者判断计算过程中的访问模式。在基于 IntelSGX 硬件支持的条件下，采用不经意排序或者级联混合网络手段实现不经意混洗方法要比 ORAM 高效的多；

总结

本文对大数据计算环境下的隐私保护技术研究进展进行了综述：首先分析了大数据计算环境下的敌手模型、隐私问题与挑战，以及隐私保护的研究方向；接着，根据隐私保护技术的不同，分别总结分析了基于数据分离的隐私保护、基于数据干扰的隐私保护、基于安全多方计算的隐私保护、基于硬件增强的隐私保护、以及基于访问模式隐藏的隐私保护等研究方向的最新研究进展，并对比分析了不同隐私保护技术的优缺点；最后，展望了大数据计算环境下隐私保护技术的未来研究方向；
通过综合分析可知，不同隐私保护技术具有不同的技术特点、局限性和适用场景。而且由于每个技术其自身的缺点，未来在大数据计算环境下应用这些隐私保护技术，仍然存在很多问题需要亟待解决。

未来展望

五个问题：
(1)研究低带宽网络环境下的高效数据分离保护；
(2)研究针对复杂数据类型的高可用差分隐私保护;
(3)研究实用型的安全多方计算协议，进一步提升性能;
(4)研究安全增强的 Intel SGX 应用，进一步提升性能;
(5)研究高效的通用访问模式隐藏结构;
未来方向：
(1)适用于大数据计算各个环节的通用隐私保护方案；
(2)针对端边云计算架构的可行隐私保护；
(3)面向多数据源协同训练的隐私保护框架；

你可能感兴趣的:(大数据,网络,人工智能)

什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
Docker指定网桥和指定网桥IP
$dockernetworklsNETWORKIDNAMEDRIVER7fca4eb8c647bridgebridge9f904ee27bf5nonenullcf03ee007fb4hosthostBridge默认bridge网络,我们可以使用dockernetworkinspect命令查看返回的网络信息，我们使用dockerrun命令是将网络自动应用到新的容器Host如果是hosts模式，启动容
UNIX域套接字
1、UNIX域套接字的定义UNIX域套接字是进程间通信（IPC）的一种方式，不涉及网络协议栈，因此在同一台主机上的通信中，它比基于TCP/IP协议的网络套接字更快速、更高效。2、UNIX域套接字的分类字节流套接字（SOCK_STREAM）：提供面向连接的、可靠的数据传输服务。数据报套接字（SOCK_DGRAM）：提供无连接的数据传输服务，数据以独立的数据报形式传输。3、UNIX套接字与TCP/IP
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
Docker容器底层原理详解：从零理解容器化技术 Debug Your Career 面试 docker 容器 docker java
一、容器本质：一个“隔离的进程”关键认知：Docker容器并不是一个完整的操作系统，而是一个被严格隔离的进程。这个进程拥有独立的文件系统、网络、进程视图等资源，但它直接运行在宿主机内核上（而虚拟机需要模拟硬件和操作系统）。类比理解：想象你在一个办公楼里租了一间独立办公室（容器）。你有自己的桌椅（文件系统）、电话分机（网络）、门牌号（主机名），但共享整栋楼的水电（宿主机内核）和电梯（硬件资源）。办公
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
如何发现 Redis 中的 BigKey？ sevevty-seven redis bootstrap 数据库
如何发现Redis中的BigKey？Redis因其出色的性能，常被用作缓存、消息队列和会话存储。然而，在Redis的使用过程中，BigKey是一个不容忽视的问题。BigKey指的是存储了大量数据或包含大量成员的键。它们不仅会占用大量内存，还可能导致网络延迟、主从同步延迟，甚至在极端情况下引发Redis服务崩溃。因此，有效地发现和处理BigKey对于维护Redis服务的稳定性和性能至关重要。本文将深
11. TCP 滑动窗口、拥塞控制是什么，有什么区别 yqcoder 前端面试-服务协议 tcp/ip 网络 php
总结滑动窗口：早期网络，通信双方不考虑网络拥挤情况，导致掉包。滑动窗口大小意味着有多少缓冲区接受数据。拥塞控制：防止过多数据注入网络中，拥塞控制是一个全局过程，控制网络流量。区别：滑动窗口解决掉包问题，拥塞控制解决网络拥塞问题。TCP滑动窗口与拥塞控制详解在TCP协议中，为了实现可靠传输和高效通信，引入了两个核心机制：滑动窗口（SlidingWindow）和拥塞控制（CongestionContr
上位机知识篇---Linux中的文件挂载 Atticus-Orion 上位机操作篇 linux 运维网络文件挂载
文章目录前言1.挂载的基本概念文件系统挂载点设备文件2.挂载的命令挂载文件系统示例卸载文件系统示例3.挂载的常用选项示例4.自动挂载（/etc/fstab文件）示例使用UUID挂载5.挂载网络文件系统（NFS）挂载NFS示例6.挂载ISO文件挂载ISO文件示例7.查看已挂载的文件系统8.挂载的注意事项9.挂载的常见问题挂载失败卸载失败10.总结前言在Linux系统中，文件挂载是指将一个文件系统（如
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
计算机科学与技术柳依依@ 学习前端 c4前端后端
计算机科学是一个庞大且关联性强的学科体系，初学者常面临以下痛点：-**知识点零散**：容易陷入"只见树木不见森林"的学习困境-**方向不明确**：面对海量技术栈不知从何入手-**体系缺失**：难以建立完整的知识网络1.计算机基础-计算机组成原理-冯·诺依曼体系-CPU/内存/IO设备-操作系统-进程与线程-内存管理-文件系统-计算机网络-TCP/IP模型-HTTP/HTTPS-网络安全2.编程能力
Ubuntu 服务器虚拟主机,ubuntu云服务器虚拟机 Gamer42 Ubuntu 服务器虚拟主机
ubuntu云服务器虚拟机内容精选换一换通过云服务器或者外部镜像文件创建私有镜像时，如果云服务器或镜像文件所在虚拟机的网络配置是静态IP地址时，您需要修改网卡属性为DHCP，以使私有镜像发放的新云服务器可以动态获取IP地址。本节以WindowsServer2008R2操作系统为例。其他操作系统配置方法略有区别，请参考对应操作系统的相关资料进行操作，文档中不对此进行详细说明后端虚拟机绑定EIP。登录
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
ModBus总线协议小仇学长 STM32 网络 Modbus协议
一、知识点1.什么是Modbus协议？Modbus是一种工业通信协议，最早由Modicon公司在1979年提出，目的是用于PLC（可编程逻辑控制器）之间的数据通信。它是主从式通信，即一个主机（主设备）控制一个或多个从机（从设备）。它常用于RS-232、RS-485串口通信，也可以用于TCP/IP网络通信（叫做ModbusTCP）。2.核心特征特征项内容通信结构主从式（Master/Slave）通信
2.4 基于dpdk的用户态协议栈的实现百亿苍狗高性能网络设计专栏开发语言网络
操作系统PosixAPI所提供的网络接口，数据收发是基于用户态与内核态的频繁切换实现。而dpdk实现了绕过内核监管，直接在用户态访问网络硬件，避免频繁状态切换。DPDK安装与配置虚拟机环境配置检查是否支持多队列网卡cat/proc/interrupts|grepens33(获取整个机器的终端)，结果19:4202120IO-APIC19-fasteoiens33，不支持多队列网卡。虚拟机关机，修改
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc