SIGMOD(Special Interest Group On Management Of Data)是数据库三大顶会之一,近几年也发表了不少水平很高的文章。本文主要针对SIGMOD会议中区块链相关的论文进行简单整理。
ACM SIGMOD Conference 2021: Virtual Event, China
SIGMOD Conference 2020: Virtual Event / Portland, OR, USA
SIGMOD Conference 2019: Amsterdam, The Netherlands
计划分三篇文章进行整理,本篇为2020年的4篇论文
类别:优化 Hyperledger Fabric 性能。
摘要:智能合约使区块链系统能够从简单的加密货币平台发展到一般的交易系统。Hyperledger结构中提出了一种名为execute-order-validate的新体系结构,以支持并行事务。然而,这种体系结构在序列化事务时可能会导致许多无效事务。由于数据处理以外的其他因素(如密码学和一致性),块形成率固有地受到限制,这个问题进一步被夸大。
受现代数据库中乐观并发控制的启发,我们提出了一种新的方法来增强execute-order-validate体系结构,通过重新排序事务来降低中止率。与现有区块链相比,我们的方法在理论上更细粒度:不可序列化的事务在重新排序之前被中止,其余的事务保证可序列化。现有区块链采用数据库的预防性方法,可能会过度支持可序列化的事务。我们分别在两个区块链中实现我们的方法,Hyperledger结构上的FabricSharp和在 FastFabric 之上的FastFabricSharp。我们比较了FabricSharp与vanilla Fabric以及三个相关系统的性能,其中两个系统分别使用一种标准和一种最先进的数据库并发控制技术实现。结果表明,在几乎所有实验场景中,与其他系统相比,FabricSharp的吞吐量提高了25%。此外,FastFabricSharp对FastFabric的改善率高达66%。
主要贡献:
我们提出了一个新的定理来识别永远无法重新排序以实现序列化的事务。基于这个定理,我们提出了有效的算法来早期过滤此类事务,并保证重新排序后剩余事务的可序列化性。我们还讨论了我们提案的安全影响。
我们在两个现有区块链的基础上实施我们提出的算法。首先,我们使用Hyperledger Fabric v1.3作为基础,并将我们的实现命名为FabricSharp(简称Fabric#)。其次,我们从FastFabric开始,它在所有结构优化中获得了最高的吞吐量,并将我们的实现命名为FastFabricSharp(简称FastFabric#)。我们已经发布了FabricSharp供公众使用。
我们通过将FabricSharp与vanilla Fabric、Fabric++以及其他两种基于数据库并发控制技术的实现进行比较,对FabricSharp进行了广泛的评估,这两种实现来自一种标准方法Ding等人的最新提议。实验结果表明,与其他系统相比,FabricSharp的吞吐量提高了25%以上。此外,FastFabricSharp比FastFabric提高了66%。
类别:区块链数据库,不仅具有数据库一样高的查询效率,同时具有区块链级别的安全性。
摘要:如今,一类新兴的应用程序基于不同实体之间共享数据库的协作。然而,现有的共享数据库解决方案可能需要信任他人,硬件需求高,个人用户负担不起,或者性能相对较低。换句话说,安全性、兼容性和效率之间存在着三重困境。在本文中,我们介绍了FalconDB,它使具有有限硬件资源的各方能够在数据库上高效、安全地协作。FalconDB采用数据库服务器,其验证接口可供客户端访问,并将摘要存储在区块链上,用于查询/更新验证。利用区块链作为共识平台和分布式账本,FalconDB能够在互不信任的情况下工作。同时,FalconDB只需要在每个客户机上花费最小的存储成本,并提供对数据库的任何可用、实时和并发访问。因此,FalconDB克服了以前解决方案的缺点,并使个人用户能够以高效率、低存储成本和区块链级别的安全保证参与协作。
主要贡献:
FalconDB利用一个区块链平台,允许多达1/3的参与者恶意,并采用一个临时数据模型,提供数据库的透明历史记录,使客户能够检查历史并恢复恶意合作者的更新。
FalconDB服务器节点使用经过验证的数据结构存储整个数据库。这样,客户机节点只需要存储块头,并且能够验证服务器节点返回的结果。因此,每个客户端的存储成本最低,FalconDB可以容忍除一个节点外的所有完整节点都是恶意的。
此外,FalconDB还提供了一种激励模式,激励每台服务器承担额外的存储成本,并诚实地响应客户端的请求,从而进一步降低服务器恶意攻击的可能性
最后,我们进行了实证评估,以验证FalconDB的性能。我们的结果表明,FalconDB能够实现与最先进的区块链协议一致的安全保障,作为外包数据库的效率高,并且对客户端的存储成本低。
摘要:在区块链技术的金融应用中,机密性是一个不可或缺的要求,支持它以及高性能和友好的可编程性在技术上具有挑战性。在本文中,我们提出了一个名为“CONFIDE”的系统设计,通过利用信任执行环境(TEE)来支持链上机密性。CONFIDE的安全数据传输协议和数据加密协议,以及在TEE中运行的高效虚拟机,保证了交易生命周期中从端到端的机密性。CONFIDE提出了一个安全的数据模型,以及一个应用程序驱动的安全协议,以保证数据的机密性和完整性。它的智能合约语言扩展为用户提供了定义复杂保密模型的灵活性。CONFIDE是作为Antfin区块链专有平台的插件模块实现的,并且可以通过其通用接口设计插入其他区块链平台。如今,CONFIDE每天支持数以百万计的商业交易。在财团区块链上运行的金融应用程序(包括供应链金融、ABS、商品来源和冷链物流)上。
主要贡献:
我们引入了一个机密原语来支持智能合约编程中的细粒度机密性规范。
我们通过多种性能优化实现了CONFIDE。生产系统是在线的,承载着多种金融应用程序,如供应链金融、ABS发行、商品来源和冷链物流。对实际工作量进行全面评估,并证明其有效性和效率。
CONFIDE 架构:
摘要:本演示展示了vChain,一个确保查询完整性的区块链系统。随着区块链应用程序和服务的激增,对查询存储在区块链数据库中的数据的需求不断增加。然而,现有解决方案要么面临着失去查询完整性的风险,要么要求用户维护区块链数据库的完整副本。相比之下,通过采用一种新的可验证查询处理框架,vChain使轻量级用户能够验证从潜在不受信任的服务提供商返回的查询结果。我们通过可视化展示其可验证的查询操作、可用性和性能,以获得更好的洞察力。我们还展示了在服务提供商受到威胁的情况下,用户如何检测伪造的结果。
类别:这是对2019年那篇vChain的演示。(Demonstrations)
vChain模型:
专栏Security, Privacy, and Blockchain 还收录4篇与差分隐私,聚合签名等文章也顺便了解一下吧。
摘要:人们对安全数据共享的需求越来越大。在实践中,一组数据所有者通常采用一种异构的安全方案,根据该方案,每一对当事人都决定自己的协议,以不同程度的信任共享数据。该方案还跟踪数据的使用情况。
本文研究异构安全环境下的分布式SQL查询应答。我们通过合并由数据共享协议确定并反映在各种安全设施使用中的收费函数来定义查询计划。我们将查询应答形式化为一个双准则优化问题,以最小化数据共享代价和并行查询评估代价。我们证明了这个问题对于SQL来说是PSPACE难的,∑p3-对于SPC来说是难的,并且它在下一个时刻。尽管困难重重,我们还是开发了一组近似算法来生成分布式查询计划,以最小化数据共享代价并降低并行计算成本。使用真实生活和合成数据,我们实证验证了我们算法的有效性、可扩展性和效率。
结论:我们首次尝试研究异构安全模型下的查询应答。我们抽象了安全异构性,形式化了查询共享数据的问题,研究了其复杂性,并开发了生成分布式查询计划的近似算法。我们的实验研究表明,我们的方法在降低安全费用和并行执行成本方面是有希望的。
这项工作旨在证明查询具有安全异构性的共享数据的需求、挑战和可行性。我们目前正在评估enclaves、Docker、安全通信通道和各种加密方案产生的成本,以使我们的收费功能更加准确。我们还正在为从业者制定一份指南,以制定一个切合实际的收费预算来回答他们的问题。
摘要:加密可以保护外包数据库(云中)中的数据,同时仍然支持对加密数据的查询处理。但是,处理过程会泄漏特定于查询类型的数据信息,例如聚合查询。使用SQL的GROUP BY子句对用户定义的组进行聚合广泛用于数据分析,例如,计算每个月的访客总数或每个部门的平均工资。泄露的信息,例如对一个组的访问模式,可能会揭示该组的频率,从而导致简单但有害的泄露滥用攻击。
在这项工作中,我们提出了SAGMA——一种用于执行按多个属性分组的安全聚合的加密方案。查询者可以在所有分组属性集中选择GROUP BY子句中一个或多个属性的任意组合。加密方案只在云端存储语义安全的密文,而查询处理隐藏了访问模式,即每个组的频率。我们实施了我们的方案,我们的评估结果支持其实际可行性
关键词:加密数据库;安全数据聚合
摘要:差异隐私(DP)目前是在数据分析中实现隐私的事实标准,通常在“中央”或“本地”模型中实现。本地模式在商业部署中更受欢迎,因为它不需要受信任的数据采集器。然而,与中心模型相比,这种增加的隐私是以实用性和算法表达能力为代价的。
在这项工作中,我们提出了Cryptϵ系统和编程框架,该框架(1)实现了中央模型(2)的准确性保证和算法表达能力,而不需要像本地模型中那样的任何可信数据采集器。Cryptϵ通过使用两台非冲突的不受信任服务器,对来自数据所有者的加密数据运行DP程序,实现了“两全其美”。理论上,使用现成的安全多方计算工具直接实现DP程序可以实现上述目标。然而,在实践中,它们面临着许多挑战,比如性能差和棘手的安全性证明。为此,Cryptϵ允许数据分析师编写逻辑DP程序,这些程序会自动转换为处理加密数据的安全协议。这些协议确保不受信任的服务器只学习噪声输出,从而保证所有Cryptϵ程序的DP(针对计算受限的对手)。Cryptϵ支持一类丰富的DP程序,这些程序可以通过一组小的转换和测量运算符以及任意的后处理来表达。此外,我们还建议利用输出噪声的事实进行性能优化。我们通过对真实世界数据集的大量实证评估,证明了Cryptϵ的实际可行性。
摘要:在收集信息时,本地差异隐私(LDP)从用户的角度消除了隐私泄露的担忧,因为用户的私人信息在发送到聚合器之前是随机的。我们研究了在满足LDP条件下恢复数值域上分布的问题。虽然人们可以将数字域离散化,然后应用为分类域开发的协议,但我们表明,利用域的数字性质可以更好地权衡隐私和实用性。我们引入了一种新的报告机制,称为方波(SW)机制,它利用了报告中的数字特性。我们还开发了一种带平滑的期望最大化(EMS)算法,该算法应用于SW机制中的聚合直方图,以估计原始分布。大量的实验表明,我们提出的方法,即SW-with-EMS,在各种效用指标上始终优于其他方法。