fake news：使用区块链技术来保证新闻中数字媒体的真实性。

fake news：使用区块链技术来保证新闻中数字媒体的真实性。
Steve Huckle, Martin White

摘要：
在这篇文章中，我们介绍了一个利用区块链技术来保证数字媒体的消息来源的技术原型。在假新闻的时代，当有人给我们看了某一事件的一段视频或一张图片，我们应该如何确认他的真实性？似乎公众已经不再完全相信传统媒体是一个可以参考的信息来源，这是因为有许多对于相同信息的矛盾报导。确实，在2016年美国总统选举的时候，“假”新闻尤为明显。特朗普总统声称纽约时报试图用过推断虚假信息来诋毁他。目前克服虚假新闻问题的研究并不着眼于建立这些故事中使用的媒体资源的所有权 - 本文中介绍的基于区块链的应用程序是能够指示数字媒体真实性的技术。简单地讲，使用基于信任机制的区块链技术，该工具毫无疑问可以显示任何数字媒体源的来源，包括使用的图像试图误导的背景。尽管该应用程序是一个早期的原型，并且它的查找假资源的能力有限，但我们概述了未来的改进，以克服这些限制。此外，我们相信我们的应用（及其使用区块链技术和标准化元数据）引入了一种新颖的方法来克服新闻报道中的错误以及其中使用的媒体资源的来源。虽然我们的应用有能力来验证媒体来源的正确性，但我们相信技术知识解决虚假新闻的一种技术手段。这是因为它不可能证明整个故事的正确性。我们相信这需要人力来解决。

关键词：虚假新闻，区块链，大数据，Ethereum，哈希函数，密码学，公钥加密技术，数字签名，保存元数据

Introduction

2016年美国总统选举的获胜者唐纳德·特朗普指责各种媒体纷纷加入协同行动时，假新闻问题成为头条新闻。通过发布恶作剧和宣传来诋毁他，甚至在总统的指责之前，其中一份牵连的报纸“纽约时报”刊登了一则报道，称特朗普的一位知名支持者正在传播消息。大概是新闻调查之后，这家报纸宣称在基督教时报网站上使用的照片（如图1所示）表明美国总统的反对者正在操纵选票，实际上是来自英国的伯明翰邮报。图为英国选举中使用的投票箱，而不是俄亥俄州仓库中发现的克林顿投票票，该网站声称。如果这些调查工作是不必要的呢？如果想要确定视频或照片的出处是十分简单的呢？我们不仅可以相信这些材料，并且我们可以不相信任何没有验证过的材料。
这篇文章主要是要介绍基于区块链技术的应用（我们把它称为Provenator），一个可以帮助证明数据源头的工具。

保证信任和数据源真实性的方法
应用Provenator使用密码学方法来帮助确定媒体资源的真实性。
另外，它使用schema来记录和检索描述这些媒体资源的元数据。我们接下来描述这些技术。
区块链
区块链具有能够确定完整性和真实性的能力，因为它们本质上是具有内置信任机制的不可变数据库技术。这里包含了密码学算法，数字签名，保证了安全的多方协作，而不需要中心媒介。区块链还可以执行智能合约，智能合约时一个可以自动执行的可验证的代码。总的来说，区块链是一个可信任的账本，可以执行程序的逻辑。进一步讲，他们不能被任何单一的个体所控制。这些机制说明我们可以使用区块链作为存储媒体资源的每件，任何个体可以认为这些存在区块链上的信息是真实的。我们仍旧需要一个合适的方式来将数据存储在区块链上。我们会在之后讨论这一问题。

元数据的出处
使用了PREMIS 数据模型，PREMIS代表Preservation Metadata: Implementation Strategies。它概述了一个有助于识别资源的出处模式。PREMIS数据模型，描述了四个保存实体：（1）object，（2）events，（3）agents, (4) rights. Provenator使用PREMIS定义来记录在区块链上的数字媒体，并使用智能合约。这可以确保数据符合开放标准，这应该“保证”所持有的信息，并有助于促进与不同用户的进一步互动。

image.png

Provenator应用程序

Provenator的主要思想是一个内容的创建者需要证明他所创建的资源。想要做到这一点，Provenator让创建者有能力来存储相关的创建信息的验证信息到区块链上，这样就可以被很容易地获取数据、验证数据。

Provenator程序的需求
我们仍然需要考虑证明媒体资源的起源元数据所需的步骤，幸运的是我们不需要自己考虑这些，因为“信任（trust）”流程和发布Ubuntu操作系统十分类似。

发布Ubuntu操作系统：整个流程包括使用数字签名来帮助确保下载和安装的软件可以被信任。具体流程如下：

（1）下载操作系统的磁盘映像，以及校验和文件和用于签署校验和文件的签名

（2）获取将要使用签名的对应公钥

（3）使用公钥来验证校验值

（4）使用SHA256哈希算法来对操作系统的磁盘映像进行哈希

（5）对比两个哈希值（磁盘映像哈希值和校验文件哈希值）

执行以上的操作，如果哈希配对成功，用户可以安装操作系统并相信他安装的是官方的Ubuntu系统。

Provenator程序的操作：

借鉴Ubuntu系统的验证流程，Provenator应该完成以下操作：

（1）获取数字媒体资源的哈希值

（2）建立数字资源的PREMIS

（3）在区块链上签名存储数字资源的哈希及其关联元数据的交易（transaction）

通过这个流程，由于区块链记录的不变性，用户能够信任数字媒体元数据的完整性和真实性。以下流程展示了provenator如何让用户可以检查在区块链上的数据的：

（1）获取数字资源的的哈希值

（2）检查在区块链中是否存在这一哈希值

（3）如果哈希值存在，获取对应的元数据

Provenator的框架

Provenator包含以下框架

使用Ethereum区块链，存储provenance媒体资源的元数据。
Ethereum智能合约，使用Solidity语言编写，读取和写入PREMIS格式的媒体资源
基于Javascript的网络程序，使用React编写，用来创建和访问在Ethereum智能合约中存储的PREMIS数据。

Provenator的原型代码：(https://github.com/glowkeeper/Provenator).

程序原型：

Provenator的程序原型工作在InterPlanetary File System （IPFS）的网络上。IPFS是一个对等的内容寻址文件系统，它构成了我们应用程序架构的最终组件。整个程序是完全分布式的。IPFS使用密码学工具来保证存储在网络中数据的真实性。下面是对IPFS的简要介绍。

The InterPlanetary file system IPFS

IPFS部署一个基于Merkle有向无环图（DAG）以建立可信数据的分散式网络。将哈希函数使用到图数据中是Ralph Merkle用来传输可靠信息的解决方法。这个思想十分有影响力，许多系统都是用Merkle DAGs来实现可信系统，比如IPFS和Bitcoin。Merkle DAG 最基本的原则是如果拥有了一个根节点的哈希值，并且哈希来自于一个可信的实体，，那么只要得到的哈希值和这个哈希值一致，我们可以相信所有的叶子结点都是真实的。IPFS使用Merkle DAG 来表示对象之间的链接，这些链接都是在文件系统中对应块的哈希。

image.png

这个图片展示了IPFS中的图像存储。任何在IPFS中存储的文件都会被确保是惟一的。只要文件可以形成一个Merkle DAG，它就可以被信任是真实的。 IPFS网络上的节点彼此连接以传输和存储对象，因为它们使用PKC来建立其身份，所以它们可以被视为可信来源。当两个节点连接时，他们彼此交换公钥来对传输进行加密。

智能合约的部分
在写入时，Provenator使用Ethereum的Testnet Ropsten。如果使用公有链，则需要消耗一定的Ether来存储电子资源的元数据。从区块链中获取数据是免费的。这对于构建一个DApp是十分重要的设计原则。主要的用户接口是使用Javascript来进行交互的。
Provenator的使用
可交换图像文件格式（Exif）是用于指定关于图像文件的信息的标准，包括诸如描述和版权信息的数据。不幸的是，这些数据很容易改变。据推测，“Christian Times”的编辑就是这么做的，因此，“The New York Times”不得不竭尽全力证明图像的脱离背景使用。现在想象一下，Alice是拍摄该照片的摄影师，并且她使用Provenator在区块链上记录了有关图片的数据。在这种情况下，证明“Christian Times”错误地使用了Alice的照片将是使用Provenator的一个简单问题。因此，The New York Times可以节省很多麻烦。接下来，我们将使用Provenator作为该照片的创建者，讨论Alice用于注册自己的模式（schema）。

Provenator的PREMIS

image.png

图12展示了Alice使用Provenator的PREMIS数据模型来创建的照片信息，其被存到了区块链上。她储存了图片的哈希值和对应的元数据（比如说图片的描述）作为了PREMIS的object。图片的拍照时间被记录为PREMIS的event（事件）。PREMIS的agent是Alice本人。PREMIS的版权信息展示了图片的版权。我们在上面展示的元数据的实现描述了一个单独的对象 - Alice关于Sheldon选举中使用的投票箱的图片。这个对象只有一个agent为Alice本人。只有一个event是图片拍照的时间。只有一个版权信息Birmingham Mail的版权。但是，在Provenator中使用的PREMIS模型更加的复杂。它可以使用多个属性来描述PREMIS的对象，比如说多个agent，event，版权信息。尽管event可能只属于一个agent，但agent可以记录多个event，拥有许多对象，并部署许多不同的版权。最后，特定版权属于单个对象和单个agent。

MetaMask 这是一个可以将Ethereum DApp运行在浏览器中的一个工具。当使用Provenator时候，Alice可以使用MetaMask来对交易（transaction）进行签名，以便将关于照片的PREMIS存储在区块链上。通过这样做，任何访问这些数据的人都有信心，这是Alice自己记录的信息。

浏览PREMIS 数据
现在Alice已经记录了她的图片信息。Bob是她的编辑，可以使用这个图片来生成一个哈希，并且从区块链中也获取对应哈希。图13展示了Provenator的截图，Bob获得的图片信息。
根据哈希函数的确定性和抗碰撞性，获取了信息，Bob可以相信Alice发送图片的正确性。因此，“The New York Times”本可以通过将“Christian Times”的副本上传到Provenator来检查图片的有效性，而不是通过大量的调查长度来证明使用Alice的图像。然后，他们将检索到与Bob相同的元数据，这会显示图片是假的。然而，尽管这可能表明图像本身是假的，但它并不能证明整篇文章是虚构的。证明这可能比技术稍微多一点。我们接下来考虑这个问题。

image.png

验证新闻
BBC在叙利亚冲突前线提供准确的新闻报道方面遇到很多困难。事实上，记者在那里失去了生命，所以从普通的叙利亚公民那里找到故事已经成为惯例。但是，确保这种“用户生成内容”（UGC）的有效性一直是“记者必须学习的技能。BBC已经使用新方法来保证UGC的有效性。显然，这些方法涉及技术，但也涉及常识，并与可靠的叙利亚人建立健康的关系。通常都是使用大数据技术和人的知识来去验证正确性。例如，一个项目主张组建一个假新闻语料库来帮助欺骗检测，为此，在收集数据时，合格的参与者将被要求发现假新闻。大数据技术都需要人为的干预，无论是用数据可视化还是其他方法。使用Provenator，用户可以验证新闻中使用的多媒体信息。此外，虽然技术可以证明新闻媒体资源的有效性，但证明整个假新闻报道的真实性往往需要良好的新闻实践。

当前的局限性
Provenator系统中存在一些问题。对于图片来说，如果只是改变几个像素点，虽然图片看起来没怎么变化，但哈希却截然不同。Christian Times可以轻而易举地改动选举图片的几个像素而摧毁这样的验证机制。不过，我们可以使用一些额外的技术来弥补这一不足。比如我们可以使用fisher vector和k-means聚类来查找相似图片。

fake news：使用区块链技术来保证新闻中数字媒体的真实性。

你可能感兴趣的:(fake news：使用区块链技术来保证新闻中数字媒体的真实性。)