区块链在众包中的应用,防止搭便车和避免不真实报告
本文讲解一个区块链在众包中的应用,主要的思想是将一个公共的区块链来代替第三方服务器(或者第三方公司)来解决搭便车(free-riding)和不真实报告(false-reporting)的问题。
更多区块链资源,欢迎关注本人公众号:链巨人
1、背景
我们把众包(crowdsourcing)和集众感知(crowdsensing)划分到相同的类别。它们大体上都表示“许多人一起完成一件任务”。如果细分的话,前者包含后者,因为集众感知一般指使用传感器来完成的任务,比如手机拍照,手机检测噪音。本文我们将两者统一对待。
在众包中典型的应用有:
-
滴滴出行: 出行者在软件上发布一个任务,多个司机抢单。
-
斯坦福大学教授FeiFei Li使用亚马逊的众包平台(Amazon Mechanical Turk)收集的超过一千多万图片数据,名为Imagenet数据集。该数据集为推动深度学习做出了卓越贡献。
-
百度地图中的交通拥堵感知。
-
环境监测:空气污染感知,噪声污染感知,地震振幅感知。
-
寻找外星人(S E T I@ home)——通过互联网利用家用个人计算机处理 天文数据共同搜寻地外文明。
通过上面列举的例子,我们能够体会到众包在我们的有很多重要的应用。群智感知是什么?有什么典型应用?
这里我们把发布任务的人叫requester,简称R,把完成任务的人叫workers,简称W。在一个任务中,有一个R和多个W。
2、动机/Motivation
W完成一个任务需要消耗时间,还有设备比如手机的电池和通信费用的成本。因此仅仅依靠W自愿来参加一个任务往往行不通:加入的W数量和覆盖范围有限。因此,我们需要一种激励机制来让W参加和完成一个任务。而最典型的激励便是R支付货币给W。
-
对W来说,只要worker的数据质量达到预设的要求,且worker得到了相应的报酬,R才能够获取到该数据(即,防止搭便车 prevent free-riding)。更严格地,我们希望除了该worker和requester,其他人都无法获取到该数据。
-
对R来说,它希望只有W完成任务,且完成的质量达到要求之后才支付W报酬 (即,防止不真实的报告 prevent false-reporting)。
但是,在互联网中,在缺少面对面接触的陌生人之间,很容易出现干活了不给钱,或者给钱了不好好干活的情况。比如,亚马逊的众包平台Amazon Mechanical Turk秉持不干预的政策,不管R和W之间的纠纷。R拥有主观决定W的工作质量的权力,造成了很多搭便车的现象。这使得W投诉无门,大大降级W参与的积极性。
3、解决方法
上图表示,借用第三方,保证:只有当数据d满足要求时,worker能够的到数量为r的报酬;只有支付了worker该报酬之后,requester才能得到数据。
为了防止搭便车和防止不真实的报告,我们需要一个第三方。该第三方是W和R都信任的。我们可以使用公共区块链,比如以太坊,来担任这个第三方的角色。公共区块链以太坊有下面的特点:
-
公开透明:任何人都可以查看链上的信息。
-
Integrity security: 这包含两个方面,一是链上的信息是不可篡改的且能够可验证的;二是智能合约的input,执行过程和output是不可篡改的且可验证的 (除非能够攻破PoW共识算法或者hash算法)。
-
具有去中心化的智能合约。本质上智能合约是执行在链上的代码。它能够定义一个区块链的应用逻辑。
-
具有加密货币。
根据上面的特点,我们可以使用以太坊来实现那个第三方。为了防止不真实报告,我们使用智能合约来检测worker的工作/数据质量。为了防止搭便车,我们让R缴纳押金(加密货币),只要W的数据质量达到预设的要求,区块链自动把押金转给W。但是,以太坊是公开透明的,这给“防止搭便车”增加了困难,因为只要worker将数据发到区块链中,所有人(不单单是R)都能看到该数据,无论该数据是否符合质量要求。可是,该数据是R花钱“买”的,它属于R的资产,因此一般情况下R不希望其他人能够免费获取到该数据。为了解决这个问题,我们使用Trusted Execution Environment (TEE)来实现数据的保密性。其中,英特尔的SGX实现了Trusted Execution Environment。
英特尔CPU从第六代酷睿开始增加了SGX特性,含有Intel Xeon版服务器级的CPU也包含了,比如Intel Xeon E3 v6。它是Software Gaurd Extensions的缩写,目的是从硬件实现信息安全。简单来讲就是英特尔通过硬件来实现一个安全的沙盒。这里一个电脑可以分为安全的沙盒和不安全的沙盒外部环境。沙盒外面的环境被认为是有可能被黑客或者恶意者完全操控的,是不安全的。沙盒外面的代码无法窥探或者修改沙盒内部的代码和数据;沙盒内部的代码执行也不会影响外部环境,沙盒有专门的“口子”,用于将数据从不安全的环境传入沙盒或者从沙盒内传出到非安全的环境。这里我们把沙盒用TEE表示,它是Trusted Execution Environment的简称,沙盒内部的环境中的程序被称为enclave程序,中文翻译为飞地。
我们需要借用TEE来解决上面所述的搭便车的问题,让worker得到保证:只要worker的数据质量达到预设的要求,且worker得到了相应的报酬,R才能够获取到该数据。
上图展示的是系统架构示意图。其中有五个实体,除了已经提到的worker,requester和公共区块链,还有矿工和TEE。现在,每一个矿工都需要安装TEE,用来检测worker的数据的质量。我们使用下图来展示worker的数据的流动过程。
1、首先worker将数据提交给区块链的节点,具体的,是区块链安装有TEE的节点或者矿工。当然,因为数据是在网络中传输的,在传给TEE之前,worker需要和TEE执行一个密钥共享协议,使得两个人都得到一个相同的密钥。worker将该数据加密,再传给TEE。
2、TEE从区块链中获取该worker的相关信息,检查该worker是否已经注册了该任务等等。
3、TEE使用预定义好的函数eva(d)来检测worker的数据d的质量。如果数据质量符合要求,区块链便支付该worker预定义好的货币。如果质量不符合要求,TEE不会将数据给requester。当然,也不会支付worker报酬。
4、等到确认该worker被成功付款了,TEE将该数据的密文存到区块链中,将密钥发给requester。如果考虑到区块链的存储有限,TEE可以将数据密文存储到一个公共的数据库中,比如IPFS或者一个公共的cloud中,然后将密钥发给requester。只是,这会降低数据密文的availability。
从上图的红色箭头路径可以看出,worker的数据在最后worker收到报酬之后才会被公开给该requester,因此,这符合我们前面提到的“防止搭便车”的要求。
现实中,并不可能所有的矿工都会安装TEE。一个矿工使用TEE来检测worker的数据质量,这是一份额外的工作,相比于正常的挖矿。因此,我们可以考虑给予这部分矿工额外的奖励。
详细内容请阅读:Liang, Y., Li, Y., & Shin, B. S. (2020). Faircs—blockchain-based fair crowdsensing scheme using trusted execution environment.Sensors,20(11), 3172.
谢谢