【引文74 & 引文114】基于区块链的联邦学习的激励机制设计

【引文114】

摘要

介绍了一个side-payment方案,让大家可信任的分享reputation信息

同时利用密码学计数保护reputation的完整性

解决开放环境分布所有权的安全问题

reputation由过往的行为决定

一个agent公布reputation到底好不好?

真实的rating不一定有利,作恶的rating可能有利

核心问题:如何让理性的agent去发布真实的reputation信息

模型

考虑边际收益

report了必须要有好处才可以

个人cheating最优,两人均合作最优

没有强行执行合约的中央机构

先验概率

每个agent可以购买并出售别人或自己的reputation然后做分析

只有最近的评分可以影响他们的选择

如果他们想卖别人的信息,那么它们只能先买这个人的信息

R-agent作为中介如何选举?

reputation的钱和游戏中获得的钱是分开的,如果亏光了reputation的钱就不能再买了

一些问题

R-agent变成blockchain

game 的money 和reputation的money有什么好处?

【引文74】

FL 当前问题

1.没有激励共享意愿不高

2.共享的参数效果不一定好

3.恶意的投毒如何避免

一些方法

通过reputation来评估实体的可信度,保证可信worker选举

direct reputation 和 indiect reputation

task publishers位于区块链上整合reputation信息

基于consortium blockchain联盟链

task publisher利用契约理论设计一个根据数据、计算量、通信资源的相关奖励

worker可以选择合约item来最大化利益

文章结构

1.相关工作

2.基于reputation的worker选举

3.利用multi-weight 的 subjective logic 模型来量化reputation

4.可信worker的奖励

相关工作

1.大多数都是假设端节点会贡献数据,没有考虑worker的可靠性

2.本文考虑耦合的选举 + 激励问题

preliminary

1.每个终端n的损失函数ln,是多个本地数据分片的损失加权和

2.中心节点发布模型,然后每个设备n根据中心模型算出梯度,更新本地模型并发送给中心节点,中心节点再加权得到下一次的模型

攻击检测方案

1.RONI[4]:有无本地模型时的差距

2.Fools-Gold scheme[19]不可靠的节点上传相似的梯度

激励方案

task publisher很多东西都不知道

为了提高效率,采用contract theory

cpu消耗

通信消耗

数据质量

按照数据质量给worker打标签

最大容忍时间

worker质量越高,task publisher分发的费用越大

worker可用性函数

实验

用EMD来评估模型的偏移

一些问题

reward min?max?sum?

pre-set reward 放到 smart contract

合约里面包括digital signature

每个等级的合同的钱怎么设计?