【引文74 & 引文114】基于区块链的联邦学习的激励机制设计
【引文114】
摘要
介绍了一个side-payment方案,让大家可信任的分享reputation信息
同时利用密码学计数保护reputation的完整性
解决开放环境分布所有权的安全问题
reputation由过往的行为决定
一个agent公布reputation到底好不好?
真实的rating不一定有利,作恶的rating可能有利
核心问题:如何让理性的agent去发布真实的reputation信息
模型
考虑边际收益
report了必须要有好处才可以
个人cheating最优,两人均合作最优
没有强行执行合约的中央机构
先验概率
每个agent可以购买并出售别人或自己的reputation然后做分析
只有最近的评分可以影响他们的选择
如果他们想卖别人的信息,那么它们只能先买这个人的信息
R-agent作为中介如何选举?
reputation的钱和游戏中获得的钱是分开的,如果亏光了reputation的钱就不能再买了
一些问题
R-agent变成blockchain
game 的money 和reputation的money有什么好处?
【引文74】
FL 当前问题
1.没有激励共享意愿不高
2.共享的参数效果不一定好
3.恶意的投毒如何避免
一些方法
通过reputation来评估实体的可信度,保证可信worker选举
direct reputation 和 indiect reputation
task publishers位于区块链上整合reputation信息
基于consortium blockchain联盟链
task publisher利用契约理论设计一个根据数据、计算量、通信资源的相关奖励
worker可以选择合约item来最大化利益
文章结构
1.相关工作
2.基于reputation的worker选举
3.利用multi-weight 的 subjective logic 模型来量化reputation
4.可信worker的奖励
相关工作
1.大多数都是假设端节点会贡献数据,没有考虑worker的可靠性
2.本文考虑耦合的选举 + 激励问题
preliminary
1.每个终端n的损失函数ln,是多个本地数据分片的损失加权和
2.中心节点发布模型,然后每个设备n根据中心模型算出梯度,更新本地模型并发送给中心节点,中心节点再加权得到下一次的模型
攻击检测方案
1.RONI[4]:有无本地模型时的差距
2.Fools-Gold scheme[19]不可靠的节点上传相似的梯度
激励方案
task publisher很多东西都不知道
为了提高效率,采用contract theory
cpu消耗
通信消耗
数据质量
按照数据质量给worker打标签
最大容忍时间
worker质量越高,task publisher分发的费用越大
worker可用性函数
实验
用EMD来评估模型的偏移
一些问题
reward min?max?sum?
pre-set reward 放到 smart contract
合约里面包括digital signature
每个等级的合同的钱怎么设计?