Abstract:
为了对移动群智感知中工人上传的不同质量的感知数据做必要的聚合处理,真值发现技术应运而生,其是为后续应用提供精确数据支持的基础.为了应对可能的隐私泄露问题,现有研究往往结合本地差分隐私技术来进行保护,然而这些研究往往忽略了感知数据中的异常值对本地差分隐私下真值发现精度的影响.这些异常值往往具有极大的取值范围,导致注入数据中的噪音量较大.而且在现实世界中,工人出于对隐私泄露的担心,移动群智感知服务器无法在无隐私保护的情况下预先处理数据.为解决以上问题,提出基于自适应剪枝的满足本地差分隐私的真值发现算法NATURE.该算法的核心思想是考虑数据中蕴含的噪音类型来自适应剪枝掉不需要的工人的所有值或者某些任务值.在NATURE中,为便于剪枝,在形式化约束优化问题的基础上,设计基于优化问题的噪音感知的权重和重要性估计方法;为进行剪枝,在证明最优剪枝问题是NP-hard的基础上,设计具有多项式时间复杂度的效用感知的自适应剪枝方法.进一步从理论上分析NATURE的隐私、效用和复杂度.在两个真实数据集和一个合成数据集上的实验结果表明,相较于对比算法, NATURE在求得噪音“真值”的精度上至少提高20%.
Keyword:
Reprint 's Address:
Email:
Source :
软件学报
Year: 2025
Issue: 07
Volume: 36
Page: 3405-3428
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: