在信息化时代的今日,在线社交网络与个人的生活密切相关。在线社交网络既能促进有益信息的传播,同时也为恶意信息的扩散提供了温床。如何快速而准确地识别恶意信息的传播源头(如网络谣言源、计算机病毒源),是网络科学中一个重要的基础问题。
日前,中国科大信息科学与技术学院张文逸课题组的博士生王朝旭和董文祥针对网络谣言源识别问题开展了深入研究,首次发现利用多样本观察知识能够为检测方法带来显著的分集增益。运用数理统计理论,他们从原理上证明,利用多样本观察知识,对于规则树状网络拓扑模型,能够将正确检测率由文献中单样本观察时的30.7%提升到趋近100%。进一步地,通过对多种实际网络模型的数值实验研究,证实了他们提出的多样本检测算法在实际场合中,有潜力大幅度提高谣言源识别的精度。
图一 小世界网络中谣言源检测结果
图二 无标度网络中谣言源检测结果
中国科大学者的该成果在未来可望应用于网络执法机构进行网络取证等各种网络安全相关的领域,通过充分挖掘利用多个数据样本中所包含的潜在联合信息,快速而准确地识别出恶意信息的传播源头。
上述研究成果以正式论文的形式在ACM SIGMETRICS会议上报告。论文由王朝旭、董文祥和他们的导师张文逸教授,以及香港城市大学计算机科学系陈志为(Chee Wei Tan)博士合作完成,中国科大电子工程与信息科学系是该论文的第一完成单位和通讯单位。创立于1973年的ACM SIGMETRICS是计算机系统性能建模、测量和分析领域的旗舰学术会议,平均录用率仅为15%左右。此前四十余年中国大陆科研单位作为第一作者仅在该会议发表过六篇正式论文,其中中国科大在2010年由计算机学院作为第一作者发表过一篇正式论文。
上述工作受到国家自然基金委、中国科学院、以及教育部博士点-香港研资局联合项目的资助。
(信息学院、科研部)
附论文信息
Z. Wang, W. Dong, W. Zhang, and C. W. Tan, “Rumor source detection with multiple observations:
Fundamental limits and algorithms”, in Proc. ACM SIGMETRICS 2014, Austin, TX, USA, June 2014.
链接:
http://dx.doi.org/10.1145/2591971.2591993