综述:弱监督下的异常检测算法
发布网友
发布时间:2024-10-24 09:34
我来回答
共1个回答
热心网友
时间:2024-11-01 02:13
Weakly Supervised Anomaly Detection: A Survey
本文综述了弱监督下的异常检测算法,简称WSAD。
针对异常检测问题,面临的挑战和问题较为一致。本文从标签角度出发,讨论了弱监督情况下的异常检测问题。大多数异常检测采用非监督方法,如去编码高级特征,重新生成数据,进行对比,得到异常。而对于监督方法来说,虽然存在标签,但标签质量难以保证。
本文将针对弱监督异常检测的论文进行整合,并从三个角度进行分类,以方便进一步了解该领域的读者寻找合适的论文进行阅读。
3.1 场景
获取完整的信用卡欺诈标签集,需要手动标注所有正常和异常交易,这通常耗时且成本高。
3.2 方法
本文提出的方法主要通过无监督表示学习,学习特征的embedding来区分异常与否。对于监督情况,通过可获得的部分监督信息来改进学习方法。例如XGBOD使用无监督方法作为特征提取器,通过监督模型学习。深度学习方法主要将特征提取部分换为神经网络,一些网络是端到端的结构,来学习异常和非异常的分布,带有标签的作为加强。
3.3 将来一些思考
4. 模型选择和超参数
4.1 场景
公司可以获得用户级异常标签,这些标签仅表明用户是否参与了欺诈等非法活动。而我们更感兴趣的是用户的哪些交易是异常的。
4.2 方法
主要基于multi-instance learning (MIL)的方法,还提出了新的评估指标或模型选择策略来解决这个问题。
4.3 将来一些思考
5.1 场景
标签存在噪音和损坏的情况,这在网络入侵检测中十分常见。
5.2 方法
1. ensemble learning:通过集成学习或设计降噪的网络,将标签噪声在模型训练过程中的影响降至最低,从多个噪声源中提取有用的标签信息。
2. denoising network:通过attention来过滤类别的噪声,通过去噪系统解决这类问题。
3. graph learning:针对视频数据,引入graph learning。
六、实验
使用6个基准算法在47个公开数据上进行了测试,具体实验结果可参考github.com/yzhao062/wsa...