文献综述
引言:
本文将从带噪数据学习和多分类不平衡数据学习两大块展开,讲课题拆分为两个领域分别介绍,然后再综合文献,总结文献中涉及到的处理带噪多分类不平衡数据学习的解决方案。
一、带噪数据学习
1.基本概念
噪声标签是分类中的重要问题,具有许多潜在的负面影响。例如,预测的准确性可能降低,而推断模型的复杂性和必要的训练样本的数量可能会增加。分类已在机器学习中得到广泛研究。在这种情况下,标准方法包括从标记的数据集中学习分类器,以预测新样本的类别。但是,现实世界中的数据集可能包含噪音,在[1]中定义为噪声,这种噪声会掩盖实例的功能与其类之间的关系。
噪声标签的定义[2]:分类包括使用从训练数据推断出的模型来预测新样本的类别。在本文中,假设每个训练样本都与一个观察到的标签相关联。该标签通常对应于样本的真实类别,但是在呈现给学习算法之前 ,可能会经历噪声处理。因此,重要的是将实例的真实类与其观察到的标签区分开。污染标签的过程称为标签噪声
噪声标签的潜在来源包括四个主要类别:
第一,提供给专家的信息可能不足以执行可靠的标记;
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。