小样本学习
分类问题在传统的机器学习中需要通过大量的数据进行训练,然后才能得到一个较好的分类器。但是在现实生活中,很多时候我们只能获得少量的数据(例如,人脸识别或科研数据),这时候就需要小样本学习。小样本学习旨在通过一个或者少量的训练样本来学习一个目标的类别。
人类在识别物体时,通常只需要看一两次就能记住,这是因为人类具有强大的学习能力,能够从少量的样本中学习到规律。小样本学习的目标就是要实现这一点。
在研究中发现,只依靠少量的样本进行学习是非常困难的。回归人的学习过程,发现人并非一出生就能够识别物体,而是通过后天大量的观察和学习,才能够识别物体。因此,小样本学习应当还拥有一个额外的数据集来帮助模型进行学习。需要注意的是,这个额外的数据集中的类别与支撑集中的类别是不同的(否则就没必要用小样本学习了)。
小样本学习的名词和符号
小样本数据集一般叫做:
- 支撑集
(小样本训练集) - 查询集
(小样本测试集) - 辅助集
(额外的数据集)
如果
基于元学习的方法
基于度量学习的方法
通过直接比较查询样本与支撑类别进行分类。
//TODO: ProtoNet