零样本学习入门指南：探索未知领域的奥秘

想象一下，你训练了一个图像识别模型，它能够准确识别猫、狗、鸟等常见动物。但是，当遇到从未见过的动物，比如鸭嘴兽时，模型却束手无策。这就是零样本学习 (Zero-Shot Learning, ZSL) 所要解决的问题：如何让机器学习模型识别从未见过的类别？

零样本学习的核心思想

零样本学习的核心思想是利用“额外信息”来弥补训练数据中缺失的类别。这些额外信息通常是对所有类别（包括已知类别和未知类别）的描述，例如属性、词语、文本描述或图像特征。

语义空间与特征空间

零样本学习涉及两个重要的空间：

零样本学习方法分类

零样本学习方法主要分为两大类：

基于分类器的方法： 直接学习一个用于未知类别分类的模型。
- 映射方法： 利用映射函数将语义空间和特征空间联系起来，学习每个类别的分类器参数。
- 关系方法： 利用类别之间的关系来构建模型，例如通过加权平均已知类别的分类器来得到未知类别的分类器。
- 组合方法： 将每个类别看作由一系列属性组成，并对每个属性训练一个二分类器，然后根据属性分类器的结果来判断样本所属类别。
基于实例的方法： 为未知类别构造样本，然后用这些样本去训练分类器。
- 拟合方法： 将样本和类别描述信息映射到同一个空间，然后利用 KNN 等方法进行分类。
- 借助实例方法： 借用与未知类别相似的已知类别的样本作为训练数据。
- 合成方法： 利用生成模型来生成未知类别的样本。