Realistic Evaluation of Semi-Supervised Learning Algorithms

Avital Oliver, etc.

semi-supervised learning (SSL) 通常是这么进行评估的： 1. 讲一个supervised learning的数据中的大部分label扔掉 2. 将有数据的部分进行训练，剩余的作为auxiliary unlabeled 3. 一些模型就在有label的部分进行训练，然后在unlabeled数据进行预测和评估

和Transfer Learning区别：当数据不够的时候一个标准做法就是transfer model。很有效，但是很少有人把它当作baseline。
class distribution不匹配：使用不同的数据源进行augment，比如用Tiny ImageNet来augmentcifar10。这类似domain adaptation中的一些特征。我们研究了labeled和unlabeled data中不同class distribution的情况。
labeled和unlabeled数据量有差别
validation set过小带来的偏差

Semi-Supervised Learning

$$(x,y) \in \mathcal{D}$$ from unknown distribution $$p(x,y)$$

produce a prediction function $$f_\theta(x)$$ on unseen data point $$x$$

SSL中，我们还额外知道unlabele^d input datapoints $$x \in \mathcal{D}_{UL}$$

大方向上是使用$$D{UL}$$来对$$f\theta(x)$$进行augment。比如通过提供数据manifold的shape形式，提供decision boundary更好的形式。

大致有这么几类模型

consistency regularization：将$$D_{UL}$$中的data point进行替换不应该改变其预测结果。
entropy－based：核心想法是让模型的预测更加有信心（low entropy）。
pseudo-labelling：对unlabeled数据用启发式的方法加上label。

Realistic Evaluation of Semi-Supervised Learning Algorithms

Realistic Evaluation of Semi-Supervised Learning Algorithms

Realistic Evaluation of Semi-Supervised Learning Algorithms

Semi-Supervised Learning

results matching ""

No results matching ""

Realistic Evaluation of Semi-Supervised Learning Algorithms

Realistic Evaluation of Semi-Supervised Learning Algorithms

Related

Semi-Supervised Learning

results matching ""

No results matching ""