728x90

Paper

arxiv.org/abs/1906.02629

 

When Does Label Smoothing Help?

The generalization and learning speed of a multi-class neural network can often be significantly improved by using soft targets that are a weighted average of the hard targets and the uniform distribution over labels. Smoothing the labels in this way preve

arxiv.org

 

Abstract

label smoothing을 적용하면 same class의 training example이 더 뭉치는 (tight) 형태로 representation이 형성되게 된다.

 

 

 

Penultimate layer representations

 

label smoothing을 하는 경우  uniform distribution에 fitting하는 항 때문에 input x가 incorrect class간의 같은 거리를 형성하도록 loss가 주어지게 되고, 결과적으로  embedding space에서 같은 class (intra class)끼리 좀 더 뭉치는 형태를 띄게 된다.

 

 

 

728x90

+ Recent posts