[논문 리뷰 #11] FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence, NeurIPS 2020

(1) 배경

- semi-supervised learning(SSL)은 labeled data, unlabeled data를 모두 사용하여, 생성을 위해 상당한 노동력이 드는 labeled data에 대한 의존을 줄이기 위한 방식

- 이전 SSL을 위한 방식은 매우 복잡한 구조를 가짐

- FixMatch는 기존 SSL의 방식을 융합해 구조를 단순화하였고, 이를 통해 state-of-the-art를 달성(Consistency regularization, Pseudo-labeling)

- FixMatch의 단순함으로 인해 다양한 ablation study를 통해 FixMatch가 높은 성능을 달성할 수 있었던 다양한 factor에 대해 연구

(2) 방법

1) supervised Loss

- weakly augmentation을 적용하여 labeled examples에 대한 예측 진행

- 기본 cross-entropy loss 사용

2) Unsupervised Loss

-과정-

1. weakly augmentation을 적용하여 unlabeled examples에 대한 pseudo label 생성

2. pseudo label의 confidence score가 threshold보다 높을 경우 pseudo label(hard)로 사용

=> hard label을 통해 unlabeled examples에 대한 예측이 작은 entropy를 가지도록 유도

3. pseudo label이 존재하는 unlabeled examples에 대해 strong augmentation을 적용하여 예측 진행

4. 기본 cross-entropy loss 사용

-주요사항-

- weakly augmentation을 적용한 경우, stong augmentation을 적용한 경우 모두 동일한 예측을 하도록 해 consistency regularization 적용

- 기존 consistency regularization 방식은 학습을 진행하며 Unsupervised loss에 대한 가중치를 점차 늘려나감

- FixMatch는 학습이 진행될수록 pseudo label의 confidence score가 threshold보다 높은 경우가 증가해 자연스럽게 Unsupervised Loss의 영향력이 확대됨

(3) 실험 결과

1) 다른 방법과의 비교

- 대부분 기존 방법에 비해 높은 성능을 달성

- Remixmatch는 Distribution Alignment를 통해 unlabeled set이 labeled set과 class distribution이 일치되도록 유하며 Fixmatch에 적용할 경우 Remixmatch보다 높은 성능 달성

2) labeled data 선택의 중요성

- labeled samples가 적을 경우 labeled samples의 quality에 따라 성능 차이가 크게 나타남

=> quality가 좋은 labeled samples를 선택한다면 매우 적은 label을 통해서도 높은 성능을 달성할 수 있음

3) Ablation Study

-Sharpening and Thresholding-

(a) - threshold의 크기에 따라 성능이 증가, threshold가 높은 경우 threshold를 약간 변형해도 성능이 큰 차이를 보이지 않음

(a) - threshold가 증가할 수록 pseudo label을 사용할 수 있는 경우가 줄어듬 => 성능은 증가하고 pseudo label은 양보다 질이 중요한 것을 증명

(b) - confidence threshold를 사용할 경우 sharpening에 의한 성능 폭은 매우 작음, confidence threshold를 사용하지 않을 경우 sharpening은 중요한 역활을 함

(b) - pseudo labeling을 thresholding, sharpening으로 교체하는 것은 매우 비효율적임

-Augmentation Strategy-

- pseudo label 생성시 strong augmentation을 사용할 경우 => 모델 학습 불가

- pseudo label 생성시 augmentation을 적용하지 않을 경우 => pseudo label에 overfit

- 모델 예측시 strong augmentation을 weakly augmentation을 교체한 경우 => 모델 학습이 불안정해지며 결국 붕괴됨

(4) 결론

- 기존 SSL 방법이 발전하면서 매우 복잡해졌으나 FixMatch는 구조를 단순화하였고, state-of-the-art 달성

- 구조 단순화를 통해 FixMatch의 작동방식을 섬세하게 연구할 수 있었음

'논문 리뷰' 카테고리의 다른 글

[논문 리뷰 #13] TE-TAD: Towards Full End-to-End Temporal Action Detection via Time-Aligned Coordinate Expression, CVPR 2024 (0)	2024.10.28
[논문 리뷰 #12] Boundary Denoising for Video Activity Localization, ICLR 2024 (5)	2024.10.15
[논문 리뷰 #10] MixMatch: A Holistic Approach to Semi-Supervised Learning, NeurIPS 2019 (0)	2024.09.21
[논문 리뷰 #9] An Image is Worth 16 x 16 Words : Transformer for Image Recognition at Scale, ICLR 2021 (0)	2024.09.06
[논문 리뷰 #8] Test-Time Zero-Shot Temporal Action Localization, CVPR 2024 (1)	2024.09.06

머신러닝 연구

[논문 리뷰 #11] FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence, NeurIPS 2020

(1) 배경

(2) 방법

1) supervised Loss

2) Unsupervised Loss

(3) 실험 결과

1) 다른 방법과의 비교

2) labeled data 선택의 중요성

3) Ablation Study

(4) 결론

'논문 리뷰' 카테고리의 다른 글

티스토리툴바

[논문 리뷰 #11] FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence, NeurIPS 2020

(1) 배경

(2) 방법

1) supervised Loss

2) Unsupervised Loss

(3) 실험 결과

1) 다른 방법과의 비교

2) labeled data 선택의 중요성

3) Ablation Study

(4) 결론

'논문 리뷰' 카테고리의 다른 글

관련글

티스토리툴바