[논문 리뷰 #15] UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework, ECCV 2024

https://arxiv.org/abs/2409.15264

UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework

In this work, we take a deeper look into the diverse factors that influence the efficacy of modern unsupervised domain adaptation (UDA) methods using a large-scale, controlled empirical study. To facilitate our analysis, we first develop UDA-Bench, a novel

arxiv.org

(1) 배경

- UDA 는 target domain의 unlabeled dataset을 사용하며, 다른 source domain의 labeled dataset을 사용할 수 있는 방법임

- 최근 UDA 연구는 새로운 algorithms나 loss function 개발에 집중하는 반면 실제 domain adaptation 성능에 영향을 미치는 assumptions 에 대한 전반적인 이해는 부족함

--> 잠재적으로 UDA에 가장 높은 영향을 미치는 Backbone architectures, Unlabeled data quantity, Pretraining dataset 3가지 Factor에 대해 연구

--> initialization, learning algorithm, batch sizes등 실제 adaptaion과 관련없는 factor를 표준화하고, 여러가지 UDA 방법을 하나의 platform으로 통합함

(2) 연구 결과

1) The Need for UDA-Bench Framework

- 그림 2은 Adaptaion 관련 Loss를 모두 비활성화하고, source data에서만 UDA 를 진행했을 때 성능을 보여줌

- Adaptation 관련 Loss를 모두 제거하였으므로 모두 동일한 성능을 보여야 함

- deeper MLP as a classifier, batchnorm layers in the bottleneck layer, 10-crop evaluation and AdaMatch 등 각 방법의 학습 전력 차이 발생 (실제 adaptaion 방법과는 무관)으로 성능이 서로 다름

--> UDA-Bench Framework가 필요함

2) Which backbone architectures suit UDA best?

* Newer Architectures Show Better Domain Transfer

- Vision transformer 기반 모델이 가장적은 relative drop을 보임(Swin-V2-t)

- Swin-V2-t는 DomainNet(r->c)에서 ResNet-50을 통해 Domain Adaptation을 진행한 경우보다 높은 성능을 보임

-> complex adaptation algorithm을 사용하는 것보다 더욱 좋은 Backbone을 사용하는 것이 더욱 효과적일 수 있음

- Vision transformer의 Robustness는 이미 널리 알려져 있으며, 이것이 out-of-domain robustness로도 이어짐을 확인

- 데이터셋에 따라 모델의 relative ranking이 달라짐 -> Domain transfer의 type은 domain robustness에 영향을 미침

* UDA Gains Diminish With Newer Architectures

- 그림 3은 UDA를 진행했을 때 성능 증가 정도를 UDA method,Backone, 데이터 셋 별로 정리해 둠

- 더욱 좋은 out-of-domain robustness를 보이는 모델을 사용할수록 relative gain은 감소

- 가장 좋은 Adaptation method, Backbone은 dataset에 따라 모두 다름

- > 각 방법의 성능 비교전 backbone, architecture를 표준화 하는 것은 매우 중요함

3) How much unlabeled data can UDA methods use?

* UDA Accuracy Does Not Increase With More Unlabeled Data

- Domain transfer type에 무관하게 unsupervised adaptation은 unlabeled data에 대해 상당히 빠른 속도로 saturate 됨

-> 대략 25%의 unlabeled data를 사용했을 때부터 saturate, 100% 활용했을 때와 성능 차이가 매우 적음(1% 정도)

* Investigating Poor Data Efficiency of UDA Methods

- poor unlabeled sample efficiency는 adaptation objective를 통한 것으로 가정

- target unlabeled data에 대한 정확도를 측정 -> 25%의 데이터를 사용해서도 이미 정확도는 saturate됨

- adaptation accuracy의 saturation은 adaptation objective에 의한 것으로 확인

- 위의 관찰 결과는 여러 UDA 방법의 근간이 되는 Ben-David 등의 domain adaptation theoretical framework

와 대조를 이룸 (target unlabeled data가 많을 수록 target data에 대한 성능 증가)

4) Does pre-training data matter in UDA?

* Supervised Pre-training Using In-Task Data Helps UDA

- 포괄적으로 in-task pre-training은 downstream adaptation에 긍정적인 영향을 미침

- 사전학습 시 사용한 dataset에 따라 target domain에 대한 정확도 변화

- in-task data에 대한 pre-training은 더 관련성 있는 특성을 사전에 생성하여 유사한 downstream dataset에 대한 generalization 능력을 향상 시키는 것으로 가정

-> target unlabeled data가 주어졌을 때 적절한 pre-trained 모델 선택은 target domain에 대한 정확도를 향상하기 위한 좋은 방법임

* In-Task Pre-training is complementary to UDA method

- no adapt, IN-1M , CUB 에서 50.30이지만 adaptation(ToAlign)을 통해 12% 성능 증가, backbone(NAT-1M)을 교체해서 5% 성능 증가

- UDA 방법이 adaptation 데이터셋과 관계없이 기본적으로 ImageNet 을 사용

- GeoP, CUB에서는 PL-1M, NAT-1M을 통한 사전학습 모델을 사용하는 것이 좋음

-> target task에 맞추어 사전학습 모델을 선택하여 target에 대한 성능향상을 이끌어 낼 수 있음

* Nature of Pre-training Images matter for Self-supervised Learning

- Self-supervised Learning은 label 정보 부족으로 인해 Supervised Learning에 비해 적은 object semantics를 학습함

- IN-1M 에 대해 DNet, CUB에서(object-centric), PL-1M 에 대해 GeoP에서(scene-centric) benefit을 얻음

- self-supervised learning때 데이터셋의 이미지 특성(object-centric, scene-centric)은 downstream transfer에 큰 영향을 미침

*즉 supervised pre-trianed 모델을 선택할 때 task, self-supervised pre-trianed 모델을 선택할 때 Nature이 중요함*

(3) 요약

- Unsupervised domain adaptation의 성능에 영향을 미치는 Factor에 대해 연구

- Backbone architectures, Unlabeled data quantity, Pretraining dataset 3가지 Factor에 대해 연구

- 1) Advanced backbone을 사용할 때 UAD 효과 감소, 2)최신 UDA 방식은 Unlabeled dataset을 충분히 이용하지 못함, 3)Pretraining dataset은 추후 adaptation에 큰 영향을 줌 을 밝혀냄

'논문 리뷰' 카테고리의 다른 글

[논문 리뷰 #17] Grounded Language-Image Pre-training, CVPR 2022 (0)	2024.12.11
[논문 리뷰 #16] A Broad Study of Pre-training for Domain Generalization and Adaptation, ECCV 2022 (0)	2024.12.08
[논문 리뷰 #14] Benchmarking the Robustness of Temporal Action Detection Models Against Temporal Corruptions, CVPR 2024 (0)	2024.10.29
[논문 리뷰 #13] TE-TAD: Towards Full End-to-End Temporal Action Detection via Time-Aligned Coordinate Expression, CVPR 2024 (0)	2024.10.28
[논문 리뷰 #12] Boundary Denoising for Video Activity Localization, ICLR 2024 (5)	2024.10.15

머신러닝 연구

[논문 리뷰 #15] UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework, ECCV 2024

https://arxiv.org/abs/2409.15264

(1) 배경

(2) 연구 결과

1) The Need for UDA-Bench Framework

2) Which backbone architectures suit UDA best?

* Newer Architectures Show Better Domain Transfer

* UDA Gains Diminish With Newer Architectures

3) How much unlabeled data can UDA methods use?

* UDA Accuracy Does Not Increase With More Unlabeled Data

* Investigating Poor Data Efficiency of UDA Methods

4) Does pre-training data matter in UDA?

* Supervised Pre-training Using In-Task Data Helps UDA

* In-Task Pre-training is complementary to UDA method

* Nature of Pre-training Images matter for Self-supervised Learning

(3) 요약

'논문 리뷰' 카테고리의 다른 글

티스토리툴바

[논문 리뷰 #15] UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework, ECCV 2024

https://arxiv.org/abs/2409.15264

(1) 배경

(2) 연구 결과

1) The Need for UDA-Bench Framework

2) Which backbone architectures suit UDA best?

* Newer Architectures Show Better Domain Transfer

* UDA Gains Diminish With Newer Architectures

3) How much unlabeled data can UDA methods use?

* UDA Accuracy Does Not Increase With More Unlabeled Data

* Investigating Poor Data Efficiency of UDA Methods

4) Does pre-training data matter in UDA?

* Supervised Pre-training Using In-Task Data Helps UDA

* In-Task Pre-training is complementary to UDA method

* Nature of Pre-training Images matter for Self-supervised Learning

(3) 요약

'논문 리뷰' 카테고리의 다른 글

관련글

티스토리툴바