본문 바로가기
반응형

34

[논문 리뷰 #20] What does a platypus look like? Generating customized prompts for zero-shot image classification, ICCV 2023 1. 배경1) 기존 prompt는 사람이 직접 생성한 “a photo of a {}”의 templete으로 구성되어 있었음. - class 수가 증가하면 prompt를 생성하기 위한 사람의 노동력이 크게 증가. - prompt는 모든 class에 적용하기 위해 충분히 general 해야함. - prompt를 생성하기 위해 데이터 셋에 대한 사전 지식을 필요로함2) 최소한의 hand-constructed sentences을 사용하여 explicit knowledge나 task의 domain 없이 더욱 높은 정확도를 높이는 prompt 생성 방식 제안.2. Customized Prompts via Language models (CuPL) - 위 방식은 LLM을 사용하여 데이터셋의 class에 .. 2025. 5. 14.
[논문 리뷰 #19] Dual Prototype Evolving for Test-Time Generalization of Vision-Language Models, NeurIPS 2024 Dual Prototype Evolving for Test-Time Generalization of...Test-time adaptation, which enables models to generalize to diverse data with unlabeled test samples, holds significant value in real-world scenarios. Recently, researchers have applied this...openreview.net 1. 배경1) Test-time prompt tuning 방식은 Text ecoder를 통과해서 Gradient 계산을 해야하기 때문에 계산비용, 메모리에서 손해2) 기존 VLM adaptaion 방식의 한계 - 과거 sample에.. 2025. 5. 9.
[논문 리뷰 #18] NOTE: Robust Continual Test-time Adaptation Against Temporal Correlation, NeurIPS 2022 NOTE: Robust Continual Test-time Adaptation Against Temporal...This paper present a test-time adaptation algorithm for non-i.i.d. test data streams.openreview.net(1) 배경- TTA는 Labeled data 없이 Test time에 Training data와 Test data의 distribution gap을 완화하기 위해 제안됨- 기존 TTA는 sample이 independent and identically distributed(i.i.d.) 라고 가정함- 하지만 많은 데이터가 temporally correlated (non-i.i.d.) 형태를 가짐- 기존 TTA는 위와 같.. 2025. 1. 22.
THC/THC.h: No such file or directory PyTorch 2.x 이후 버전에서는 THC(Torch CUDA)와 관련된 헤더 파일이 대규모 리팩토링으로 인해 더 이상 제공되지 않거나 이름이 변경됨 THC 헤더는 주로 PyTorch의 내부 구현에 사용되던 것으로, 최신 버전에서는 ATen과 c10으로 대체됨 그래서..  기존 THC에서 제공한 코드를 모두 수정해야함 #include                              ==>         #include #include            ==>         #include #include      ==>         #include  THCudaCheck(cudaGetLastError());       ==>        AT_CUDA_CHECK(cudaGetLastError().. 2024. 12. 19.
[논문 리뷰 #17] Grounded Language-Image Pre-training, CVPR 2022 https://arxiv.org/abs/2112.03857 Grounded Language-Image Pre-trainingThis paper presents a grounded language-image pre-training (GLIP) model for learning object-level, language-aware, and semantic-rich visual representations. GLIP unifies object detection and phrase grounding for pre-training. The unification brings two benarxiv.org(1) 배경- visual recognition 모델은 사전에 추가적인 labeled data가 필요한 domain.. 2024. 12. 11.
[논문 리뷰 #16] A Broad Study of Pre-training for Domain Generalization and Adaptation, ECCV 2022 https://arxiv.org/abs/2203.11819 A Broad Study of Pre-training for Domain Generalization and AdaptationDeep models must learn robust and transferable representations in order to perform well on new domains. While domain transfer methods (e.g., domain adaptation, domain generalization) have been proposed to learn transferable representations across domains,arxiv.org(1) 배경- Domain transfer method는.. 2024. 12. 8.
반응형