반응형 홈34 [논문 리뷰 #5] Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy, CVPR 2020 Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New StrategyData augmentation is an effective way to improve the performance of deep networks. Unfortunately, current methods are mostly developed for high-level vision tasks (e.g., classification) and few are studied for low-level vision tasks (e.g., image restoratioarxiv.org 기존 High-level vision tasks에서 Dat.. 2024. 3. 25. [논문 리뷰 #4] Activating More Pixels in Image Super-Resolution Transformer, CVPR 2023 위 논문에서 제안한 Hybrid Attention Transformer(HAT) 모델은 channel attention과 window-based self attention을 결합한 최근 Single Image Super Resolution(SISR) Sota를 달성하였습니다. (1) 동기 최근 Transformer 기반의 방법은 low-level vision task에서 상당한 성과를 보여주었습니다. 하지만 Transformer 기반의 방법이 왜 CNN architecture에 기반한 모델보다 뛰어난 성능을 보이는지는 명확하지 않습니다. 우리는 그저 self-attention mechanism과 long-range information을 활용해서 더 뛰어난 것이라고 직관적으로 설명하고 있습니다. 그래서 .. 2024. 3. 7. [논문 리뷰 #3] SwinIR: Image Restoration Using Swin Transformer, ICCVW 2021 (1) 동기 대부분의 Image restoration 모델이 CNN을 기반으로 하고 있었습니다. 최근에 Transformer를 Image restoration 적용하려는 노력으로 최근 높은 성능을 달성하였습니다. 이러한 상황속에서 위 논문의 저자들은 Swin transformer에 기반한 SwinIR baseline 모델을 제안합니다. (2) Method SwinIR은 3가지 파트로 구성되어 있습니다. 3가지 파트에 대해 차례로 설명해 드리겠습니다. 1) Shallow feature extraction shallow feature extraction 단계에는 3 × 3 convolutional layer를 활용합니다. 위 과정을 통해 조금 더 안정적인 최적화를 진행할 수 있습니다 또한 간단한 방법으로 i.. 2024. 3. 7. [실험결과 재현 #11] Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy, CVPR 2020 1. 가상환경 설정 1) github에서 설치해야할 파이썬 버전을 알려주지 않고 있음 -> table1에서는 여러 data augmentation방법을 EDSR 모델에 적용하고 성능을 평가한 것임 -> EDSR모델의 github에서는 python 3.6.0 사용 -> 가장 가까운 python 3.6.2 설치 2) pytorch 1.4.0은 torchvision 0.5.0 과 함께 설치 conda create -n cutblur python==3.6.2 pip3 install -r requirements.txt 2. Training (1) 데이터 준비 1) 데이터 다운로드 - train set과 validataion set을 분할하지 않고 한 폴더에 병합해야함 - 아래 구조와 동일하게 저장 (2) Trin.. 2024. 3. 5. [논문 리뷰 #2] Learning Action Completeness from Points for Weakly-supervised Temporal Action Localization, ICCV 2021 1. Point-level supervision우선 논문 리뷰 시작 전 Temporal action localiaztion(TAL)의 지도방식에 대해 우선 설명해 드리겠습니다. Fully-supervised TAL 은 action instance의 정확한 시작 시간 과 종료 시간을 제공해 주며, 이러한 정확한 annotaion을 제공받아 높은 성능을 달성합니다. 하지만 정확한 Annotation을 생성하기 위해 많은 시간과 노동력이 투입되어야 합니다. 이러한 문제를 해결하기위해 action class만을 annotation으로 모델에 제공하는 Weakly-supervised TAL이 제안 되었지만 제공되는 label이 너무 적어 성능이 매우 낮습니다. 이로 인해 최근에는 action에 속하는 fra.. 2024. 1. 26. [실험결과 재현 #10] Feature Modulation Transformer: Cross-Refinement of Global Representation via High-Frequency Prior for Image Super-Resolution, ICCV2023 1. 가상환경 설정 git clone https://github.com/AVC2-UESTC/CRAFT-SR.git conda create -n CRAFT python=3.7 conda activate CRAFT pip install -r requirements.txt python setup.py develop 2. Training (1) 데이터 준비 1) 데이터 다운로드 (2) Train.py 실행 bash scripts/dist_train.sh 4 options/train/CRAFT/train_CRAFT_SRx4_scratch.yml 1) 오류 발생 - num_worker를 키워주면 해결됨 3. 결과 - 학습이 종료되기까지 매우 오랜 시간일 걸림(대략 5일) - 사전학습 모델을 다운받아 간간하게 재현 .. 2024. 1. 26. 이전 1 2 3 4 5 6 다음 반응형