본문 바로가기

Paper Review/ETC.

(6)
[Paper Review] FFHQ-UV: Normalized Facial UV-Texture Dataset for 3D Face Reconstruction (CVPR' 23) 안녕하세요. :) 얼마 전 유명한 Human Face dataset인 FFHQ로부터 uv-texture를 추출한 FFHQ-UV라는 데이터셋이 공개되었습니다. 다양한 방향으로 활용이 가능할 것 같습니다만, 본 리뷰에서는 연구에서 제시하는 texture generation관점에서 서술해보고자 합니다. 그럼 시작하겠습니다 :) 1. Introduction 본 연구는 3D Face Reconstruction을 위한 Public & High Quality & High Fidelity UV-Texture Dataset를 공개했다는 것에 의의가 있다. 실제로 기존에도 비전 및 그래픽스 커뮤니티에서 Face의 3d shape( identity & expression )과 texture를 reconstruction하는 ..
[Paper Review] VideoINR: Learning Video Implicit Neural Representation for Continuous Space-Time Super-Resolution Introduction 비디오는 현실의 continous한 visual data를 discrete한 consecutve frame들로 저장하는 방법이다. High fidelity & frame rate을 가진 video를 저장하는 것은 현실적으로 매우 큰 비용이 들기 때문에, 상대적으로 low resolution & frame rate으로 저장하게 된다. ( = limited spatial resolution & temporal frame rate ) 하지만, 이러한 video가 human에게 보여질 때는 high level 정보를 가지도록 복원되기를 원한다. 본 논문에서는 이와 같이 space & time 관점에서 high resoluton & frame rate으로 비디오를 복원하는 방법을 Impli..
[Paper Review] Neural nano-optics for high-quality thin lensimaging ( Nature Communicatons' 21 ) 간단히 적은 후 추후에 내용을 자세히 보충해서 설명해두려고 합니다. 최근 아이폰의 카툭튀 현상처럼 스마트폰과 같은 consumer device에서 camera는 점점 더 정교해지고 복잡해지고 있다. 이는 더 좋은 이미지 퀄리티를 위해서 bulky camera bumps를 계속 쌓고 있기 때문이다. ( Bulky Compound Optics ) 이러한 이유로 실제로 Medical & Astronomy 등의 ( microscope & telescope ) 도메인에서는 metasurface optics을 활발히 연구하고 있다. 이러한 metasurface optics가 정말 작은 nano 혹은 ultra-small optical element로 사용될 수 있을지라도 실제로 얻게 되는 이미지의 퀄리티는 기존의 ..
[Paper Review] DETR : End-to-End Object Detection with Transformers 1. Abstract 기존의 Obejct Detection Methods들은 task에 대한 사전 지식을 고려한 hand-designed component들이 필요해 complex detection pipeline을 가지고 있는 indirect set prediction problem이었습니다. 저자들은 이에서 벗어나 object detection을 direct set prediction problem(image-to-set)으로 보고자 했습니다. 이를 위해 set matching을 위한 bipartite matching, hungarian algorithm같은 기존의 매칭 알고리즘을 Loss에 녹였고, image-to-set으로 direct set prediction에 sequnece-to-sequen..
[Paper Review] DeiT : Training data-efficient image transformers & distillation through attention 2020년 Vision Transformer가 등장하면서 Vision task에서도 Transformer가 큰 격변을 가져오기 시작했습니다. 하지만, 이러한 Vision task에서의 Transformer들은 1. 거대 데이터셋으로 학습 필요 2. 매우 무거움 등의 문제로 인해 활발히 활용되기 어려웠습니다. 이번에는 이러한 Transformer를 실질적으로 활용하기 위해서 Efficiency에 집중한 Efficient Transformer들의 시초 격인 DeiT : Training data-efficient image transformers& distillation through attention를 살펴보도록 하겠습니다. 1. Abstract 최근에는 NLP뿐 아니라 Audio, Computer Visi..
[Paper Review] Making Convolutional Networks Shift-Invariant Again Making Convolutional Networks Shift-Invariant Again는 ICML 2019에 소개된 논문으로 약간은 신호처리적인 관점에서 CNN을 다룬 논문입니다. aliasing과 shift-invariant에 대해서 소개하고 있습니다. 이번에는 세세히 리뷰보다는 얻어가야 할 아이디어와 중요한 background위주로 서술해보겠습니다. 다만, 저는 신호처리에 대한 깊은 이해를 가지고 있지는 못하기에 부족한 부분이나 잘못된 부분이 있을 수 있습니다.(피드백은 언제든지 환영! )또한, 논문에 대한 저자의 발표의 흐름과 유사하게 서술할 예정이니 필요하다면 영상 또한 참고하셔도 좋을 것 같습니다. 1. Abstract We show that classic antialiasing appli..