[3D Graphics/개념] 카메라 원리, 카메라 모델
3D 그래픽스에 대해 학습하기 전에 기본적인 카메라 원리에 대한 이해가 필요합니다. 그래서 이번 글에서는 카메라 원리에 대해 간단히 정리해봤습니다. 이번 글에서 다룰 내용은 아래와 같습니다. 카메라의 기본 원리 카메라 모델 (핀홀 카메라 모델, 렌즈 카메라 모델) 카메라 원리 카메라의 사진이 찍혀서 디지털 이미지로 저장되는 과정은 다음...
3D 그래픽스에 대해 학습하기 전에 기본적인 카메라 원리에 대한 이해가 필요합니다. 그래서 이번 글에서는 카메라 원리에 대해 간단히 정리해봤습니다. 이번 글에서 다룰 내용은 아래와 같습니다. 카메라의 기본 원리 카메라 모델 (핀홀 카메라 모델, 렌즈 카메라 모델) 카메라 원리 카메라의 사진이 찍혀서 디지털 이미지로 저장되는 과정은 다음...
안녕하세요. 오늘은 구글리서치 그룹에서 발표한 Lumiere에 대해 소개 드리려고 합니다. 다만 아쉽게도 Imagen부터 해서 구글은 공식적인 코드를 공개하고 있지 않습니다. 또한 Make-a-Video 논문에서처럼 해당 논문에서도 구체적으로 언급하고 있지 않은 내용들이 많은데요. 아마 해당 분야 경쟁이 심화 되면서 구글 측에서는 모든 정보를 공개하지...
💡 핵심 요약 기존 디퓨전 모델에서 생성 과정을 제어할 때 발생했었던 문제를 해결하는 방법 제안 Asyrp을 제안하여 중간 변화가 상쇄되는 문제를 해결 디퓨전 모델에서 이미지 생성 과정을 제어할 수 있는 의미적 잠재 공간(semantic latent space)인 h-space의 발견 GA...
이번에 리뷰할 논문은 메타에서 공개한 Make-A-Video라는 논문입니다. 논문에서 구체적으로 설명되지 않은 부분은 Official하게 공개된 코드가 없어서 해당 코드 레파지토리를 통해 이해했습니다. (official 코드는 공개된 것이 없고 해당 레파지토리는 다른 분께서 구현하신 코드입니다.) 💡 핵심 요약 Text-to-Image...
이번에 리뷰할 논문은 구글 리서치 그룹에서 TMLR(Transactions on Machine Learning Research) 2023에 제출한 논문인 Synthetic Data from Diffusion Models Improves ImageNet Classification입니다. 생성 모델이 놀라운 속도로 발전하고 있는데요! 해당 논문에서는 생...
이 포스트는 Attention Is All You Need로 유명한 transformer에 대한 포스트입니다. NLP로 처음 transformer를 접했었는데 최근에는 비전 분야에서도 SOTA 기술로 적용되는 등 놀라운 성과를 보여 이번 기회에 transformer에 대해 정리해야겠다는 생각이 들어 본 글을 작성했습니다. Transformer는 나온...
1. SENet SeNet은 Squeeze와 Excitation 방법을 적용한 SE Block을 사용한 네트워크입니다. SE Block의 동작은 다음과 같이 설명할 수 있습니다. Squeeze operation: 각 피쳐맵에 대한 전체 정보를 요약하는 operation Excitation operation: 각 피쳐맵의 중요도를 스케일하는...
Score-CAM: Score-Weighted Visual Explanations for Convolutional Neural Networks은 CVPR 2020에 제출된 논문이다. Gradient에 대한 의존성을 제거하여 CAM을 구한다는 특징을 가진다. 1. Gradient의 문제점 Gradient Saturation ...
1. 요약 본 논문에서 저자들은 기존의 pooling 기법과 차별은 둔 Probabilistic Class Activation Map (PCAM) pooling을 제안하였다. PCAM pooling은 트레이닝 하는 동안 CAM의 우수한 localization 능력을 활용한다. 이 방법을 chestX-ray 데이터셋에 적용한 결과 classificat...
안녕하세요. 오늘은 정말 따끈따끈한 논문인 High-Performance Large-Scale Image Recognition Without Normalization에 대한 리뷰입니다. Deepmind에서 새롭게 발표한 일주일도 안된 따끈따끈한 논문입니다. 그동안 ImageNet데이터에서 SOTA 성능을 달성한 논문은 대부분 EfficientNet을 ...