JeongHwarr의 작은 다락방

[논문리뷰] Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

오늘 소개 드릴 논문은 알리바바에서 발표한 Animate Anyone입니다. 현재 공식 코드는 레포만 만들어져 있는데 언제인지는 모르지만 코드는 공개할 예정이라고 합니다! 공식 코드는 아니지만 다른 분께서 구현해 놓은 코드가 있으니 참고하시길 바랍니다. 그리고 결과 영상 등은 해당 페이지에서 보실 수 있습니다. 구체적인 내용 소개에 앞서 해당 모...

[3D Graphics/개념] 카메라 원리, 카메라 모델

3D 그래픽스에 대해 학습하기 전에 기본적인 카메라 원리에 대한 이해가 필요합니다. 그래서 이번 글에서는 카메라 원리에 대해 간단히 정리해봤습니다. 이번 글에서 다룰 내용은 아래와 같습니다. 카메라의 기본 원리 카메라 모델 (핀홀 카메라 모델, 렌즈 카메라 모델) 카메라 원리 카메라의 사진이 찍혀서 디지털 이미지로 저장되는 과정은 다음...

[논문리뷰] Lumiere: A Space-Time Diffusion Model for Video Generation

안녕하세요. 오늘은 구글리서치 그룹에서 발표한 Lumiere에 대해 소개 드리려고 합니다. 다만 아쉽게도 Imagen부터 해서 구글은 공식적인 코드를 공개하고 있지 않습니다. 또한 Make-a-Video 논문에서처럼 해당 논문에서도 구체적으로 언급하고 있지 않은 내용들이 많은데요. 아마 해당 분야 경쟁이 심화 되면서 구글 측에서는 모든 정보를 공개하지...

[논문리뷰] Make-A-Video: Text-to-Video Generation without Text-Video Data

이번에 리뷰할 논문은 메타에서 공개한 Make-A-Video라는 논문입니다. 논문에서 구체적으로 설명되지 않은 부분은 Official하게 공개된 코드가 없어서 해당 코드 레파지토리를 통해 이해했습니다. (official 코드는 공개된 것이 없고 해당 레파지토리는 다른 분께서 구현하신 코드입니다.) 💡 핵심 요약 Text-to-Image...