AI3 [Overview] Image Formation Image Formation : Projection of 3D scene onto 2D plane : scene๊ณผ image๊ฐ์ geometric and photometric relation์ ๋ํด์ ์ดํดํ ํ์๊ฐ ์์ - geometric : scene์ ํ point๊ฐ ์์ ๋, image์ ์ด๋ป๊ฒ ํํ๋๋์ง์ ๊ด์ - photometric : scene์ brightness์ apearance๊ฐ image์์๋ ์ด๋ป๊ฒ ํํ๋๋์ง์ ๊ด์ Topics : (1) Pinhole and Perspective Projection - ๊ฐ์ฅ ๊ธฐ๋ณธ์ด ๋๋, ์ญ์ฌ๊ฐ ๊ธด pinhole ์นด๋ฉ๋ผ์ ๋ํด์ ์์๋ณด๊ฒ ์ - ๋ฌผ๋ก ์ฅ์ ๋ ๋ง์ ์นด๋ฉ๋ผ์ด์ง๋ง (can produce great clarity) ๋น์ ๋ชจ์ผ๋๋ฐ ๋ฌธ์ ๊ฐ .. 2024. 4. 6. Lecture 2. Image Classification Image Classification What is Image Classification? Example : Input : ๊ณ ์์ด ์ฌ์ง ์ปดํจํฐ๋ ์ฌ์ ์ ์ ํด์ง label๋ค์ ์งํฉ์(predetermined set of labels) ๊ฐ์ง๊ณ , input๊ฐ๊ณผ ์ผ์นํ๋ label๊ฐ์ output์ผ๋ก ์ถ๋ ฅํ๋๋ก ๊ณ์ฐํ๋ค. Output : Cat Semantic Gap (์๋ฏธ์ ์ฐจ์ด) ์ ์ : ์ค์ ์ด๋ฏธ์ง๊ฐ ๊ฐ๊ณ ์๋ ์๋ฏธ์ ์ปดํจํฐ๊ฐ ๋ณด๋ ํฝ์ ๊ฐ ์๋ฏธ์ ์ฐจ์ด ์ฐ๋ฆฌ๋ ์ฝ๊ฒ ๊ณ ์์ด๋ฅผ ๋ณด๊ณ "๊ณ ์์ด"์์ ๋ถ๋ฅํ ์ ์์ง๋ง, ์ปดํจํฐ์ ๊ฒฝ์ฐ์๋ ํ๋์ image๊ฐ ๊ฑฐ๋ํ ์ซ์ ๊ทธ๋ฆฌ๋(gigantic grid of numbers)๋ก ๋ณด์ด๊ธฐ ๋๋ฌธ์ ๊ณ ์์ด๋ฅผ ๋ฐ๋ก ์ฐ์ํ ์ ์๋ ๊ฒ์ด๋ค. Challenges : Viewpoin.. 2024. 2. 16. Lecture 13. Generative Models Overview - Unsupervised Learning - Generative Models PixelRNN and PixelCNN Variational Autoencoders (VAE) Generative Adversarial Networks (GAN) Classification : Input : Image Output : Text (Label) Object Detection : Input : Image Output : Bounding Boxes of instances Semantic Segmentation (having label for every pixel) : ? Image Captioning : Input : Image Output : Caption (form of natural languag.. 2024. 2. 13. ์ด์ 1 ๋ค์