Image Classification
What is Image Classification?
- Example :
- Input : ๊ณ ์์ด ์ฌ์ง
- ์ปดํจํฐ๋ ์ฌ์ ์ ์ ํด์ง label๋ค์ ์งํฉ์(predetermined set of labels) ๊ฐ์ง๊ณ , input๊ฐ๊ณผ ์ผ์นํ๋ label๊ฐ์ output์ผ๋ก ์ถ๋ ฅํ๋๋ก ๊ณ์ฐํ๋ค.
- Output : Cat
Semantic Gap (์๋ฏธ์ ์ฐจ์ด)
- ์ ์ : ์ค์ ์ด๋ฏธ์ง๊ฐ ๊ฐ๊ณ ์๋ ์๋ฏธ์ ์ปดํจํฐ๊ฐ ๋ณด๋ ํฝ์
๊ฐ ์๋ฏธ์ ์ฐจ์ด
- ์ฐ๋ฆฌ๋ ์ฝ๊ฒ ๊ณ ์์ด๋ฅผ ๋ณด๊ณ "๊ณ ์์ด"์์ ๋ถ๋ฅํ ์ ์์ง๋ง, ์ปดํจํฐ์ ๊ฒฝ์ฐ์๋ ํ๋์ image๊ฐ ๊ฑฐ๋ํ ์ซ์ ๊ทธ๋ฆฌ๋(gigantic grid of numbers)๋ก ๋ณด์ด๊ธฐ ๋๋ฌธ์ ๊ณ ์์ด๋ฅผ ๋ฐ๋ก ์ฐ์ํ ์ ์๋ ๊ฒ์ด๋ค.
- Challenges : Viewpoint variations (๋ฐ๋ก๋ณด๋ ๊ด์ ์์์ ์ฐจ์ด ์ธ์), Illumination (๋น์ ๋ฐ์ฌ์ ์ํ ์ฐจ์ด ์ธ์), Deformation, Occlusion, Background and Clutter, Intraclass variations
- ํ์ง๋ง ํ์ฌ์ ์ปดํจํฐ๋ ์ธ๊ฐ ์์ค์ ์ ํ๋๋ก ์ ํ๋ ์ํฉ ์์์ ๋น ๋ฅด๊ฒ ์ฌ๋ฌผ์ ํ๋จํ ์ ์์! → HOW??
How to Implement Image Classification
- Image Classification์ ํ๊ธฐ ์ํด์ ์ด๋ค API๋ฅผ ๋ง๋ค์ด๋ณผ ์ ์์๊น? ๊ณ ๋ฏผํ๊ฒ ๋ ๊ฒ์ด๋ค.
- ๋ญ๊ฐ image๋ฅผ inputํ๊ณ ์ค๊ฐ์ ๋ง๋ฒ ๊ฐ์ ์ฝ๋๋ฅผ ๋ง๋ค์ด์ class_label์ return ๋ฐ๊ณ ์ถ์ ๊ฒ์ด์ง๋ง..
- ๋ณดํต ์ผ์ด ์ฃผ์ด์ ธ์ ์์ฐจ์ ์ผ๋ก ์๊ณ ๋ฆฌ์ฆ์ ๋ง๋ค์ด ๋๊ฐ๋ ๊ฒ๊ณผ ๋ค๋ฅด๊ฒ.. ์ด๊ฑธ ์ด๋ป๊ฒ ์ฝ๋๋ฅผ ์ง์ผ ์ ์งฐ๋ค๊ณ ์๋ฌธ์ด ๋ ์ง ๋์ ํ ๊ฐ์ด ์กํ์ง ์์ ๊ฒ์ด๋ค..
- ๊ทธ๋๋ ์ผ๋จ ํ ๊ฐ์ง์ ๋ฐฉ๋ฒ์ ๋ ์ฌ๋ ค๋ณด์๋ฉด! ๊ณ ์์ด๋ฅผ ์ธ์ํ ์ ์๋ ๊ท์น(rule)์ ๋ง๋ค์ด ๋ณผ ์๋ ์์ ๊ฒ์ด๋ค.
- ๊ณ ์์ด์๊ฒ๋ ๋, ๊ท, ์ , ์ฝ ๋ฑ์ด ์์
- visual recognition์๋ edge๋ค์ด ์ค์ํ ๊ฒ์ ์
- ํ์ฒด์ edge์ ๋ง๊ฒ corner์ boundaries๊ฐ ์์์ ์ธ์ํ๊ณ ๊ท์น์ ์ธ์๋ด
- ํ์ง๋ง ์ด ๋ฐฉ๋ฒ์ 1. super brittle 2. ๋ชจ๋ object category๋ง๋ค ๊ท์น์ ๋ง๋ค์ด์ค์ผํจ (์ข์ง ์์ ๋ฐฉ๋ฒ..)
Data-Driven Approach
1. Collect a dataset of images and labels
- ์ธํฐ๋ท์ ํตํด์, large quantity & high quality dataset์ ๊ตฌํ ์ ์์
- dataset์ ์ง์ ์ฐพ๋ ๊ณผ์ ์ ์์ฒญ ์ค๋ ๊ฑธ๋ฆฌ์ง๋ง, ๋คํํ ์ธํฐ๋ท์ ์ข์ dataset๋ค์ด ๋ง์ ์ํ
2. Use Machine Learning to train a classifier
- ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ๋จธ์ ๋ฌ๋์ ๋ฃ์ผ๋ฉด ๋ฐ์ดํฐ๋ฅผ ์์ฝํ๊ณ ๋ชจ๋ธ์ ์ง์ด๋ฃ๊ณ ํ์ต์ด ์๋ฃ๊ฐ ๋ ๋ชจ๋ธ์ด ๋์ฌ ๊ฒ์
3. Evaluate the classifier on new images
- ์์ ํ์ต์ํจ ๋ชจ๋ธ์ ์๋ก์ด image๋ฅผ ๋ฃ์ด image classification์ ์ํํจ
So, in this example, the image is 800 by 600 pixels
And each pixel is represented by three numbers,
giving the red, green, and blue values for that pixels.
'AI > Stanford CS231n' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Lecture 13. Generative Models (0) | 2024.02.13 |
---|