2022๋ 11์ Chat GPT๊ฐ ๋์ค์ ์ผ๋ก ๊ต์ฅํ ๋๊ฒ ์๋ ค์ง๋ฉด์ ์์ํ ๋ถ์ด ์ค๊ณ ์๋ ์ธ๊ณต์ง๋ฅ ์์ฅ์ด ๊ทธ์ผ๋ง๋ก ์ ์ฑ๊ธฐ๋ฅผ ๋ง์ดํ๋ค๋ ์๊ฐ์ด ๋๋ ์์ฆ์ ๋๋ค. LLM(Large Language Model) ๋ฟ๋ง ์๋๋ผ CV(Computer Vision) ๋ถ์ผ์์๋ ์ ์๊ถ ๋ฌธ์ ๊ฐ ๋๋๋๊ณ ์๊ธฐ๋ ํ์ง๋ง ์ฌ์ง๊ณผ ๊ทธ๋ฆผ์ฒด๋ฅผ ํ์ต์์ผ ๊ทธ๋ฆผ์ฒด๋ฅผ ์ ์ ์๋ก์ด ๊ทธ๋ฆผ์ ๋ง๋ค์ด๋ด๊ณ , ์์ฑํฉ์ฑ ๋ถ์ผ์์๋ ์ธ๊ณต์ง๋ฅ์ ํ์ฉํด TTS๊ฐ ๋ ธ๋๋ฅผ ๋ถ๋ฅด๊ฒ ํ๊ธฐ๋ ํฉ๋๋ค.
๋์ ๋ณด์ด๋ ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ์์ ๊ฐ์ ๋ถ์ผ๋ฅผ ์ ์ธํ๊ณ ๋ ์ธ๊ณต์ง๋ฅ์ ํตํ ์ด์ํ์ง ์๋ฃจ์ , ๊ฐํํ์ต์ ํ์ฉํ ๊ฒ์ ๋ด(Bot) ์์ฑ ๋ฑ ์์ง ์ ๋ ์๋ฒฝํ ์ฐ์์ ๋ค ์์ง ๋ชปํ๋ ๋ฌด๊ถ๋ฌด์งํ ๋ถ์ผ์์ ๋ฅ๋ฌ๋์ด ์ฌ์ฉ๋๊ณ ์์ต๋๋ค. ์ด๋ฒ ํฌ์คํ ์์๋ AI๋ฅผ ๊ณต๋ถํ๊ธฐ๋ก ๋ง์๋จน์ ๋น์ ๊ณผ ์ ๋ฅผ ์ํ์ฌ ๋จธ์ ๋ฌ๋์ ๊ฐ๊ดํ๋ ๊ฐ๋ฒผ์ด ๋ด์ฉ์ ๋ค๋ค๋ณด๊ฒ ์ต๋๋ค.
1. What is ML / DL?
"์ผ, ๊ทธ๋์ ์ธ๊ณต์ง๋ฅ์ด ๋ญ๋ฐ?"
๋ผ๊ณ ๋ฌผ์ด๋ณด๋ ์น๊ตฌ๋ค์๊ฒ ์ ๋ ์ฃผ๋ก "๋ฏธ์ ๋ถ์ด์ผ^^..." ๋ผ๊ณ ๋๋ตํ๊ณค ํฉ๋๋ค. ์ค์ ๋ฏธ์ ๋ถ๋ง์ ์๋๊ณ , ์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค๊ณ ํ ์ ์๊ฒ ์ต๋๋ค. ๊ณ ๋ฑํ๊ต๋ฅผ ๋ค๋ ๋ ๋์ฒด ๋ฏธ์ ๋ถ์ ์ด๋์ ์จ๋จน๋์ง ๊ถ๊ธํ๋๋ฐ 5๋ ๋ง์ ๊นจ๋ฌ์์ต๋๋ค. ์ด๋ ๊ฒ ์จ๋จน์ผ๋ ค๊ณ ๊ณต๋ถํ๋ค๋ ์ฌ์ค์์. ์ธ๊ณต์ง๋ฅ์ด ์ํ์ธ ๊ฑธ ์์๋ค๋ฉด ๋ค์์ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ๋ํด ํ๊ตฌํด๋ณผ ์๊ฐ์ ๋๋ค.
์์ฆ์์ผ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋๊ณผ ์ธ๊ณต์ง๋ฅ์ ํผ์ฌํด์ ์ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ ๊ฒ ๊ฐ๊ณ ์ ๋ ๊ทธ๋ฐ๋ฐ, ๊ฐ์ธ์ ์ผ๋ก๋ ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๋๋ ์๋๋๊ฐ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ๋๋๋ค๊ณ ์๊ฐํฉ๋๋ค. ๋จธ์ ๋ฌ๋์ ์ข ๋ ํฌ๊ด์ ์ธ ๊ฐ๋
์ด๊ณ , ๊ทธ ์ค์์ ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๋ ๋
์๋ค์ด ๋ฅ๋ฌ๋์ด๋ผ๋ ํ์ ์งํฉ์ผ๋ก ๋ฌถ์ด๋ ๊ฒ์ด์ฃ . ์ ๊ฒฝ๋ง์ด ๋ฌด์์ธ์ง๋ ์ข ๋ ๋์ค์ ์ ๊ฒฝ์ฐ๋๋ก ํฉ์๋ค.
๋ชจ๋ธ ํ์ต์ด๋ ๊ตฌ์กฐ๋งํผ์ด๋ ์ค์ํ ํํธ๊ฐ ๋ฐ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ ๊ฐ๊ณตํ๋ ๊ณผ์ ์ ๋๋ค. ๋ฐ์ดํฐ ๋ถ์ ์ ๋ฌธ๊ฐ ์๊ฒฉ์ฆ(๋ง๋์ง ๋ชจ๋ฅด๊ฒ ์ต๋๋ค)์์๋ ์ค์ ๋ก ๋๋ค ํฌ๋ ์คํธ ์ ๋์ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ ์จ์ ๋ถ์ํ๋ ๊ณผ์ ๊ฐ ๋์จ๋ค๊ณ ๋ค์์ต๋๋ค. ์ฌ์ค ์ธ๊ณต์ง๋ฅ์ ๋ฌด์๋ณด๋ค๋ ๋ฐ์ดํฐ๊ฐ ์ค์ํ ๋ถ์ผ์ด๊ธฐ ๋๋ฌธ์ ๋นผ๋์ ์ ์์ต๋๋ค. ๋ฐ๋ก EDA๋ฅผ ๊ณต๋ถํ ๊น ๊ณ ๋ฏผ์ด ๋ ์ ๋๋ก์. ๊ณต๋ถํ๊ฒ ๋๋ฉด ์ ๋ฆฌํด์ ์ฌ๋ฆฌ๊ฒ ์ต๋๋ค.
์ด์จ๊ฑฐ๋ ํ ํฝ์ ์ด๋ ์ต๋๋ค. ๋จธ์ ๋ฌ๋์ ๊ฒฝํ์ ์ผ๋ก ์ค์ค๋ก๋ฅผ ๋ฐ์ ์ํค๋ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ์ค์ํ ๊ฒ์ '์ด๋ป๊ฒ' ๋ฐ์ ์ํฌ ๊ฒ์ด๋ฉฐ, '๋ฌด์์' ํด๋ผ ๊ฒ์ธ์ง๊ฐ ๋๊ฒ ์ต๋๋ค. ๊ทธ๋ผ ๋จธ์ ๋ฌ๋ ๋ถ์ผ์ ๋ํด ์์๋ด ์๋ค.
2. ์ข ๋ฅ
์ ์งง์ ์ง์์ ์ํ๋ฉด ํฌ๊ฒ ์ธ ๊ฐ์ง๋ก ๋ถ๋ฅํ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ์ง๋ํ์ต(Supervised Learning), ๋น์ง๋ํ์ต(Unsupervised Learning), ๊ฐํํ์ต(Reinforcement Learning) ์ ๋๋ค.
์ง๋ ํ์ต(Supervised Learning)
์ง๋ํ์ต์ ์ ๋ต์ ์ ๊ณตํด์ฃผ๋ ํ์ต๋ฐฉ๋ฒ์ ๋๋ค. ๋ง ๊ทธ๋๋ก ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด ๋ง์๋์ง, ํ๋ ธ๋์ง๋ฅผ '์ง๋' ํด์ฃผ๋ ๊ฒ์ ๋๋ค. ํํ ์์ ๋ฅผ ๋ ์ฌ๋ ค๋ณด์๋ฉด ์๋์ ๊ฐ์ ๊ฒฝ์ฐ์ ๋๋ค.
- ๋ฌผ์ฒด๋ฅผ ๊ตฌ๋ถํ๋ ๋ชจ๋ธ์ด ์ถ์ ํ ์ด๋ฆ์ด ๋ง์๋์ง ํ๋ ธ๋์ง๋ฅผ ๋ชจ๋ธ์๊ฒ ์๋ ค์ค
- 30๋ถ ๋ค์ ์ฃผ๊ฐ๋ฅผ ์์ธกํ๋ ๋ชจ๋ธ์ด ์ถ์ ํ ์ฃผ๊ฐ๊ฐ ์ค์ ๊ฐ๊ณผ ์ผ๋ง๋ ์ฐจ์ด๊ฐ ๋๋์ง ๋ชจ๋ธ์๊ฒ ์๋ ค์ค
- ์ด๋ฏธ์ง์์ ๋ฌผ์ฒด์ ํ
๋๋ฆฌ๋ฅผ ์ธ์ํ๋ ๋ชจ๋ธ์ด ์ถ์ ํ ํ
๋๋ฆฌ๊ฐ ์ค์ ํ
๋๋ฆฌ์ ์ด๋ ์ ๋ ์ฐจ์ด๊ฐ ๋๋์ง ๋ชจ๋ธ์๊ฒ ์๋ ค์ค
์ ๋ต(label)์ ํ์ต ์์ ์ ๊ณตํด์ค๋ค๋ ํน์ง์ด ์์ต๋๋ค. ์ฃผ๋ก ๋ต์ ์์ธกํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒฝ์ฐ๊ฐ ์ง๋ํ์ต์ ํฌํจ๋ฉ๋๋ค. ๋ถ๋ฅ(Classification) ๋ฐ ํ๊ท(Regression) ๋ฌธ์ ๊ฐ ์ฃผ๋ก ์ด์ชฝ์ด๊ณ , ์ด๋ป๊ฒ ๋ถ๋ฅํ๊ณ ๋ฌด์จ ๋ฌธ์ ๋ฅผ ํ๊ท๋ก ํด๊ฒฐํ๋์ง์ ๋ฐ๋ผ์ ๋ชจ๋ธ์ ๋ฌด๊ถ๋ฌด์งํ๊ฒ ๋ฌ๋ผ์ง๋๋ค.
๋น์ง๋ ํ์ต(Unsupervised Learning)
๋น์ง๋ํ์ต์ ๊ฑฐ์ 1๋ถํฐ 100๊น์ง๋ฅผ ์ ๋ถ! ๋ชจ๋ธ์๊ฒ ๋งก๊ธฐ๋ ๋ฐฉ์์ ๋๋ค. ๋ชจ๋ธ์๊ฒ ์ ๋ต์ ์ ๊ณตํ์ง ์์ผ๋ฉฐ, ์ค๋ก์ง ๋ฐ์ดํฐ๋ง ๊ฐ์ง๊ณ ๋ชจ๋ธ์ด ์์ฒด์ ์ผ๋ก ํน์ฑ๊ณผ ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ๊ณต๋ถํด์ ๊ฒฐ๊ณผ๋ฅผ ๋ ๋๋ค. ์์ฆ ํซํ ์์ฑ๋ชจ๋ธ๋ค์ด ์ด ์นดํ ๊ณ ๋ฆฌ์ ์ํฉ๋๋ค.
- ์ฌ๋ฌ ๋ฐ์ดํฐ๋ค์ ๋ชจ๋ธ์ด ์ค์ค๋ก ์์๋ธ ํน์ฑ์ ๋ฐ๋ผ ๋ถ๋ฅ
- ๋ฐ์ดํฐ์ ํน์ฑ์ ํ์ตํด ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์ ํ๋ ๊ฒฝ์ฐ
- ํ์ต๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑ
์๊ธฐ์ง๋ ํ์ต Self-Supervised Learning
์๊ธฐ์ง๋ ํ์ต์ ์ผ์ข ์ ๋น์ง๋ ํ์ต์ด๋ผ๊ณ ๋ ๋ณผ ์ ์์ต๋๋ค. ์ ๋ต์ด ์๋ ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ง๋ฉด ๋ชจ๋ธ์ด ์ค์ค๋ก ๋ ์ด๋ธ์ ๋ง๋ค์ด์ ํ์ตํ๋ ๊ฒฝ์ฐ๋ฅผ ๋งํฉ๋๋ค. ๋ํ์ ์ธ ์์๋ก ์ธ์ด๋ชจ๋ธ์ธ BERT๊ฐ ์์ต๋๋ค. ์ด ๋ด์ฉ์ ๋งํ๋ฉด ๊ธธ์ด์ง๊ณ ์ด๋ ค์์ง๋ฏ๋ก ์ถํ ๋ค๋ฃจ๋๋ก ํ๊ฒ ์ต๋๋ค.
๊ฐํ ํ์ต(Reinforcement Learning)
๊ฐํ ํ์ต์ ์ง๋ํ์ต, ๋น์ง๋ ํ์ต๊ณผ๋ ์์ ํ ๊ถค๋ฅผ ๋ฌ๋ฆฌํฉ๋๋ค. ๊ฐํ ํ์ต ๋ชจ๋ธ์ ํ๊ฒฝ(Environment)์ ์ํตํ๋ฉด์ ํ๋ ์ ํ ์ ์ฑ (policy)์ ๋ฐ๋ผ ์ ํํ ํ๋(action)์ด ํ๊ฒฝ์ ๋ฏธ์น๋ ์ํฅ์ ๋ฐ๋ผ ๋ณด์(Reward)๋ฅผ ๋ฐ์ผ๋ฉฐ ์ํฉ(state)์ ๋ง๋ ํ๋์ ์ ํํ ์ ์๊ฒ ํ์ต๋ฉ๋๋ค.
- ๋ฒฝ๋๊นจ๊ธฐ ๊ฒ์ ๋ด ํ์ต
- ์๋์ง ์ต์ ํ ์ฅ์น ์ ์ด ๋ชจ๋ธ
์ค์๊ฐ์ผ๋ก ํ๊ฒฝ์ ๋์ฒํ๋ ๋ฐฉ๋ฒ์ ๋ฐฐ์ด๋ค๋ ์ ์ด ํ์ฐํ ๋ค๋ฅธ ์ปจ์ ์ธ๋ฐ, ์์ธํ ๋ด์ฉ์ Reinforcement Learning ์นดํ ๊ณ ๋ฆฌ(https://dnai-deny.tistory.com/category/%F0%9F%90%AC%20ML%20%26%20Data/%F0%9F%93%AE%20Reinforcement%20Learning)์์ ๋ค๋ฃจ๊ณ ์์ต๋๋ค.
3. ๋ถ๋ฅ(Classification)์ ํ๊ท(Regression)
๋ถ๋ฅ(Classification)
์ ๊ฒ ๊ฐ์ฅ ์น์ํ ๋ถ๋ฅ ๋ฌธ์ ๋ MNIST hand writing ๋ฐ์ดํฐ์ ๋ถ๋ฅ์ ๋๋ค. ์๋ง ๋๋ถ๋ถ์ ์์ง๋์ด ๋ถ๋ค๊ป์ MNIST ๋ฐ์ดํฐ์ ์ผ๋ก ๋จธ์ ๋ฌ๋ ์ ๋ฌธ์ ํ์ จ์ ๊ฒ์ผ๋ก ์๊ฐ๋ฉ๋๋ค.
(์ถ์ฒ - Towards Data Science)
MNIST ๋ฐ์ดํฐ์
์ 0๋ถํฐ 9๊น์ง๋ฅผ ์์ผ๋ก ์ด ์ด๋ฏธ์ง๋ค๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ์ด ์ด๋ฏธ์ง ๊ฐ๊ฐ์ "์ด ์ด๋ฏธ์ง๋ 7์ด์ผ, ์ด ์ด๋ฏธ์ง๋ 6์ด์ผ" ํ๊ณ ๋ผ๋ฒจ์ ๋ฌ์์ค ๋ค์ ๋ถ๋ฅ๋ชจ๋ธ์ ์คํ์์ผ ์ค์ ๋ก ๋ชจ๋ธ์ด ์ ํํ๊ฒ ์ด๋ฏธ์ง๋ฅผ ์ฌ๋ฐ๋ฅธ ํด๋์ค๋ก ๋ถ๋ฅํ ์ ์๊ฒ๋ ํฉ๋๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ์ง๋ํ์ต - ๋ถ๋ฅ ๋ฌธ์ ๋ก ๋ด
๋๋ค.
๋น์ง๋ ํ์ต์ ์์ญ์์๋ ์ฐ์ฌ๋ ๋ฐ์ดํฐ๋ฅผ ์ฃผ๊ณ , ํน์ฑ์ ๋ฐ๋ผ ๊ทธ๋ฃน์ ๋ง๋๋ Clustering ์ด ๋ํ์ ์ ๋๋ค.
(์ถ์ฒ - Water Programming)
๋ฐ์ดํฐ์ ํน์ฑ์ ์ถ์ถํด๋ด๊ณ , ๊ทธ ํน์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๊น์ด ๋
์๋ผ๋ฆฌ ๋ฌถ์ด์ฃผ๋ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ณด์๋ฉด ๋๊ฒ ์ต๋๋ค.
ํ๊ท(Regression)
๊ฐ์ฅ ์ ๋ช ํ ํ๊ท ๋ฌธ์ ๋ ์๋ง๋ ์ง๊ฐ ์์ธก ๋ฌธ์ ์ผ ๊ฒ๋๋ค. MNIST ๋ฐ์ดํฐ์ ๊ณผ ํจ๊ป ์ ๋ฌธ ๋ฌธ์ ๋ก ์๋์ฐ๋งฅ, ์๋๋ง์ฐจ๋ฅผ ์ด๋๊ณ ์์ฃ . ํ๊ท ๋ฌธ์ ๋ ๊ณผ๊ฑฐ์ ๋ฐ์ดํฐ๋ค์ ๋ณด๊ณ ํ์ฌ ์ํ๊ฐ ์ฃผ์ด์ก์ ๋ ์์ธก๋๋ ๊ฒฐ๊ณผ๋ฅผ ์ถ์ ํด๋ด๋ ๊ฒ์ ๋๋ค.
(์ถ์ฒ - Grokking Machine Learning)
๋ฐฉ ๊ฐ์, ๊ฑด์ถ ์ฐ๋ ๋ฑ๋ฑ์ ๋ฐ์ดํฐ์ ์ง์ ๊ฐ๊ฒฉ์ ์ ๊ณตํ๋ฉด ๋ชจ๋ธ์ ์ง์ ๊ฐ๊ฒฉ์ ์ ์ธํ ํน์ฑ๋ค๋ก ์ง ๊ฐ๊ฒฉ์ ์์ธกํ๊ณ , ์ค์ฐจ๋ฅผ ์ค์ฌ๋๊ฐ๋๋ค. ํ์ต์ด ์๋ฃ๋ ๋ชจ๋ธ์๊ฒ ๋ฐฐ์ธ ๋ ์ผ๋ ์ข
๋ฅ์ ๋ฐ์ดํฐ๋ค์ ์ ๊ณตํ๋ฉด ์ง๊ฐ์ ์์ธกํด์ฃผ๊ฒ ๋๋ ๊ฒ์ด์ฃ .
์ด๋ ๊ฒ ์ฐ์์ ์ธ ๊ฐ์ ๋ฒ์ ๋ด์์ ์์ธก๊ฐ์ด ๋์ค๋ ๊ฒฝ์ฐ๋ฅผ ํ๊ท ๋ฌธ์ ๋ผ๊ณ ํฉ๋๋ค.
์ฌ๊ธฐ๊น์ง๊ฐ ๋จธ์ ๋ฌ๋์ ๊ธฐ์ด ์ค์ ๊ธฐ์ด๋ผ๊ณ ์๊ฐ์ด ๋ฉ๋๋ค. ์์์ผํ ์ฉ์ด๋ ์ฐ๋๋ฏธ๊ณ ์์ผ๋ก๋ ์ํ๊ณผ๋ ์นํด์ ธ์ผ๊ฒ ์ง๋ง, ์ฐ์ ์ด ์ ๋๋ถํฐ ์์ํ๋๋ก ํฉ์๋ค. ๋ค์ ์๊ฐ์๋ ํ๊ท ๋ฌธ์ ์ ๋ํด์ ์ข ๋ ์์ธํ, ์ํ์ ์ผ๋ก^^ ๋ค๋ค๋ณด๋ ์๊ฐ์ ๊ฐ๊ฒ ์ต๋๋ค. ์๊ณ ํ์ จ์ต๋๋ค!
'๐ฌ ML & Data > ๐ฆ ๋ผ์ดํธ ๋ฅ๋ฌ๋' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ผ์ดํธ ๋ฅ๋ฌ๋] n. Backpropagation ์์ ํ์ด ๋ฐ ๊ฒ์ฆ (0) | 2024.03.13 |
---|---|
[๋ผ์ดํธ ๋ฅ๋ฌ๋] 0. Intro (1) | 2023.10.06 |