Last Updated on 2025-05-28 by AEIAI.NET
ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค๋ฅผ ํจ๊ป ์ดํดํ๋ ๋ฉํฐ๋ชจ๋ฌ AI! ์ ํํ ๋ป๊ณผ ์ค์์ฑ, ์๋ ์๋ฆฌ, ์ ๋๋ชจ๋ฌ๊ณผ์ ์ฐจ์ด, ๋๋ผ์ด ํ์ฉ ์ฌ๋ก์ ๋ฏธ๋ ์ ๋ง๊น์ง ์ฝ๊ฒ ์๋ ค๋๋ฆฝ๋๋ค.

์ฑGPT ๊ฐ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋๋ผ์ด ํ ์คํธ ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์ง๋ง, ์ด๋๊ฐ ๋ถ์กฑํจ์ ๋๋ ๋๊ฐ ์์ต๋๋ค. ์ฐ๋ฆฌ๊ฐ ์ธ์์ ์ดํดํ๋ ๋ฐฉ์์ ๋จ์ํ ๊ธ์๋ฅผ ์ฝ๋ ๊ฒ์ ๋์ด์์ฃ . ์ฐ๋ฆฌ๋ ๋ณด๊ณ , ๋ฃ๊ณ , ์ฝ๋ ๋ฑ ๋ค์ํ ๊ฐ๊ฐ ์ ๋ณด๋ฅผ ์ข ํฉํ์ฌ ์ํฉ์ ํ์ ํ๊ณ ์ํตํฉ๋๋ค. ๋ง์ฝ AI๋ ์ฐ๋ฆฌ์ฒ๋ผ ์ฌ๋ฌ ์ข ๋ฅ์ ์ ๋ณด๋ฅผ ํจ๊ป ๋ฐ์๋ค์ด๊ณ ์ดํดํ ์ ์๋ค๋ฉด ์ด๋จ๊น์? ๋ฐ๋ก ์ด ์ง๋ฌธ์์ ๋ฉํฐ๋ชจ๋ฌ AI(Multimodal AI)์ ์ด์ผ๊ธฐ๊ฐ ์์๋ฉ๋๋ค.
๋ฉํฐ๋ชจ๋ฌ AI๋ ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค, ๋น๋์ค ๋ฑ ์ฌ๋ฌ ์ ํ(์์, Modality)์ ๋ฐ์ดํฐ๋ฅผ ๋์์ ์ฒ๋ฆฌํ๊ณ ๊ทธ ๊ด๊ณ๋ฅผ ์ดํดํ์ฌ ๋ ๊น์ด ์๋ ๋ถ์๊ณผ ์์ฑ์ ์ํํ๋ ์ธ๊ณต์ง๋ฅ ์์คํ ์ ์๋ฏธํฉ๋๋ค. ๋ง์น AI์๊ฒ ๋๊ณผ ๊ท๋ฅผ ๋ฌ์์ฃผ๋ ๊ฒ๊ณผ ๊ฐ๋ค๊ณ ํ ๊น์? ๋จ์ํ ํ ์คํธ๋ง ์ดํดํ๋ ๊ฒ์ ๋์ด, ์ด๋ฏธ์ง ์ ๊ฐ์ฒด๋ฅผ ์ธ์ํ๊ณ ๊ทธ ๋ด์ฉ์ ํ ์คํธ๋ก ์ค๋ช ํ๊ฑฐ๋, ์์ฑ ๋ช ๋ น์ ๋ฃ๊ณ ๊ด๋ จ๋ ์ด๋ฏธ์ง๋ฅผ ์ฐพ์์ฃผ๋ ๋ฑ ํจ์ฌ ๋ ํ๋ถํ๊ณ ์ธ๊ฐ๊ณผ ์ ์ฌํ ๋ฐฉ์์ผ๋ก ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ ์ ์๊ฒ ๋ฉ๋๋ค.
์ด ๊ธ์์๋ AI ๊ธฐ์ ์ ์๋ก์ด ์งํ์ ์ด๊ณ ์๋ ‘๋ฉํฐ๋ชจ๋ฌ AI’์ ๋ํด ์ฌ์ธต์ ์ผ๋ก ์์๋ด ๋๋ค. ๋ฉํฐ๋ชจ๋ฌ AI๊ฐ ์ ํํ ๋ฌด์์ธ์ง, ์ ์ด๊ฒ์ด AI ๋ฐ์ ์ ํ์ฐ์ ์ธ ๋ค์ ๋จ๊ณ์ธ์ง, ์ด๋ค ์๋ฆฌ๋ก ์ฌ๋ฌ ์ข ๋ฅ์ ๋ฐ์ดํฐ๋ฅผ ํจ๊ป ์ฒ๋ฆฌํ๋์ง ๊ฐ์ฅ ์ฌ์ด ๋น์ ์ ํต์ฌ ์๋ฆฌ๋ฅผ ํตํด ๋ช ํํ๊ฒ ์ค๋ช ํด ๋๋ฆฝ๋๋ค. ๋ํ, ๋๋ผ์ด ์ค์ ์ ์ฉ ์ฌ๋ก์ ์์ผ๋ก์ ๋ฐ์ ๊ฐ๋ฅ์ฑ, ๊ทธ๋ฆฌ๊ณ ์คํํธ์ ๊ณผ VC ๊ด์ ์์ ์ฃผ๋ชฉํด์ผ ํ ๊ธฐํ๊น์ง, ๋ฉํฐ๋ชจ๋ฌ AI์ ๋ํ ๋ชจ๋ ๊ฒ์ ๋ด์์ต๋๋ค.
๋ฉํฐ๋ชจ๋ฌ AI, ๊ทธ๋์ ์ ํํ ๋ฌด์์ธ๊ฐ์? ์ ์์ ํต์ฌ ๋น์
๋ฉํฐ๋ชจ๋ฌ AI(Multimodal AI)๋ ์ด๋ฆ ๊ทธ๋๋ก ‘๋ค์ค(Multi)’์ ‘์์(Modal)’์ ๋ค๋ฃจ๋ ์ธ๊ณต์ง๋ฅ์ ๋๋ค. ์ฌ๊ธฐ์ ‘์์(Modality)’์ด๋ ์ ๋ณด๋ฅผ ํํํ๋ ๋ฐฉ์, ์ฆ ๋ฐ์ดํฐ์ ์ข ๋ฅ๋ฅผ ์๋ฏธํฉ๋๋ค. ๋ํ์ ์ผ๋ก ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค, ๋น๋์ค ๋ฑ์ด ์์ผ๋ฉฐ, ๋ ๋์๊ฐ ์จ๋, ์๋ ฅ, ๋ํ ๊ฐ์ ์ผ์ ๋ฐ์ดํฐ๊น์ง ํฌํจํ ์ ์์ต๋๋ค. ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด๋ฌํ ์๋ก ๋ค๋ฅธ ์ ํ์ ๋ฐ์ดํฐ์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๊ณ , ๊ทธ ์ ๋ณด๋ค ๊ฐ์ ๊ด๊ณ์ ๋งฅ๋ฝ์ ํตํฉ์ ์ผ๋ก ์ดํดํ๋ ๋ฅ๋ ฅ์ ๊ฐ์ถ AI ์์คํ ์ ์ด์นญํฉ๋๋ค.
๊ธฐ์กด์ AI ๋ชจ๋ธ๋ค์ด ์ฃผ๋ก ํ ๊ฐ์ง ์ ํ์ ๋ฐ์ดํฐ(์: ํ ์คํธ๋ง ์ฒ๋ฆฌํ๋ ์ธ์ด ๋ชจ๋ธ, ์ด๋ฏธ์ง๋ง ์ฒ๋ฆฌํ๋ ๋น์ ๋ชจ๋ธ)์ ํนํ๋์๋ค๋ฉด, ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด ๊ฒฝ๊ณ๋ฅผ ํ๋ฌผ๊ณ ์ฌ๋ฌ ๊ฐ๊ฐ ์ ๋ณด๋ฅผ ๋์์ ํ์ฉํฉ๋๋ค.
๋ฉํฐ๋ชจ๋ฌ AI๋ฅผ ๋ ์ฝ๊ฒ ์ดํดํ๊ธฐ ์ํ ๋น์ ๋ฅผ ๋ค์ด๋ณผ๊น์?
- ์ธ๊ฐ์ ์ค๊ฐ ํ์ฉ: ์ฐ๋ฆฌ๊ฐ ์ฌ๋๊ณผ ๋ํํ ๋, ์๋๋ฐฉ์ ๋ง(์ค๋์ค)๋ฟ๋ง ์๋๋ผ ํ์ (์ด๋ฏธ์ง), ์ ์ค์ฒ(์ด๋ฏธ์ง/๋น๋์ค) ๋ฑ์ ์ข ํฉ์ ์ผ๋ก ๋ณด๊ณ ๋ค์ผ๋ฉฐ ๊ทธ ์๋์ ๊ฐ์ ์ ํ์ ํ๋ ๊ฒ๊ณผ ์ ์ฌํฉ๋๋ค. ๋ฉํฐ๋ชจ๋ฌ AI๋ ๋ง์น AI์๊ฒ ์ฌ๋ฌ ๊ฐ๊ฐ์ ๋ถ์ฌํ์ฌ ์ธ์์ ๋ ์ ์ฒด์ ์ผ๋ก ์ธ์ํ๊ฒ ๋ง๋๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
- ์ค์ผ์คํธ๋ผ์ ์กฐํ: ๋ค์ํ ์ ๊ธฐ(๋ฐ์ดํฐ ๋ชจ๋ฌ๋ฆฌํฐ)๊ฐ ๋ชจ์ฌ ํ๋์ ์๋ฆ๋ค์ด ๊ตํฅ๊ณก(์ข ํฉ์ ์ธ ์ดํด ๋ฐ ์์ฑ)์ ๋ง๋ค์ด๋ด๋ ์ค์ผ์คํธ๋ผ์ ๋น์ ํ ์ ์์ต๋๋ค. ๊ฐ ์ ๊ธฐ(๋ชจ๋ฌ๋ฆฌํฐ)๋ ๊ณ ์ ํ ์๋ฆฌ(์ ๋ณด)๋ฅผ ๋ด์ง๋ง, ์งํ์(๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ)๋ ์ด ์๋ฆฌ๋ค์ ์กฐํ๋กญ๊ฒ ์ตํฉํ์ฌ ํ๋ถํ๊ณ ๊น์ด ์๋ ์์ ์ ๊ฒฝํ์ ์ ์ฌํฉ๋๋ค.
- ์๋ฆฌ์ฌ์ ์ฌ๋ฃ ์ตํฉ: ๋ฐ์ด๋ ์๋ฆฌ์ฌ๊ฐ ๋ค์ํ ์์ฌ๋ฃ(ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค ๋ฑ)์ ๋ง๊ณผ ํฅ, ์๊ฐ์ ์ดํดํ๊ณ ์ด๋ฅผ ์ฐฝ์์ ์ผ๋ก ์กฐํฉํ์ฌ ์์ ํ ์๋ก์ด ๋ง์ ์๋ฆฌ(์๋ก์ด ์ธ์ฌ์ดํธ ๋๋ ์ฝํ ์ธ )๋ฅผ ๋ง๋ค์ด๋ด๋ ๊ณผ์ ๊ณผ๋ ๋น์ทํฉ๋๋ค.
๊ฒฐ๊ตญ ๋ฉํฐ๋ชจ๋ฌ AI๋ ๋ค์ํ ์ ๋ณด ์์ค๋ฅผ ํตํฉํ์ฌ ๋จ์ผ ๋ชจ๋ฌ๋ฆฌํฐ๋ง์ผ๋ก๋ ์ป์ ์ ์๋ ๋ ๊น๊ณ ์ ํํ ์ดํด์ ํ๋ถํ ํํ๋ ฅ์ ๊ฐ์ถ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
์ ์ฐ๋ฆฌ๋ ๋ฉํฐ๋ชจ๋ฌ AI์ ์ฃผ๋ชฉํด์ผ ํ ๊น์? ๋จ์ผ ๋ชจ๋๋ฅผ ๋์ด์ ‘์ง์ง ์ดํด’์ ์์
๋ฉํฐ๋ชจ๋ฌ AI๊ฐ ๋จ์ํ ์ฌ๋ฌ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๊ฒ์ ๋์ด AI ๊ธฐ์ ์ ์ค์ํ ์ง์ ์ผ๋ก ์ฌ๊ฒจ์ง๋ ์ด์ ๋ ๋ฌด์์ผ๊น์?
- ๋ ๊น๊ณ ์ ํํ ์ดํด: ํ์ค ์ธ๊ณ์ ์ ๋ณด๋ ๋๋ถ๋ถ ์ฌ๋ฌ ์์์ด ๋ณตํฉ์ ์ผ๋ก ์ฝํ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๋ด์ค ๊ธฐ์ฌ๋ ํ ์คํธ์ ์ด๋ฏธ์ง, ๋์์์ด ํจ๊ป ์ ๊ณต๋ ๋ ๊ทธ ๋ด์ฉ์ ํจ์ฌ ๋ ๋ช ํํ๊ฒ ์ ๋ฌํฉ๋๋ค. ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด๋ ๊ฒ ๋ค์ํ ์์ค์์ ์ค๋ ์ ๋ณด๋ฅผ ์ํธ ๋ณด์์ ์ผ๋ก ํ์ฉํ์ฌ ๋งฅ๋ฝ์ ๋ ํ๋ถํ๊ฒ ์ดํดํ๊ณ ๋ชจํธ์ฑ์ ์ค์ฌ ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ ์ ํํ ํ๋จ๊ณผ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
- ์ธ๊ฐ๊ณผ ์ ์ฌํ ์ํธ์์ฉ: ์ธ๊ฐ์ ๋ณธ์ง์ ์ผ๋ก ๋ฉํฐ๋ชจ๋ฌ ๋ฐฉ์์ผ๋ก ์ํตํ๊ณ ์ธ์์ ๊ฒฝํํฉ๋๋ค. ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด๋ฌํ ์ธ๊ฐ์ ๋ฐฉ์์ ๋ชจ๋ฐฉํจ์ผ๋ก์จ ๋ ์์ฐ์ค๋ฝ๊ณ ์ง๊ด์ ์ธ ์ธ๊ฐ-AI ์ํธ์์ฉ(HCI)์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ์ฌ์ฉ์๊ฐ ์ด๋ฏธ์ง์ ํ ์คํธ๋ฅผ ํจ๊ป ์ ๋ ฅํ๋ฉฐ ์ง๋ฌธํ๊ฑฐ๋, ์์ฑ์ผ๋ก ๋ช ๋ นํ๊ณ ์๊ฐ์ ์ธ ํผ๋๋ฐฑ์ ๋ฐ๋ ๋ฑ์ ๊ฒฝํ์ด ๊ฐ๋ฅํด์ง๋๋ค.
- ์๋ก์ด ๊ธฐ๋ฅ ๋ฐ ์ ํ๋ฆฌ์ผ์ด์ ์ฐฝ์ถ: ์ฌ๋ฌ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ํตํฉํจ์ผ๋ก์จ ๊ธฐ์กด์๋ ๋ถ๊ฐ๋ฅํ๋ ์๋ก์ด ๊ธฐ๋ฅ๊ณผ ์๋น์ค๊ฐ ๊ฐ๋ฅํด์ง๋๋ค. ์๋ฅผ ๋ค์ด, ์ด๋ฏธ์ง์ ๋ํ ์ง๋ฌธ์ ๋ตํ๊ฑฐ๋(Visual Q&A), ํ ์คํธ ์ค๋ช ๋ง์ผ๋ก ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๊ณ (Text-to-Image), ์์์ ๋ด์ฉ์ ์์ฝํ๊ณ ํน์ ์ฅ๋ฉด์ ์ฐพ์์ฃผ๋ ๋ฑ์ ๊ธฐ๋ฅ์ ๋ฉํฐ๋ชจ๋ฌ AI์ ๋ํ์ ์ธ ์ฑ๊ณผ์ ๋๋ค.
- ๋ฐ์ดํฐ ํ์ฉ์ ๊ทน๋ํ: ์ธ์์๋ ํ ์คํธ ์ธ์๋ ์์ฒญ๋ ์์ ์ด๋ฏธ์ง, ์ค๋์ค, ๋น๋์ค ๋ฐ์ดํฐ๊ฐ ์กด์ฌํฉ๋๋ค. ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด๋ฌํ ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ์ฌ ์จ๊ฒจ์ง ํจํด๊ณผ ์ธ์ฌ์ดํธ๋ฅผ ๋ฐ๊ฒฌํ ์ ์๋ ๊ธธ์ ์ด์ด์ค๋๋ค.
- ๋ชจ๋ธ์ ๊ฒฌ๊ณ ์ฑ(Robustness) ํฅ์: ํ๋์ ๋ชจ๋ฌ๋ฆฌํฐ์ ์ค๋ฅ๋ ๋ ธ์ด์ฆ๊ฐ ์๋๋ผ๋ ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ์ ์ ๋ณด๋ฅผ ํ์ฉํ์ฌ ์ด๋ฅผ ๋ณด์ํ๊ณ ๋ ์์ ์ ์ธ ์ฑ๋ฅ์ ์ ์งํ ์ ์์ต๋๋ค.
์ด๋ฌํ ์ด์ ๋ก ๋ฉํฐ๋ชจ๋ฌ AI๋ ํ๊ณ์ ์ฐ์ ๊ณ ๋ชจ๋์์ AI ์ฐ๊ตฌ ๊ฐ๋ฐ์ ํต์ฌ์ ์ธ ๋ฐฉํฅ์ผ๋ก ์๋ฆฌ ์ก๊ณ ์์ผ๋ฉฐ, ๊ตฌ๊ธ์ ์ ๋ฏธ๋์ด(Gemini), OpenAI์ GPT-4V ์ ๊ฐ์ ์ต์ LLM๋ค์ด ๋ฉํฐ๋ชจ๋ฌ ๋ฅ๋ ฅ์ ์๋คํฌ์ด ์ ๋ณด์ด๋ ์ด์ ์ด๊ธฐ๋ ํฉ๋๋ค
์ฌ๋ฌ ๊ฐ๊ฐ์ ํฉ์น๋ ๋ง๋ฒ: ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด๋ป๊ฒ ์๋ํ ๊น์?
์๋ก ๋ค๋ฅธ ํํ์ ๋ฐ์ดํฐ(์: ํฝ์ ๊ฐ์ผ๋ก ์ด๋ฃจ์ด์ง ์ด๋ฏธ์ง, ๋จ์ด ์ํ์ค์ธ ํ ์คํธ, ํํ์ธ ์ค๋์ค)๋ฅผ AI๊ฐ ์ด๋ป๊ฒ ํจ๊ป ์ดํดํ๊ณ ์ฒ๋ฆฌํ ์ ์์๊น์? ์ด๊ฒ์ด ๋ฉํฐ๋ชจ๋ฌ AI์ ํต์ฌ ๊ธฐ์ ๊ณผ์ ์ ๋๋ค. ๋ง์น ์๋ก ๋ค๋ฅธ ์ธ์ด๋ฅผ ์ฌ์ฉํ๋ ์ฌ๋๋ค์ด ๋ชจ์ฌ ํ๋์ ๋ชฉํ๋ฅผ ์ํด ํ๋ ฅํ๋ ๊ณผ์ ๊ณผ ๋น์ทํฉ๋๋ค.
๋ฉํฐ๋ชจ๋ฌ AI์ ์๋ ์๋ฆฌ๋ฅผ ์ดํดํ๊ธฐ ์ํ ๋ช ๊ฐ์ง ํต์ฌ ๊ฐ๋ ๋ค์ด ์์ต๋๋ค. (์ธ๋ถ ๊ธฐ์ ์ ๋งค์ฐ ๋ณต์กํ์ง๋ง, ๊ธฐ๋ณธ์ ์ธ ์์ด๋์ด๋ฅผ ์ค์ฌ์ผ๋ก ์ค๋ช ํฉ๋๋ค.)
- ์๋ฒ ๋ฉ (Embedding): ๊ณตํต ์ธ์ด๋ก ๋ฒ์ญํ๊ธฐ
- ๊ฐ์ฅ ์ค์ํ ๋จ๊ณ๋ ์๋ก ๋ค๋ฅธ ์ ํ์ ๋ฐ์ดํฐ๋ฅผ AI๊ฐ ์ดํดํ ์ ์๋ ๊ณตํต๋ ํ์์ ์ซ์ ๋ฒกํฐ(Vector)๋ก ๋ณํํ๋ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ‘์๋ฒ ๋ฉ’์ด๋ผ๊ณ ํฉ๋๋ค. ๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ(ํ ์คํธ, ์ด๋ฏธ์ง ๋ฑ)์ ํนํ๋ ์ธ์ฝ๋(Encoder) ๋ชจ๋ธ์ด ํด๋น ๋ฐ์ดํฐ๋ฅผ ์ซ์ ๋ฒกํฐ ๊ณต๊ฐ์ ํ ์ ์ผ๋ก ‘์ฌ์(Projection)’ํฉ๋๋ค.
- ํต์ฌ ์์ด๋์ด๋ ์๋ฏธ์ ์ผ๋ก ์ ์ฌํ ๋ด์ฉ์ ์๋ก ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ์์ ์๋๋ผ๋ ๋ฒกํฐ ๊ณต๊ฐ ์์์ ๊ฐ๊น์ด ์์น์ ์๋๋ก ์๋ฒ ๋ฉ ๊ณต๊ฐ์ ํ์ต์ํค๋ ๊ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ‘๊ณ ์์ด’๋ผ๋ ํ ์คํธ์ ๊ณ ์์ด ์ด๋ฏธ์ง, ‘์ผ์น’ํ๋ ์๋ฆฌ๊ฐ ๋ฒกํฐ ๊ณต๊ฐ์์ ์๋ก ๊ฐ๊น๊ฒ ์์นํ๋๋ก ๋ง๋ญ๋๋ค. ๋ง์น ์ฌ๋ฌ ์ธ์ด๋ฅผ ํ๋์ ‘๊ณต์ฉ์ด(๋ฒกํฐ ๊ณต๊ฐ)’๋ก ๋ฒ์ญํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
- ์ตํฉ (Fusion): ์ ๋ณด ํฉ์น๊ธฐ
- ๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ์์ ์ถ์ถ๋ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ค์ ํ๋๋ก ๊ฒฐํฉํ์ฌ ์ข
ํฉ์ ์ธ ์ ๋ณด๋ฅผ ํํํ๋ ๋จ๊ณ์
๋๋ค. ์ตํฉ ๋ฐฉ์์ ํฌ๊ฒ ์ธ ๊ฐ์ง๋ก ๋๋ฉ๋๋ค.
- ์ด๊ธฐ ์ตํฉ (Early Fusion): ์์ ๋ฐ์ดํฐ ์์ค์์ ์ ๋ณด๋ฅผ ๊ฒฐํฉํ ํ ๋จ์ผ ๋ชจ๋ธ๋ก ์ฒ๋ฆฌ. (๊ฐ๋จํ์ง๋ง ์ ๋ณด ์์ค ๊ฐ๋ฅ์ฑ)
- ํ๊ธฐ ์ตํฉ (Late Fusion): ๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ์ฒ๋ฆฌํ ํ, ๋ง์ง๋ง ์์ธก ๋จ๊ณ์์ ๊ฒฐ๊ณผ๋ฅผ ๊ฒฐํฉ. (๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ ํน์ฑ ์ ์ด๋ฆฌ์ง๋ง ์ํธ์์ฉ ๋ถ์กฑ)
- ํ์ด๋ธ๋ฆฌ๋ ์ตํฉ (Hybrid Fusion): ์ด๊ธฐ ์ตํฉ๊ณผ ํ๊ธฐ ์ตํฉ์ ์ฅ์ ์ ๊ฒฐํฉํ์ฌ ์ค๊ฐ ๋จ๊ณ์์ ์ ๋ณด๋ฅผ ๊ตํํ๊ณ ์ตํฉ. (๊ฐ์ฅ ๋ณต์กํ์ง๋ง ์ฑ๋ฅ ์ ์ฌ๋ ฅ ๋์)
- ๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ์์ ์ถ์ถ๋ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ค์ ํ๋๋ก ๊ฒฐํฉํ์ฌ ์ข
ํฉ์ ์ธ ์ ๋ณด๋ฅผ ํํํ๋ ๋จ๊ณ์
๋๋ค. ์ตํฉ ๋ฐฉ์์ ํฌ๊ฒ ์ธ ๊ฐ์ง๋ก ๋๋ฉ๋๋ค.
- ์ ๋ ฌ (Alignment) ๋๋ ๊ณต๋ ํ์ต (Co-learning): ๊ด๊ณ ๋ฐฐ์ฐ๊ธฐ
- ๋จ์ํ ์ ๋ณด๋ฅผ ํฉ์น๋ ๊ฒ์ ๋์ด, ์๋ก ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ์ ์์๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ตํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ด๋ฏธ์ง ์ ํน์ ์์ญ๊ณผ ํ ์คํธ ์ค๋ช ์ ํน์ ๋จ์ด๋ฅผ ์ฐ๊ฒฐํ๋ ๋ฐฉ๋ฒ์ ๋ฐฐ์๋๋ค. ์ด๋ฅผ ์ํด ์ดํ ์ ๋ฉ์ปค๋์ฆ(Attention Mechanism)๊ณผ ๊ฐ์ ๊ธฐ์ ์ด ์ฌ์ฉ๋์ด, ํ ๋ชจ๋ฌ๋ฆฌํฐ์ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ ๋ ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ์ ๊ด๋ จ์ฑ ๋์ ๋ถ๋ถ์ ๋ ‘์ง์ค’ํ๋๋ก ํ์ตํฉ๋๋ค.
์ด๋ฌํ ๊ณผ์ ์ ํตํด ๋ฉํฐ๋ชจ๋ฌ AI๋ ๊ฐ๊ธฐ ๋ค๋ฅธ ๋ฐ์ดํฐ ์์ค๋ก๋ถํฐ ์ป์ ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํตํฉํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ ๊น์ด ์๋ ์ดํด์ ์์ฑ์ ์ํํ ์ ์๊ฒ ๋ฉ๋๋ค.
๋จ์ผ ๊ฐ๊ฐ vs. ์ค์ผ์คํธ๋ผ: ์ ๋๋ชจ๋ฌ AI vs. ๋ฉํฐ๋ชจ๋ฌ AI ๋น๊ต
๋ฉํฐ๋ชจ๋ฌ AI์ ํน์ง์ ๋ ๋ช ํํ ์ดํดํ๊ธฐ ์ํด, ๊ธฐ์กด์ ๋จ์ผ ๋ชจ๋ฌ๋ฆฌํฐ๋ง ๋ค๋ฃจ๋ ์ ๋๋ชจ๋ฌ(Unimodal) AI์ ๋น๊ตํด ๋ณด๊ฒ ์ต๋๋ค.
๊ตฌ๋ถ | ์ ๋๋ชจ๋ฌ AI (Unimodal AI) | ๋ฉํฐ๋ชจ๋ฌ AI (Multimodal AI) |
์ฒ๋ฆฌ ๋ฐ์ดํฐ | ๋จ์ผ ์ ํ (ํ ์คํธ ๋๋ ์ด๋ฏธ์ง ๋๋ ์ค๋์ค ๋ฑ) | ๋ณต์ ์ ํ (ํ ์คํธ + ์ด๋ฏธ์ง + ์ค๋์ค ๋ฑ) |
์ ๋ณด ์ดํด | ์ ํ์ , ๋จํธ์ | ๊น์ด ์๊ณ ๋งฅ๋ฝ์ , ์ํธ ๋ณด์์ |
ํต์ฌ ๊ธฐ์ | ํน์ ๋ชจ๋ฌ๋ฆฌํฐ ์ฒ๋ฆฌ (NLP, CV, Speech Recognition) | ๋ฐ์ดํฐ ์๋ฒ ๋ฉ, ์ตํฉ(Fusion), ์ ๋ ฌ(Alignment), ๊ณต๋ ํ์ต(Co-learning) |
์ฃผ์ ๊ธฐ๋ฅ ์์ | ํ ์คํธ ๋ฒ์ญ, ์ด๋ฏธ์ง ๋ถ๋ฅ, ์์ฑ ์ธ์ | ์ด๋ฏธ์ง ์บก์ ๋, ์๊ฐ์ ์ง์์๋ต(VQA), ํ ์คํธ-์ด๋ฏธ์ง ์์ฑ, ๊ฐ์ ๋ถ์ |
๋ณต์ก์ฑ | ์๋์ ์ผ๋ก ๋ฎ์ | ๋์ (๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๋ชจ๋ธ ๊ตฌ์กฐ, ํ์ต ๋ฑ) |
์ฅ์ | ํน์ ์์ ์ ๊ณ ๋๋ก ์ต์ ํ ๊ฐ๋ฅ, ๋ชจ๋ธ ๊ฒฝ๋ํ ์ฉ์ด | ํ์ค ์ธ๊ณ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ ์ฐ์, ์ธ๊ฐ๊ณผ ์ ์ฌํ ์ดํด, ์๋ก์ด ๊ธฐ๋ฅ |
๋จ์ | ๋ค๋ฅธ ์ ํ ๋ฐ์ดํฐ ํ์ฉ ๋ถ๊ฐ, ๋งฅ๋ฝ ์ดํด ๋ถ์กฑ | ๋์ ๊ฐ๋ฐ ๋์ด๋, ๋ง์ ๋ฐ์ดํฐ ๋ฐ ์ปดํจํ ์์ ์๊ตฌ, ํธํฅ ์ฆํญ ์ํ |
์ ๋๋ชจ๋ฌ AI๊ฐ ํน์ ๋ถ์ผ์ ‘์ ๋ฌธ๊ฐ’๋ผ๋ฉด, ๋ฉํฐ๋ชจ๋ฌ AI๋ ์ฌ๋ฌ ๋ถ์ผ์ ์ง์์ ์ตํฉํ์ฌ ์๋ก์ด ๊ฐ์น๋ฅผ ์ฐฝ์ถํ๋ ‘์ตํฉ ์ ๋ฌธ๊ฐ’ ๋๋ ‘๋ฅด๋ค์์คํ AI’๋ผ๊ณ ๋น์ ํ ์ ์์ต๋๋ค.
ํ์ค ์ธ๊ณ์ ๋ฉํฐ๋ชจ๋ฌ AI: ๋๋ผ์ด ์ ์ฉ ์ฌ๋ก์ ๊ฐ๋ฅ์ฑ
๋ฉํฐ๋ชจ๋ฌ AI๋ ์ด๋ฏธ ์ฐ๋ฆฌ ์ฃผ๋ณ์ ๋ค์ํ ๋ถ์ผ์์ ๋๋ผ์ด ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์์ผ๋ฉฐ, ๊ทธ ๊ฐ๋ฅ์ฑ์ ๋ฌด๊ถ๋ฌด์งํฉ๋๋ค.
- ์ฝํ
์ธ ์ดํด ๋ฐ ์์ฑ:
- ์ด๋ฏธ์ง/๋น๋์ค ์บก์ ๋: ์ด๋ฏธ์ง๋ ๋น๋์ค์ ๋ด์ฉ์ ์ค๋ช ํ๋ ํ ์คํธ๋ฅผ ์๋์ผ๋ก ์์ฑํฉ๋๋ค. (์: ์๊ฐ ์ฅ์ ์ธ์ ์ํ ์ค๋ช ์ ๊ณต, ๋ฏธ๋์ด ๊ฒ์ ํจ์จํ)
- ํ ์คํธ-์ด๋ฏธ์ง/๋น๋์ค ์์ฑ: ํ ์คํธ ์ค๋ช ์ ์ ๋ ฅํ๋ฉด ๊ทธ์ ๋ง๋ ์ด๋ฏธ์ง๋ ๋น๋์ค๋ฅผ ์์ฑํฉ๋๋ค. (์: Midjourney, DALL-E, Sora)
- ์๊ฐ์ ์ง์์๋ต (VQA): ์ด๋ฏธ์ง์ ๋ํ ์ง๋ฌธ์ ํ ์คํธ๋ก ์ ๋ ฅํ๋ฉด AI๊ฐ ์ด๋ฏธ์ง๋ฅผ ๋ณด๊ณ ๋ต๋ณํฉ๋๋ค. (์: “์ด ์ฌ์ง ์ ๊ฐ์์ง๋ ๋ช ๋ง๋ฆฌ์ธ๊ฐ์?”)
- ํฅ์๋ ์ฌ์ฉ์ ์ธํฐํ์ด์ค:
- ๋ฉํฐ๋ชจ๋ฌ ์ฑ๋ด/์ด์์คํดํธ: ์ฌ์ฉ์๊ฐ ํ ์คํธ, ์์ฑ, ์ด๋ฏธ์ง๋ฅผ ์กฐํฉํ์ฌ AI์ ์ํธ์์ฉํ ์ ์์ต๋๋ค. (์: ์ค๋งํธํฐ์ผ๋ก ์ฐ์ ์ท ์ฌ์ง์ ๋ณด์ฌ์ฃผ๋ฉฐ “์ด ์ท๊ณผ ์ด์ธ๋ฆฌ๋ ์ ๋ฐ ์ถ์ฒํด์ค”๋ผ๊ณ ์์ฑ์ผ๋ก ์ง๋ฌธ)
- ์๋ฃ ๋ถ์ผ:
- ์๋ฃ ์์ ๋ถ์ ๋ฐ ์ง๋จ ๋ณด์กฐ: X-ray, CT, MRI ๋ฑ ์๋ฃ ์์(์ด๋ฏธ์ง)๊ณผ ํ์์ ์ง๋ฃ ๊ธฐ๋ก(ํ ์คํธ)์ ํจ๊ป ๋ถ์ํ์ฌ ๋ ์ ํํ ์ง๋จ์ ๋์ต๋๋ค.
- ์์จ ์ฃผํ:
- ์ฃผ๋ณ ํ๊ฒฝ ์ธ์: ์นด๋ฉ๋ผ(์ด๋ฏธ์ง/๋น๋์ค), LiDAR(3D ํฌ์ธํธ ํด๋ผ์ฐ๋), RADAR(์ ํ) ๋ฑ ๋ค์ํ ์ผ์ ๋ฐ์ดํฐ๋ฅผ ์ตํฉํ์ฌ ๋๋ก ์ํฉ, ์ฅ์ ๋ฌผ, ๋ณดํ์ ๋ฑ์ ์ ํํ๊ฒ ์ธ์ํ๊ณ ์ฃผํ ๊ฒฐ์ ์ ๋ด๋ฆฝ๋๋ค.
- ์ด์ปค๋จธ์ค ๋ฐ ๋ง์ผํ
:
- ์ํ ์ถ์ฒ ๋ฐ ๊ฒ์: ์ํ ์ด๋ฏธ์ง์ ๊ณ ๊ฐ ๋ฆฌ๋ทฐ(ํ ์คํธ), ์ฌ์ฉ์ ํ๋ ๋ฐ์ดํฐ ๋ฑ์ ์ข ํฉ ๋ถ์ํ์ฌ ๋ ์ ํํ๊ณ ๊ฐ์ธํ๋ ์ํ ์ถ์ฒ ๋ฐ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ๋ณด์ ๋ฐ ๊ฐ์:
- ์ด์ ํ๋ ํ์ง: CCTV ์์(๋น๋์ค)๊ณผ ์ฃผ๋ณ ์๋ฆฌ(์ค๋์ค)๋ฅผ ํจ๊ป ๋ถ์ํ์ฌ ์นจ์ ์ด๋ ์ฌ๊ณ ๋ฑ ์ด์ ์ํฉ์ ๋ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์งํฉ๋๋ค.
์ด ์ธ์๋ ๊ต์ก, ์ํฐํ ์ธ๋จผํธ, ๋ก๋ณดํฑ์ค ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๋ฉํฐ๋ชจ๋ฌ AI์ ํ์ ์ ์ธ ์ ์ฉ์ด ๊ธฐ๋๋๊ณ ์์ต๋๋ค.
๋์ด์ผ ํ ๊ณผ์ ์ ๋ฏธ๋: ๋ฉํฐ๋ชจ๋ฌ AI์ ํ์ฃผ์์ ๋ฐ์ ๋ฐฉํฅ
๋ฉํฐ๋ชจ๋ฌ AI๋ ์์ฒญ๋ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์ง๋ง, ์์ง ํด๊ฒฐํด์ผ ํ ๊ธฐ์ ์ , ์ค๋ฆฌ์ ๊ณผ์ ๋ค๋ ์๊ณ ์์ต๋๋ค.
- ๊ธฐ์ ์ ๊ณผ์ :
- ๋ฐ์ดํฐ ์ ๋ ฌ ๋ฐ ๋ถ์กฑ ๋ฌธ์ : ์ฌ๋ฌ ๋ชจ๋ฌ๋ฆฌํฐ ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ต์ํค๊ธฐ ์ํด์๋ ๋๊ท๋ชจ์ ์ ์ ๋ ฌ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์ ์ด ํ์ํ์ง๋ง, ์ด๋ฅผ ๊ตฌ์ถํ๋ ๊ฒ์ ์ด๋ ต๊ณ ๋น์ฉ์ด ๋ง์ด ๋ญ๋๋ค.
- ํจ๊ณผ์ ์ธ ์ตํฉ ๋ฐฉ๋ฒ๋ก : ์๋ก ๋ค๋ฅธ ํน์ฑ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๊ฐ์ฅ ํจ๊ณผ์ ์ผ๋ก ์ตํฉํ ์ง์ ๋ํ ์ฐ๊ตฌ๊ฐ ๊ณ์ ์งํ ์ค์ ๋๋ค.
- ๋ชจ๋ธ์ ๋ณต์ก์ฑ ๋ฐ ๊ณ์ฐ ๋น์ฉ: ์ฌ๋ฌ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ์ ๊ตฌ์กฐ๊ฐ ๋ณต์กํ๊ณ ํ์ต ๋ฐ ์ถ๋ก ์ ๋ง์ ๊ณ์ฐ ์์์ ํ์๋ก ํฉ๋๋ค.
- ํ๊ฐ ์งํ์ ์ด๋ ค์: ์์ฑ๋ ๋ฉํฐ๋ชจ๋ฌ ์ฝํ ์ธ ์ ํ์ง์ด๋ ๋ชจ๋ธ์ ์ดํด๋๋ฅผ ๊ฐ๊ด์ ์ผ๋ก ํ๊ฐํ๊ธฐ ์ํ ํ์คํ๋ ์งํ ๊ฐ๋ฐ์ด ์ด๋ ต์ต๋๋ค.
- ์ค๋ฆฌ์ ๊ณผ์ :
- ํธํฅ ์ฆํญ: ๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ ๋ฐ์ดํฐ์ ๋ด์ฌ๋ ํธํฅ์ด ์ตํฉ ๊ณผ์ ์์ ์ฆํญ๋๊ฑฐ๋ ์๋ก์ด ํํ์ ํธํฅ์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
- ๋ฅํ์ดํฌ ๋ฐ ์ ์ฉ ๊ฐ๋ฅ์ฑ: ํ ์คํธ-์ด๋ฏธ์ง/๋น๋์ค ์์ฑ ๊ธฐ์ ๋ฑ์ ๊ฐ์ง ๋ด์ค๋ ์ ํด ์ฝํ ์ธ ์ ์์ ์ ์ฉ๋ ์ํ์ด ์์ต๋๋ค.
- ํ๋ผ์ด๋ฒ์ ์นจํด: ๋ค์ํ ์ผ์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ฒ๋ฆฌํ๋ ๊ณผ์ ์์ ๊ฐ์ธ ์ ๋ณด ์นจํด ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.
๋ฏธ๋ ์ ๋ง: ์ด๋ฌํ ๊ณผ์ ์๋ ๋ถ๊ตฌํ๊ณ ๋ฉํฐ๋ชจ๋ฌ AI๋ ๋์ฑ ๋ฐ์ ํ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
- ๋ ๋ง์ ๋ชจ๋ฌ๋ฆฌํฐ ํตํฉ: ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค๋ฅผ ๋์ด ์ด๊ฐ, ํ๊ฐ, ๋ํ ๋ฑ ๋ ๋ค์ํ ์ผ์ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ๋ ค๋ ์ฐ๊ตฌ๊ฐ ์งํ๋ ๊ฒ์ ๋๋ค.
- ์ค์๊ฐ ์ํธ์์ฉ ๊ฐํ: ๋ก๋ด์ด๋ ๊ฐ์ํ์ค(VR)/์ฆ๊ฐํ์ค(AR) ํ๊ฒฝ์์ ์ค์๊ฐ์ผ๋ก ๋ฉํฐ๋ชจ๋ฌ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ๊ณ ์ํธ์์ฉํ๋ ๋ฅ๋ ฅ์ด ํฅ์๋ ๊ฒ์ ๋๋ค.
- ๋ ๊น์ ์ถ๋ก ๋ฐ ์ธ๊ณผ๊ด๊ณ ์ดํด: ๋จ์ํ ์ ๋ณด๋ฅผ ์ฐ๊ด์ํค๋ ๊ฒ์ ๋์ด, ๋ณต์กํ ์ํฉ์ ๋ํ ๊น์ด ์๋ ์ถ๋ก ๊ณผ ์ธ๊ณผ๊ด๊ณ ์ดํด ๋ฅ๋ ฅ์ด ๋ฐ์ ํ ๊ฒ์ ๋๋ค.
- ํจ์จ์ ์ธ ๋ชจ๋ธ ๊ฐ๋ฐ: ๋ชจ๋ธ ๊ฒฝ๋ํ, ํจ์จ์ ์ธ ํ์ต ๊ธฐ๋ฒ ๋ฑ์ ํตํด ๋ ์ ์ ์์์ผ๋ก๋ ๋ฉํฐ๋ชจ๋ฌ AI๋ฅผ ๊ฐ๋ฐํ๊ณ ํ์ฉํ ์ ์๊ฒ ๋ ๊ฒ์ ๋๋ค. ์คํ ํฌ๋ ์ธ๊ฐ ์ค์ฌ AI ์ฐ๊ตฌ์(Stanford HAI)์ ์ฐ๋ก AI Index ๋ณด๊ณ ์ ๋ฑ์์๋ ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ์ ์ค์์ฑ๊ณผ ๋ฐ์ ์ถ์ธ๋ฅผ ํ์ธํ ์ ์์ต๋๋ค. (Stanford HAI AI Index)
์คํํธ์ ๊ณผ VC๊ฐ ์ฃผ๋ชฉํด์ผ ํ ๋ฉํฐ๋ชจ๋ฌ AI์ ๊ธฐํ์ ์ ๋ต
๋ฉํฐ๋ชจ๋ฌ AI์ ๋ฐ์ ์ ์คํํธ์ ๊ณผ ๋ฒค์ฒ์บํผํ(VC)์๊ฒ ์๋ก์ด ๊ธฐํ์ ์ฅ์ ์ด์ด์ฃผ๊ณ ์์ต๋๋ค.
- ์ฐจ์ธ๋ AI ์๋น์ค ๊ฐ๋ฐ: ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ์ ํ์ฉํ์ฌ ๊ธฐ์กด์๋ ๋ถ๊ฐ๋ฅํ๋ ํ์ ์ ์ธ ์ฌ์ฉ์ ๊ฒฝํ์ ์ ๊ณตํ๋ ์๋น์ค๋ฅผ ๊ฐ๋ฐํ ์ ์์ต๋๋ค. (์: ์ธํฐ๋ํฐ๋ธ ๊ต์ก ํ๋ซํผ, ์ฐจ์ธ๋ ์ฝํ ์ธ ์ ์ ๋๊ตฌ, ๊ณ ๋๋ก ๊ฐ์ธํ๋ ํฌ์ค์ผ์ด ์๋ฃจ์ ๋ฑ)
- ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ฒฝ์ ์ฐ์ ํ๋ณด: ํน์ ์ฐ์ ๋ถ์ผ์ ๊ณ ์ ํ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ๊ณ ์ด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌ, ๋ถ์ํ๋ ๊ธฐ์ ์ ๊ฐ๋ ฅํ ๊ฒฝ์ ์ฐ์(Data Moat)๋ฅผ ๊ตฌ์ถํ๋ ๋ฐ ํต์ฌ์ ์ธ ์ญํ ์ ํ ์ ์์ต๋๋ค.
- ํ์ ์์ฅ ๊ณต๋ต: ์์ง ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ์ ์ฉ์ด ์ด๊ธฐ ๋จ๊ณ์ธ ํน์ ์ฐ์ ์ด๋ ๋ฌธ์ ์์ญ์ ๋ฐ๊ตดํ์ฌ ์ ์ ํ๋ ์ ๋ต์ด ์ ํจํ ์ ์์ต๋๋ค. (์: ๊ฑด์ค ํ์ฅ ์์ ๊ด๋ฆฌ, ๋์๋ฌผ ์์ก ์ํ ๋ถ์ ๋ฑ)
- ๊ธฐ๋ฐ ๊ธฐ์ ๋ฐ ๋๊ตฌ ๊ฐ๋ฐ: ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๋ชจ๋ธ ํ์ต, ์ตํฉ ๊ธฐ์ , ์ค๋ฆฌ์ ๋ฌธ์ ํด๊ฒฐ ๋ฑ ๋ฉํฐ๋ชจ๋ฌ AI ์ํ๊ณ๋ฅผ ์ง์ํ๋ ๊ธฐ๋ฐ ๊ธฐ์ ์ด๋ ๊ฐ๋ฐ ๋๊ตฌ๋ฅผ ์ ๊ณตํ๋ ์คํํธ์ ๋ ์ ๋งํฉ๋๋ค.
- VC์ ํฌ์ ๊ด์ : VC๋ ๋ฉํฐ๋ชจ๋ฌ AI ์คํํธ์ ์ ํฌ์ํ ๋, ๊ธฐ์ ์ ํ์ ์ฑ๋ฟ๋ง ์๋๋ผ ์์ง์ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ํ๋ณด ์ ๋ต, ํจ๊ณผ์ ์ธ ์ตํฉ ๊ธฐ์ ๋ณด์ ์ฌ๋ถ, ๋ช ํํ ๋น์ฆ๋์ค ๋ชจ๋ธ, ๊ทธ๋ฆฌ๊ณ ์ ์ฌ์ ์ธ ์ค๋ฆฌ์ ๋ฆฌ์คํฌ ๊ด๋ฆฌ ๋ฐฉ์ ๋ฑ์ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํด์ผ ํฉ๋๋ค. ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ์์ฒด๊ฐ ๋์ ์ง์ ์ฅ๋ฒฝ์ ๊ฐ์ง ์ ์์ผ๋ฏ๋ก, ๊ธฐ์ ์ ๊น์ด์ ์คํ ๋ฅ๋ ฅ์ ๊ฐ์ถ ํ์ด ์ค์ํฉ๋๋ค.
๋ฉํฐ๋ชจ๋ฌ AI๋ ๋จ์ํ ๊ธฐ์ ํธ๋ ๋๋ฅผ ๋์ด, AI๊ฐ ์ธ์์ ์ดํดํ๊ณ ์ํธ์์ฉํ๋ ๋ฐฉ์์ ๊ทผ๋ณธ์ ์ผ๋ก ๋ณํ์ํฌ ์ ์ฌ๋ ฅ์ ์ง๋๊ณ ์์ต๋๋ค. ์คํํธ์ ๊ณผ ํฌ์์ ๋ชจ๋ ์ด ๋ณํ์ ํ๋ฆ์ ์ฝ๊ณ ์ ๋ต์ ์ผ๋ก ๋์ํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
AI์ ์งํ, ๋ณด๊ณ ๋ฃ๊ณ ์ดํดํ๋ ๊ธธ
๋ฉํฐ๋ชจ๋ฌ AI๋ ํ ์คํธ๋ผ๋ ํ๊ณ๋ฅผ ๋์ด AI๊ฐ ์ธ์์ ๋์ฑ ํ๋ถํ๊ณ ๊น์ด ์๊ฒ ์ดํดํ๋๋ก ๋ง๋๋ ํ์ ์ ์ธ ํจ๋ฌ๋ค์ ์ ํ์ ๋๋ค. ๋ง์น ์ธ๊ฐ์ด ์ฌ๋ฌ ๊ฐ๊ฐ์ ํตํด ์ธ์์ ๋ฐฐ์ฐ๊ณ ์ํตํ๋ฏ, ๋ฉํฐ๋ชจ๋ฌ AI๋ ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค ๋ฑ ๋ค์ํ ์ ๋ณด ์กฐ๊ฐ๋ค์ ํ๋๋ก ์ฎ์ด ๋ ์์ ํ ๊ทธ๋ฆผ์ ๊ทธ๋ ค๋ ๋๋ค.
์ด ๊ธฐ์ ์ ๋จ์ํ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ์์ ๋ฐ๊พธ๋ ๊ฒ์ ๋์ด, ์ฐ๋ฆฌ๊ฐ AI์ ์ํธ์์ฉํ๋ ๋ฐฉ์, AI๊ฐ ์ฐ๋ฆฌ ์ถ์ ๊ธฐ์ฌํ๋ ๋ฐฉ์์ ๊ทผ๋ณธ์ ์ผ๋ก ๋ณํ์ํฌ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ด๋ฏธ์ง ์บก์ ๋๋ถํฐ ์์จ ์ฃผํ, ์๋ฃ ์ง๋จ ๋ณด์กฐ์ ์ด๋ฅด๊ธฐ๊น์ง ๊ทธ ๊ฐ๋ฅ์ฑ์ ์ด์ ๋ง ํผ์ณ์ง๊ธฐ ์์ํ์ต๋๋ค.
๋ฌผ๋ก ์์ง ํด๊ฒฐํด์ผ ํ ๊ธฐ์ ์ , ์ค๋ฆฌ์ ๊ณผ์ ๋ค์ด ๋จ์์์ง๋ง, ๋ฉํฐ๋ชจ๋ฌ AI๋ฅผ ํฅํ ์ฐ๊ตฌ์ ํฌ์๋ ๊ณ์ํด์ ๊ฐ์ํ๋ ๊ฒ์ ๋๋ค. ์ด ํฅ๋ฏธ๋ก์ด ๊ธฐ์ ์ ๋ฐ์ ์ ์ฃผ์ ๊น๊ฒ ์ง์ผ๋ณด๊ณ ๊ทธ ๊ฐ๋ฅ์ฑ์ ํ์ํ๋ ๊ฒ์, AI ์๋๋ฅผ ์ด์๊ฐ๋ ์ฐ๋ฆฌ ๋ชจ๋์๊ฒ ์ค์ํ ๊ณผ์ ๊ฐ ๋ ๊ฒ์ ๋๋ค. ๋ณด๊ณ ๋ฃ๊ณ ์ดํดํ๋ AI, ๋ฉํฐ๋ชจ๋ฌ AI๊ฐ ๋ง๋ค์ด๊ฐ ๋ฏธ๋๋ ์ฐ๋ฆฌ๊ฐ ์์ํ๋ ๊ฒ ์ด์์ผ์ง๋ ๋ชจ๋ฆ ๋๋ค.
์ต๊ทผ ๊ฐ์ฅ ๋๋ฆฌ ์๋ ค์ง ์์๋ OpenAI์ย GPT-4(Vision)ย ์ ๊ตฌ๊ธ์ย ์ ๋ฏธ๋์ด(Gemini)ย ์ ๋๋ค. ์ด ๋ชจ๋ธ๋ค์ ์ฌ์ฉ์๊ฐ ํ ์คํธ์ ์ด๋ฏธ์ง๋ฅผ ํจ๊ป ์ ๋ ฅํ์ฌ ์ง๋ฌธํ๊ฑฐ๋ ์์ ์ ์์ฒญํ ์ ์๋ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ค๋๋ค. ์๋ฅผ ๋ค์ด, ๋์ฅ๊ณ ๋ด๋ถ ์ฌ์ง์ ์ฐ์ด ๋ณด์ฌ์ฃผ๋ฉฐ “์ด ์ฌ๋ฃ๋ค๋ก ๋ง๋ค ์ ์๋ ์๋ฆฌ ๋ ์ํผ ์๋ ค์ค” ๋ผ๊ณ ์ง๋ฌธํ๋ ๊ฒ์ด ๊ฐ๋ฅํฉ๋๋ค. ๋ํ, ํ ์คํธ๋ฅผ ์ ๋ ฅํ๋ฉด ์ด๋ฏธ์ง๋ฅผ ์์ฑํด์ฃผ๋ย Midjourney๋ย DALL-Eย ๋ฑ๋ ๋ฉํฐ๋ชจ๋ฌ AI์ ๋ํ์ ์ธ ์์์ ๋๋ค.
๋จผ์ ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค ๋ฑ ๊ฐ ๊ฐ๋ณ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๊ธฐ๋ณธ์ ์ธ AI ๋ชจ๋ธ(NLP, ์ปดํจํฐ ๋น์ , ์์ฑ ์ฒ๋ฆฌ)์ ๋ํ ์ดํด๊ฐ ํ์ํฉ๋๋ค. ์ดํ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์ ์ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ, ์๋ฒ ๋ฉ ๊ธฐ๋ฒ, ๋ค์ํ ์ตํฉ ์ ๋ต, ์ดํ ์ ๋ฉ์ปค๋์ฆ ๋ฑ์ ๋ํด ํ์ตํด์ผ ํฉ๋๋ค. Hugging Face์ ๊ฐ์ ํ๋ซํผ์์ ์ ๊ณตํ๋ ์ฌ์ ํ์ต๋ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ๊ณผ ํํ ๋ฆฌ์ผ์ ํ์ฉํ์ฌ ์คํํด๋ณด๋ ๊ฒ์ด ์ข์ ์์์ด ๋ ์ ์์ต๋๋ค.
์ฌ๋ฌ ๊ฐ์ง๊ฐ ์์ง๋ง,ย ์๋ก ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ์ ์ ๋ณด๋ฅผ ์ด๋ป๊ฒ ํจ๊ณผ์ ์ผ๋ก ‘์ ๋ ฌ(Align)’ํ๊ณ ‘์ตํฉ(Fuse)’ํ์ฌ ์๋ฏธ ์๋ ์ํธ์์ฉ์ ์ด๋์ด๋ผ ๊ฒ์ธ๊ฐ๊ฐ ํต์ฌ์ ์ธ ๊ณผ์ ์ค ํ๋์ ๋๋ค. ๊ฐ ๋ฐ์ดํฐ์ ํน์ฑ๊ณผ ์๊ฐ์ /๊ณต๊ฐ์ ๊ด๊ณ๋ฅผ ๊ณ ๋ คํ์ฌ ์ต์ ์ ํํ(Representation)์ ํ์ตํ๊ณ ์ด๋ฅผ ํตํฉํ๋ ์ ๊ตํ ๋ชจ๋ธ ์ํคํ ์ฒ ์ค๊ณ๊ฐ ์ด๋ ต์ต๋๋ค. ๋ํ, ๋๊ท๋ชจ์ ๊ณ ํ์ง ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์ ํ๋ณด์ ์ด๋ ค์๋ ํฐ ์ฅ๋ฒฝ์ ๋๋ค.
๋ค, ๋ค๋ฆ ๋๋ค. ์ฌ๋ฌ ์ ๋๋ชจ๋ฌ AI ๋ชจ๋ธ์ ๋จ์ํ ํ์ดํ๋ผ์ธ์ฒ๋ผ ์ฐ๊ฒฐํ๋ ๊ฒ(์: ์ด๋ฏธ์ง ์บก์ ๋ ๋ชจ๋ธ๋ก ํ ์คํธ๋ฅผ ์์ฑํ ํ, ๊ทธ ํ ์คํธ๋ฅผ ์ธ์ด ๋ชจ๋ธ์ ์ ๋ ฅ)์ ๊ฐ ๋ชจ๋ธ์ด ๋ ๋ฆฝ์ ์ผ๋ก ์๋ํ๋ฉฐ ์ ๋ณด์ ‘์ตํฉ’์ด ์ ํ์ ์ ๋๋ค. ์ง์ ํ ๋ฉํฐ๋ชจ๋ฌ AI๋ ๋ชจ๋ธ ๋ด๋ถ์์ย ์ฌ๋ฌ ๋ชจ๋ฌ๋ฆฌํฐ์ ์ ๋ณด๊ฐ ์๋ก ์ํธ์์ฉํ๊ณ ์ํฅ์ ์ฃผ๋ฉด์ ํตํฉ๋ ์ดํด๋ฅผ ํ์ฑํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ์ฆ, ์ ๋ณด ์ฒ๋ฆฌ ๊ณผ์ ์์ ๋ ๊น์ ์์ค์ ํตํฉ์ด ์ด๋ฃจ์ด์ง๋๋ค.
๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ ์์ฒด๋ฅผ ์ฐ๊ตฌํ๊ณ ๊ฐ๋ฐํ๋ย AI ์ฐ๊ตฌ์ ๋ฐ ์์ง๋์ด์ ์์๋ ๊ณ์ ์ฆ๊ฐํ ๊ฒ์ ๋๋ค. ๋ํ, ๋ค์ํ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ์์ง, ๊ฐ๊ณต, ๊ด๋ฆฌํ๋ย ๋ฐ์ดํฐ ์ ๋ฌธ๊ฐ, ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ์ ํ์ฉํ์ฌ ์๋ก์ด ์๋น์ค๋ ์ฌ์ฉ์ ๊ฒฝํ์ ๋์์ธํ๋ย UX/UI ๋์์ด๋ ๋ฐ ๊ธฐํ์, ๊ทธ๋ฆฌ๊ณ ๋ฉํฐ๋ชจ๋ฌ AI์ ์ค๋ฆฌ์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๊ณ ๊ฐ์ด๋๋ผ์ธ์ ๋ง๋๋ย AI ์ค๋ฆฌ ์ ๋ฌธ๊ฐย ๋ฑ์ ์ญํ ์ด ์ค์ํด์ง ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค. ํน์ ์ฐ์ ๋ถ์ผ์ ์ง์๊ณผ ๋ฉํฐ๋ชจ๋ฌ AI ํ์ฉ ๋ฅ๋ ฅ์ ๊ฒธ๋นํย ์ตํฉํ ์ ๋ฌธ๊ฐ๋ ๊ฐ๊ด๋ฐ์ ์ ์์ต๋๋ค.
4 Comments