‘1400만 장의 텍스트와 이미지 세트 사전 학습’ 텍스트로 명령어 입력하면 이미지 도출
카카오브레인은 15일 초거대 AI 멀티모달 ‘minDALL-E’를 세계 최대 오픈소스 커뮤니티 ‘깃허브’에 공개했다고 밝혔다.
minDALL-E는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 오픈 AI의 'DALL-E'를 누구나 접근하기 쉽게 작은 사이즈 모델로 만든 것으로 1400만 장의 텍스트와 이미지 세트를 사전 학습했다.
예를 들어 “바나나 껍질로 만든 의자 그려줘”라는 명령어를 입력하면 AI가 명령어의 맥락을 이해하고 바로 이미지를 도출한다. 검색을 통해 이미지를 찾아내는 것이 아니라 AI가 스스로 명령을 이해하고 직접 이미지를 그리는 것이다.
김일두 카카오브레인 대표는 “인공지능이 사람처럼 생각하고 말하려면 어떤 요소가 필요할지, 인공지능에게 기억력, 추론 능력, 이해 능력이 있다면 사람처럼 소통할 수 있을지 등 끝없이 질문을 던지며 연구하고 있다”며 “최근 공개한 언어 모델 KoGPT과 이번에 공개한 DALL-E를 시작으로 순차적으로 초거대 AI의 다양한 모델을 공개할 것”이라고 전했다.
박형민 기자 godyo@ilyo.co.kr
-
'루나만큼은 아니지만…' 한국 대표 코인 클레이 폭락의 비밀
온라인 기사 ( 2022.05.27 19:51 )
-
에픽스토어 무료게임으로 명작 ‘바이오쇼크’ 3부작 푼다
온라인 기사 ( 2022.05.28 15:18 )
-
불사조 될까 잿더미 될까…권도형 '루나 2.0' 론칭 막전막후
온라인 기사 ( 2022.05.31 11:27 )