
이 모델은 최신 대규모 언어 모델(LLM)인 제미나이 3.0과 연동돼 사용자의 복잡한 의도를 정밀하게 반영하고 실제 물리 법칙이 재현된 고해상도 환경을 제공한다. 구글은 “이용자가 자신만의 상호작용 가능한 세계를 직접 생성하고 탐색하며 재구성할 수 있는 권한이 생긴 것”이라고 설명했다. 순다르 피차이 구글 CEO(최고경영자)는 X(옛 트위터)를 통해 “직접 해봤는데 정말 놀라운 수준”이라고 극찬을 아끼지 않았고, 데미스 허사비스 딥마인드 CEO도 “세계에서 가장 진보한 월드 모델”이라고 자신했다.
구글의 이번 발표로 가장 먼저 직격탄을 맞은 곳은 게임 업계다. 공개 직후 게임 엔진 시장의 선두 주자인 유니티의 주가가 24.22% 폭락했으며, 게임 플랫폼 기업 로블록스 주가 또한 13.17% 하락하며 이른바 ‘지니 쇼크’를 겪었다. 시장에서는 AI가 복잡한 코딩과 물리 연산을 독자적으로 수행하며 기존 게임 엔진의 역할을 대체할 것이라는 전망도 나왔다. 게임뿐 아니라 소프트웨어 산업도 AI로 대체될 수 있다는 우려가 빠르게 확산하며 투자심리가 얼어붙었다.
하지만 구글의 진짜 목표는 게임이 아니다. 지니 3의 실질적인 지향점은 로봇 공학이나 자율주행 같은 피지컬 AI 분야에 닿아있다는 분석이다. 기존 챗GPT나 제미나이 등의 LLM은 텍스트 중심의 데이터 학습으로 인해 물리 세계에 대한 이해가 부족하고 실생활의 상호작용 관련 지식이 부재하다는 한계가 있었다. 그런데 월드 모델은 AI에게 실질적인 ‘물리적 감각’을 학습할 수 있는 환경을 제공한다.
임준호 한국전자통신연구원(ETRI) 인공지능연구소 책임연구원은 “가령 로봇이 계란을 집을 때, 부서지지 않을 정도의 적절한 힘을 유지하다가 깨지기 직전의 임계점을 넘지 않도록 제어하는 과정은 인간이 일일이 프로그래밍하기 매우 어려운 영역”이라며 “지니 3와 같은 월드 모델이 이러한 동적인 물리 데이터를 제공함으로써 AI가 사람처럼 똑똑하고 정교하게 현실에 대응할 수 있는 지평이 열릴 것”이라고 분석했다.
전문가들은 이러한 월드 모델의 완성을 AGI(범용 인공지능)로 향하는 필수 관문으로 꼽는다. 언어 모델이 인간의 지식을 외우는 ‘뇌’ 수준이라면 지니 3와 같은 월드 모델은 그 지식이 실제로 구현되는 ‘공간’과 ‘감각’을 제공하기 때문이다. ‘계란을 너무 세게 쥐면 깨진다’는 사실을 텍스트가 아닌 물리적 경험으로 이해하는 AI야말로 인간 수준의 판단력을 갖춘 진정한 지능에 가깝다는 평가다.
임 책임연구원은 “이미 엔비디아가 ‘코스모스’라는 월드 모델 개발을 통해 자율주행과 로봇 연구에 박차를 가하고 있듯, 구글 역시 지니 3로 기술 격차를 벌리고 있다. 지니 3를 피지컬 AI에 완전히 접목하기까지는 시간이 필요하겠으나 이 월드 모델의 유무에 따라 향후 6개월에서 1년 뒤면 경쟁사들이 구글의 발전 속도를 따라잡기 힘든 수준에 도달할 수 있다”고 전망했다.
김정민 기자 hurrymin@ilyo.co.kr














