구글, 성능 10배 높인 추론형 TPU ‘아이언우드’ 공개

구글 클라우드 Next 25/ 구글 클라우드 제공

구글이 새 인공지능(AI) 모델, 클라우드 인프라, 성능을 10배 이상 끌어올린 AI 칩 등 혁신 기술을 대거 공개했다.

9일(현지시각) 구글 클라우드는 미국 라스베이거스 만달레이 베이 컨벤션 센터에서 열린 ‘구글 클라우드 Next 25’ 행사에서 추론에 특화된 7세대 텐서처리장치(TPU) ‘아이언우드(Ironwood)’를 공개했다. 이전 TPU 모델(v5p) 대비 성능이 10배 이상 개선됐다. TPU는 AI 딥러닝(심층학습)에 최적화된 칩으로, 챗봇·코드 및 미디어 콘텐츠 생성 등 다양한 AI 처리 요구량에 맞게 확장할 수 있도록 설계됐다.

아이언우드는 포드(Pod) 당 9000개 이상의 칩을 탑재하고 42.5 엑사플롭스(1초에 100경 번의 부동소수점 연산 처리 능력)의 연산 성능을 제공한다. 전력 효율성도 직전 TPU 모델인 트릴리움 대비 2배 높다고 구글 클라우드는 설명했다. HBM(고대역폭 메모리) 용량의 경우 트릴리움 대비 6배 끌어올렸다.

구글 클라우드는 “(아이언우드는) 지금까지 개발된 TPU 중 가장 강력한 칩”이라며 “제미나이 2.5 같은 AI 모델의 급증하는 연산 수요를 완벽히 충족한다”라고 했다. 아이언우드는 연말 출시할 예정이다.

구글은 이날 제미나이 2.5의 보급형 모델인 ‘제미나이 2.5 플래시’도 선보였다. 이 AI 모델은 실시간 요약과 문서 탐색에 적합하고, 프롬프트의 복잡성에 따라 추론 수준을 조정할 수 있다는 게 특징이다. 또 질문의 복잡한 정도에 따라 답변 시간을 조정할 수 있어, 사실 확인이 필요한 질문에 답하는 데 시간이 더 오래 걸린다.

순다르 피차이 구글 최고경영자(CEO)는 이날 현장에서 “제미나이 2.5 플래시를 사용하면 모델 추론의 정도를 제어하고, 예산과 성능의 균형을 맞출 수 있다”라며 “우리의 목표는 최신 AI 기술을 제품과 플랫폼에 적용하는 것”이라고 말했다. 피차이 CEO는 이어 네트워크 성능을 최대 40% 높인 ‘클라우드 광역 네트워크(Cloud WAN)’를 전 세계 기업에 지원한다고 밝혔다.

이날부터 사흘간 열리는 이 행사에서 구글 클라우드와 AI·클라우드 사업에서 협력하는 전 세계 기업들이 다양한 혁신 사례를 소개한다. 삼성전자, 카카오 등 주요 한국 기업들도 다수 참여했다.

삼성전자는 상반기 출시를 앞둔 ‘홈 AI 컴패니언’ 로봇 ‘볼리’에 구글 클라우드의 생성형 AI 기술을 탑재한다고 밝혔다. 볼리는 제미나이의 강력한 추론 능력에 삼성의 독자적인 언어 모델을 결합해 실시간으로 행동과 반응을 조율할 수 있도록 고도화할 예정이다.

LG AI연구원은 구글 클라우드의 AI 하이퍼컴퓨터와 인프라를 활용해 자체 개발한 대규모언어모델(LLM) ‘엑사원’의 사례를 소개하고 카카오는 구글 클라우드 TPU 및 GPU에서 머신러닝 연구 성능을 최적화한 뒤 대규모 차세대 기반 모델을 구축한 사례를 발표한다.

구글 클라우드 Next 25 (구글 클라우드 제공)

구글, 성능 10배 높인 추론형 TPU ‘아이언우드’ 공개

이재은 기자 편집국 기자