구글 제미나이 3 출시, 멀티모달. 코딩. 에이전트 역대 최고 성적
구글이 최신 인공지능 모델 '제미나이3'을 출시했다.
이 모델은 강력한 멀티모달과 에이전트 기능, 코딩 능력을 갖췄다.
구글은 제미나이 앱과 함께 AI 검색, AI 스튜디오 및 버텍스 AI 개발자, 그리고 새로운 에이전트 개발 플랫폼인
'구글 안티그래피티(Google Antigravity)'도 발표했다.

또 구글은 최고 성능의 '제미나이 3 프로'를 프리뷰로 출시하고, 강력한 추론 기능을 갖춘 '제미나이 3 딥 싱크(Deep Think)'
모드는 몇 주 안에 구글 AI 울트라 구독자에게 서비스할 예정이라고 전했다.
구글이 새로운 모델을 검색에 바로 적용한 것은 처음이다.
하지만 이는 이미 예고되었다.
오픈 AI나 퍼블렉시티 등의 AI 검색과 차별화하기 위해 구글은 최신 AI 기술을 모두 검색에 집중하고 있다.
AI 모드의 제미나이 3 프로 적용은 미국 유료 사용자부터 적용되었으며 다른 국가에는 차례도 도입할 예정이라고 한다.
제미나이 3 각종 벤치마크에서 최고 성적들을 거둠
제미나이 3 프로가 각종 벤치마크에서 최고 성적을 거뒀다는 점도 집중 부각되었다.
우선, 사용자 선호 테스트인 'LM아레다 리더보드'에서 1501점으로 정상을 차지했다.
상식과 추론 등을 테스트하는 '인류의 마지막 시험(HLE)에서는 37.5%를 기록,
GPT-5 프로의 31.64%를 넘어 역대 최고 성적이다.
'GPQA 다이아몬드'에서도 91.9%의 최고 정확도를 기록했다.

또 '메스아레나 에이펙스(MathArena Apex)'에서 23.4%라는 최고 점수를 달성하며 수학 분야에서도 새로운 기준을
제시했다고 전했다.
'MMMU-프로' 에서 81%, '비디오-MMMU'에서 87.6%의 점수를 기록해 가장 뛰어난 멀티모달 능력을 보였으며,
'심플QA 베리파이(SimpleQA Verified)'에서도 최고인 72.1%를 기록하며 사실 정확도 측면에서도
큰 진전을 보였다고 한다.
출시 대기 중인 제미나이 3 딥 싱크 보드는 제미나이 3 프로보다 더 뛰어난 성적을 거뒀다.
HLE 테스트에서 41%, GPQA 다이아몬드에서 93.3%를 기록했다.

특히, 인공일반 지능(AGI0)능력을 테스트하는 'ARC-AGI-2'에서도 역대 최고 점수인
45.1%를 기록했다.
웹데브 아레나(WebDev Arena) 순위에서 1487점으로 1위를 차지했으며,
도구 활용 능력을 테스트하는 '터미널-벤치(Terminal-Bench 2.0)'와 코딩 능력 테스트인
'SWE-벤치 베리파이'에서 각각 54.2%와 76.2%로 2.5 프로 버전을 크게 앞섰다.
바이브 코딩 플랫폼 안티그래피티도 출시
구글은 제미나이 3 기반의 바이브 코딩 플랫폼 안티그래피티(Antigravity) 도 소개했다.
안티그래피티는 개발자용 AI IDE 환경으로, 에이전트는 전용 화면으로 확장돼 편집기와 터미널,
브라우저 등에서 접근할 수 있게 됐다.
여기에 제미나이 3 프로 외에도 브라우저 제어를 위한 최신 제미나이 2.5 컴퓨터 우즈(Gemini 2.5 Computer Use)와
이미지 편집 모델 '나노바나나(Nano Banana)' 도 결합됐다.
에이전트 능력도 강조했는데 자판기 사업을 관리해 장기 계획 수립을 테스트하는 '벤딩-벤치 3(Vending-Bench 2)'에서
리더보드 1위를 차지했다고 한다.
1년간의 시뮬레이션 운영 동안 일관된 도구 사용과 의사 결정 유지로 업무에서 벗어나지 않고 더 높은 수익을
창출했다고 전했다.
구글 AI 울트라 구독자는 제미나이 앱에서 에이전트 기능을 바로 확인할 수 있다.
한편, 피차이 CEO는 이날 'AI 개요'의 월간 활성 사용자(MAU)가 20억명이며, 제미나이 앱의 MAU는 6억 5000만명,
제미나이 사용 개발자가 1300만명에 달한다고 밝혔다.
'AI NEWS' 카테고리의 다른 글
| 구글 CEO가 치즈버거 제조법 이미지를 게시한 이유? (0) | 2025.11.25 |
|---|---|
| 구글 '나노바나나 프로' 출시 반응 "완전 미쳤다" (0) | 2025.11.23 |
| 오픈AI GPT 5.1 업데이트 (0) | 2025.11.16 |
| 구글, 제미나이 API에 엔지니어링 부담 없는 RAG 시스템 ‘파일 서치’ 공개 (0) | 2025.11.12 |
| AI, 무례한 어조의 프롬프트가 더 정확률이 높다? (0) | 2025.10.24 |