엔트로픽, 코딩 최강 클로드 오퍼스 4.5 출시 가격은 3분의 1로 낮춰

앤트로픽이 역대 최고의 코딩 성능을 자랑하는 AI 모델 '클로드 오퍼스 4.5'를 공개했다.
앤트로픽은 24일 플래스십 모델 '클로드 오퍼스 4.5'를 출시했다.
이번 모델은 소프트웨어 엔지니어링을 비롯한 다양한 전문 업무에서 기존 모델을 크게 앞서는 성능을 보여주는 동시에,
가격은 이전 대비 약 3분의 1 수준으로 낮춘 것이 특징이다.
앤트로픽은 "코딩, 에이전트 작업, 컴퓨터 활용 등에서 세계 최고 수준"이라며
"일상적 업무, 슬라이드, 스프레드시트 작업, 딥 리서치에서도 의미 있는 개선을 보였다"라고 소개했다.
벤치마크 결과를 보면 소프트웨어 엔지니어링 능력을 측정하는 'SWE-벤치 베리파이드' 내부 테스트에서 80.9%를 기록,
오픈AI 'GPT-5.1-코덱스-맥스(77.9%), 구글 '제미나이 3 프로(76.2%)', 그리고 이전 모델 '소네트 4.5(77.2%)'까지
모두 넘어섰다.

앤트로픽은 "오퍼스 4.5는 복잡한 버그를 스스로 파악하고 애매모호한 상황에서도 적절한 판단을 내린다" 라며
"이전 모델이 해결하지 못했던 문제까지 처리 가능하다"고 설명했다.
특히, 내부 엔지니어 채용 평가에서는 2시간 제한 내에서 역대 인간 지원자보다 높은 점수를 기록해, AI가 전문 기술 직종의 미래를
재편할 가능성을 보여줬다고 전했다.
모델 성능 면에서는 동일 작업을 수행하면서 토큰 사용량이 크게 줄어들었다.
새롭게 도입된 에포트(Effort) 파라미터를 통해 개발자는 연산량을 직접 조절하며 비용. 지연. 성능 간 균형을 맞출 수 있다.
오퍼스 4.5는 코드 작성 뿐 아니라 문서 작성, 스프레드 시트, 프레젠테이션 제작 등 사무 작업에서도
뛰어난 성능을 보였다.
금융 모델링 업체 FRL은 '정확도 20% 증가, 효율성 15% 상승, 과거 불가능했던 복잡한 작업까지 가능해졌다"고 밝혔다.
주목할만한 기능으로는 '자기 개선(Self-Improving) 에이전트'를 꼽았다.
일본 라쿠텐의 사무 자동화 테스트에서 오퍼스 4.5는 4번 반목 만에 기존 모델이 10번 반복해도 도달하지 못한
최고 성능에 도달했다.
이는 문제 해결 과정에서 스스로 도구 사용 방식과 전략을 최적화하는 구조 덕분이라고 한다.
제품 측면에서도 대규모 업데이트가 이뤄졌다.
'무한 대화(Infinite Chats)' 기능은 대화가 길어질 경우 자동 요약. 정리를 통해 사실상 무한 컨텍스트를 유지할 수 있게 했다.
'기업용 엑셀용 클로드(Claude for Excel)'에는 피벗 테이블, 차트, 파일 업로드 기능이 포함됐다.
또 클로드 코드(Claude Code)는 계획 자동 생성 기능 '플랜 모드(Plan Mode)'가 강화되고, 데스크옵 앱에서는 연구 프리뷰 형태로
제공된다.
API 개발 플랫폼도 업그레이드되어 복잡한 멀티 에이전트 시스템 구성과 운영이 용이해졌다.
이번 버전보다 가격도 저렴해졌다. 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러로,
기존 오퍼스 4.1 대비 약 3분의 1가격이다.
이는 개발자와 기업의 접근성을 크게 넓히는 동시에, 오픈AI. 구글 등 경쟁사에 큰 압박으로 작용할 전망이다.
'AI NEWS' 카테고리의 다른 글
| 오픈AI, 사전훈련 개선한 '갈릭' 모델 내년 출시..'코드 레드'도 발령 (0) | 2025.12.03 |
|---|---|
| 소라. 나노 바나나 프로, 수요 급증으로 일일 한도 줄었다. (0) | 2025.12.01 |
| 샘 알트먼 "제미나이에 뒤쳐질수도"..새 모델 '샬롯 피트'로 반격 (0) | 2025.11.28 |
| 오픈AI '챗GPT음성' 기본으로 통합 "대화 중 다른 기능도 작동" (0) | 2025.11.27 |
| 구글 CEO가 치즈버거 제조법 이미지를 게시한 이유? (0) | 2025.11.25 |