코딩 AI '지뢰찾기' 제작 테스트서 오픈AI '코덱스' 압승
주요 AI 코딩 에이전트 4종에 동일한 조건으로 '지뢰찾기' 게임 제작을 맡긴 결과,
오픈AI의 '코덱스'가 압도적 완성도를 보였다는 실험 결과가 나왔다.
반면, 구글의 제미나이 CLI'는 정상 작동조차 하지 못했다.

IT전문 매체 아스 테크니카는 최근 대표적인 AI 코딩 에이전트 4종을 대상으로 고전 윈도 게임
'지뢰찾기(Minesweeper)'를 웹 버전으로 다시 제작하게 하는 테스트를 진행했다.
조건은 단순하지만 까다로웠다.
단순 복제가 아닌
1.사운드 효과 포함,
2. 모바일 터치 스크린 지원,
3. 기존 지뢰찾기를 충실히 재현하면서도
"깜짝 재미 요소' 하나 추가하라는 조건 등이 붙었다.
테스트에는 오픈AI의 'GPT-5' 기반 코덱스, 엔트로픽의 '클로드 코드',
구글의 제미나이 CLI, 미스트랄의 '바이브'가 참여했다.
동일한 프롬프트를 각 모델에 입력했고, AI들은 로컬 환경에서 HTML과
스크립트 파일을 직접 조작하며 코드를 생성했다.
이 과정에서 인간의 추가 수정이나 디버깅은 전혀 개입되지 않았다.
가장 높은 평가를 받은 것은 오픈AI의 코덱스였다.
코덱스는 시각적 완성도 뿐 아니라,
깃발을 정확히 꽂았을 때 주변 타일을 한꺼번에 여는 고급 기능인 '코딩(Chording)'을 유일하게 구현했다.
이는 숙련된 지뢰찾기 이용자들이 특히 중시하는 요소다.
사운드 온.오프 버튼, 모바일과 데스크톱을 아우르는 조작 안내, 레트로 감성의 효과음도
모두 정상 작동했다.
게임 변주로는 조건을 충족하면 안전한 칸 하나를 열어주는 '럭키 스윕' 버튼이 추가됐다.
다소 느린 코드 작성 속도에도 불구하고, 평가자는 "거의 즉시 출시 가능한 수준"이라며 9점(10점 만점)을 부여했다.
2위는 엔트로픽의 클로드 코드
코덱스보다 절반 수준의 시간에 결과물을 완성했고 외형적인 완성도는 가장 뛰어났다는 평가다.
폭탄 아이콘과 상단의 스마일 이모지 등 커스텀 그래픽이 돋보였고, 사운드 효과와
모바일. 데스크톱 호환성도 안정적이었다.
다만 아쉽게도 핵심 기능인 코딩(chording)이 빠진 점이 치명적인 감점 요인이 됐다.
전체적인 점수는 7점을 받았다.
3위는 미스트랄의 바이브였다.
기본적인 플레이는 가능했지만, 코딩과 사운드 효과가 빠졌고, '커스텀' 버튼이 작동하지 않는 등
미완성 요소가 눈에 띄었다.
또 재미 요소도 추가하지 않았기 때문에 점수가 깎였다.
시각적 오류와 단순한 구성에도 불구하고, 대형 기업보다 제한된 자원으로
이 정도 결과를 냈다는 점은 긍정적으로 평가됐지만 점수는 4점에 불과했다.
구글의 제미나이 CLI는 가장 실망스러운 결과를 보였다.
버튼이 존재했지만 정작 게임 타일이 나타나지 않아 플레이 자체가 불가능했다.
코드 실행에 매번 한 시간 가량이 걸렸고, 외부 의존성을 반복적으로 요구해
테스트가 원활하게 진행되지 않았다.
HTML5만 사용하라는 추가 지침을 줬음에도 결과는 개선되지 않았다.
다만 제미나이 CLI가 최신 제미나이 3 코딩 모델이 아닌 2.5 계열을 사용해서
불안전한 테스트일 수 있지만, 결과 자체는 실망스럽다는 평가가 지배적이다.
이번 테스트는 AI 코딩이 지닌 잠재력과 동시에 뚜렷한 한계를 동시에 드러냈다는 평이다.
일부 결과물은 인간의 개입 없이도 상당한 완성도에 이르렀지만,
실무 환경에서 곧바로 활용하기에는 여전히 인간의 점검과 보완이 불가피하다는 점이
분명해졌다는 분석이다.
'AI NEWS' 카테고리의 다른 글
| 그록, 국내 양대 모바일 스토어 다운로드 1위 석권 (0) | 2025.12.27 |
|---|---|
| 구글,2026년 한정 할인 실시..'AI 프로' 요금제 50% 인하 (0) | 2025.12.26 |
| 오픈AI 코딩 전용 GPT-5.2 Codex 공개 사이버 보안 기능 대폭 강화 (3) | 2025.12.22 |
| 오픈AI, 모델이 잘못을 '고백'하도록 만드는 새로운 훈련법 공개 (1) | 2025.12.09 |
| 구글, 직장인도 간단 에이전트 구축 가능한 '워크스페이스 스튜디오' 출시 (0) | 2025.12.08 |