Claude 4 모델 출시, 7시간 연속 코딩 작업 가능

Anthropic이 차세대 AI 모델인 Claude Opus 4와 Claude Sonnet 4를 공개했다. 이번 업데이트는 특히 코딩 분야에서 획기적인 성능 향상을 보여주며, 복잡한 장기 작업에서도 지속적인 성능을 유지한다는 점이 주목받고 있다.

"세계 최고 수준"의 코딩 성능

Claude Opus 4는 SWE-bench에서 72.5%의 점수를 기록하며 현재 출시된 모델 중 가장 뛰어난 코딩 성능을 입증했다. Terminal-bench에서도 43.2%의 성과를 거두어 복잡한 소프트웨어 개발 작업에서 실질적인 도움을 제공할 수 있음을 보여준다.

향상된 추론과 도구 활용

Claude 4 모델들은 확장된 사고 기능을 통해 웹 검색 같은 도구를 사용하면서 동시에 깊이 있는 추론을 수행할 수 있다. 이전 모델 대비 작업 수행 시 지름길이나 허점을 활용하는 행동이 65% 감소해 더욱 신뢰할 수 있는 결과를 제공한다.

Claude Sonnet 4는 SWE-bench에서 72.7%를 기록하며, 이전 버전인 Sonnet 3.7보다 크게 개선된 성능을 보인다. GitHub는 Claude Sonnet 4를 GitHub Copilot의 새로운 코딩 에이전트 모델로 도입한다고 발표했다.

메모리와 연속성 강화

Claude Opus 4는 개발자가 로컬 파일 접근 권한을 제공할 경우, 중요한 정보를 저장하는 '메모리 파일'을 생성하고 관리할 수 있다. 포켓몬 게임을 플레이하면서 '내비게이션 가이드'를 자동으로 작성한 사례처럼, 장기간 작업에서 맥락을 유지하고 누적된 지식을 활용하는 능력이 크게 향상됐다.

Claude Code 정식 출시

연구 미리보기 단계를 거쳐 Claude Code가 정식 서비스로 출시됐다. VS Code와 JetBrains용 베타 확장 프로그램을 통해 IDE에서 직접 Claude의 코드 편집 제안을 확인할 수 있으며, GitHub Actions를 통한 백그라운드 작업도 지원한다.

가격과 이용 방법

Claude Opus 4는 토큰당 $15/$75(입력/출력), Claude Sonnet 4는 $3/$15의 가격으로 기존 모델과 동일한 수준을 유지한다. 두 모델 모두 Anthropic API, Amazon Bedrock, Google Cloud Vertex AI를 통해 이용할 수 있으며, Sonnet 4는 무료 사용자도 이용 가능하다.

AI 기술의 발전 속도가 빨라지는 가운데, Claude 4는 특히 개발자와 연구자들에게 실질적인 도움을 제공할 수 있는 수준까지 성능이 향상됐다. 복잡한 코딩 작업과 장기간 프로젝트에서 지속적인 성능을 유지하는 능력은 AI 어시스턴트의 활용 범위를 크게 넓힐 것으로 예상된다.