7%. Claude의 Mythos Preview가 OpenAI의 GPT-5.5 대비 사이버 공격 시뮬레이션을 해결하는 데서 보인 성능 향상 폭이다. 작은 수치처럼 보일 수 있지만, AI 전쟁터에서는 0.1%의 차이도 승패를 가른다. 이는 AI 경쟁의 양상이 순수한 지능에서 ‘특화된 응용’으로 옮겨가고 있으며, 이제 그 누구도 특정 영역에 만족하지 않는다는 명확한 신호다.
예상대로 OpenAI는 자사의 Codex 모델을 ‘만능 디지털 도구’로 만들려는 거대한 움직임을 보이고 있다. 단순히 코드를 작성하는 것을 넘어, “Codex for Work”라는 새로운 피치를 통해 ‘지식 노동자’들을 직접적으로 겨냥하고 있다. 이는 단순한 웹페이지 개편이 아니다. AI 에이전트가 더 이상 ‘얼간이’들만을 위한 것이라는 편견을 깨부수려는 전면전이다. CUA(정확히 무엇인지는 모르겠지만), 빠릿한 브라우징, 프로젝트 관리자를 울릴 만한 목표 설정 루프, 그리고 무엇보다 중요한 마이크로소프트, 구글, 세일즈포스 생태계와의 깊은 연동을 이야기하고 있다. 심지어 ‘Cowork와 유사한 플래닝 UI’와 앱 내 오피스 파일 편집기까지 탑재했다. 메시지는 명확하다: 이제 Codex는 컴퓨터를 사용하는 모든 사람, 모든 작업을 위한 것이다. 샘 알트먼 본인도 “코딩 외 컴퓨터 업무에 한번 써보라”고 독려하고 있다. 야심찬 목표는 바로 ‘디지털 삶의 OS’가 되는 것이다.
이것은 단순히 기능을 추가하는 수준을 넘어선다. 인터페이스 자체를 재구상하고 있다는 의미다. OpenAI 팀은 다른 곳에서 보이는 직접적인 토글 방식 대신, 사용자의 경험을 동적으로 라우팅하는 에이전트를 선택한 것으로 보인다. 솔직히 말해, 이는 굉장히 야심찬 시도다. 이것이 직관적이고 유연한 시스템으로 이어질지, 아니면 메뉴의 혼란스러운 미로가 될지는 지켜봐야 할 것이다. 하지만 AI 모델을 동적인 UI 오케스트레이터로 전환하려는 이 대담함 자체만으로도, 그것이 무엇이든 간에 큰 선언이라 할 수 있다.
Claude, 창작 영역에 뛰어들다
한편, Anthropic도 가만히 있지 않는다. 보안 취약점과 AI ‘신화’에 대한 소문이 무성한 가운데, 그들은 코드 검토 도구인 Claude Security를 출시했다. 필요한 악재일 수도 있지만, 헤드라인을 장식할 만한 뉴스는 아니다.
이번 주 Claude의 진짜 이야기는 창작 워크플로우에 대한 적극적인 수용이다. 이제 그들은 블렌더, 오토데스크, 어도비 크리에이티브 클라우드, 에이블톤, 스플라이스, 캔바, 어피니티 등 수많은 전문가용 창작 도구들을 명시적으로 지원한다. 이는 예술가, 디자이너, 음악가 등 자동화에 저항적인 분야로의 명확한 방향 전환, 혹은 최소한 확장 신호를 보내는 것이다.
보안 취약점 증가와 Mythos를 둘러싼 메타 신화 속에서, Anthropic은 코드 검토 도구인 Claude Security를 출시했습니다.
이 움직임은 단순한 통합 이상의 의미를 갖는다. 창작 과정 자체의 ‘부조종사’로 Claude를 포지셔닝하는 것이다. 시각적 콘셉트 브레인스토밍을 돕거나, 초안 애니메이션을 생성하거나, 심지어 오디오 편집까지 지원하는 AI를 상상해보라. 이것이야말로 인간의 독창적인 창의력과 AI의 끊임없는 효율성이 만나는 지점이다. 질문은 이것이다. 이 도구들이 인간의 창의성을 증강시킬 것인가, 아니면 대체하려 할 것인가? 마케팅 자료는 종종 그 불편한 질문을 회피한다.
AI 지능 경쟁, 더욱 구체화되다
더 넓은 맥락에서 보면 흥미롭다. GPT-5.5가 복잡한 사이버 작업에서 놀라운 능력을 보여주고 있다는 보고가 나오고 있으며, 이는 Anthropic의 Mythos Preview를 다단계 시뮬레이션에서 심각하게 위협할 정도다. 이것은 단순히 누가 가장 똑똑한 AI를 가지고 있느냐의 문제가 아니다. 누가 지능을 가장 효과적으로 ‘무기화’할 수 있느냐의 문제다. OpenAI가 이 능력을 ChatGPT의 고급 계정 보안 기능과 결합하는 것은, 단순히 모델을 구축하는 것을 넘어 ‘안전한 디지털 요새’를 구축하고 있음을 시사한다.
그리고 효율성 증가는 경제적으로도 상당한 의미를 갖는다. 예를 들어, GPT-5.5 Pro는 특정 작업에서 훨씬 낮은 비용과 토큰 사용량으로 새로운 벤치마크를 달성하고 있다. 이는 AI의 차세대 물결이 단순히 원시 지능의 도약을 넘어, 그 지능을 고가치 워크플로우에 실용적이고, 신뢰할 수 있으며, 저렴하게 만드는 데 있다는 것을 암시한다. 이론적인 슈퍼컴퓨터를 갖는 것과 실용적인 워크스테이션을 갖는 것의 차이다.
오픈 웨이트: 민주화는 계속된다
독점적인 거대 기업들을 넘어, 오픈 웨이트 모델 생태계 역시 활기를 띠고 있다. Qwen3.6 27B가 파장을 일으키고 있으며, 150B 매개변수 이하에서 최고의 오픈 웨이트 경쟁자로 떠오르고 있다는 보고다. Apache 2.0 라이선스, 방대한 컨텍스트 창, 네이티브 멀티모달 기능, 그리고 고성능 GPU 하나에 탑재될 수 있는 모델 크기까지 - 이것은 거대 연구실 밖에서 혁신을 촉진하는 종류의 릴리스다.
이는 무엇을 의미할까? 차세대 특화 AI 에이전트 구축을 위한 도구들이 그 어느 때보다 접근 가능해지고 있다는 것이다. 이것은 단순히 OpenAI와 Anthropic이 규칙을 정하는 것이 아니다. 수천 개의 꽃이 피어나 각기 고유한 문제를 해결하거나 새로운 종류의 예술적 표현을 창조하는 것과 같다. AI의 민주화는 가속화되고 있으며, 이는 주목할 만하고, 어쩌면 축하할 만한 발전이다.
이 에이전트들이 정말로 통제를 벗어나고 있을까? 아마도. 하지만 이는 혼란스러운 탈출이라기보다는 전략적인 배포, 우리 디지털 생활의 모든 구석으로의 계산된 확장처럼 보인다. 질문은 AI가 ‘언제’ 어디에나 있을 것인가가 아니라, ‘어떻게’ 우리의 작업과 창의성을 재편할 것인가에 대한 것이다. 그리고 우리는 그 변화에 대해 얼마나 의미 있는 통제력을 가질 것인가 하는 점이다.