앤스로픽 미토스급 AI 공개, 초고성능과 안전성 사이에서 시작된 새로운 경쟁
AI 성능 경쟁의 새 분기점…앤스로픽 ‘미토스급 AI’ 공개가 던진 질문
“더 강한 AI인가, 더 안전한 AI인가”… 초고성능 인공지능 시대의 새로운 규칙
2026년 6월 9일(현지시간), 미국 인공지능 기업 앤스로픽(Anthropic)은 차세대 초거대 인공지능 모델인 ‘클로드 페이블5(Claude Fable 5)’와 전문가용 모델 ‘클로드 미토스5(Claude Mythos 5)’를 공식 공개했다.
이번 발표는 단순한 신제품 출시 이상의 의미를 갖는다. AI 산업이 그동안 추구해 온 ‘성능 경쟁’에서 한 걸음 더 나아가 ‘통제 가능한 초지능(Control of Frontier AI)’이라는 새로운 과제에 직면했음을 보여주는 사건으로 평가받고 있다.
특히 앤스로픽은 미토스급 모델의 강력한 사이버 보안 능력이 실제 악용될 가능성을 우려해 일반 이용자용과 전문가용 모델을 분리 공개하는 방식을 선택했다. 이는 AI 역사상 사실상 처음으로 최상위 모델의 성능 자체를 의도적으로 제한해 배포한 사례로 기록될 가능성이 높다.

‘미토스 쇼크’가 촉발한 안전성 논쟁
앤스로픽이 미토스를 처음 공개한 것은 2026년 4월이었다.
당시 회사는 일부 보안 연구기관과 연구자 약 200곳에만 접근 권한을 부여했다. 이유는 단순했다.
모델의 능력이 기존 AI 수준을 크게 넘어섰기 때문이다.
당시 공개된 평가 결과에 따르면 미토스는 사람이 찾기 어려운 보안 취약점을 대량으로 발견할 수 있었고, 실제 해킹 공격 시나리오를 분석하는 능력에서도 기존 모델을 압도했다.
사이버 보안 업계에서는 이를 두고 이른바 ‘미토스 쇼크(Mythos Shock)’라는 표현까지 등장했다.
그동안 AI는 보안 전문가를 지원하는 도구로 인식됐지만, 미토스는 보안 체계 자체를 무력화할 수 있는 잠재력까지 보여줬다는 평가를 받았다.
일부 연구자들은 “강력한 AI가 잘못된 사용자 손에 들어갈 경우 국가 단위 사이버 공격 비용이 급격히 낮아질 수 있다”고 경고했다.

공개 모델 중 최고 수준 성능 입증
앤스로픽에 따르면 페이블5는 AI 성능 평가 지표인 ‘인류 최후의 시험(HLE·Humanity’s Last Exam)’에서 정답률 59%를 기록했다.
이는 같은 평가에서:
클로드 오퍼스4.8 : 49.8%
GPT-5.5 : 41.4%
보다 높은 수치다.
또한 사이버 보안 능력을 측정하는 ExploitBench 평가에서는 미토스5가 78점을 기록했다. 이는:
오퍼스4.8 : 약 40점
GPT-5.5 : 약 34점
보다 크게 앞선 성과다.
AI 물리학 연구 스타트업 PSI의 매슈 파인스 CEO는 “GPT-5.5가 4일 걸린 연구 과제를 페이블5는 약 36시간 만에 수행했다”고 평가했다.
전문가들은 이를 두고 “AI가 단순 정보 생성 단계를 넘어 실제 연구개발(R&D)의 핵심 도구로 진입했다는 신호”라고 분석한다.
성능 제한이라는 전례 없는 선택
그러나 이번 발표의 핵심은 성능 자체가 아니다.
더 주목받은 부분은 ‘제한된 공개’다.
앤스로픽은 사이버 보안, 생물학, 화학 무기 관련 질문에 대해 최고 성능 모델 대신 한 단계 아래 모델인 오퍼스4.8이 응답하도록 설계했다고 밝혔다.
이용자는 자신이 제한된 응답을 받고 있다는 사실도 확인할 수 있다.
또한 경쟁사의 AI 모델을 복제하는 데 활용될 수 있는 ‘증류(Distillation)’ 시도 역시 차단한다.
증류는 고성능 AI의 답변을 대량 수집해 새로운 AI를 학습시키는 기술이다.
최근 중국 일부 AI 기업들이 경쟁사 모델의 응답을 활용했다는 의혹이 제기되면서 글로벌 AI 산업의 새로운 분쟁 요소로 떠오르고 있다.
사회적 반응 엇갈려
AI 업계와 학계의 반응은 크게 두 갈래로 나뉜다.
찬성 측은 이번 조치를 “책임 있는 AI 개발의 첫 사례”로 평가한다.
초고성능 AI가 실제 사회에 미칠 영향을 고려한다면 무조건적인 공개보다 통제된 접근이 필요하다는 주장이다.
반면 반대 측은 기술 발전을 지나치게 소수 기업과 기관이 통제할 가능성을 우려한다.
실제로 성능 제한이 없는 미토스5는 앤스로픽의 보안 협의체 ‘프로젝트 글래스윙(Project Glasswing)’을 통해 검증된 기관에만 제공된다. 국내에서는 삼성전자, SK하이닉스, SK텔레콤, 한국인터넷진흥원(KISA) 등이 참여 기관으로 거론된다.
일부 연구자들은 “AI의 민주화가 아니라 AI의 독점화가 진행될 수 있다”고 지적한다.
‘무료 AI 시대’의 종말 신호
이번 발표는 AI 산업의 수익 모델 변화도 보여준다.
앤스로픽은 일반 이용자 대상 서비스에도 종량제 과금 방식을 도입하기로 했다.
2026년 6월 22일까지는 기존 요금제 내에서 사용할 수 있지만 이후에는:
입력 100만 토큰당 10달러
출력 100만 토큰당 50달러
를 부과한다.
이는 AI 산업이 무료 확산 단계에서 수익성 확보 단계로 전환하고 있음을 의미한다.
생성형 AI 경쟁이 치열해질수록 필요한 GPU와 데이터센터 규모가 기하급수적으로 증가하기 때문이다.
실제로 마이크로소프트와 주요 빅테크 기업들 역시 사용량 기반 과금 모델 도입을 확대하고 있다.
재발방지와 향후 대책은
전문가들은 초고성능 AI의 등장이 단순 기술 문제가 아니라 사회적 거버넌스 문제라고 지적한다.
향후 필요한 대응책으로는 다음이 제시된다.
① AI 안전성 평가 의무화
최상위 AI 공개 전 정부 또는 독립기관의 위험성 검증 체계 구축.
② 국제 공동 감시체계
핵 기술이나 생물무기 관리 체계와 유사한 글로벌 AI 감독기구 설립 논의.
③ 고위험 기능 접근 통제
사이버 공격·생물학 연구 등 위험 분야에 대한 단계별 인증 제도 마련.
④ AI 투명성 강화
어떤 기능이 제한됐는지 이용자가 명확히 확인할 수 있는 공개 기준 마련.
⑤ AI 증류 및 모델 도용 규정 정비
국제 표준 수준의 AI 지식재산권 보호 체계 구축.
결론
앤스로픽의 이번 결정은 AI 산업이 단순한 성능 경쟁을 넘어 안전성과 통제 가능성을 중심으로 재편되고 있음을 보여준다.
2022년 생성형 AI 혁명이 ‘누가 더 똑똑한 AI를 만들 것인가’의 경쟁이었다면, 2026년의 화두는 ‘누가 더 안전하게 AI를 통제할 것인가’로 바뀌고 있다.
미토스급 AI의 등장은 인공지능이 인간의 생산성을 획기적으로 높일 가능성을 보여주는 동시에, 기술의 힘이 커질수록 사회적 책임 역시 비례해 커진다는 사실을 다시 한번 확인시켜주고 있다.