최신뉴스


상장 앞둔 앤트로픽, ‘미토스 수준’ 최신 AI 모델 ‘페이블 5’ 공개 2026.06.10

미토스도 ‘미토스5’로 업그레이드... ‘프로젝트 글래스윙’ 참여 조직에만 공개

[보안뉴스 한세희 기자] 앤트로픽이 ‘미토스’급 최상위 모델 ‘클로드 페이블(Claude Fable) 5’를 9일(현지시간) 공개했다.

페이블5는 미토스에서 사이버 보안 취약점 공략에 악용될 수 있는 기능을 막은 모델이다.

[출처: 연합]


이같은 제약이 없는 ‘미토스5’ 모델은 ‘프로젝트 글래스윙’에 참여하는 정부 기관과 기업에만 공개됐다. 미토스5는 기존 ‘미토스 프리뷰’에서 업그레이드된 버전이다. 우리나라에선 삼성전자와 SK하이닉스, SK텔레콤, 한국인터넷진흥원(KISA) 등이 최근 프로젝트 글래스윙에 참여했다.

페이블5는 악용이 우려되는 사이버 보안 관련 질의가 들어오면 직전 최상위 모델이었던 ‘오퍼스4.8’로 처리하고, 이를 이용자에게 알린다. 모델을 안전하고 신속하게 출시하기 위해 안전장치를 보수적으로 조정했다는 설명이다. 이같은 안전 장치로 무해한 요청이 차단되는 경우는 평균적으로 전체 세션의 5% 미만이라고 밝혔다.

이같은 안전 장치는 생화학 무기 등에 악용될 수 있는 생물학이나 화학 관련 질의, 자사 AI 모델 학습을 위해 다른 AI 모델의 기능을 추출하는 ‘증류’로 의심되는 질의에도 적용된다.

앤트로픽은 페이블과 미토스 모델에서 발생하는 데이터를 30일간 보존하는 새 데이터 정책을 마련했다. 새로운 공격을 방어하거나 오탐을 식별하는 작업에 활용된다.

미토스5는 미토스 프리뷰에 비해 사이버 보안 관련 능력이 개선됐다. 미토스5는 ‘익스플로잇벤치’ 평가에서 78%의 점수를 받아, 34%를 받은 오픈AI GPT-5.5나 40% 수준인 자사 직전 모델 오퍼스4.8, 69%를 기록한 미토스 프리뷰보다 높은 성적을 기록했다.

‘인류의 마지막 시험’(HLE)에서도 59%를 기록, 56.8%를 기록한 미토스 프리뷰를 넘어섰다. HLE는 각 분야에서 박사 학위 소지자 수준의 문제를 푸는 역량을 테스트한다.

터미널 환경에서 코딩 작업 능력을 보는 ‘터미널-벤치 2.1’에서도 88%를 기록해 GPT-5.5를 앞섰다.

▲클로드와 GPT 주요 모델 코딩 성능 비교 [출처: 앤트로픽]


페이블5는 안전 장치가 적용돼 같은 기준에서 비교하기 어렵다. 다만 일반적 코딩 능력을 측정하는 ‘SWE-벤치 프로’ 성능은 80.3%로 GPT-5.5(58.6%)나 구글 제미나이3.1 프로(54.2%)를 앞섰다. 지식업무 능력을 평가하는 ‘GDPval-AA’에서도 GPT-5.5나 제미나이 3.프로보다 높은 점수를 기록했다.

앤트로픽은 미국 정부와 협의, 프로젝트 글래스윙 참여 기관을 확대할 계획이다. 사이버 보안 기업 및 기관들이 보다 체계적으로 미토스5 접근 프로그램 참여를 신청하도록 하는 방안을 마련한다.

생물학 분야 관련 기관을 대상으로 생화학 관련 안전 장치를 제거한 페이블5 모델을 제공하는 새 ‘신뢰성 있는 접근 프로그램’(TAP) 신설도 검토 중이다.

페이블5는 이날부터 사용 가능하다. 22일까진 현행 유료 구독자에 추가 비용 없이 제공되지만, 이후엔 별도 요금을 내야 한다. 서버 용량이 충분히 확보되면 페이블5를 다시 기존 구독에 포함시킬 계획이다.

[한세희 기자(hahn@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>