보안 제품정보


[클릭! 월드시큐] 시스코, “딥시크 R1, 프롬프트 공격에 매우 취약” 2025.02.04

요약 : 보안 외신 핵리드에 의하면 딥시크(DeepSeek) R1 모델이 시스코의 안전 테스트에서 심각한 문제를 보였다고 한다. 악성 프롬프트 공격에 취약한 것으로, 쉽게 말해 ‘간단히 탈옥시킬 수 있다’는 뜻이다. 시스코의 로버스트인텔리전스(Robust Intelligence)와 펜실베이니아대학에서 공동으로 진행한 실험에서 탈옥 공격에 100% 성공했다. 메타의 라마3.1-405B가 96% 성공률로 2위를 기록했다. 오픈AI(OpenAI)의 GPT-4o는 86%로 3위, 제미나이 1.5프로는 64%로 4위였다. 테스트는 이미 ‘탈옥용’으로 널리 알려진 프롬프트들을 자동 대입하는 방식으로 진행됐다. 새로운 공격 기법이 동원된 게 아니라는 뜻이다.

[이미지 = gettyimagesbank]


배경 : 딥시크는 인공지능 모델 개발을 위해 세 가지 주요 원칙들을 고수했다고 알려져 있다. ‘사고의 사슬’(chain-of-thought), 강화 학습(reinforcement learning), 증류(distillation)가 바로 그것이다. 가격 효율성을 크게 높이는 데 주요하게 작용한 것으로 분석된다. 하지만 인공지능의 안전을 저해했을 가능성도 제기된다. 비용 절감을 위해 안전을 희생시키는 사례는 무수히 많은데, 딥시크도 그 중 하나일 것으로 추정된다.

말말말 : “탈옥에 성공하는 데 들어간 비용은 50달러도 되지 않습니다. 악성 프롬프트 개발을 위해 깊이 고민한 것도 아니고요. 공격 자원이 거의 들어가지 않았다고 봐도 무방합니다.” -핵리드-
[국제부 문가용 기자(globoan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>