[클릭! 월드시큐] 시스코, “딥시크 R1, 프롬프트 공격에 매우 취약” | 2025.02.04 |
요약 : 보안 외신 핵리드에 의하면 딥시크(DeepSeek) R1 모델이 시스코의 안전 테스트에서 심각한 문제를 보였다고 한다. 악성 프롬프트 공격에 취약한 것으로, 쉽게 말해 ‘간단히 탈옥시킬 수 있다’는 뜻이다. 시스코의 로버스트인텔리전스(Robust Intelligence)와 펜실베이니아대학에서 공동으로 진행한 실험에서 탈옥 공격에 100% 성공했다. 메타의 라마3.1-405B가 96% 성공률로 2위를 기록했다. 오픈AI(OpenAI)의 GPT-4o는 86%로 3위, 제미나이 1.5프로는 64%로 4위였다. 테스트는 이미 ‘탈옥용’으로 널리 알려진 프롬프트들을 자동 대입하는 방식으로 진행됐다. 새로운 공격 기법이 동원된 게 아니라는 뜻이다.
![]() [이미지 = gettyimagesbank] 배경 : 딥시크는 인공지능 모델 개발을 위해 세 가지 주요 원칙들을 고수했다고 알려져 있다. ‘사고의 사슬’(chain-of-thought), 강화 학습(reinforcement learning), 증류(distillation)가 바로 그것이다. 가격 효율성을 크게 높이는 데 주요하게 작용한 것으로 분석된다. 하지만 인공지능의 안전을 저해했을 가능성도 제기된다. 비용 절감을 위해 안전을 희생시키는 사례는 무수히 많은데, 딥시크도 그 중 하나일 것으로 추정된다. 말말말 : “탈옥에 성공하는 데 들어간 비용은 50달러도 되지 않습니다. 악성 프롬프트 개발을 위해 깊이 고민한 것도 아니고요. 공격 자원이 거의 들어가지 않았다고 봐도 무방합니다.” -핵리드- [국제부 문가용 기자(globoan@boannews.com)] <저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지> |
|
![]() |