보안 제품정보


티오리, 글로벌 AI 학회서 ‘윤리적 편향 기반 LLM’ 취약점 연구 발표 2026.02.03

싱가포르서 열린 ‘AAAI 2026’ 워크샵서 성과 발표... ‘바이어스 제일브레이크’ 프레임워크 제안
“윤리적 편향이 보안 구멍 만든다”... 공격 방어 모델 ‘바이어스 디펜스’ 함께 공개


[보안뉴스 조재호 기자] 티오리는 자사 연구원이 참여한 논문이 인공지능 관련 주요 학회인 최근 열린 ‘AAAI 2026’(AAAI Conference on Artificial Intelligence) 워크샵에 채택됐다고 3일 밝혔다.

AAAI는 세계 AI 연구기관과 기업들이 모여 최신 기술을 공유하는 영향력 있는 국제 학술대회 다.

▲이이삭 티오리 연구원 [출처: 티오리]

이번에 채택된 논문은 ‘LLM 내부 윤리적 편향이 대형 언어 모델의 탈옥 취약점에 미치는 영향 분석’이다. 연구팀은 LLM 내부에 잠재된 윤리적·사회적 편향이 외부의 악의적인 ‘탈옥(Jailbreak)’ 공격과 어떻게 상호작용하는지 실험적으로 분석했다.

연구팀은 분석 결과를 바탕으로 윤리적 편향과 탈옥 공격 간 관계를 측정하는 분석 프레임워크 ‘바이어스 제일브레이크’(BiasJailbreak)를 제안했다. 또 편향 기반 공격을 효과적으로 완화할 수 있는 대응 기술 ‘바이어스 디펜스’(BiasDefense)도 함께 제시했다.

이 연구 성과는 논문에 그치지 않고 실제 보안 솔루션에 적용됐다. 티오리는 자사 LLM 보안 솔루션 ‘알파프리즘’(aprism)의 위험 탐지 기능 설계 과정에서 이번 연구를 참고했다.

논문 제1저자인 이이삭 티오리 연구원은 “이번 연구는 LLM의 편향성 문제와 보안 안전성 문제를 통합적 관점에서 분석했다는 데 의의가 있다”며 “앞으로 이어질 LLM 보안 논의 과정에서 하나의 사례로 활용되길 기대한다”고 말했다.

티오리는 구글, 마이크로소프트, 삼성전자 등 국내외 주요 기업에 보안 컨설팅을 제공하고 있으며, 웹 보안 자동화 솔루션 ‘진트’(Xint)와 사이버보안 교육 플랫폼 ‘드림핵’(Dreamhack) 등을 운영하고 있다.

[조재호 기자(sw@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>