보안 제품정보


S2W, 세계 최고 권위 자연어처리 학회 2년 연속 논문 등재... 기술력 인정받아 2023.05.04

S2W, 오는 6월·7월 사이버 보안 영역 다크웹 전문 언어 모델 ‘다크버트 (DarkBERT)’ 공개 예정

[보안뉴스 이소미 기자] 데이터 인텔리전스 기업 에스투더블유(S2W)가 자연어 처리 분야에서 선도적인 기술력을 인정받았다. S2W는 세계에서 인정받는 자연어처리(NLP) 학술대회인 NAACL과 ACL에서 2년 연속 논문이 채택됐다고 4일 밝혔다.

▲세계에서 우수한 입지를 다지고 있는 국제 자연어처리 학술대회 ACL[이미지=S2W]

S2W는 지난 2022년에도 자연어처리 분야 국제 3대 학술대회 중 하나인 북미 지역 NAACL에서 ‘다크웹 언어에 대한 새로운 조명(Shedding New Light on the Language of the DarkWeb)’이라는 논문을 발표한 바 있어 이번 ACL에서의 논문 발표로 2년 연속 국제 학회로부터 그 기술력을 인정받았다.

ACL(Association for Computational Linguistics)은 컴퓨터 과학 및 AI 분야의 세계적 학술대회 중 하나로 올해로 61회를 맞이했다. ACL은 자연언어처리(NLP) 및 기계번역(MT)과 같은 컴퓨터 과학 분야의 학자·전문가들이 모여 최신 연구결과와 기술개발 현황에 대해 발표하고 공유하는 자리로, 지난 1962년 첫 개최 이후 61년째를 맞이하는 긴 역사와 명성을 자랑하는 학술대회다.

S2W가 올해 7월, ACL에서 발표 예정인 논문 주제는 ‘다크버트 : 인터넷의 어두운 단면을 위한 언어 모델(DarkBERT : A Language Model for the Dark Side of the Internet)’로 논문 준비를 위해 S2W는 독자적으로 보유한 △다크웹 수집 △정제 △분석 엔진 △범용 언어모델 BERT(언어 표현을 사전 학습시키는 방법)를 이용해 다크웹에 특화된 언어모델 ‘다크버트’(DarkBERT)를 제작했다.

‘다크버트’는 최근 다양한 사이버 범죄 및 위협의 주요 원인으로 꼽히는 다크웹에서 음란물, 총기류, 마약 등의 콘텐츠를 자동 분류하고, 각종 사이버 위협과 관련된 키워드를 추론하는데 이용할 수 있다. 또한, 기밀 정보 유출 사이트를 탐지하고 해킹포럼 내 중요 게시물을 분류하는 등 다양한 유형의 범죄 활동을 탐지하고 분석하는 데 있어 기존의 범용언어 모델보다 우월한 성능을 자랑한다. S2W AI팀의 장우진, 정진우, 최건, 이용재 연구원은 카이스트(KAIST) 연구팀과 공동으로 성공적인 결과를 이끈 주역들이다.

S2W는 이러한 다크버트에 대한 설명과 관련된 벤치마크 데이터를 오는 6월에 열리는 자체 정기 웨비나 ‘with’와 7월 정기 오프라인 세미나 ‘SIS 2023’을 통해서 대중에게 공개할 예정이다.

국내 사이버 보안 업체가 2년 연속 NLP 국제적인 대표 학회에서 논문을 발표한 것은 이번이 처음으로 S2W는 “이번 논문 발표로 앞으로도 국내는 물론 글로벌 사이버 보안업계의 선두 주자로서 기술 발전과 보안에 대해 지속적인 기여를 이어갈 것으로 기대한다”고 밝혔다.
[이소미 기자(boan4@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>