S2W, KAIST와 협력해 세계 최초 다크웹 전용 AI언어모델 '다크버트' 개발
2023년 06월 08일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

국내 사이버 보안 스타트업인 S2W와 KAIST 연구진이 공동 개발한 AI 언어 모델인 다크버트(DarkBERT)가 세계적인 주목을 받고 있다. 다크웹상에서 각종 범죄 데이터를 효과적으로 추출할 수 있도록 훈련한 다크웹 전문 언어 모델 다크버트 (DarkBERT)는 지난 5월 4일 세계적인 자연어처리 학술대회 ACL (Association for Computational Linguistics)에 연구 성과가 채택되고 논문이 공개된 이후 그 출현 소식이 트위터와 IT 미디어를 통해서 전 세계로 빠르게 확산되고 있다. 


이번 연구를 주도한 카이스트와 에스투더블유(S2W)사 연구진에 따르면 “다크웹을 학습시킨 AI 모델은 전 세계적으로 처음이다”라며 “다크웹과 같은 신종 사이버 위협에 대한 효과적은 대응력을 전 세계의 기관과 기업에 보급할 수 있는 계기가 마련된 것이라 기대감이 높다”고 말했다. 


다크웹은 마약, 정보 유출, 랜섬웨어, 해킹 등 최근 급증하는 사이버범죄들의 온상이 되고 있는 익명 기반의 네트워크다. 각종 불법거래와 유해 콘텐츠들로 가득하지만 빠르게 사라지는 휘발성과 탈중앙화 기술로 보호되고 있어서 정확한 출처나 증거가 되는 데이터를 얻기가 매우 어렵다. 일반적인 인터넷 브라우저로는 접속이 안되고, 추적이 불가능한 익명화 기술이 적용되어 있어 많은 수사기관을 물론 기업들이 실체를 파악하는 데 어려움을 겪어 소위 ‘어둠의 네트워크’라고 불린다. 


OpenAI사의 ChatGPT 및 구글의 Bard 등 다양한 생성형 언어모델의 출시는 최근 뜨거워진 빅 테크 기업 간 AI를 둘러싼 경쟁상황을 잘 설명해 준다. 빠르게 발전하는 AI 기술의 발전만큼 그에 대한 우려도 덩달아 증폭되고 있다. ChatGPT를 이용한 악성코드 제작법이 시연되기도 하고, AI를 활용한 공격 방안들이 다크웹 내에 공유되는 사례도 있었다. 


지금까지 국제적인 해킹 사건이나 다크웹 기반의 랜섬웨어, 글로벌 마약사이트 검거 등은 특정 국가들의 소수의 전문가 집단에 의해 수사가 국한적으로 진행되었다. 그러나, 초연결의 시대 국가별 사이버 안보 역량의 중요성이 강조되고 있다. 지난 3월 미국 바이든 행정부가 발표한 국가 사이버 보안 전략 행정 명령서 (FACT SHEET: Biden-⁠Harris Administration Announces National Cybersecurity Strategy)에서는 미국 및 우방국의 사이버 범죄에 대응하는 보안 역량을 강화하는 방안을 명시하였다. 각국의 사이버 안보력과 주요 기관 및 기업의 사이버 위협 대응 수준은 조직의 경쟁력이자 국력의 기준이 될 만큼 사이버보안의 중요성이 커지고 있다. 


국제적으로 사이버 범죄의 온상인 다크웹에 대한 전용 AI 모델인 다크버트가 전 세계의 이목을 끌고 있는 것도 사이버보안에 대한 AI 경쟁력이 곧 사이버 안보와 맞닿아 있기 때문이다. 


2023년을 기점으로 한층 더 강력해진 사이버 보안에 대한 미국 정부의 노선을 중심으로, 향후 정부와 민간기업 간 사이버 보안 전력과 관련된 협력 사례가 크게 증가하였다. 실제로 2022년 11월 국가정보원, 과학기술부, 국방부 등이 포함된 정부기관과 S2W를 포함한 5개 민간 보안 기업이 최초로 함께 사이버 위협 통합 대응을 위한 민관 합동 협력 센터인 ‘국가 사이버 안보 협력센터’가 개설하였다. 


비단 한국뿐 아니라 세계적으로 정부기관 및 기업이 새로운 디지털 환경에 부합하는 사이버 보안 대비책에 대한 투자 및 지출이 늘어날 것으로 예상된다. 이런 상황에서 다크버트는 전 세계 최초로 사이버 보안과 관련된 AI 원천 기술을 한국이 리드하는 사례가 될 가능성이 있으며, 한국의 사이버 보안 업계에 수출 활로 및 추가 원천 기술 개발에 대한 동력이 될 것으로 기대된다. 


S2W 서상덕 대표는 “다크버트 (DarkBERT)는 국경의 경계가 없는 무수히 넓은 위협 공간에서 공격자의 행동을 꼼꼼히 살펴보며 수사와 분석을 돕는 인공지능이다. 이를 위해서는 사이버 범죄에 사용되는 언어를 잘 학습하고 이해하는 것이 기본이다”라고 말하며, “다크버트는 가장 어두운 곳의 정보를 다루지만 밝고 안전한 세계를 지키는 일에 지금까지 출시된 어떤 AI 언어 모델보다 의미 있는 기여를 하게 될 것”이라고 강조했다.

그래픽 / 영상
많이 본 뉴스