보안 제품정보


Web SPAM 그 원인과 해결책 2007.02.01

요즘 세상은 닫힌 세계를 딛고 열린 세상에서의 협업을 통해 새로운 세상을 만들어 내라고 종용하고 있다. 더 나아가 개별의 개체들이 ‘열린 커뮤니케이션’을 통해서 정보를 주고받으며 발전하고 있다. 서비스간의 경계는 하루가 멀다 하고 허물어지고 있으며, 전례 없는 커뮤니케이션의 홍수는 우리를 새로운 곳으로 이끌어가고 있다.


이러한 정보활동의 근간에 서게 된 것이 바로 인터넷에서 활성화되고 있는 ‘블로그’다. 하지만 블로그의 오픈 커뮤니케이션에 막대한 짜증을 유발하는 존재가 있으니, 바로 Web SPAM이다.


웹 스팸은 무엇인가?


웹 스펨은 주로 오픈된 커뮤니케이션을 지향하는 곳에서 발생하는 의미 없는 광고성 댓글이나 트랙백(trackback)들을 말한다. 보통 독립적으로 출현하지 않고, 한번 나타나게 되면 몇 백 개씩 떼를 지어서 출몰하는 경향이 있다. 주로 world-writable한 블로그의 트랙백이나 코멘트(comment) 입력창에서 많이 발생한다.

 

 <웹 스팸은 보통 이렇게 생겼다>


이러한 웹 스팸을 막기 위해서 업계는 어떤 방식을 사용하고 있는가?  몇몇 전문 블로그 서비스와 대형 포탈의 예를 살펴보면 ‘로그인한 사용자의 댓글만 허용하기’라는 항목이 있다. 이 말대로라면 지나가다 발견한 블로그 하나에 댓글을 달기 위해서 해당 서비스에 로그인을 해야만 한다.


이런 항목은 스패머들이 서비스에 반드시 로그인을 해야 되는 불편함을 가져와 손쉽게 봇을 제작할 수가 없게 만들었다. 그런 만큼 효과도 좋다. 네이버 블로그와 같은 거대한 공간일 경우에는 더더욱 그렇다.


웹 스팸은 도대체 왜 일어나는가?


초창기에는 구글(Google)의 검색순위(pagerank)를 높이기 위해서가 주목적이었다. 생각해보라, 명망 있는 블로그 사이트(즉, pagerank가 높은 사이트)에서 수천 개의 링크가 내가 원하는 곳으로 사용자들을 유도하도록 만든다면 얼마나 많은 inbound link, 그것도 영양가 높은 링크를 순식간에 만들 수 있겠는가. casino, porno, viagra와 같은 인기 있는 키워드를 검색할 때처럼 랭크가 높아질 수만 있다면 이는 곳 매출의 상승으로 직결된다고 할 수 있다(이렇게 쉽게 이야기할 수 있을 만큼 google의 pageview는 엄청나다).


그러나 대부분의 블로그 툴에서 link rel=‘nofollow’라는 옵션을 트랙백과 커멘트 부분에 도입하면서 pagerank를 높일 수 있는 수단으로서의 웹 스팸은 그 의미를 잃어가게 됐다. 그럼에도 불구하고 스팸은 지속적으로 창궐하고 있다. 


왜 그럴까? 답은 ‘Rule of Quantity’ 때문이다. 여기서 잠시 구글이나 네이버같은 거대 검색엔진들의 수익모델에 대해서 살펴보도록 하자. 그들의 수익모델이 무엇인지 당신은 너무나도 잘 알고 있다. 바로 광고다. 누군가 ‘의도’를 갖고 검색을 할 때 광고를 살짝 노출하고 클릭당 연결비용을 받음으로써 비지니스가 성립하는 것이다.


이해가 안 간다고? 맞다. 당신과 나는 지금껏 검색사이트에서 광고를 눌러본 경험이 거의 없다. 거의 클릭하지 않는 광고를 갖고 그 정도의 돈을 벌고 있는 것이 우습지 않은가? 그리고 더욱 놀라운 사실은 당신과 나 뿐만 아니라 실제로도 많은 사람들이 인터넷의 광고를 거의 누르지 않는다는 것이다.


이를 표현하기 위해서 ‘CTR7’이라는 것을 사용한다. 이는 하나의 광고를 노출했을 때 받게 되는 클릭비율을 표시한 것이다. 그렇다면 그 비율은 얼마나 될까? 키워드 광고의 경우에도 그 클릭율은 그리 높은 수치가 아니라고 한다. 그럼에도 불구하고 엄청난 수의 사용자 때문에 해외에서는 구글, 국내에서는 네이버가 엄청난 매출을 올리고 있는 것이다.


웹 스팸도 이와 크게 다르지 않다. 일단 많이만 보내놓으면 반드시 ‘수확’은 생기게 된다. 아무것도 하지 않는 것과는 비교도 되지 않을 정도로 확실한 방법이지 않는가? 누군가는 반드시 누르게 된다는 것이다.


결국 스팸이든 광고든 그 효과는 분명 존재한다는 것이다. 스팸을 백만 통 발송하는데 드는 비용은 얼마일까?(당신은 설마 이 비용이 엄청나리라고는 생각하지 않을 것이다) 백만 통 중에서 단 0.1%만을 건졌다고 할지라도 그것은 약 천명에게 응답을 받은 것과 같다는 결론이 된다.


상업적인 커뮤니케이션이 문제다. 하나의 글을 쓰면 보통 몇 개에서 몇 십 개의 코멘트가 달리게 된다. 문제는 그 중에 스팸업자들이 교묘하게 끼어있다는 것이다. 이들은 몇몇의 호기심 많은 유저들에 의해 이와 같은 이득을 얻게 되지만, 문제는 그 과정에서 수많은 블로거들이 희생당할 수 있으며, 그들의 순수한 마음이 훼손될 수 있다는 것이다. 


이러한 공간에 몇 백 개의 코멘트, 그것도 의미 없는 것을 넘어선 짜증나는 코멘트가 달리게 되면 어떤 일이 발생할까? 정상적인 커뮤니케이션은 거의 불가능하게 되고 결국 블로거는 글을 쓰고자 하는 의도와 장점을 잃게 된다. 이는 결과적으로 블로거들의 활동 폭을 좁게 만들어 스패머들에게도 광고공간이 없어지는 결과를 만들게 된다. 하지만 언제 스패머들이 이런 생각을 하면서 살았나? 그들은 당장 돈 되는 것이면 무조건 하는 거다.


우리는 이러한 웹 스팸을 무조건 막아야 한다. 블로거의 유입을 늘리고, 의미 있는 커뮤니케이션을 보호해 블로거들이 활동 폭을 넓히도록 유도해야 한다. 


어떻게 스팸을 막나 ?


가장 간단한 방법은 keyword blocking을 사용하는 것이다. 몇 개의 금칙어를 만들어 놓고 금칙어에 해당하는 커뮤니케이션이나 코멘트는 차단하는 것이다. 하지만 금칙어를 계속 늘려나가는 것은 꽤 괜찮은 방법처럼 보일지 모르지만, 현실을 살펴보면 이것은 매우 귀찮은 작업일뿐더러 효과도 크지 않다.


또한, 모든 광고가 금칙어로 이루어져 있지도 않다(이를 테면 건강식품 광고를 생각해보라. 처음부터 끝까지 좋은 말만 나오며 그곳에서 출현하는 키워드들은 우리가 일상에서 늘 사용하는 말이다).


그래서 필자는 훨씬 더 간단한 방법을 소개한다. 스패머들이 이용하는 Rule of Quantity를 역이용하는 것이다. 하지만 아직 이해를 못하는 사람들이 나올 수 있다. 그걸 이용하면 어떤 차이가 있다는 것인지, 남들이 다할 수 있는 건데 그걸 왜 해야 되는지 영문을 몰라 고개가 갸우뚱 거려진다면 다음을 생각해보자.


구글에 대해서 한번 생각해보자. 구글이 갖고 있는 경쟁우위는 pagerank라는 독특한 알고리즘인가? 아니면 80억 페이지에서 다양한 관계를 실시간으로 계산해내는 ‘실시간 계산능력’인가? pagerank는 이미 잘 알려져 있는 알고리즘이며, 이를 유사하게 계산해내는 능력을 갖춘 사업자는 많다.


그러나 앞서 말한 ‘계산능력’은 우리가 생각하는 것만큼 많은 사업자들이 활용을 하지 못하고 있다. 이렇듯 우리가 그동안 경쟁력이라고 생각하던 것이 반드시 경쟁력이라고 말할 수 없고, 오히려 그렇지 않아 보이는 것이 경쟁력이 될 수 있다.

우리가 만드는 것은 바로 이런 것이다. 천만 개의 블로그에 쏟아지는 스팸을 실시간으로 방어해내면서 시간이 흐를수록 정교해지고 굳건해지는 것. 스팸 필터는 아무나 만들 수 있지만, 이러한 플랫폼은 쉽게 만들어 지지 않는다.


스팸이라고 보기 애매한 것들도 있지 않은가?


그렇다. 이게 정상적인 커뮤니케이션인지 스팸인지 해결의 기준(?)이 애매한 것이 바로 Social SPAM이다. 이것이 스팸인지 아닌지를 한참 들여다봐야 하는 것이다. 예를 들어 “너무 아름다우세요.”  “정말 잘 디자인됐군요.” “스팸이 아니니 봐주세요.” 이런 것들이 대표적이라 할 수 있겠다. 이런 것들 역시 최대한 간단하게 처리해야 한다. EAS(Eolin Antispam Service)도 그렇게 하고 있다. 가볍게 보이지만 가혹한 패널티를 부여하는 것이다.


그렇다면 꼭 코멘트랑 트랙백만 걸러내야 하는 것인가? 블로그는 물론 인터넷의 곳곳에는 오히려 그것만도 못한 페이지들도 수두룩하게 널려있다. 도대체 무엇이 쓸 만한 것이고, 무엇이 그렇지 않은 것인가? 물론 레이싱걸 찌라시(?) 같은 것이 나쁜 것이라고 말하는 것은 아니다(사실 필자는 그런 거 좋아한다). 오히려 그저 그런 데이터들이 엄청나게 복제돼있는 상황이 스팸보다 더 나쁘다고 생각한다.

<글: 노정석 태터앤컴퍼니 대표이사>

 

[월간 시큐리티월드(info@boannews.com)]


           <저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>