보안 제품정보


[오늘의 보안 영어] unindexed 2023.05.17

“Just like the Dark Web exists on an unindexed deep Web, the darkverse will operate within an unindexed "deepverse" that law enforcement will find hard to penetrate, they noted.”
-DarkReading-

[이미지 = gettyimagesbank]


- 다크웹이 범죄의 온상이 되고, 각종 수사력이 이 다크웹에 집중되기 시작하면서 언론에도 다크웹 이야기가 많이 나오고 있습니다.

- 그러면서 다크웹의 여러 가지 특성이 묘사되곤 하는데, 그 중 하나가 unindexed입니다. 문맥상 대강 넘겨 읽어도 되는 단어로서 사용될 때도 있고, 위의 예문처럼 그렇지 않을 때도 있습니다. 어느 쪽이든 다크웹의 중요한 특성이 소개되고 있는 건 맞습니다.

- index는 색인입니다. 방대한 자료를 구조화 하는 장치이죠. 이 색인이 있어서 우리는 산더미같은 정보 속에서 필요한 자료를 보다 쉽고 빠르게 찾을 수 있습니다. 국어사전이 ㄱ, ㄴ, ㄷ 순으로 분류되어 있는 것처럼 말이죠.

- 우리가 흔히 사용하는 검색엔진들(eg. 구글, 빙)은 사용자의 ‘찾아달라’는 요청에 언제나 빠르고 정확하게 대응하기 위해 색인 작업을 늘 합니다. 자동 봇이 인터넷 공간을 항상 돌아다니면서 새롭게 올라오는 모든 정보를 탐색하고 색인을 통해 분류하여(이 작업을 indexing이라고 합니다) 저장해 둡니다. 이 덕분에 우리는 검색엔진을 통해 원하는 정보를 얻어낼 수 있습니다.

- 하지만 인터넷 공간은 광활하고, 모든 사람이 검색엔진들의 색인에 포함되는 걸 좋아하는 건 아닙니다. 그런 의사들도 존중해야 하죠. 그래서 검색엔진들은 로봇배제표준(Robots Exclusion Standard)을 도입하여 검색엔진 봇들이 들어가면 안 되는 곳들을 걸러냅니다. 그런 곳들은 색인 작업에 포함되지 않으며 따라서 검색엔진으로 검색되지 않습니다. 그렇게 ‘색인에서 제외되어 검색되지 않는다’는 것을 unindexed라고 표현합니다.

- 게다가 일반 인터넷과 다크웹은 서로 다른 망에 있다고도 볼 수 있습니다. 한국 전화번호부에 우간다 전화번호가 실리지 않는 것과 비슷하죠. 그래서 unindexed는 일반 웹 공간과 다크웹 공간이 서로 다르게 분리되어 있다는 걸 의미하기도 합니다.

※ 이 코너는 보안뉴스에서 발간하는 프리미엄 리포트의 [데일리 보안뉴스+] 콘텐츠를 통해 2주 빨리 만나실 수 있습니다.
[국제부 문가용 기자(globoan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>