보안 제품정보


데이터 폭발의 시대, 다시 점검해야 할 건 스토리지 전략 2022.06.06

킬로바이트의 시대는 기억도 나지 않을 정도다. 메가바이트도 점점 드물어지고 있다. 지금은 기가바이트에서 테라바이트로 넘어가 페타바이트라는 단위까지도 나오고 있는 때다. 데이터가 빠르게 증가하고 있다. 그런데 우리는 그 많은 데이터를 잘 간수할 능력을 가지고 있는가?

[보안뉴스 문정후 기자] 고성능 컴퓨터에 페타바이트 단위의 데이터를 다루는 애플리케이션들이 점점 더 많이 탑재되고 있다. 이런 현상 때문에 현대의 스토리지 기술이 빠르게 갈 곳을 잃고 있다. 또한 기존 스토리지 기술에 의존해 왔던 기업과 기관들도 언제 스토리지 시스템을 싹 갈아치워야 하는가 골치 아프게 눈치를 보기 시작했다. 우리가 생성하고 다루는 데이터의 양은 하루가 다르게 늘어나고 있는데 기존의 스토리지 전략으로는 한계가 분명하다는 걸 누구나 섬뜩하게 느끼고 있는 것도 사실이다.

[이미지 = utoimage]


데이터의 양적 증가가 공포스러울 정도의 지금 상황에서 계속해서 서비스를 소비자들에게 제공하고 사업 행위를 유지하려면 새로운 스토리지를 찾아내야 한다. 하지만 아직까지 ‘이거다!’라고 할 만한 스토리지 솔루션이나 전략이 등장하지는 않고 있다. 동시에 기존 스토리지 솔루션들의 한계에 대한 이야기는 계속해서 나오는 중이다.

1) RAID의 한계 : 온프레미스와 에지 데이터 스토리지는 RAID의 한계에 봉착한 상황이다. RAID로 구성된 환경에서는 사용 가능한 속도를 유지하고 데이터 손실의 위험성을 최소화 하기 위해 드라이브의 수와 용량을 제한하는 방식으로 배열한다. 그렇더라도 재구성을 통해 드라이브를 크게 늘리면 테라바이트 당 비용이 낮아지고 테라바이트 당 와트 수도 낮아질 수 있지만, 그 재구성 자체에 들어가는 시간과 비용이 상당히 높고, 데이터 손실의 리스크가 무척 높은 편에 속하기 때문에 결정을 내리기가 어렵다.

2) Hierarchical RAID : 결국 데이터가 처리 불가능할 정도로 많아지면 제일 먼저 ‘속도’가 수면 위로 떠오른다. 그래서 기본적인 RAID 5와 RAID 6가 RAID 50와 RAID 60로 대체되기도 한다. 이렇게 구성하는 걸 Hierarchical RAID라고 하는데, 효율과 비용의 측면에서 그리 훌륭하다고 말하기 힘들다. 게다가 확실한 실패 도메인(failure domain)을 지정하기가 힘든 구조이기도 하다. 예를 들어 RAID 50 배열에서 두 개의 드라이버가 오류를 낸다고 했을 때, 아무런 데이터 손상이 없을 수도 있지만 모든 데이터가 사라질 수도 있다. 이런 불확실성이 큰 리스크로 다가간다.

3) 데이터 복제 : 많은 기업들이 데이터 보호 차원에서 데이터의 복사본을 보관한다. 각종 사이버 공격의 기술이 발달하면서 데이터 복사본을 보관한다는 건 거의 모든 기업들의 필수 전략 중 하나로 자리를 잡았다. 하지만 원 데이터의 양이 기하급수적으로 늘어나는 상황에서 이 전략을 고수하는 것이 큰 부담이 될 수밖에 없다. 조만간 이런 전략은 폐기처분 될 것으로 보인다. 스토리지 용량과 성능도 그렇지만 운영비와 탄소발자국에도 부담이 되기 때문이다.

4) 데이터 스토리지 운영비 : 예를 들어 설명을 해 보겠다. 경우에 따라 데이터 처리 및 활용의 속도를 높여야 한다는 이유 때문에 데이터의 ‘미러 버전’을 만들어야만 하는 상황이 있을 수 있다. 즉 데이터를 당겨서 열람하거나 편집할 수 있는 곳을 두 곳 이상 만들어 보다 빠르게 사용할 수 있도록 하는 것이다. 이렇게 하면 한 곳에만 데이터를 두는 것보다 속도 면에서 확실히 빨라진다. 다만 원래 대로라면 한 곳에 둘 데이터를 두 장비에 저장하게 되는 것이며, 따라서 장비 비용이 배로 들어가게 된다. 장비 비용 만이 아니다. 그 스토리지를 운영하는 데 들어가는 전력도 두 배가 된다.

이게 집에 있는 데스크톱 하나에 드라이브를 하나 더 두는 것이라면 큰 문제가 되지 않는다. 하지만 덩치가 큰 조직에서 발생하는 문제라면 얘기가 달라진다. 추가해야 하는 드라이브의 수, 스토리지 장비의 수, 그 스토리지 장비가 사용하게 될 전력의 양이 기하급수적으로 늘어난다. 실제로 보관할 수 있는 데이터의 양은 전혀 늘어나지 않는데 말이다. 심지어 큰 조직일수록 이런 장비들이 늘어날 때마다 네트워크 장비들도 같이 늘려야 한다. 장비가 늘어나니 라이선스 비용, CPU의 파워도 같이 늘어난다. 예상치 못한 비용 증가에 깜짝 놀랄 것이다.

처음부터 용량이 큰 드라이브를 사용하면 운영비 절감에 큰 도움이 된다. 물리적 공간도 아낄 수 있고 전력 역시 감소한다. 예를 들어 8TB 드라이브는 보통 9.5와트를 소비한다. 하지만 헬륨을 기반으로 한 20TB 드라이브는 7.3와트만을 소비할 뿐이다. 용량을 계산하면 TB 당 전력 효율이 70% 증가한다는 걸 알 수 있다. 문제는 오래된 네트워크를 보유한 조직일수록 이렇게 큰 용량의 스토리지를 보유하고 있을 확률이 낮다는 것이다.

새로운 스토리지 아키텍처가 필요하다
그렇다면 예견된 데이터 폭발의 시대를 우리는 어떻게 맞이해야 충격을 완화시킬 수 있을까? RAID를 대체할 수 있는 새로운 스토리지 아키텍처다. 용량만이 아니라 속도, 저항력, 효율성 모두 RAID를 월등히 앞서는 것이어야 한다. 즉, 위에 언급한 한계들 혹은 다가올 위기의 상황들에 대처할 수 있는 기술로 스토리지를 무장시켜야 한다는 것이다.

아키텍처를 바꾸지 않고 어중간한 하이브리드 체제를 유지하면 표면에 드러나는 문제점들 일부를 감출 수는 있다. 하지만 문제가 해결되지는 않는다. 보이지 않는 다른 곳에서 돈이 새나가기 시작할 것이다. CPU나 메모리가 한계에 다다라 수명이 빨라진다던가 값비싼 업그레이드를 요구하게 된다거나 하는 식으로 말이다. 게다가 기존의 아키텍처를 고집하는 건 데이터를 복제하여 백업을 한다거나 속도를 높이는 기존의 데이터 전략을 근본적으로 바꾸지 못한다는 뜻이 되고, 이는 데이터의 폭발적 증가라는 사태를 악화시킬 뿐이다.

물론 아직 정답으로 제시할 만한 스토리지 기술이 등장한 건 아니다. 이 시점에, 이 글을 통해 필자가 말하고자 하는 건 온갖 신기술 소식에 기울이는 것만큼 스토리지라는 기술의 발전 방향에 대해서도 관심을 가져야 한다는 것이다. 스토리지 기술은 고리타분하고 오래된 것일지 모르나, 그렇기 때문에 가장 먼저 바뀌어야 하는 부분이기도 하다.

글 : 아담 로버츠(Adam Roberts), CTO, Nyriad
[국제부 문정후 기자(globoan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>