오늘은 이상한 제목으로 이야기를 시작해 보겠습니다.
소프트웨어 정의 스토리지 기업인 맥스타(Maxta, Inc.)와 인텔(Intel Corp.)이 후원하고 리서치 기관인 451 리서치(451 Research LLC)가 발간한 ‘Software-defined storage and Hyper-converged infrastructure in the midmarket’이라는 보고서(다운로드를 위해서는 등록 필요)가 얼마 전에 나왔습니다. 사실 요즘 소프트웨어로 모든 것을 정의하는 이른바 Software defined anything이라는 것이 대세가 되고 있는 듯 한데요, 앞으로 소프트웨어가 세상을 집어 삼킬 것(Software is eating the world)이라는 이런 문구는 분명 사실로 드러나게 될 것으로 보입니다.
이 보고서를 살펴 보겠습니다. 총 5개의 파트로 구성되어 있는 이 보고서는 미드마켓(Midmarket)을 타깃으로 하고 있습니다. 여기서 정의하는 미드마켓이란 매출 1억 달러에서 10억 달러 미만의 기업으로서 이들 기업들을 대상으로 소프트웨어 정의 스토리지와 컨버지드 인프라에 관한 설문 조사 결과를 담고 있습니다. Part 1에서는 미드마켓에 관한 이야기를 담고 있고 Part 2와 Part 3에서는 소프트웨어 정의 데이터와 컨버지드 인프라에 관한 내용을 싣고 있습니다.
이 보고서에 따르면 SDS(software defined storage)가 나온 지 5년이 넘고 – 정말일까 싶지만 – 그리고 솔루션에 따라 다르겠지만 SDS는 비용, 복잡성, 위험성 등의 관리 면에서 우수한 점이 있다는 것이 공통되는 핵심 이점(benefits)이 있다고 정리하고 있습니다. SDS를 위해서는 어떻게 보면 전제 조건이라고 할 수 있는 서버 가상화(server virtualization)의 진척 정도를 살펴야 할 것인데요, 이 보고서에 따르면 이미 미드마켓의 50% 이상이 서버 가상화를 했다고 밝히고 있습니다. 스토리지 측면에서는 스토리지의 복잡성, 적절한 유지/관리 인원의 문제 등은 이 시장(midmarket)이 성장하면서 대형 시장(large enterprise)과 다르지 않다는 점입니다.
이러한 문제점을 바탕으로 200개의 미국 기업들의 데이터센터, 스토리지 시스템 등의 운영 관리자와 관련 임원들을 대상으로 설문을 실시하였습니다. 설문 대상자들이 가지는 스토리지 시스템에서의 과제는 무엇인가 하는 설문에서 데이터 관리, 관리 인원의 육성, 관리의 복잡성 등이 가장 어려운 과제로 꼽고 있습니다(아래 그림 참조). 이들이 관리하는 데이터는 통상 25TB 이상이고 경우에 따라서는 50TB 이상인 기업도 있었다고 하는군요.
이러한 결과는 지난 4월(2014년) SNIA에 올린 맥스타의 “Thinking outside of the storage box”라는 프레젠테이션 자료와도 그 맥이 닿아 있습니다. 왜 SDS인가를 설명하는 것을 보면 아래 그림에서 보아 알 수 있듯이 비용 감소, 비즈니스 신속성과 가용성, 여러 플랫폼 지원, 확장성 등이라고 되어 있습니다.
(출처: SNIA, Thinking outside of the storage box, 2014, 04)
이러한 논조는 사실 맥스타의 제품과 관계가 있습니다(당연히 그러하겠지만). 다시 설문 조사 리포트를 보겠습니다. 아래와 같은 글을 볼 수 있는데요, SDS를 서버 클러스터 상에 올리고 스토리지 기능을 제공함으로써 스토리지 어레이와 스토리지 네트워크(SAN)을 걷어낼 수 있다고 주장합니다(아래 해당 원문 참조).
Software-defined storage(SDS) is created by loading software onto any cluster of standard servers and leveraging any type of server-side storage devices, while providing shared storage capabilities. SDS elimates the needs for storage arrays and storage area networks
그래서 이러한 SDS를 실제로 자신들의 데이터센터에 적용하는 것에 대해 다소 고려(somewhat likely to consider)하고 있다고 응답한 경우가 75%이고 신중히 고려(very likely to consider)하고 있다고 응답한 경우가 25%에 이릅니다. 북미지역만 해도 SDS에 관한 생각이 이렇게 커가고 있구나 하는 생각이 들면서 조사 방법론 자체에 약간의 불손한(?) 의심이 들어 정말 그럴까 하는 생각마저도 듭니다. 왜 그들은 SDS를 생각하고 있는 것일까요? 충분히 예상할 수 있지만 다음과 같습니다(가독성을 고려해서 번역을 하였으니 필요하신 분은 원문을 참조하시길 바랍니다).
- 스토리지 관리를 단순하게 하기 위해서 _ 52.11%
- SAN 관리를 단순하게 하기 위해서 _ 49.47%
- 스토리지 자원의 최적 활용과 효율성 증대를 위해서 _ 45.26%
- 확장성을 위해서 _ 41.05%
- 데이터 보호 정책을 향상시키기 위해서 _ 40.53%
40% 이상의 응답만을 꼽아 봤는데요, 여기에서 뭔가 중요한 맥락을 읽을 수 있을 것 같습니다. 요약해 보자면 “데이터는 늘어나는데 관리하기 힘들다”라는 것이죠. 공감하시나요? 기업의 성장에 따라 데이터도 늘어나고 인력도 늘어나는 것도 당연하겠지만 이른바 스태프(Staff)의 인력까지 동반해서 늘어나게 되면 고정 비용 증가로 수익을 상쇄해 버리는 경우가 발생하기 때문에 기존 직원들에게 더 많은 일이 가해지는 것이 분명한 현실일 겁니다. 결국 관리 효율에 관한 문제가 발생하고 보다 더 쉽게 그래서 더 많은 시스템을 소수의 사람들이 관리할 수 있도록 해야 할 것입니다. 이를 위한 스토리지 기능들로는 플래시 드라이브(캐싱 포함)와 하드 디스크 드라이브의 혼용 구성과 관리, 가상 머신 수준에서의 스토리지 관리, 압축(compression), 스냅샷과 클로닝(cloning), 중복 제거(deduplication) 등이 있습니다.
Part 3에서는 좀 더 구체적인 접근 방법으로서 보고서에서는 하이퍼 컨버지드 시스템(Hyper-converged systems)라는 이름을 거론하고 있습니다. 이름이 거창하게 보이지만 사실 일반적으로 통용되는 CI(converged infrastructure)와 다를 바 없습니다. CI 경향에 대해서는 이전에도 몇 차례 적어 보았는데요, 이들이 정의하는 하이퍼 컨버지드 시스템은 아래와 같습니다.
Hyper-converged systems consist of standard servers that implement both compute and storage functionality, leveraging software and server resources. A hyper-converged system is delivered either as an appliance, or as software-only
우리 말로 바꿔보면 하이퍼 컨버지드 시스템은 표준 서버로 구성되어 컴퓨트와 스토리지 기능을 수행하는데, 소프트웨어와 서버 리소스를 이용하는 것으로 하나의 어플라이언스 형태 또는 소프트웨어로만 구성되는 형태로 제공된다는 것입니다. 소프트웨어로만 구성되는 형태도 있다는 점은 통용되는 개념의 CI와는 분명한 경계선이 있습니다.
이는 맥스타 제품의 컨셉과도 닿아 있습니다. 맥스타는 ‘컨버추얼라이제이션(Convirtualization)’는 낯선 용어를 꺼내면서 가상화된 환경에서 통합된 UI(integrated UI)를 이용, 컴퓨트와 스토리지를 운영, 통제할 수 있는 체제를 가지면 OPEX와 CAPEX를 최적화 할 수 있다고 주장합니다. 이들이 Convirtualization을 말하는 이유는 서버 기술의 비약적인 발전(CPU 코어, 메모리 용량, 네트워크 대역폭 등)과 많아지는 가상화 경향, 플래시 최적화된 아키텍처, 클라우드 추세 등입니다.
(출처: SNIA, Thinking outside of the storage box, 2014, 04)
맥스타의 스토리지 기술이 제공하는 것은 스냅샷과 클로닝, 씬 프로비저닝, 인라인 압축 및 중복제거, 고가용성(replication이 필요) 등이며, 가장 중요한 것은 글로벌 네임스페이스(global namespace)입니다. 이것을 이용해 대형 스토리지 풀을 만들 수 있으며 이 풀에 여러 대의 VM이 접속할 수 있도록 하는 것이죠. 플래시와 관련해서 기능을 보니, VM에서는 플래시에 우선 데이터를 쓰고, 이때 기록(write)되는 데이터는 random IO 형태이고, 이 플래시에서 데이터를 일정 수준 보관하다가 하드 드라이브(예: SATA)로 순차적인 형태(sequential write)로 기록하게 한다고 하는군요. 그런데 흥미로운 것은 2013년 11월에 발표한 ESG의 리포트를 보면 이 부분에 대한 언급을 아래와 같이 하고 있습니다.
Although Maxta uses dispersed storage devices across multiple servers, it all essentially becomes one large pool of storage that any VM on any server can access.
(출처: Solution Brief, Can Maxta Eliminate the Storage Array?, November 2013)
상기 리포트는 2013년 11월에 나온 것이므로, 1년 전의 리포트이고, 지금은 기술의 진보와 더 많은 고객을 확보했을 겁니다.
스토리지 산업 협회 쯤 되는 SNIA(The Storage Networking Industry Association)에서는 아직 드래프트 버전이지만 SDS를 주제로 발간한 보고서(2014년 4월)가 있는데, 여기에 따르면 소프트웨어 정의 스토리지의 속성(attributes)을 다음과 같이 정의하고 있습니다.
- May allow customers to “build it themselves,” providing their own commodity hardware to create a solution with the provided software.
- May work with either arbitrary hardware or may also enhance the existing functions of specialized hardware.
- May also enable the scale-out of storage (not just the scale up typical of big storage boxes).
- Nearly always includes the pooling of storage and other resources.
- May allow for the building of the storage and data services “solution” incrementally.
- Incorporates management automation.
- Includes a self service interface for users.
- Includes a form of service level management that allows for the tagging of metadata to drive the type of storage and data services applied. The granularity may be large to start, but is expected to move to a finer grained service level capability over time.
- Allows administrators to set policy for managing the storage and data services.
- Enables the dis-aggregation of storage and data services.
그러면서 동시에 SDS를 구축하는데 있어 (스토리지) 가상화만을 의미하는 것이 아닌 컨트롤 패스(control path) 역시 추상화되어 제공되어야 한다고 언급하고 있습니다. SDS를 위한 필수 기능은 자동화(Automation), 표준 인터페이스(Standard Interface), 가상화된 데이터 경로(Virtualized Data Patch), 확장성(Scalability) 등으로 요약하면서 아래와 같은 그림으로 정리하고 있습니다.
(출처: Software Defined Storage, Working Draft, April, 2014)
여기서 중요한 것은 데이터 패스(data path)와 컨트롤 패스(control path)라는 점입니다. SDS는 이렇게 경로를 이원화 하고 있는데, 여기서 이것이 물리적인 이원화냐 혹은 논리적인 이원화냐 하는 것이 중요한 것은 아닙니다. 물리적으로 2개의 경로(path)를 분리하고 싶다면 분리해도 되는 것이고 단일하게 만들고 싶다면 그러해도 됩니다. 이는 순전히 워크로드(workload)에 의해 결정되는 것입니다. 그리고 이러한 SDS 개념이 서비스 수준 관리로 연결되고 전체적으로 큰 그림 차원에서 SNIA에서는 아래와 같이 그려가고 있습니다.
(출처: Software Defined Storage, Working Draft, April, 2014)
다시 맥스타로 돌아와 보겠습니다. 기업 정보를 살펴보니 맥스타는 2009년에 설립되었고 2014년 11월 현재까지 3개 투자사로부터 2차례의 펀딩을 받았습니다. 2013년 11월에 1천만 달러를 안델센 호로비츠(Andreessen Horowitz)로 부터 받았고 2014년 5월에는 기존 투자사에 더해 테네야 캐피탈(Teneya Capital)과 인텔 캐피탈(Intel Capital) 등으로부터 2천 5백만 달러를 투자 받았습니다. 총 3천 5백만 달러를 유치한 맥스타는 현재 요람 노빅(Yoram Novick)이라는 사람이 CEO이자 창업자인데요, 노빅은 IBM에서 스토리지 시스템 개발 경험을 바탕으로 복제 소프트웨어 전문 기업이었던 토피오(Topio)를 설립하였고 이를 2006년 11월 넷앱(NetApp)에 1,600만 달러에 매각한 인물이기도 합니다.
맥스타의 기술이 현재로서는 크게 대단해 보이진 않습니다. 거의 대부분 현존하는 기술들이고 새로운 기술이라기 보다는 현존 기술들의 조합이라는 면에서 놀라울 것도 없습니다. 최근 에디톨로지라는 용어를 들고 나온 김정운 문화심리학자처럼 기존 있는 기술들을 편집해 내는 것이 창조인 듯 합니다. 선택과 집중의 시대에서 편집의 시대를 주장하는 그의 말처럼 맥스타의 기술 편집성이 눈에 띄는 그런 것이죠.
하긴, 저 역시도 지금 이 순간 편집을 하고 있군요.
- fin -
'일? Work ? IT!' 카테고리의 다른 글
마지막까지 플래시, 2016년이면 SSD가 더 싸진다 (0) | 2014.12.28 |
---|---|
플래시 스토리지 기업, 「테자일」 살펴보기 (0) | 2014.12.06 |
편집, SDS 그리고 맥스타 (0) | 2014.11.23 |
새로운 스토리지 소프트웨어 기업-스카일러블(Skylable) (0) | 2014.10.27 |
SDS를 생각해 본다 (0) | 2014.10.13 |
하드 디스크의 저장, 어디까지 갈까? (0) | 2014.09.15 |