데이터 마트(Data Mart)와 쿼리/리포팅 툴(Query/Reporting Tool)

1. 데이터 마트

기업들은 아마도 데이터 웨어하우스를 구축하면 그것으로 모든 것이 끝난 것처럼 생각할 수도 있다. 이제 기업의 모든 사용자들이 구축된 웨어하우스에 대해 질의를 하고 필요한 정보를 얻는 일만 남았다고 여길 수도 있다. 그러나 이것은 현실적이지 않다. 기업의 모든 사용자들이 웨어하우스에 대해 직접질의를 수행하는 것은 현실적이지 못할 뿐 아니라, 전체 시스템 성능에 심각한 부하를 줄 수 있으며, 웨어하우스가 사용자들이 원하는 유용한 정보를 주지 못할 수 있다. 나아가 데이터 웨어하우스는 다양한 질의에 응답할 수 있도록 상세 데이터를 보유하고 있으며,. 이러한 데이터는 일반적으로 정규화되어야 한다. 그래서 데이터 웨어하우스와 사용자 사이에 중간층이 필요할 수 있다. 이 중간층이 바로 '데이터 마트'이다.
전사적 '데이터 웨어하우스'가 모든 사업부문에 걸쳐 통합된 정보를 제공하기 위해 많은 운영시스템으로부터 관련된 데이터들이 취합되는 장소라면, '데이터 마트'는 하나의 주제 혹은 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있다. 즉 데이터 마트는 개별적인 부서 혹은 사용자 그룹에 의해 사용되는 소규모, 단일 주제의 웨어하우스이다.
현실에서 데이터 웨어하우징은 다양한 운영시스템으로부터 전사적 데이터에 대한 통합적 관점을 제공하는, 단일의 대규모 서버에 초점을 맞운다. 데이터 웨어하우스는 운영시스템을 보호하고, 통합된 단일한 데이터 모델로 데이터를 수집한다. 반면 데이터 마트는 거의 배타적으로 상이한 사용자 집단의 비즈니스에 대한 이해를 반영하여 구축된다.
데이터 마트에서 사용자 집단이 생성할 질의의 범위와 유형은 어느 정도 예측할 수 있으며, 전사적 데이터 웨어하우스와는 다르게 데이터를 조직화하고 인덱싱함으로써 이러한 질의에 대해 빠르게 응답할 수 있다(Kelly, 1996). 데이터 마트의 목적은 사용자의 질의에 매우 빠르게 응답할 수 있도록 데이터를 제공하는 데 있다(Varney, 1996).
데이터 마트는 특별하게 요약된 형태로 웨어하우스 플랫폼상에 위치할 수도 있으나, 일반적으로 분리된 플랫폼상에 위치한다. 데이터 마트는 이해관계가 동일한 사용자 집단에 특화된 데이터 저장소로서, 데이터 마트 내의 데이터는 대부분 데이터 웨어하우스로부터 복제되지만 자체적으로 수집될 수도 있다. 데이터 마트는 동질적인 사용자 집단에 유사한 비즈니스 모델과 비즈니스 언어를 제공함으로써 데이터의 이해성(logibility)을 높이는 데 초점을 맞춘다(Demartest, 1994).
데이터 마트는 데이터 웨어하우스를 대체하는 것이 아니며, 보완하는 개념으로 출발하였다. 그러나, 오늘날 많은 기업들이 데이터 웨어하우스를 구축하기 이전에 데이터 마트를 먼저 구축한다. 이러한 현상의 가장 큰 이유 중의 하나는, 데이터 마트가 데이터 웨어하우스보다 구축하기 쉽다는 점이다. 데이터 웨어하우스를 구축하려면 그 규모와 비용, 기간 등의 측면에서 막대한 자원을 필요로 하며, 그래서 쉽게 실행으로 옮기기 힘들다.
데이터 웨어하우스를 구축하는 데 가장 어려운 점 중의 하나는 바로 데이터이다. 데이터 웨어하우스는 기업의 곳곳에 산재해 있는 모든 데이터를 소화하고 통합하여 조직화해야 한다. 반면 데이터 마트는 많은 부분이 일반적으로 요약된 데이터로 구성되며, 사용자들이 사용하기에 아주 편한 형태를 위한다. 데이터 마트는 기업이 가진 전체 데이터를 분리하여, 이를 필요로 하는 사용자들에게 더 가깝게 제공한다는 의미에서 커다란 매력을 가진다.
한편 이러한 데이터 마트는 잠재적인 결함을 가진다. 앞으로의 시스템은 여러 사업부서 사이의 연계적인 부문(cross funtion)의 통합에 대한 필요성을 많이 요구할 것이다. 이 시점에서 각 사업부서들의 데이터 마트들은 서로 잘 연계되지 않을 가능성이 있다. 그러나 한편 데이터 마트 구축 경험은 웨어하우스 구축에 많은 도움이 될 것이며, 사용자들이 자신들이 원하는 답을 얻을 수 있다면, 그러한 답이 데이터 마트로부터 나온 것인지, 데이터 웨어하우스로부터 나온 것인지는 전혀 문제가 된지 않는다.
데이터 마트는 다차원 정보를 가지는 경우가 많은데 OLAP(OnLine Analytical Processing) 서버는 분석용 데이터 마트로서 사용자에게 다차원 정보를 제공하는 데 초점을 맞춘다.

2. 쿼리/리포팅 툴

쿼리/리포팅 툴은 사용자들이 기업 데이터베이스 내의 데이터에 접근하기 위해 이용하는 대표적인 툴로서 다양한 제품이 시장에 나와 있다. 과거에 사용자들은 이러한 툴을 사용하기 위해 많은 교육을 받아야 했으며, 데이터베이스 내의 데이터구조에 대해 이해하고 있어야 했다. 오늘날 이러한 툴들은 많이 발전하여, 심지어 SQR 문을 모르는 사람들이 사용할 수 있을 정도로 쉬워졌으며 강력한 기능을 보유하고 있다. 그러나 여전히 이러한 툴들은 사용자들이 원하는 형태의 정보를 추출해내지 못하고 있다. 또한 잘못된 사용자 질의는 응답성능에 심각하게 영향을 미친다.

자료원 : 데이터 웨어하우징과 OLAP