database.sarang.net
UserID
Passwd
Database
ㆍDBMS
MySQL
PostgreSQL
Firebird
Oracle
Informix
Sybase
MS-SQL
DB2
Cache
CUBRID
LDAP
ALTIBASE
Tibero
DB 문서들
스터디
Community
공지사항
자유게시판
구인|구직
DSN 갤러리
도움주신분들
Admin
운영게시판
최근게시물
DBMS Tutorials 173 게시물 읽기
 News | Q&A | Columns | Tutorials | Devel | Files | Links
No. 173
DataWarehouse 란 무엇인가?
작성자
정재익(advance)
작성일
2001-12-14 21:50
조회수
5,370

DW 란 무엇인가?

 

정보처리의 궁극적인 목표는 DATAINFORMATION으로 변환시키는 것이다. 왜 정보로 변환시키는가? 그것은 업무를 처리함에 있어서 문제를 해결하기 위하여는 정보를 어떻게 사용하여야 하는가에 대한 지식과 정보를 필요로 하기 때문이다.

 

데이타를 정보로 변환하기 위하여는 다음 사항이 가능해야 한다.

 

. 데이타를 가지고 있어야 하고,

. 어떤 데이타를 가지고 있는지 자신이 알고 있어야 하고,

. 그 데이타를 액세스할 수 있어야 하며,

. 그 데이타에 대한 신뢰성이 있어야 한다.

 

많은 사람들이 정보 환경을 설계하고, 구축하고, 운영하는데 대한 지침을 이야기 하지만, 중요한 것은 이런것들이 과연 나의 업무가 요구하는 정보를 제대로 효율적으로 제공할 수 있는 것인가 하는데서부터 출발하여야 한다는 것이다. 대부분의 상황에서 정보를 제공하기 위하여 위 4가지의 조건을 필요로 하게된다. 여기서 데이타 웨어하우스가 출발한다고 생각한다.

 

데이타 웨어하우스는 구조(architecture)이지 기술(technology)이 아니다. 데이타 웨어하우스 구조는 다음과 같은 특징을 가진다고 본다.

 

. 주제 지향적이다.(Subject Oriented)

. 통합적이다.시계열성을 가진다.(Time Variant)

. 비 휘발성이다.(Non-Volatile)

 

이런 특징들은 나중에 더 논하기로 하고 이제 데이타 웨어하우스 구조를 좀더 이야기 하기로 하자. 구조는 4 단계의 데이타로 구성된다.

 

 

1. The Automic level

2. Departmentally structured data

3. Individually structured data

4. Metadata

 

비지니스 마다 필요한 정보의 수준과 유형이 서로 다르고, 이를 충족시키기 위한 데이타 웨어하우스의 각 단계라고 이해하면 될것이다.

또한 이 개념은 논리적인 것이라는 점을 기억해야 한다. 각 단계는 동일한 기술환경일 수도 있고 서로 다른 기술을 적용하여 구축될수 있는것이다.

 

1. Automic level은 데이타 웨어하우스에서 데이타의 historical integrity를 제공하기 위한 목적으로 설계된다. 성능은 여기서 고려 대상이 아니다. 이 단계는 조직 전체의 정보 요구를 충족시킬수 있는 가장 상세하고 가장 쪼개진 데이타를 가진다. 따라서 automic level이 조직 구조와 가장 밀접하고 가장 상세한 현재의 데이타의 공급처로 역할을 하게 된다.

 

2. 데이타 웨어하우스의 Departmental level은 정보관리에 있어서 중복 관리 형태로 나타난다. 그래서 automic level보다는 월등한 성능을 제공할 수 있게 된다. Departmental level data는 automic level에서 찾는것보다는 데이타의 부분(subset)에 촛점을 두고 설계된다. 부서나 특정 그룹의 요구에 부응한 미리 맞추어진 설계를 함으로써 신속한 데이타 검색을 제공하고자 하는것이다. 데이타 마트가 항상 데이타 웨어하우스에 고려되는 이유가 바로 여기에 있다.

(데이타 마트는 새로운 것이 아니다. 데이타 마트는 항상 데이타 웨어하우스의 일부분이었다. 그런데 데이타 웨어하우스 구축에 어려움을 겪자 automic level에만 촛점을 두고 구축해 오면서 별도의 분야로 인식하게된데 기인한다.)

 

3. 데이타 웨어하우스의 individual level은 Departmental level 보다도 더 큰 성능을 구현하고자 하는 것이다. 이 단계는 departmental level보다도 더 작은 단위의 특정 목적에 맞도록 설계하는 것이다. 즉 과거 추세를 모니터 하려는 특정 임원용 이라거나 특정 그룹이 사용하는 특정 업무를 위하여 설계하는것들이다. 이 단계는 흔히 이미 검색한 결과(result-set) 같이 이미 가공된 수준의 데이타를 제공하고 있다.

 

4. Metadata는 문법적으로 "데이타에 대한 데이타"를 의미한다. 그렇지만 특히 데이타 웨어하우스 분야에서 크게 잘못 이해되고 있다. 데이타를 정보로 변환시키기 위한 기준을 상기하여 보라. 이 기준들 중에서 가장 어려운 두개 즉 어떤 데이타를 가지고 있는지 알아야 하고, 그 데이타들을 신뢰할 수 있어야 하는 것이 바로 metadata로 지원된다. Metadata는 데이타의 물리적 구조 정보를 표시하는 단순한 기술정보가 아니다. 기술과 비지니스 요소가 결합되어 만들어진 metadata가 데이타 웨어하우스의 내용을 제공하게된다. 또한 데이타 웨어하우스와 마찬가지로 metadata도 시계열적이다. 즉 metadata도 변경에 대한 historical data를 유지하여야 한다는 것이다.

 

원본출처 : http://bora.dacom.co.kr/~mhan/

이 글에 대한 댓글이 총 1건 있습니다.

예전에 읽은 책중에 있는 Data Warehousing 의 정의에 대해서 원본 그대로 한번 옮겨 보겠습니다.

 

My favored definition of a data warehouse is a slightly modified version of Ralph Kimball's definition on page 310 of The Data Warehouse Toolkit (http://www.wiley.com/compbooks/catalog/15337-0.htm):

 

A data warehouse is a copy of transaction data specifically structured for querying and reporting.

Ralph states that a data warehouse is "a copy of transaction data specifically structured for query and analysis". Two quibbles I have with Ralph's definition are: 1) Sometimes non-transaction data are stored in a data warehouse - though probably 95-99% of the data usually are transaction data. 2) I say "querying and reporting" rather than "query and analysis" because the main output from data warehouse systems are either tabular listings (queries) with minimal formatting or highly formatted "formal" reports. Queries and reports generated from data stored in a data warehouse may or may not be used for analysis. - For some more information about why the transaction data are copied, you may want to see my essay The Case for Data Warehousing.

정재익님이 2002-08-27 13:26에 작성한 댓글입니다.
[Top]
No.
제목
작성자
작성일
조회
185GDBC 설치기
정재익
2001-12-16
4487
176Backup & Recovery
정재익
2001-12-14
7648
174DW 데이터 변환
정재익
2001-12-14
6045
173DataWarehouse 란 무엇인가? [1]
정재익
2001-12-14
5370
155예약어와 중복되는 이름을 이용할려면
정재익
2001-12-09
9349
140DB 테이블 디자인에 도전하기 (5)
정재익
2001-12-07
5673
139DB 테이블 디자인에 도전하기 (4)
정재익
2001-12-07
5165
Valid XHTML 1.0!
All about the DATABASE... Copyleft 1999-2024 DSN, All rights reserved.
작업시간: 0.018초, 이곳 서비스는
	PostgreSQL v16.2로 자료를 관리합니다