용어사전 정의

OLAP(On-line Analytical Processing)

OLAP는 사용자가 다양한 각도에서 직접 대화식으로 정보를 분석하는 과정을 말한다.OLAP 시스템은 단독으로 존재하는 정보 시스템이 아니며, 데이터 웨어하우스나 데이터 마트와 같은 시스템과 상호 연관된다. 데이터 웨어하우스가 데이터를 저장하고 관리한다면, OLAP은 데이터 웨어하우스의 데이터를 전략적인 정보로 변환시키는 역할을 한다. OLAP은 기본적인 접근과 조회·계산·시계열·복잡한 모델링까지도 가능하다. OLAP은 최근의 정보 시스템과 같이 중간매개체 없이 이용자들이 직접 컴퓨터를 이용하여 데이터에 접근하는 데 있어 필수적인 시스템이라 할 수 있다.

이용자가 직접 데이터베이스를 검색, 분석해서 문제점이나 해결책을 찾는 분석형 애플리케이션 개념. 대규모 데이터를 이용한 질의 검색시 발생한 대량의 결과값을 단순히 사용하기는 어렵다. 대부분 이 같은 질의는 복수의 데이터 정보 테이블을 기반으로 처리되고, 요약화된 정보를 얻기 위해 연산처리가 수반되어 장시간이 소요되기 때문이다. OLAP TOOL 또는 OLAP SERVER는 온라인 검색을 지원하는 데이터웨어하우스(DW) 지원 도구인데 이 같은 대규모 연산이 필요한 질의를 고속으로 지원한다.

- 다차원 정보분석

- 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정을 활용하는 과정

- 1993년 E.F.Codd에 의해 처음 사용된 용어

- 온라인거래 처리프로세싱(On-Line Transaction Processing; OLTP)에 상대되는 개념

- 데이터웨어하우스 환경에서 데이터 접근 전략의 중요한 요소로 자리잡아가고 있음

1. 다차원 정보

정보는 본질적으로 다차원이며 다차원 모델은 비지니스를 표현하는 가장 자연스러운 형태이다.

2. 직접접근

데이터는 사용자가 원하는 형태로 존재하지 않는다.

OLAP 환경에서 사용자는 필요한 시점에 정보 매게자 없이 정보원에 직접 접근하여 다양한 각도에서 분석을 수행 할 수 있다.

3. 대화식 분석

정형화된 보고서를 단순히 조회하는 방식에서 벗어나 대화식으로 정보를 분석하게 된다.

4. 의사결정에 활용

OLAP 시스템의 목적은 사용자가 기업의 전반적인 상황을 이해 할 수 있게 하고 의사결정을 지원하는데 있다.

OLTP

OLAP

워크플로우 기반(업무프로세스 중심)

사용자의 분석 수행 기반(주제 중심)

트랜잭션 처리(입력, 조회, 삭제, 수정)

운영자 계층 시스템

보고서, 분석 계획(조회, 제한적 입력/수정)

분석가 및 의사결정자 계층 시스템

2차원, 정규화

다차원, 계층구조

상세데이터

중복성 배제

요약정보

중복성 수용

소량의 데이터 처리

활용 패턴 단순, 고른 시간대 분포

시스템 자원 사용량 예측 용이

대량의 데이터 처리

활용 패턴 다양, 시간대 불규칙 분포

시스템 자원 사용량 예측 어려움

구축 후 데이터 축적 중심

전통적 개발 주기

시스템 구축 후 유지보수 단순

구축 후 데이터 축적 및 반복 확장 개발 주기

시스템 구축 후 유지보수 전략 필요

사용자 중심 응용프로그램

Customizing 용이

정형화된 보고서, 변경 어려움

단순한 화면 조작

Customizing 제한적

동적인 비정형 분석, 변경 용이

EUC(End User Computing)활성화 필요

■ OLAP 제품 분류

1. MOLAP(Multidimensional OLAP)

다차원 데이터베이스에 기반한 OLAP 아키텍처. 다차원 데이터의 저장과 프로세싱에 MDB가 사용된다. 타 아키텍처에 비해 네트워크 상의 데이터 이동이 최소화 ⇒ 다차원 데이터의 저장과 프로세싱에 동일한 엔진 사용

- 대표적인 제품 : 하이페리언 솔루션의 에스베이스, 오라클의 익스프레스, 파일롯 소프트웨어의 디시젼 서포트 등

2. ROLAP(Relational OLAP)

관계형 데이터베이스에 기반한 OLAP 아키텍처. 관계형 데이터와 클라이언트 사이의 연결 역할을 수행

- 대표적인 제품 : 인포믹스의 메타큐브, 인포메이션 어드벤티지의 디시전 쉬이트, 마이크로스트래 티지의 DSS 에이젼트 등

3. DOLAP(Desktop OLAP)

다차원 데이터의 저장 및 프로세싱이 모두 클라이언트에서 이루어지는 데이터베이스

- 장점 : 타 OLAP 제품에 비해 비교적 설치와 관리가 쉽고 유지 보수가 용이함

- 단점 : 필요한 데이터가 모두 클라이언트로 이동 필요, 대용량 데이터 처리에 한계

- 대표적인 제품 : 코그노스의 파워플레이, 브리오 테크놀러지의 브리오쿼리 등

4. HOLAP(Hybrid OLAP)

다차원 데이터의 저장 공간으로 다차원 데이터베이스와 관계형 데이터베이스가 함께 사용될 수 있는 제품. 일반적으로 요약된 데이터나 관계식에 의해 새로 계산된 데이터는 다차원 데이터베이스에 저장되며 상세 데이터는 관계형 데이터베이스에 저장

- 대표적인 제품 : 오라클의 익스프레스, 마이크로소프트의 SQL 서버 OLAP 등

■ 다차원 모델의 구성

1. 모델

하나의 큐브(Cube), 예로 아래그림은 매출분석모델의 규브

2. 차원(Dimension)

큐브를 구성하는 축(Axis). 매출분석 모델은 변수, 매장, 제품이라는 3개 차원으로 구성된 규브

3. 차원 항목(Member 혹은 Element)

각 축의 좌표에 해당하는 것. 매출분석모델에서 살펴보면 제품 차원은 냉장고, 세탁기 등의 항목, 매장 차원은 반포, 잠실 등의 항목이 있음

4. 셀(Cell)

OLAP의 장점과 단점

장점

단점

-강력한 시각화 도구

-빠른, 상호 교환적인 응답시간

-통계량을 분석함에 편리

-자료를 찾기에 유용

-많은 곳에서 OLAP 제품을 제공

-운영자의 프로그램 유지보수 비용의 최소화

-프로그램 운영부담의 경감

-입방체를 설정하는 것이 어려움

-지속적인 변수들을 취급하지 않음

-입방체 자료의 가치가 쉽게 떨어질 수 있음

-고객의 불만을 들어주기 어려움

성공사례(군단 전선관측 자료분석 시스템)

OLAP 도입전

OLAP 도입후

-관측된 자료가 정보화가 되기까지 수작업에 의존

-수작업에 의존하는 데이터 분석방식은 투입되는 시간과 노력에 비해 비효율적

-정보실무자는 특정활동에 국한된 자료를 이용하여 단순통계를 구하고 분석할 수 밖에 없었음

-필요한 정보의 수집자산별, 첩보내용별로 구조화

-과학적인 분석을 통해 적활동을 신속하고 정확하게 파악

-복잡하게 느껴지던 분석업무의 체계화

-보고서 작성의 최소화

-전선관측 정보를 새로운 관점에서 보게 됨

Posted by 요지
,