인포믹스-NAG 파이낸셜 데이터블레이드 모듈
차세대 시장 정보 시스템을 제공하는 기술
데이터 스토리지의 성능이 지속적으로 향상되면서 새로운 문제가 야기되고 있다. 트렌드 유형의 데이터를 이용해 업무를 수행해야 하는 사람들의 경우 처리해야할 기본 자료의 규모가 엄청나게 증가하게 된 것이다.
정량 분석가들과 위험 관리자들은 거래 및 입찰, 세계 시장의 상품, 주식, 통화 가격 등에 관한 수백 만 개의 데이터 간 패턴을 신속하게 파악해야 하는 매우 어려운 작업을 수행하고 있다. 점점 더 많은 데이터가 제공됨에 따라 “주식 포트폴리오의 위험도는 어느 정도인가?”와 같은 단순한 질문에도 그 해답을 찾는 것은 더욱 어려워지고 있다. 여러 해 동안 상업 및 투자은행의 거래 데스크의 경우 통화를 비롯해 주식, 채권 등 수많은 금융 자산에 대해 정교한 정량 방법론을 적용해 왔다.
그 목적은 다음과 같은 사항을 다각적으로 분석하는 것이다.
■ 자산의 과대 또는 과소 평가 여부 확인
■ 자동 거래 전략 구현
■ 파생상품과 같은 복잡한 증권 평가
■ 은행의 기업 고객들을 위한 맞춤 상품 개발
이러한 기법들은 미국의 최고 경영대학원은 물론 월스트리트와 런던의 기업들이 출자한 대부분의 지적 자본(intellectual capital)을 통해 전세계적으로 채택됐다. 이러한 정량 기법을 통해 이들의 목표를 성공적으로 달성했을 뿐만 아니라 정량 기법을 채택한 은행들은 기업 고객들과의 보다 나은 거래와 고마진 상품 판매로 수천만 달러의 이익이 발생했다고 인정되고 있다.
현재의 기술 : 일간 데이터 분석
궁극적으로 분석가들은 보안, 복잡한 거래 또는 전체 시장이 미래에 어떻게 변화할지 예측하기 위해 모델을 구축하고 있다. 분석에 필요한 주요 자료는 과거 자산 가격으로 모델과 함께 20년 전의 가격 데이터를 활용하는 사례가 비일비재 하다. “시계열 데이터”라고도 하는 이 데이터는 모델을 백테스트(backtest; 상품의 가격을 인상한 후에 일부를 원래의 값으로 팔아 보아 가격 인상의 영향을 알아보는 판매 시험)하거나 지금까지의 자산 시세를 예측하는데 있어서 모델이 얼마나 효과적인지를 파악하는데 사용된다.
오늘날 가장 많이 분석된 시계열 데이터는 “일간 데이터(daily data)”로서 이는 금융 자산에 대한 일일 활동의 단면이라고 할 수 있다. 예를 들면 특정 주식을 위해 수집된 일간 데이터는 일반적으로 주식 거래량과 함께 개장 시세, 상·하한가, 종장 시세 등이다.
시계열 데이터를 관리하는데 있어서 금융 전문가들은 독특한 문제에 직면해왔다. 관계형 모델은 시계열에서는 비효율적인 모델이며, 고성능은 물론 유용한 프로그래밍 인터페이스도 제공하지 않는다. 일간 데이터를 포함하고 있는 데이터 세트의 크기는 일반적으로 수 기가바이트에 이르고 있다.
일반으로 실행되는 사례를 보면, 데이터 세트는 서버에 저장되어 분석되는 클라이언트에 제공된다. 다양한 데이터 유형을 통합하는 작업은 개인 고객들과 컨설팅 기업의 몫이 되어 왔다.
최신 동향 : 틱 데이터베이스
일간 데이터보다는 처리 데이터나 틱 데이터(tick data)를 요구하는 것이 정량 분석가들 간의 최신 동향이다.
예를 들면, 현재 주식을 연구하는 분석가는 여러 해에 걸친 특정 주식에 관한 각기 모든 거래 시세 및 거래량을 포함하고 있는 데이터세트를 원한다. 문제는 10년 간 전세계 주식에 대한 짧은 내역을 포함하고 있는 데이터 세트의 크기가 대략 1 테라바이트에 이른다는 것이다. 이렇게 용량이 클 경우 네트워크 상에서 자유롭게 이동할 수 없을 뿐만 아니라 워크스테이션으로는 분석할 수도 없기 때문에 서버 중심 모델을 필요로 한다.
솔루션:인포믹스 인터넷 파운데이션, 타임시리즈 및 NAG 파이낸셜 데이터블레이드 모듈
인포믹스만이 유일하게 틱 데이터베이스를 제공하고 있다. 틱 데이터를 분석해야 하는 기업의 핵심 요구는 인포믹스가 자체 역량을 발휘할 수 있는 절호의 기회를 맞도록 했다. 다른 분야와는 달리 금융 서비스 분야에서는 보다 신속하게 자산을 평가하거나 거래에 따라 위험 대책을 파악하는 기능은 뜻밖의 수익을 가져올 수 있다.
일반적으로 분석은 때로 데이터의 양을 한 자리 수까지 줄여준다. 이러한 분석은 일찍 이루어질수록 효과적이다. 필요한 것은 결과이지 원시 데이터 그 자체는 아니다. 인포믹스-NAG 파이낸셜 데이터블레이드 모듈은 이러한 분석을 데이터에 보다 가까이 옮겨 놓았다. 또한 데이터베이스 서버 내 분석 작업은 동일한 분석이 이기종의 클라이언트 프로세스에서도 이루어진다는 것을 의미한다. 클라이언트 프로세스(여러 프로그램과 웹 브라우저를 연결하는 C 프로그램, ODBC 또는 JDBC)는 다양한 기능이 구현된 동일한 서버를 이용할 수 있다. 매일의 종장 시세를 이용해 1년에 걸친 100주(株)의 분산-공분산 메트릭스를 계산하는 간단한 예를 생각해 볼 수 있다. 입력 데이터와 출력 데이터의 비율은 5대1이다. 분산-공분산 메트릭스가 서버에서 작성될 수 있다면 그 결과를 클라이언트에게 전송하기만 하면 된다. 클라이언트는 모든 프로그램이 될 수 있고, 이제 모든 클라이언트 프로그램은 여러 동일한 분석 기능을 공유할 수 있다.
수치 분석은 서버 프로세스에 의해 직접 실행된 표준 NAG Fortran 라이브러리의 다양한 기능을 통해 실행된다. 이는 최고 수준의 계산 기능을 통해 가능한 최고의 성능을 제공한다. 따라서 사용자는 속도는 물론 수학적인 무결성을 확보하게 된다.
인포믹스-NAG 데이터블레이드 모듈과 인포믹스 타임시리즈 데이터블레이드 모듈은 뗄레야 뗄 수 없는 긴밀한 관계를 가지고 있다. 타임시리즈 데이터블레이드 모듈은 시간 표시 데이터를 효율적으로 저장 및 검색하고, 인포믹스-NAG 데이터블레이드에는 산더미처럼 많은 원시 데이터에서 정보를 추출할 수 있는 강력한 분석 성능을 보유하고 있다.
성공적인 솔루션
파운데이션의 뛰어난 확장성을 비롯해 텍스트와 타임시리즈 데이터블레이드 모듈을 통한 컨텍스트 리치 데이터의 관리, NAG 파이낸셜 데이터블레이드 모듈의 분석 성능 등을 활용하는 유일한 솔루션은 바로 MIS(Market Information Services)의 토털서버이다. MIS(www.marketinfoserv.com)는 효과가 매우 클 뿐만 아니라 특히 거래 지원 및 위험 관리를 위해 설계된 오리지널 경영정보시스템을 판매하고 있는 인포믹스의 VAR이다. 세계적인 거래 시 직면하게 되는 과제에 차세대 시장 정보 시스템을 제공하기 위한 기술 및 기능은 바로 이용할 수 있다.
|