시맨틱 웹 포털 기술 동향

정한민* 강인수* 성원경**

팀 버너스 리(Tim Berners-Lee)에 의해 주창된 시맨틱 웹은 해외뿐만 아니라 국내에서도 빠르게 적용 분야를 넓혀가고 있다. 그 중 인터넷 상에서 사용자와 직접 접점을 가지는 관문이라 할 수 있는 포털, 특히 시맨틱 웹 기술이 적용된 시맨틱 웹 포털(Semantic Web Portals)은 시맨틱 웹 기술이 집약된 응용 분야로서 각광받고 있다. 웹 포털과 시맨틱 웹 포털의 모든 차이는 온톨로지의 유무로부터 파생된다. 시맨틱 웹 포털에서는 해당 분야 도메인에 대한 온톨로지 스키마를 정의하고, 서비스할 필요가 있는 모든 도메인 콘텐츠를 온톨로지 인스턴스로 구축하게 된다. , 포털에서 서비스되는 모든 개별 단위 콘텐츠가 온톨로지 스키마 상의 특정 클래스의 인스턴스로 연결되어 있는 것이다. 또한, 시맨틱 웹 포털에서는 개념적이고 명시적인 지식 체계인 온톨로지에 대한 스키마 브라우징 및 인스턴스 검색 기능을 제공함으로써, 사전 지식이 부족한 포털 이용자들에게 포털 접근의 수월성을 제공할 수 있어야 한다. 본 고는 이러한 관점에서 해외 및 국내 사례를 중심으로 기술의 발전과 방향을 가늠해 본다.

I. 서 론

컴퓨터 분야에서 포털(Portal)은 월드와이드웹(World Wide Web: WWW) 상의 웹 데이터(웹 링크)로 표현될 수 있는 웹 사이트, 웹 페이지나 다운로드 가능한 콘텐츠를 포함)에 대한 웹 링크들을 특정 개념 체계에 따라 정리하여 서비스하는 웹 사이트를 가리킨다. 그렇지만 인터넷 시대 초기에는 그 용어가 웹 상에서 정보 접근 및 탐색을 위한 시작점을 제공하는 인터넷 검색 및 항해(Navigation) 사이트들을 일컫는 말로 한정되어 사용되었으며 검색 엔진 자체를 의미하기도 하였다[25]. 그 뒤 Yahoo, Excite, Infoseek, Lycos 등 대형 사이트들의 등장에 따라 웹 서핑을 위한 시작점으로서 인터넷 포털 또는 웹 포털이라는 용어가 사용되기 시작하였으며, 이 사이트들은 과거 검색 엔진에 더해 구조적으로 문서들을 분류하여 보여주는 웹 디렉터리 서비스 등을 통해 보다 유용하다고 판단되는 사이트들에 대한 정보를 제공하는 방식으로 과거보다 좀더 구조적이고 항해 가능한 인터페이스를 제공하였다. 현재는 포털의 역할과 기능이 더욱 복잡해짐에 따라 그 정의 또한 여러 다양한 소스로부터 정보를 수집하고, 분류된 그리고 개인화된 방식으로 이를 제공할 수 있는 단일 포인트 역할을 하는 개인화된 웹 필터 관점에서 이루어지고 있다.

포털은 Naver, Nate, Yahoo 등과 같이 전체 인터넷 커뮤니티를 대상으로 하는 수평 포털(Horizontal Portal)과 특정한 주제 또는 콘텐츠를 대상으로 하는 수직 포털(Vertical Portal)로 나눌 수 있다. 특히, 수직 포털의 경우 관심 대상이 공유되는 특정 커뮤니티를 대상으로 정보 제공과 교환 공간을 제공하기 때문에 수평 포털에 비해 의사 소통과 정보 공유에 있어서 보다 효율적인 지원이 이루어져야 한다. 이러한 요구 사항에 따라 포털 내에서의 데이터와 정보 소스의 의미를 기계가 이해하고 처리함으로써 정보 공유 프로세스를 향상시킬 수 있어야 한다.

그렇지만 현재 서비스되는 웹 포털들은 이러한 요구 사항을 만족시키기 힘든데 그 이유는 웹 포털이 다루고자 하는 분야에 대해 잘 정립된 지식 체계의 부재로부터 기인한다. 그러한 지식 체계의 진보된 형태는 온톨로지(Ontology)이며, 그것은(특정 분야의 관련자들 사이에서) 공유되는 개념과 개념 간의 관계를 명시적으로 규정해 놓은 개념 체계로 정의될 수 있다[9]. 온톨로지는 현재까지 정보 표현[7], 정보 통합[24], 시스템 개발[3] 등의 다양한 분야에서 그 유용성을 입증해 왔으며, 웹 포털에도 적용되어 앞서 언급된 다양한 문제들을 해결할 수 있을 것으로 예상된다. 온톨로지에 기반한 웹 포털은 국내외를 막론하고 시맨틱 웹 포털이라는 이름 아래 활발히 개발 및 구축되고 있다. 시맨틱 웹 포털은 최종 사용자에게 정보 탐색 및 검색 측면에서 콘텐츠를 구성하는 단위 지식의 의미에 기반한 검색 기능[6]을 제공하는 것과 더불어, 온톨로지에 정의된 지식 단위 간의 의미 관계에 기반한 웹 페이지간 동적 링킹 기능[8]을 지원하게 될 것이라고 한다.

결국 시맨틱 웹 포털은 정보를 체계화하고 이를 관리하기 위해 시맨틱 웹에서의 근간이 되는 온톨로지를 활용함으로써 기계가 정보를 이해할 수 있고, 사용자가 정보를 검색추출해석처리하도록 도와준다. <1>은 유럽연합의 SWAD-E 프로젝트팀에서 시맨틱 웹 포털과 기존 웹 포털의 접근법을 다양한 관점에서 정리한 것이다. 이에 따르면 시맨틱 웹 포털은 기존 방식에 비해 이용자에게는 정보 접근 방식의 융통성 및 수월성을 제공할 수 있으며, 운영자 및 관리자에게는 포털 유지 보수 및 확장의 용이성을 증대시켜 주는 장점이 있음을 알 수 있다.

전체적으로 정리하면 시맨틱 웹 포털을 다음과 같이 정의할 수 있다[14].

- 시맨틱 웹 포털은 웹 포털의 일종이다. 웹 포털은 공통 관심 사항을 가지는 사용자 그룹을 위해 정보를 수집하는 웹 사이트이다[11].

- 해당 그룹이 정보를 공유하고 교환할 수 있도록 해 주는 웹 포털의 일종이다.

- 시맨틱 웹 기술에 기반하여 개발된 웹 포털의 일종이다.

상기 정의에서의 시맨틱 웹 기술은 (그림 1)에서 기반 기술(Grounding Technologies)에 속하며 온톨로지와 시맨틱 웹 서비스로 구성된다. 앞에서 기술한 바와 같이 온톨로지는 시맨틱 웹 기술에서 가장 중요한 요소라고 할 수 있는데, 일반적인 시맨틱 웹 포털에서는 도메인 온톨로지(Domain Ontology)와 응용 온톨로지(Application Ontology)가 주로 사용된다. 시맨틱 웹 포털의 사용성(Usability)을 오래 유지하기 위해서는 온톨로지 관리가 체계적으로 이루어져야 한다. , 온톨로지를 편집, 유지보수, 검색, 표준화하는 방법을 적절히 제공할 수 있어야 한다. 또한, 추론을 도입함으로써 정보를 체계화하는 데 있어서 제약과 관계를 검사하고, 공리(Axioms)와 추론 규칙을 이용하여 새로운 관계들을 유도해낼 수 있도록 해 준다. <2>는 대표적인 시맨틱 웹 포털들인 Esperonto, Ontoweb, Empolis K42, Mondeca ITM을 시맨틱 웹 기술 기준으로 비교한 결과를 보여준다(국내 분석 결과는 <2> 참조).

(그림 2)Hype Cycle 상에서의 시맨틱 웹 위치를 보여준다[10],[31]. 여기서 주목할 만한 것은 시맨틱 웹의 경우 2004년에 Visibility가 정점에 가까이 있으나, 2005년에는 기업 시맨틱 웹(Corporate Semantic Web)으로 구체화되면서 성숙도(Maturity)에 있어서 초기 단계로 후퇴하였다는 것이다. 시맨틱 웹 포털이 몇 년 전부터 개발되기 시작하였으나, 아직 완성되지 않은 상태이고 특정 기업 위주의 수직 포털로서의 세부적인 기술 개발이 이루어지고 있다는 것을 의미한다. (그림 2)는 수직 포털 또한 안정기에 접어들기 위해서는 2~5년의 시간이 더 필요한 상태로 파악된다.

II. 해외 기술 동향

본 장에서는 해외 시맨틱 웹 포털 기술 동향을 소개하기 위해 서론에서 제시한 포털 평가 지표 적용의 적합성, 기존 시맨틱 웹 커뮤니티에서의 인지도, 인터넷을 통한 온라인 접근테스트의 용이성, 관련 포털에 대한 내용 파악에 도움이 되는 논문 등 출판물의 존재 유무, 포털 등장의 최신성 등을 종합적으로 고려하여 분석 대상을 선정하였다.

에스페론토 포털(Esperonto Portal)은 스페인 마드리드의 폴리테크니카(Politécnica) 대학에서 개발한 포털 생성 도구인 ODESeW(Semantic Web Portal based on WebODE platform)를 사용하여 만든 시맨틱 웹 포털로 유럽연합 프로젝트의 하나인 에스페론토 과제의 내용 및 관련 성과물들을 내외부에 서비스하기 위해 개발된 것이다.

에스페론토 포털을 위해 Project, Documentation, Person, Organization, Meeting5개 도메인 온톨로지가 만들어졌는데, 최대 깊이가 5이며 하나의 클래스는 2~8개의 하위 클래스들을 가진다. 20037월 현재, 클래스 100, 데이터 타입 속성(Datatype Property) 200, 객체 관계 속성(Object Property) 100, 인스턴스 300개로 구성되어 있다.

온톨로지 관리 측면에서 살펴본다면 온톨로지 스키마는 WebODE 온톨로지 에디터로 관리되며, 온톨로지 인스턴스는 포털 인터페이스를 통해서도 수정될 수 있다. 에스페론토 포털의 장점 중 하나는 온톨로지와 포털의 실시간 동기화 기능인데, 이것은 ODESeW 포털 생성 도구에 의해 제공되는 것으로 온톨로지 스키마나 인스턴스의 변경 시, 관련 수정 내용이 실시간으로 에스페론토 포털에 반영된다[5]. 온톨로지와 포털 간의 이와 같은 실시간 동기화는 시맨틱 웹 포털이 가져야 할 중요한 필수 요건 중 하나로서 온톨로지 데이터가 포털의 최종 사용자에게 흘러가는 과정에서 온톨로지 스키마 외의 어떠한 부가적인 스키마도 개입되지 않아야 얻어질 수 있는 것이다.

정보 접근 및 탐색 측면에서 살펴본다면 에스페론토 포털은 전통적인 키워드 검색과 더불어 온톨로지 브라우징 및 온톨로지 기반 검색 기능을 제공하고 있으나, 아쉽게도 시맨틱 웹 포털의 정체성을 결정해 주는 중요한 검색 기능인 온톨로지 기반 의미 검색은 제공되지 않고 있다. 에스페론토 포털에서의 온톨로지 기반 검색은 예를 들어 클래스 사람이름, 출생일, 국적, 주소 등을 검색하는 것과 같이 클래스 종속적인 데이터 타입 속성들에 대한 조건 검색으로 한정되어 있으며 클래스간 조건에 사용되는 객체 관계 속성을 이용한 검색 기능은 제공하지 않는다.

에스페론토 포털은 최종 사용자 측면에서 추론에 기반하여 온톨로지에 내재된 지식을 획득할 수 있는 기능은 찾아보기 힘들다. 단지 포털의 근간이 되는 온톨로지 데이터의 정합성을 검사하는 측면에서 추론 기능을 사용하고 있는데, 이것은 일반적으로 시맨틱 웹 온톨로지를 만들 때 필수적으로 거치는 과정이므로 시맨틱 웹 포털에만 국한되는 특징으로 언급하기는 어렵다. 또한, 현재 에스페론토 포털을 위해 구축된 온톨로지 인스턴스 수는 소규모로서 대용량 온톨로지에 기반한 포털 서비스에서 발생할 수 있는 시공간적 복잡도와 그에 대한 해결방안을 기술하기에도 무리가 있다.

온토웹 포털(OntoWeb Portal)은 유럽연합 프로젝트인 OntoWeb(IST-2000-29243)의 일부로 만들어진 것이며, 온톨로지에 기반하여 지식 관리와 전자상거래를 위한 정보 교환 환경을 제공하기 위한 커뮤니티 포털 사이트이다. 이 포털은 ZOPE 응용 서버와 CMF(Content Management Framework) 기술을 근간으로 구축되었다. (그림 4)는 온토웹 포털에서 프로젝트 OntoBroker에 대한 내용을 브라우징하는 화면 예를 보여주고 있다.

온토웹 포털을 위해 Organization, Person, Project, Publication, Event, Topic 등의 개념을 포함하는 도메인 온톨로지가 만들어졌으며, 그 최대 깊이는 4이며 하나의 클래스는 2~10개의 하위 클래스들을 갖고 있다. 20067월 현재, RDF 언어를 이용하여 기술한 클래스 73, 데이터 타입 속성(Datatype Property)과 객체 관계 속성(Object Property)을 합하여 178개로 구성된다.

이 온톨로지의 특징은 포털에서 제공되는 모든 콘텐츠 타입들을 온톨로지 클래스로 포함시켰다는 점이며, 이것은 온톨로지와 포털 간의 내용적 동기화를 얻기 위해 반드시 고려되어야 하는 요건 중 하나이다. 그러나, 포털 사용자에 대한 관리가 온톨로지와 별도로 이루어지고 있다는 점에서 완전한 내용적 동기화를 달성한 것은 아니다. 한편, 온톨로지 관리 측면에서 본다면 에스페론토 포털에서와 같이 온톨로지와 포털의 실시간 동기화는 이루어지지 않고 있다. , 온톨로지 스키마의 변경이 포털에 즉시 반영되지 않는다.

정보 접근 및 탐색 측면에서 본다면 온토웹 포털은 키워드 검색, 온톨로지 브라우징 기능과 더불어 온톨로지 기반 검색을 제공하고 있다. 온토웹 포털의 가장 두드러진 특징은 하나 이상의 객체 관계 속성을 검색 조건에 포함시킬 수 있는 온톨로지 기반 의미 검색을 제공한다는 것이다. (그림 5)는 온토웹 포털의 온톨로지 기반 의미 검색 예를 보여 주고 있는데, 클래스 Project와 클래스 Person 간에 Member라는 객체 관계 속성을 사용하여 이름이 Robert Meersman인 사람이 참여한 프로젝트를 검색한다. 그림에서 알 수 있듯이 carriedOutBy, financedBy, head, isAbout 등과 같은 Project의 다른 객체 관계 속성들도 검색 조건에 추가로 사용하여 원하는 Project의 범위를 좁힐 수 있으며, author, dcContributor, dcCoverage 등과 같은 Project의 데이터 타입 속성들에도 값을 입력하여 검색 결과를 제약할 수 있다.

온토웹 포털 역시 추론에 기반하여 온톨로지의 내재된 지식을 추출하는 기능은 지원되지 않고 있다. 또한, 온토웹 포털의 온톨로지는 현재 RDF 레벨에서 작성되었으므로 OWL 레벨에서 작성된 온톨로지에서 사용할 수 있는 DL(Description Logic) 기반의 온톨로지 정합성 검사가 제공되지 않는다. 온토웹 포털에서는 향후 OWL로의 확장을 계획하고 있다.

수오미닷피 포털(Suomi.fi)은 핀란드 재정부에서 일반인들이 공공서비스를 원활히 찾아 이용하는데 도움을 주기 위해 개발되었다[22]. 최초의 수오미닷피 포털은 문화취미, 교육도서관, 고용기업활동 등을 포함하는 12개 주요 주제를 중심으로 야후 디렉터리 체계와 유사한 웹 디렉터리를 만들어 서비스되었다. 개별 주제에는 그것에 대한 간략한 설명과 함께 해당 주제와 관련된 공공서비스를 제공하는 웹 페이지로의 링크들을 제공하였다. 그러나, 야후 스타일의 단일 패싯 디렉터리 체계가 갖는 콘텐츠로의 단일 경로는 포털 사용자들이 가진 다양한 교육문화지역적 배경을 고려하지 못한다는 단점을 갖는다. SW-Suomi.fi(Semantic Web-Suomi.fi)는 이러한 문제를 온톨로지에 기반하여 콘텐츠에 대한 다중 패싯 디렉터리 체계를 제공하는 방식으로 해결한다. 다중 패싯 탐색의 기본 아이디어는 다양한 사용자의 상이한 패싯 선호도를 반영할 수 있도록 하나의 콘텐츠에 이르는 패싯 경로를 다중화시킨다는 것이다. 예를 들어, 하나의 콘텐츠는 토픽 관점에서 하위 토픽 경로를 따라 내려 가며 발견될 수도 있고, 어린이학생구직자주부 등 검색자의 현재 직업에 따라 세부 직업 경로를 추적하여 찾아질 수도 있도록 하나의 콘텐츠에 다양한 패싯 정보를 할당해 두는 것이다.

SWWS(Semantic Web enabled Web Services) 포털은 유럽연합 과제인 SWWS의 홍보를 위해 만들어졌으며 프로젝트 주체 및 그 성과물들에 대한 정보로 구성된 도메인 온톨로지에 기반한 정보 서비스를 제공한다. 이 포털은 앞서 기술한 도메인 온톨로지와 더불어 포털 사이트에 대한 시각화 온톨로지를 추가로 사용하고 있다[14]. 이것은 포털 사이트에 보여지는 개체들을 온톨로지화한 것으로 시맨틱 웹 포털과 온톨로지 간의 내용적 동기화를 달성하기 위해 필수적으로 요구되는 온톨로지라 할 수 있다. 포털에 대한 시각화 온톨로지를 구성한 시도는 다른 시맨틱 웹 포털 사이트의 사례에서 찾아볼 수 없는 것이다.

칼스루헤 포털(Karlsruhe Portal)은 잘 알려진 최초의 시맨틱 웹 포털 중 하나로서 지식 획득 커뮤니티의 지식 태깅(Knowledge Annotation Initiative of Knowledge Acquisition Community: KA2)을 목표로 정보 교류와 협업을 위한 플랫폼을 목표로 독일의 칼스루헤 대학(University of Karlsruhe)에서 개발한 것이다. 초기의 KA2 포털은 Person, Project, Organization, Publication, Research Topic, Event 등의 핵심 클래스를 포함하는 온톨로지에 기반하여 개발되었으며, 현재는 더 이상 유지/보수되고 있지 않다[14],[21].

III. 국내 기술 동향

2006년은 국내 시맨틱 웹 분야에 있어서 실제적인 원년으로 볼 수 있으며, 이에 따라 관련시장 규모를 올해는 190억 원으로, 2010년에는 최대 3,260억 원으로 확대될 것으로 전망하고 있다[26]. 세계적으로는 2010년에 국내보다 훨씬 큰 400~600억 달러에 달하는 시장이 형성될 것으로 보고 있다. 그렇지만, 학계뿐만 아니라 업체 등에서도 최근 1~2년 사이에 시맨틱 웹에 대한 관심이 부쩍 늘어난 데 반해, 시맨틱 웹 포털을 비롯하여 관련 연구들의 상용화 수준은 아직까지 프로토타입 범위를 크게 벗어나지 못하고 있다. 국내의 경우, 기술의 발전 정도를 보아 시맨틱 웹 포털과 기타 지식 관리 시스템, 응용 서비스를 구분하는 것이 큰 의미를 가지고 있지는 않다. 그렇지만, 본 고에서는 이들에 대한 구분을 통해 국내 기술 동향을 세분화하고자 한다. 국내 기술 동향 중 시맨틱 웹 포털을 중심으로 살펴본다면, 한국과학 기술정보연구원(KISTI)과학 기술정보 포털서비스, 한국문화콘텐츠진흥원(KOCCA)문화콘텐츠 유통정보 포털시스템, 그리고 한국정보문화진흥원(KADO)국가지식 포털을 꼽을 수 있다.

. KISTI과학 기술정보 포털서비스

KISTIyesKiSTi.net을 통해 200411월부터 과학 기술정보 포털서비스를 제공하고 있다[30]. 이를 위해 국내 최대 수준인 약 4,800만 건 규모의 논문, 연구 보고서, 특허, 분석, 동향, 인력, 과학 세미나 동영상 등 7DB에 대한 통합 검색 및 상세 검색을 지원하고 있다. 또한, 포털의 주요 기능들에 해당하는 메일링 서비스, 원문 서비스 등의 각종 정보 서비스, 커뮤니티 및 블로그로 구성된 지식 공유넷, 해외 과학 기술 동향 및 분석 보고서 등의 과학 기술 데이터를 제공함으로써 국내 최대의 과학 기술 정보 포털 사이트로서의 역할을 수행하고 있다. KISTI는 향후 진정한 시맨틱 웹 포털로서의 변신을 위해 2004년부터 지식 기반 정보유통 플랫폼 개발 사업을 추진하고 있다[1],[13].

이 사업은 시맨틱 웹과 정보 자원 공유 기술의 심화 연구와 융합을 통해 방대한 양의 과학 기술 정보 자원을 효율적으로 공유하고 유통시킬 수 있는 정보유통 체계인 OntoFrame-K®를 구축하는 것을 목표로 한다. 이를 위해 세계 최초로 시도하는 URI(Uniform Resource Identifier) 기반의 온톨로지 모델링을 포함하여 과학 기술 분야 시소러스 구축, 과학 기술 분야 분류 체계 연계, 국가 과학 기술 기반정보 온톨로지 구축, DBMS 기반 추론 서비스 및 전문 용어 생명주기 관리 시스템 등을 연구개발하고 있다. URI 기반의 온톨로지 모델링은 온톨로지에 표현될 인스턴스의 신원을 관리하기 위해 개별 클래스에 종속적인 URI식별 체계에 따라 고유한 인스턴스 ID를 할당할 수 있도록 하며, 인스턴스 ID의 생성, 저장, 검색 등의 관리를 위해 별도의 URI서버를 사용한다는 데 그 특징이 있다[2]. 이를 통해 대다수 시맨틱 웹 연구들이 간과하고 있는 개체 확인(Identity Resolution) 문제를 해결하고 온톨로지 상의 인스턴스가 가지는 관계(Property)들의 정합성을 보장할 수 있다는 장점이 있다.

KISTI는 또한 현재 공개되거나 상용화된 외국 추론 엔진들인 JENA, KAON2, RacerPro, OntoBroker 등이 가지는 성능 상의 불안정성을 배제하고자 schema-aware 방식의 DBMS 기반 Triple Store 상에서 전방향 추론(Forward-chaining Inference)을 수행함으로써 지식을 안정적으로 확장할 수 있도록 한다. 이 때 URI 서버를 동시에 활용하는데 이 방법 또한 세계 최초로 시도되는 것이다. 현재 국내 학술 대회 논문집 및 논문지 1만여 건을 대상으로 프로토타입을 구축하고 있으며, 향후 시범 서비스를 통한 검증 이후 과학 기술 정보 포털 서비스에 탑재하는 것을 목표로 하고 있다((그림 7) 참조).

. KOCCA문화콘텐츠 유통정보 포털시스템

KOCCA에서 추진 예정인 문화콘텐츠 유통정보 포털시스템은 디지털 환경에서 문화 콘텐츠 기업간 OSMU(One Source Multi Use)1) 활성화를 위한 유통 정보 서비스를 구축하고, 원활한 협력을 위한 커뮤니티를 제공하여 국가 차원의 OSMU 활성화 기반을 조성하는 것을 목표로 하고 있다. 결국 이용자가 편리하게 관련 정보를 검색 및 활용할 수 있도록 KOCCA 내의 전 시스템을 단일화된 접근 경로로 제공할 수 있도록 하고자 한다[28]. 시맨틱 웹 포털로서 시맨틱 웹 기술을 도입하고자 하는데, 그 대상으로 의미 기반의 정보 연계성을 확보하기 위하여 온톨로지 기법을 도입하여 이용자가 쉽게 검색할 수 있도록 하는 온톨로지 통합 검색이 있다((그림 8) 참조).

이를 위해 검색 대상 정보들에 대해 메타데이터를 먼저 정의하고 이를 기반으로 상위 레벨 온톨로지와 하위 레벨 온톨로지를 정의함으로써 각 데이터 간의 관계를 설정한다. 또한, 터치 그래프 기능을 통한 검색 지원, 온톨로지 병합(Merge)을 위한 읽기 권한의 다중 토픽 맵(Topic Map) 접근 지원 등의 부가 기능을 제공하고자 한다. 그렇지만, 온톨로지의 활용을 데이터간 연계 증대 측면에서만 한정하고 있고, 메타데이터 추출 시, KISTIURI 서버와 같은 개체 확인(Identity Resolution) 해결 방안을 고려할 필요가 있다.

. KADO국가지식 포털

KADO는 현재 국가지식 포털 프로젝트를 기획 중에 있다. 이를 위해 선행 연구 과제로서 국가지식정보 온톨로지 표준 개발을 수행할 예정이다[29]. 이 온톨로지 표준을 통해 KADO에서 추구하고자 하는 지식 포털을 예측할 수 있을 것으로 보이는데, 온톨로지 표준의 목표는 현재 비구조화되어 있고 의미적으로 상호운용성이 확대되지 않은 지식 정보 자원들을 구조화함으로써 One-stop 지식 검색 서비스를 제공하는 데 있다. 이를 위해 국가 지식 정보를 제공하고 서비스하는 모든 공공 및 민간에서 공통적으로 활용될 수 있는 온톨로지 구축 방법에 대한 표준 모델을 개발하고 온톨로지를 적용한 지능형 지식 정보 검색 서비스와 국가 지식 정보 차세대 서비스의 구조화 전략을 제시할 것을 요구하고 있다. 또한, 이들이 적용된 국가 지식 포털의 온톨로지 프로토타입을 구현하여 국가 지식 정보 이용 활성화에 기여하는 모델을 구현하고자 한다. 이러한 선행 연구를 통해 얻어지는 국가지식 포털은 궁극적으로 국가 지식 정보 이용 활성화에 기여하고 정책 수행자 입장에서 현장 활용도 제고 및 산업적 파급 효과로 이어질 수 있도록 할 것으로 기대한다. 다만, 아직까지 본격적으로 사업이 이루어지지 않아 그 최종 형태에 있어서도 단순한 검색 시스템의 고도화에 그칠 것인지 다양한 시맨틱 웹 기술들이 적용되어 진정한 시맨틱 웹 포털로서의 모습을 갖출 것인지를 가늠하기 힘든 상황이다.

그 외의 국내 기술 동향으로는 LG CNS에서 추진중인 기존 KMS를 시맨틱 웹 기반으로 재구축하는 시맨틱 지식 관리 시스템(KMS) 구축 프로젝트, 한국교육학술정보원(KERIS)에서 추진중인 KERIS 의미 기반 검색 시스템 시범구축 사업 등이 있다. LG CNS 프로젝트의 경우 참여 인력, 기술 영업과 같은 프로젝트 내의 다양한 정보를 온톨로지 기반으로 구축하여, 다른 연관 프로젝트에서 재활용하기 위한 목적을 가지고 있다. KERIS의 경우 교육학 분야 온톨로지를 구축하고 이에 기반하여 검색 시스템을 구축하는 것을 목표로 하고 있다. 온톨로지 구축 자료 유형은 약 10만 건 이상의 학위 논문과 학술 논문을 포함하고 있으며 100여 개 이상의 클래스로 구성된 온톨로지를 설계개발중에 있다. 시맨틱 주석(Annotation) 도구를 이용하여 학술 정보의 원문, 초록 등으로부터 온톨로지에 기술된 메타데이터를 추출하여 F-Logic 기반의 Onto Broker를 활용하여 검색 결과를 제시하고자 한다. 이외에도 KTF에서 준비중인 시맨틱 웹 기반 모바일 서비스와 SKT에서의 시맨틱 웹 기반 자사 정보 인프라 구축 등이 관심을 모으고 있다. 네이버, 야후, 네이트 등 국내 포털들 역시 시맨틱 웹에 관심을 많이 가지고 있으나 본격적인 연구와 도입은 미진한 상태이다.

IV. 결 론

포털 사이트의 구축에는 온톨로지와 같은 데이터 모델 외에도 포털의 외양 및 사용자 인터페이스와 관련된 네비게이션 모델(Navigation Model), 프리젠테이션 모델(Presentation Model), 개인화 모델(Personalization Model) 등의 사이트-인터페이스 모델이 반영된다[4],[12],[17]. 그렇지만 기존의 웹 포털들은 대부분 데이터 모델과 사이트-인터페이스 모델이 개발자 및 구축자의 머리 속에 내재되어 있거나 포털 사이트 생성 코드에 하드 코딩되어 있었다. 따라서, 이상적인 시맨틱 웹 포털을 지향하기 위해서는 포털의 데이터 모델을 온톨로지로 구축함과 동시에 포털의 사이트-인터페이스 모델 역시 온톨로지로 명시적으로 표현하여 관리할 필요가 있다[4],[12],[15],[17]. 결국 포털에서 제공되는 데이터와 사용자 인터페이스까지 온톨로지로 관리하게 되면, 포털의 콘텐츠와 포털 인터페이스 간의 내용적 동기화를 획득할 수 있게 되고 콘텐츠 스키마나 웹 포털의 구조 변경에 용이하게 대처할 수 있는 장점을 얻게 된다.

마지막으로, 시맨틱 웹 포털을 구축함에 있어서 시맨틱 웹 포털 구축용 방법론(SEAL[18])이나 자동화 도구(KAON portal tool[23], ODESeW[5], OntoWeaver[16], OntoWebber[12], SWED portal tool , OntoViews[19])의 사용은 포털의 구축 및 유지 보수를 체계적이고 경제적으로 달성하도록 도와준다는 측면에서 적극 장려되어야 한다. 전문 도구의 사용은 온톨로지나 포털 구조 변경 시, 해당 수정 내용을 포털에 반영하는 시간을 획기적으로 줄일 수 있을 것으로 기대된다. 또한, 초기 구축된 시맨틱 웹 포털의 온톨로지 데이터가 통제할 수 없을 정도로 점차 늘어나게 될 때, 대용량 온톨로지 관리 측면에서도 앞으로 시맨틱 웹 포털에서 포털 구축용 도구의 사용은 피할 수 없는 선택이 될 것이다.

<참 고 문 헌>

[1]    정한민, 국가 R&D 기반정보 온톨로지 기반 추론서비스, 4회 지식정보처리와 온톨로지 워크숍, 2006.

[2]    정한민, 강인수, 구희관, 이승우, 성원경, URI 서버에 기반한 국가 R&D 기반정보 온톨로지 설계 및 구현, 정보관리연구 37(2), 2006.

[3]    Benjamins, R., Fensel, D., and Decker, S., KA2: Building Ontologies for the Internet: A Midterm Report, International Journal of Human Computer Studies 51(3):687-713, 1999.

[4]    Ceri, S., Fraternali, P., and Bongio, A., Web Modeling Language(WebML): A Modeling Language for Designing Web Sites, Computer Networks 33:137-157, 2000.

[5]    Corcho, Ó., Gómez-Pérez, A., López-Cima, A., López-García, V., and María del Carmen Suárez-Figueroa, ODESeW: Automatic Generation of Knowledge Portals for Intranets and Extranets, Proceedings of the 2nd International Semantic Web Conference, Oct. 20-23, Florida, USA, 2003, pp.802-817.

[6]    Decker, S., Erdmann, M., Fensel, D., and Studer, R., Ontobroker: Ontology Based Access to Distributed and Semi-Structured Information, Proceedings of IFIP TC2/WG2.6 8th Working Conference on Database Semantics(DS-8), Jan. 4-8, Rotorua, New Zealand, 1999, pp.351-369.

[7]    Fröhlich, P., Nejdl, W., and Wolpers, M., KBS-HYPERBOOKAn Open Hyperbook System for Education, Proceedings of the 10th World Conference on Educational Media and Hypermedia, Jun., Freiburg, Germany, 1998.

[8]    Goble, C.A., Bechhofer, S., Carr, L., Roure, D.D., and Hall, W., Conceptual Open Hypermedia = The Semantic Web?, Proceedings of the 2nd International Workshop on the Semantic Web, May 1, Hong Kong, China, 2001.

[9] Gruber, T.R., A Translation Approach to Portable Ontology Specifications, Knowledge Acquisition 5(2):199-220, 1993.

[10] Hayward, B., The Future Impact of IT on IS and Library Service Delivery, ALIA 2004 Biennial Conference, 2004.

[11]  Heflin, J., Web Ontology Language(OWL) Use Cases and Requirements, W3C Working Draft, 2003.

[12] Jin, Y., Decker, S., and Wiederhold, G., OntoWebber: Model-Driven Ontology-Based Web Site Management, Proceedings of the 1st Semantic Web Working Symposium, Jul. 30Aug. 1, California, USA, 2001, pp.529-547.

[13]  Jung, H., OntoFrame-K: Semantic Web-based Information Dissemination Platform, The 9th International Forum on Metadata Registry, 2006.

[14] Lausen, H., Stollberg, M., Hernández, R.L., Ding, Y., Han, S.K., and Fensel, D., Semantic Web PortalsState of the Art Survey, Technical Report(2004-04-03)of Digital Enterprise Research Institute(DERI), 2004.

[15] Lei, Y., Motta, E., and Domingue, J., An Ontology-Driven Approach to Web Site Generation and Maintenance, Proceedings of the European Knowledge Acquisition Workshop(EKAW-2002), Oct. 1-4, Siguenza, Spain, 2002, pp.219-234.

[16] Lei, Y., Motta. E. and Domingue, J., Design of customized web applications with OntoWeaver, Proceedings of the 2nd International Conference on Knowledge Capture, Oct. 23-25, Florida, USA, 2003, pp.54-61.

[17] Lin, C., Zhang, L., Zhou, J., Yang, Y., and Yu, Y., SPortS: Semantic + Portal + Service, Proceedings of the ECAI-2004 Workshop on Application of Semantic Web Technologies to Web Communities, Aug. 23-27, Valencia, Spain, 2004.

[18] Maedche, A., Staab, S., Studer, R., Sure, Y., and Volz, R., SEAL-Tying Up Information Integration and Web Site Management by Ontologies, IEEE Data Engineering Bulletin 25(1):10-17, 2002.

[19] Mäkelä, E., Hyvönen, E., Saarela S., and Viljanen, K., OntoViews - A Tool for Creating Semantic Web Portals, Proceedings of the 3rd International Semantic Web Conference, Nov.7-11, Hiroshima, Japan, 2004, pp.797-811.

[20]  Reynolds, D., Cayzer, S., Shabajee, P., and Steer, D., SWAD-E Demonstrators - Lessons Learnt, SWAD-Europe deliverable 12.1.8(http://www.w3.org/2001/sw/Europe/reports/demo_2_report/), 2004.

[21] Staab, S., Angele, J., Decker S., Erdmann, M., Hotho, A., Maedche, A., Schnurr, H.P., Studer, R., and Sure, Y., Semantic community Web portals, Computer Networks 33(1-6):473-491, 2000.

[22] Sidoroff, T., and Hyvönen, E., Semantic E-government Portals-A Case Study, Proceedings of the ISWC-2005 Workshop Semantic Web Case Studies and Best Practices for eBusiness (SWCASE05), Nov.6-10, Galway, Ireland, 2005.

[23] Volz, R., Oberle, D., Staab, S., and Motik, B., KAON SERVER-A Semantic Web Management System, Proceedings of the 12th International World Wide Web ConferenceAlternate Tracks, May 20-24, Budapest, Hungary, 2003.

[24] Wiederhold, G., and Genesereth, M., The Conceptual Basis for Mediation Services, IEEE Expert 12(5):38-47, 1997.

[25]  http://www.sapdesignguild.org/editions/edition3/portal_definition.asp

[26]  http://www.ebuzz.co.kr/content/buzz_view.html?ps_ccid=5995

[27]  http://www.kocca.or.kr/ctnews/kor/SITE/data/html_dir/2005/04/13/200504130009.html

[28]  http://www.kocca.or.kr/_New/not_main/notice_read.jsp

[29]  http://www.kado.or.kr/index.aspx?PortalID=ko&MenuID=0510041347413146

         &template=Bid&control=View.ascx&seq=13419&idx=1

[30]  http://www.yeskisti.net/yesKISTI/index.jsp

[31]  http://www.blogwriteforceos.com/blogwrite/files/attr_129930_115.pdf



1) 2003년도 한국문화콘텐츠진흥원의 연차보고서에 의하면, OSMU우수한 기획을 통해 제작된 1차 콘텐츠를 시장에 성공시킨 후 재투자 및 라이선스를 통해 2, 3차 콘텐츠로 발전시키는 전략으로 정의되고 있다[27].