Ⅴ. 한글 문화유산 지식 정보 데이터 모델 설계


1. 한글 문화유산 지식 정보 데이터 모델 개발 전략


 1) 한글 문화유산에 관한 범국가적 지식 유통망 구상


 - 한글박물관이 유물의 소장 여부와 무관하게, ‘한글 문화유산’에 관한 지식의 소통에 기여한다는 전제에서 출발한다.


 - 향후 한글박물관뿐 아니라 국내외 모든 기관, 개인 소장 ‘한글 문화재’의 소재에 관한 정보가 이 지식 정보망에 포함되는 것을 지향한다.


 - 한글 문화재에 관한 실물 정보뿐 아니라, 인터넷 상에서 공유될 수 있는 다양한 디지털 자원을 적정하게 기술하고, 이것이 실물 정보 및 소장 정보에 연계, 활용될 수 있는 장치를 마련한다.


 - 한글 문화유산과 관련된 인물, 장소, 역사적 사건 등에 관한 지식을 정보화하고, 이를 매개로 한글 문화유산에 관한 다양한 지식이 서로에 대해 의미를 갖는 연계망을 형성하도록 한다. ☞ Storytelling


 2) 문화유산 분야 디지털 데이터의 재이용 및 교환에 관한 선진 모델 도입


 - 디지털 가상 박물관의 선도적 모델인 Europeana의 데이터 모델 EDM(Europeana Data Model)과 ICOM(International Council of Museums)의 문화유산 데이터 스키마 LIDO(Lightweight Information Describing Object)를 벤치마킹한다.


 - Europeana는 자체 콘텐츠를 갖지 않고, 유럽 제국의 박물관, 미술관, 도서관 및 다양한 문화 예술 분야의 Digital Library가 제공하는 콘텐츠를 집적하여 세계 최대 규모의 가상 박물관을 구현하고 있어, 성공적인 Semantic Web 개념의 문화 예술 포털(Web of Data)로서, 한글 디지털 아카이브의 모델로 적합하다고 판단된다.

 - 단, Europeana는 EU의 정책적 지원과 참여 기관 사이의 긴밀한 협력을 기반으로 구현된 것인 데 반해, 디지털 한글 아카이브는 당분간 그와 같은 제도적 지원을 기대할 수 없는 상황이므로, Europeana의 장점을 최대한 수용하면서 우리의 환경에 현실적으로 적용할 수 있는 방향으로 데이터의 틀을 재구성하기로 한다.



2. 데이터 모델 설계 원칙 및 수행 과제


 1) 전제


 - 국립한글박물관은 (한글 문화유산에 관한 국가 대표 지식 서비스 기관으로서) 한글 문화유산에 관한 망라적인 지식 정보 서비스 기능을 수행할 수 있어야 한다.


 - 국립한글박물관은 현존하는 한글 문화유산의 일부를 수집·소장하고 있으며, 이를 보존, 전시하는 기능을 수행한다.


 2) 설계 원칙


 ① 지식 정보 시스템과 유물 관리 시스템의 이원화


   국립한글박물관은

 - (한글 문화유산에 관해) 국가를 대표하는 하나의 지식 관리 시스템과

 - 이것과 연계된 수많은 소장 유물 관리 시스템(박물관, 도서관, 연구소) 중 하나를 운영


 ② 국립한글박물관의 유물 관리 시스템은 현재 운영 중인 ‘표준 유물 관리 시스템’을 활용


 ③ 지식 정보 시스템의 콘텐츠는 국립한글박물관이 모든 것을 생산 · 보유하는 것이 아니라 다양한 관련 자원을 집적 · 연계하는 형태로 존재


 3) 수행 과제


 ① 한글 문화유산 지식망을 이루는 개별 자원의 성격을 파악하여 유형별로 객체화하고, 그것의 속성을 명시적으로 표현할 수 있는 데이터 모델 설계


 ② 한글 문화유산 및 관련 객체에 대한 식별자(URI) 제정


 - 가치 있는(국민들이 알아야 할) ‘한글 문화유산’ 하나하나를 객체(Object)로 상정하고 이를 유일하게 식별할 수 있게 하는 식별자 – Hangeul Heritage Identifier

 - 한글 문화유산을 설명할 때 필요한 역사적 문화적 관련 객체를 유일하게 식별할 수 있게 하는 식별자: 인물(Agent), 공간(Place), 시간(Time Span), 개념(Concept) – Contextual Knowledge Identifier


 ③ 정보 자원의 속성 및 유관 자원과의 관련성을 명시적으로 드러내는 술어(Predicate)의 이름 공간(Namespace) 제정


 ④ 1, 2, 3의 기반 위에서 수집·조사된 자원의 관계성을 정의하고 이를 데이터베이스에 수록



 

[그림 5-1] 한글 문화유산 자원이 만들어내는 의미망




 [그림 5-2] 한글 문화유산 의미망에서 도출되는 지식 정보 서비스


3. 한글 문화유산 지식 정보 데이터 모델((hhdm: Hangeul Heritage Data Model): 클래스 구조/식별자/이름 공간


 1) 클래스 구조


  3 개의 핵심 클래스와 1 개의 문맥 데이터 클래스 (4 종의 하위 클래스 포함), 1 개의 참고문헌 클래스로 구성


 ① 핵심 클래스(Core Classes):


 - hhdm:HangeulHeritageKnowledgeObject – 한글 문화유산 지식 정보

 - hhdm:HoldingInformation – 한글 문화유산 소장 정보

 - hhdm:WebResource – 한글 문화유산 관련 월드 와이드 웹 자원


 ② 문맥 데이터 클래스(Contextual Classes):


 - hhdm:ContextualKnowledgeObject – 한글 문화유산 연계 지식 정보

. Agent - 인물, 기관

. Place - 공간(장소)

. TimeSpan - 시간(사건, 연대)

. Concept - 개념, 용어


 ③ Bibliography Class:


 - hhdm:Bibliography – 연구 성과 참고 문헌


 2) 한글 문화유산 지식 객체 식별자(Knowledge Object Identifiers for Hangul Heritage)


 - 유물: http://www.hangeul.go.kr/hhterms/Heritage/ ~

 - 인물: http://www.hangeul.go.kr/hhterms/Agent/ ~

 - 공간: http://www.hangeul.go.kr/hhterms/Place/ ~

 - 시간: http://www.hangeul.go.kr/hhterms/TimeSpan/ ~

 - 개념: http://www.hangeul.go.kr/hhterms/Concept/ ~


  ※ 객체 식별자가 필요한 이유:


 - 월드 와이드 웹의 세계에서 관련 지식 객체 사이의 명확한 ‘관계 맺음’을 이루기 위한 첫 번째 요건.1)

 - 강제적인 데이터 통합 장치가 없는 상황에서, 자율적인 ‘관계성 기술’만으로 지식 연계망의 구현이 가능할 것을 기대. (Linked Open Data)

 - 특정 분야 국가 지식 포털의 기능을 수행하려는 공공 기관에서 선도적으로 수행해야 할 과제.


 3) 한글 문화유산 지식 정보 기술을 위해 사용하는 이름 공간(Namespace)


        dc: http://purl.org/dc/elements/1.1/

        dcterms: http://purl.org/dc/terms/

        edm: http://www.europeana.eu/schemas/edm/

        wgs84_pos: http://www.w3.org/2003/01/geo/wgs84_pos#

        foaf: http://xmlns.com/foaf/0.1/

        rdaGr2: http://rdvocab.info/ElementsGr2/

        oai: http://www.openarchives.org/OAI/2.0/

        owl: http://www.w3.org/2002/07/owl#

        rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#

        ore: http://www.openarchives.org/ore/terms/

        skos: http://www.w3.org/2004/02/skos/core#

        lido: http://www.lido-schema.org

        bibo: http://purl.org/ontology/bibo/

        hhdm: http://www.hangeul.go.kr/hhterms/


  ※ 이름 공간(Namespace)을 사용하는 이유


 - 한글 문화유산 지식 정보의 다양한 속성을 명시적으로 표현하기 위해 사용.

 - 속성 이름을 새롭게 정의하기보다는 월드 와이드 웹의 세계에서 널리 통용되고 있는 이름을 사용함으로써 데이터의 소통성 확보

 - 한글 문화유산 지식을 전자적으로 기술하기 위해 사용하는 이름 공간은 대부분 Europeana가 사용하는 것을 차용



4. 한글 문화유산 지식 정보 데이터 모델((hhdm: Hangeul Heritage Data Model): 클래스별 속성(Property)


   한글 문화유산 지식 정보 시스템은 아래 그림에서 보이는 바와 같이 5개의 클래스로 구성된다.


[그림 5-1] 한글 문화유산 지식 정보 시스템


  5개 클래스에 대해서 다음과 같은 속성(Property)을 부여하였다.



 1) hhdm:HangeulHeritageKnowledgeObject


        /* Primary Key */

Property Name

설명

비고

dc:identifier    

식별자

hhdm URI: 유물

 


        /* 외부 자원 연계 */

Property Name

설명

비고

edm:isShownAt

외부 자원 URL

※ 이 오브젝트의 콘텐트를 외부 자원으로 대체할 때 사용

 

edm:provider

외부 자원의 서비스 주체

※ 이 오브젝트의 콘텐트를 외부 자원으로 대체할 때 사용

※ the organization providing data to directly to the public


        /* Multimedia Objects */

Property Name

설명

비고

edm:isShownBy

오브젝트에 포함된 대표 이미지

 

edm:hasView

오브젝트가 포함하는 멀티미디어 데이터

 


        /* Data Provider & Copyright Statement */

Property Name

설명

비고

edm:dataProvider

데이터 제공자

※ the organization providing data to an service provider.

edm:rights

저작권 표시

 


        /* Basic Desciption */

Property Name

설명

비고

dc:type

유형

 

dc:creator

저자, 작가

 

dc:contributor

대상에 담긴 콘텐츠의 생산자

 

dc:title

제목

 

dc:alternative

이명(별서명) 

※ 외국어 명칭은 xml:lang 속성으로 언어 표시

dc:language

본문의 언어

 

dc:coverage

시간적, 공간적 범위

 

dc:date

날짜

 

dc:subject

주제

 

dc:description

설명

 

dc:source

파생 유물의 원천 자료

 

dcterms:created

제작일

 

dcterms:issued

발행일

 

dcterms:provenance

유물의 출처

 

dcterms:tableOfContents

목차

 

dc:publisher

출판자

 

dc:right

원저작물의 저작권 표시

 

dc:format

포맷, 

※ born-digital object인 경우 data format

 

dcterms:hasFormat

다른 포맷.

※ 다른 format이 있는 경우

 

dcterms:conformsTo

포맷이 준수하는 표준

 

dcterms:medium

매체

 

dcterms:extent

연장, 규격

 


        /* Relations to Other Knowledge Objects: HH & Contextual */

Property Name

설명

비고

dcterms:hasPart

~을 포함

 

dcterms:isPartOf

~의 부분

 

dcterms:hasVersion

이본이 있음

 

dcterms:isVersionOf

~의 이본

 

dcterms:spatial

공간 정보

※ 공간 정보(Place) 식별자를 참조

※ reference Place Objects

dcterms:temporal

시간 정보

※ 시간 정보(TimeSpan) 식별자를 참조

※ reference TimeSpan Objects

edm:incorporates

이것이 사용된 다른 객체

 

edm:isDerivativeOf

~로부터 파생

 

edm:isNextInSequence

큰 범주에 속하는 것 중 ~의 다음

 

edm:isRelatedTo

~과 관계가 있다

 

edm:isRepresentationOf

~을 다른 형태로 표현한 것

 

edm:isSimilarTo

~과 유사

 

edm:isSuccessorOf

~의 속편

 

edm:realizes

~을 구상화한 것

 

owl:sameas

~과 동일

 


        /* Event Description: Event Sub Class */

Property Name

설명

비고

lido:eventID

Event ID

 

lido:eventType

Event type

 

lido:roleInEvent

Object’s role in the event

 

lido:eventName

Event name

 

lido:eventActor

Actors (persons or organisations)

 

lido:culture

Cultural Context

※ reference Concept Objects

lido:eventDate

Date

 

lido:periodName

Period

※ reference TimeSpan Objects

lido:eventPlace

Places

※ reference Place Objects

lido:eventMethod

Event method

 

lido:eventMaterialsTech

Materials and techniques used

 

lido:thingPresent

Other objects present at the event

 

lido:relatedEvent

Related events

 

lido:eventDescription

Description of the event

 

※ 유물의 역사성을 상세하게 기술할 수 있도록 LIDO의 Event Class 차용

 

        /* Subject Description: Subject Sub Class */

Property Name

설명

비고

lido:subjectConcept

Concepts related to the subject of the described object

 

lido:subjectActor

A person, group, or institution depicted in or by an object

 

lido:subjectDate

A time specification depicted in or by an object

 

lido:subjectEvent

An event depicted in or by an object

 

lido:subjectPlace

A place depicted in or by an object

 

lido:subjectObject

An object depicted in or by an

object

 


 2) hhdm:HoldingInformation


Property Name

설명

비고

dc:identifier    

식별자

Primary Key

dc:relation

foreign key for the related HH knowledge object

Foreign Key

skos:prefLabel

소장 정보의 표제

 

skos:note

소장 정보에 대한 설명

 

edm:currentLocation

소장처 

 

edm:isShownAt

소장처의 목록 데이터 식별자

 

edm:isShownby

소장처의 목록 데이터 식별자

 


 3) hhdm:WebResource


Property Name

설명

비고

dc:identifier    

웹 자원 오브젝트 식별자

Primary Key

dc:relation

foreign key for the related HH knowledge object

Foreign Key

edm:type

웹 자원의 유형: TEXT, VIDEO, SOUND, IMAGE, 3D -

 

dc:description

설명

 

dc:format

포맷

 

dc:rights

원저작물의 저작권 표시

 

dc:source

소스

 

dcterms:conformsTo

포맷이 준수하는 표준

 

dcterms:created

제작일

 

dcterms:issued

발행일

 

dcterms:extent

규격, 연장

 

dcterms:hasFormat

다른 포맷을 지원

 

dcterms:hasPart

다른 웹 자원과의 관계: ~를 포함

 

dcterms:isPartOf

다른 웹 자원과의 관계: ~의 부분

 

dcterms:isNextInSequence

다른 웹 자원과의 관계: ~의 다음

 

edm:rights

CotyRight Statement

 


 4) hhdm:ContextualKnowledgeObject


        /* 공통 사항 */

Property Name

설명

비고

dc:identifier    

식별자

hhdm URI: 인물, 공간, 시간, 개념

Primary Key

edm:isShownAt

외부 자원 URL

※ 이 오브젝트의 콘텐트를 외부 자원으로 대체할 때 사용

 

edm:Provider   

외부 자원의 서비스 주체

※ 이 오브젝트의 콘텐트를 외부 자원으로 대체할 때 사용

 

dc:type

유형

 

skos:prefLabel

문맥 정보의 표제

 

skos:altLabel

문맥 정보의 다른 이름

 

skos:note

노트

 

dcterms:hasPart

~을 포함

 

dcterms:isPartOf

~의 부분

 

edm:hasMet

~과 약한 관계

ex) 인물의 경우: ~를 안다.

 

edm:isRelatedTo

~과 관련이 있다.

 

edm:isNextInSequence

큰 범주 안에서 ~의 다음

 

owl:sameAs

~과 동일

 


        /* Sub Class: Agent */

Property Name

설명

비고

rdaGr2:
  biographicalInformation

인물 정보

 

rdaGr2:dateOfBirth

출생일

 

rdaGr2:dateOfDeath

사망일

 

rdaGR2:dateOfEstablishment

설립일

 

rdaGR2:dateOfTermination

종료일

 

rdaGR2:gender

 

rdaGR2:
  professionOrOccupation

직업

 

        

        /* Sub Class: Place */

Property Name

설명

비고

wgs84_pos:lat

위도

 

wgs84_pos:long

경도

 

wgs84_pos:alt

고도

 



        /* Sub Class: TimeSpan */

Property Name

설명

비고

edm:begin

시작

 

edm:end

 

        


        /* Sub Class: Concept */

Property Name

설명

비고

skos:broader

광의의 개념

 

skos:narrower

협의의 개념

 

skos:related

관련어

 

skos:exactMatch

동의어

 

skos:closeMatch

유사어

 

skos:notation

주석

 

skos:inScheme

개념적 관계 틀

※ Ontology, 용어사전 등의 식별자

 


 5) hhdm:Bibliography


        /* Primary Key */

Property Name

설명

비고

dc:identifier

식별자

 


        

        /* Bibliography */

Property Name

설명

비고

dc:type

유형

 

dc:language

언어

 

dc:creator

저자

 

dc:title

제목

 

dc:description

설명

 

dc:date

날짜

 

dc:publisher

출판사

 

bibo:pageStart

시작 면수

 

bibo:pageEnd 

끝 면수

 

        


        /* Journal Article */

Property Name

설명

비고

dcterms:isPartOf

Journal, ISSN

 

bibo:volume

 

bibo:issue

 

        

        

        /* unpublished document */

Property Name

설명

비고

dcterms:isPartOf

collection의 이름

 

bibo:owner

소장자

 

bibo:locator 

소장처

 

        

        

        /* thesis */

Property Name

설명

비고

bibo:degree

학위

 

        


        /* conference proceeding */

Property Name

설명

비고

dcterms:isPartOf

conference proceeding

 

bibo:presentedAt 

회의명

 

bibo:organizer

개최, 주관 기관

 

                


        /* external resource outlink */

Property Name

설명

비고

edm:isShownAt

상세서지 및 원문

※ 외부 자원 식별자

 



1) “Publishing LOD requires a few essential components, the first of which is that each entity must have a unique resource identifier (URI)” (Berners-Lee, 2006).