LOD 시범 서비스

LOD 시범 서비스는 정보소통광장이 단순히 문서 위주의 공개 서비스에 그치지 않고, 미래DB 신기술인 개방형 연결 데이터(LOD)를 행정정보에 접목한 발행·활용 서비스를 통하여 정보공개 서비스의 지평을 새롭게 열기위한 시범 서비스 입니다.

LOD (개방형 연결 데이터, Linked Open Data)

Linked Open Data는 Linked Data와 Open Data의 합성어입니다. Linked Data가 정보 기술적인 면이 강한 반면 Open Data는 정보 문화적인 면이 강한 용어입니다. 우리말로는 '개방형 연결 데이터'라고 하는데(@TTA 정보통신용어사전), 개방형 연결 데이터(LOD)는 사용자가 정확하게 원하는 정보를 찾을 수 있도록 웹상의 모든 데이터와 데이터베이스를 공개하고 연결한 것으로, 다양한 웹표준(RDF, URI 등)에 따라 인터넷에 공개된 방대한 정보들 중 서로 관련 있는 것들을 연계·공유하는 기술입니다.

LOD를 적용한 행정정보를 제공함으로써 인터넷에 있는 다양한 자료와 연결·공유된 정보를 이용자가 활용할 수 있게 하고, 이를 통하여 정보소통광장의 행정정보 공개서비스가 단순 공개가 아닌 행정정보 지식 서비스로 거듭나도록 하고 있습니다.

특히 행정정보 공개포털에서 LOD 서비스를 제공하는 것은 첫 시도로, 올해 정보소통광장에 시범 구축한 뒤 내년부터는 서비스를 더욱 고도화하여 결재문서 및 사전정보공표 등 핵심 행정정보에까지 확대할 예정입니다.

 

Open Data의 원칙

Open Data는 누구나 자유롭게 사용하고 재사용하고 재배포할 수 있는 데이터를 의미하는데, 다음과 같은 조건을 만족시킬 수 있어야 합니다. (@Open Knowledge Foundataion, 2012 인용)

가용성과 접근성(Availability and Access)
데이터는 인터넷을 통해서 다운로드 받을 수 있어야 하고, 합리적인 비용으로 원천데이터를 변환하거나 새로운 저작물 생산이 가능해야 함. 또한 데이터는 편리하게 수정 가능한 형태로 제공해야 함.
재사용과 재배포(Reuse and Redistribution)
데이터는 다른 데이터셋과 조합하여 사용하는 것을 포함한 재사용, 재배포가 가능한 형태(가능하면 관련 라이센스나 법제도적 조항)여야 함.
모두의 참여(Universal Participation)
모든 사람이 사용, 재사용, 재배포할 수 있어야 함. 예를 들어 상업적, 비상업적 이용에 대한 제한 혹은 특정목적(교육용 등)을 위한 이용의 제한 등이 없어야 함.

 

Linked Data의 특징

Linked Data는 이미 거대한 정보생태계를 갖추고 있는 웹에 구조화된 데이터를 연결하고 발행(publishing)하기 위한 방법으로서 이렇게 발행된 데이터들은 상호 연결되어 보다 유용하게 사용될 수 있습니다.

※Linked Data는 HTTP, RDF, URIs와 같은 웹표준 기술을 활용하고 자동적으로 컴퓨터(기계)가 읽고 처리할 수 있는(Machine readable and processable) 방식으로 정보를 공유함.
※Linked Data는 서로 다른 출처로부터의 데이터들이 서로 연결되고 또한 질의가 가능함.

 

Linked Open Data

Linked Open Data는 사람의 이해와 활용을 전제한 문서 중심의 웹(web of documents)을 기계도 또한 사람처럼 이해하고 자동으로 처리할 수 있는 데이터 중심의 웹(web of data)으로 구축하는 것입니다. 누구나 활용할 수 있도록하기 위해서는 웹에 개방되는 데이터들이 표준화된 형식을 준수해야 하고, 어떤 분야에 어떻게 활용될 수 있는지 명확하게 정의되어야 합니다. 이런 데이터 중심의 웹이 구현되면 열린 데이터의 조합을 기반으로 누구나 다양하고 새로운 서비스를 개발할 수 있습니다. 이런 의미에서 LOD는 기존의 정보 개방 혹은 데이터 개방과 다르게 새로운 서비스 실현을 가능하게 하기 때문에 가장 적극적인 형태의 개방형태라고 할 수 있습니다. Linked Open Data에 대한 것은 아래 팀버너리(Tim Berners Lee)의 TED영상(The next web of open, linked data)에서 보다 자세히 보실 수 있습니다.

 

SPARQL(SPARQL Protocol And RDF Query Language)란

SPARQL은 자원 기술 프레임워크(RDF: Resource Description Framework) 기반의 데이터베이스에 사용되는 시맨틱 질의 언어(semantic query language)입니다. 관계형 데이터베이스로부터 자신이 원하는 데이터를 가져오기 위해 SQL이란 표준 질의언어를 사용하는 것과 마찬가지로 LOD 플랫폼에서는 SPARQL이란 질의언어를 이용하여 자신이 원하는 데이터를 질의하여 사용할 수 있습니다.

 

정보소통광장의 LOD 시범 활용서비스

정보소통광장의 'LOD 시범 활용서비스'는 사진 아카이브와 시보 기록물에 우선 적용하여 제공하게 되는데, 한국문화정보원의 ‘대한늬우스’를 LOD 방식으로 연계하여 실시간 서비스함으로써 사진 아카이브나 서울 시보를 보던 시민에게 해당 시기의 시대상까지 보다 쉽게 확인할 수 있도록 서비스를 제공합니다.

시민에게 시대상이라는 넓은 의미의 맥락을 함께 제공하기 위하여, 문화융합LOD 서비스 중 ‘대한늬우스’를 LOD의 SPARQL질의 방식으로 실시간 연계하여 시범 서비스를 제공하며, 서비스 안정화 등을 검토하여 점차 서비스를 고도화할 계획입니다. 이러한 시범 활용서비스를 통하여 LOD 활용에 대한 가능성을 타진하고 시민의 알권리와 정책의 설명책임성을 더욱 높일 수 있는 고도화된 서비스를 기획할 수 있는 기반이 될 것입니다.

 

정보소통광장의 LOD 시범 발행서비스

정보소통광장 행정정보를 어디서나 손쉽게 가져가갈 수 있도록 제공하는 'LOD 발행 시범서비스'는 우선 '정책연구자료'6천여건을 대상으로 제공됩니다. 정책연구자료는 기술용역·학술용역의 성과품 및 보건환경연구원, 서울연구원 등 각 기관에 산재되어 있던 정책연구자료를 한곳에 모아서 서비스하는 창구입니다. 정책연구자료는 이번 LOD 시범 서비스를 통하여 공개된 행정정보의 활용가치를 더욱 높이고, 해당 자료가 공공데이터로서 더 많은 서비스로의 재확산이 가능하도록 보다 체계적인 서비스를 제공하고 있습니다.

예를 들어, LOD 방식으로 보건환경연구원의 “석면 비산안정화제의 성능평가 방법과 고형화” 같은 환경 관련 정책연구자료를 발행하면, 이를 필요로 하는 환경단체나 학술·연구기관 등에서 마치 내부의 데이터베이스를 연계한 것처럼 인터넷을 통해 실시간으로 쉽게 해당 자료를 연계·서비스할 수 있게 됩니다.

 

참고자료