LOD 시범 서비스

LOD 시범 서비스는 정보소통광장이 단순히 문서 위주의 공개 서비스에 그치지 않고, 미래DB 신기술인 개방형 연결 데이터(LOD)를 행정정보에 접목한 발행·활용 서비스를 통하여 정보공개 서비스의 지평을 새롭게 열기위한 시범 서비스 입니다.

데이터 정보

LOD 시범 발행서비스 - 정책연구자료

정책연구자료는 서울시의 산재된 정책자료와 연구자료를 한데모아 서비스하는 통합 창구로, 가치가 높은 정책연구자료에 LOD를 우선 적용하여 행정정보의 가치를 더욱 극대화하는데 그 목적이 있습니다. 현재 11개 분야, 12개 기관의 정책연구자료 데이터를 트리플로 저장하여 발행하고 있습니다.

 

발행 현황

전체 LOD 발행 현황
문서건수 6,688건 트리플수 124,983건 (2017.06.25. 기준)
정책연구자료의 분야별 LOD 발행 문서건수와 기관별 문서건수를 나타내는 표
분야 문서건수 기관 문서건수
소계6,688건소계6,688건
건강·식품1,038건SH도시연구원70건
경제18건보건환경연구원1,604건
교통·건설2,648건서울디자인재단28건
문화관광150건서울물연구원137건
복지200건서울시복지재단175건
안전37건서울시(기술용역)2,697건
여성 ·가족255건서울시(학술용역)144건
재정·세금4건서울시립대학교서울학연구소100건
주택·도시계획73건서울시여성가족재단269건
행정·기타1,537건서울연구원1,301건
환경728건서울특별시의회135건
--한성백제박물관28건

 

URI의 개념

정보소통광장은 최초 구축되던 2013년부터 World Wide Web의 가치에 부합된 오픕 웹을 만들기 위하여 노력했습니다. 그 노력 중하나가 바로 개별 행정정보(문서)가 독립적인 URI를 갖도록 하는 것이었습니다. 당시 한국의 많은 공공기관이 매개변수 형태 혹은 프레임형태로 URL을 가리는 경우가 많았으나, 정보소통광장을 필두로 오픈웹의 저변이 넓어지게 되었으며, 미래지향적인 환경을 만들기 위하여 개별 행정정보마다 독립된 URI 주소체계를 갖도록 하였고, 이를 통하여 사람과 기계의 접근성을 대폭 높일 수 있었으며, 외부 검색 포털에서도 정보소통광장의 개별 행정정보로 바로 유입할 수 있었으며, 확산이 가능한 구조가 만들어졌습니다. 이러한 정보소통광장의 URI에 대한 철학은 LOD 구축이 용이하도록 한 기반이었습니다.

URI, 통합 자원 식별자(Uniform Resource Identifier)
통합 자원 식별자(Uniform Resource Identifier, URI)는 인터넷에 있는 자원을 나타내는 유일한 주소입니다. URI의 존재는 인터넷에서 요구되는 기본조건으로서 인터넷 프로토콜에 항상 붙어 다닙니다. 1994년 팀 버너스 리가 하이퍼텍스트를 제안하면서 하이퍼링크의 대상이 되는 자원을 대표하는 짧은 문자열로 URL의 개념을 암묵적으로 도입하였습니다.©wikipedia

 

정책연구자료의 메타데이터와 RDF 매핑결과

정책연구자료의 필드명, 기계명, RDF Property를 나타내는 표
연번 필드명 기계명 RDF Property
1제목titledc:title
2초록bodydc:abstract
3본문-dc:description
4목차field_tocdc:tableOfContents
5키워드field_keyworddc:subject
6유형field_clasdc:type
7생산년도field_creat_yrdcterms:temporal
8분야field_categoryschema:category
9지역field_regiondc:spatial
10공개시작일field_bgn_dtdc:date
11생산기관field_sysiddc:publisher
12책임부서field_deptdc:rightsHolder
13책임자field_nmfoaf:givenName
14책임자 연락처field_telnofoaf:phone
15저작권:CCLfield_cclcc:license
16저작권:공공누리field_kogl(미표출)
17생산일field_creat_dtdc:created
18ISBNfield_isbnbibo:isbn
19문서IDfield_dociddc:identifier
20--dc:language
21--dc:URI
22URIdc:source

아키텍처

정보소통광장의 LOD 시범 발행서비는 Apache의 Jena를 기반으로한 아키텍처로 구성되어 있습니다. 시범 서비스 구축과정에서의 노하우와 시행착오, 식별된 개선의 기회를 바탕으로 정보공개 서비스의 패러다임을 혁신할 수 있도록 아키텍처를 지속적으로 고도화할 계획입니다.

정보소통광장 LOD 시범 발행 서비스 아키텍처
정보소통광장 LOD 시범 발행 서비스 아키텍처 설명

정보소통광장 LOD 서비스 Beta는 Apache Jena를 통해 발행이 됩니다.

  1. 정보소통광장(@ opengov.seoul.go.kr)에서는 PostgreSQL(RDB)를 통해 Raw Data(In-memory, custom, TDB, SDB)들을 Apache Jena에 RDB2RDF 표준으로 제공합니다.
  2. Apache Jena에서는 이 Raw Data들을 Triple Store에 저장하고, 다시 Inference API(None, Built for reasoner, External reasoner)로 이동후 RDF API, Ontology API, SPARQL API의 세 가지 API로 저장합니다.
  3. 사용자와 Application code는 HTTP를 통해 Fuseki에 접속하고 Fuseki는 HTTP를 통해 위 세가지 API에 접근할 수 있게 해줍니다.
  4. Application code는 Fuseki를 통하지 않고 직접 위 세 가지 API에 접근 할수도 있습니다.

RDF API에는 Parsers와 writers가 있는데, RDF/XML, RDF/Json, Turtle, N-triples, RDFa 같은 다양한 파일 종류를 제공합니다.