LOD 시범 서비스

LOD 시범 서비스는 정보소통광장이 단순히 문서 위주의 공개 서비스에 그치지 않고, 미래DB 신기술인 개방형 연결 데이터(LOD)를 행정정보에 접목한 발행·활용 서비스를 통하여 정보공개 서비스의 지평을 새롭게 열기위한 시범 서비스 입니다.

데이터 정보

LOD 시범 발행서비스 - 정책연구자료

정책연구자료는 서울시의 산재된 정책자료와 연구자료를 한데모아 서비스하는 통합 창구로, 가치가 높은 정책연구자료에 LOD를 우선 적용하여 행정정보의 가치를 더욱 극대화하는데 그 목적이 있습니다. 현재 11개 분야, 12개 기관의 정책연구자료 데이터를 트리플로 저장하여 발행하고 있습니다.

 

정책연구자료 발행 현황

정책연구자료 LOD 발행 현황- 문서건수와 트리플수 정보를 나타내는 표
문서건수 6,790건 트리플수 126,915건 (2017.12.18. 기준)
정책연구자료의 분야별 LOD 발행 문서건수와 기관별 문서건수를 나타내는 표
분야 문서건수 기관 문서건수
소계6,790건소계6,790건
건강·식품1,038건SH도시연구원70건
경제18건보건환경연구원1,636건
교통·건설2,648건서울디자인재단28건
문화관광150건서울물연구원137건
복지200건서울시복지재단175건
안전37건서울시(기술용역)2,729건
여성 ·가족255건서울시(학술용역)148건
재정·세금4건서울시립대학교서울학연구소100건
주택·도시계획73건서울시여성가족재단270건
행정·기타1,639건서울연구원1,334건
환경728건서울특별시의회135건
--한성백제박물관28건

 

LOD 시범 발행서비스 - 연관검색어

2015년, 2016년 각 상위 100개 검색어를 추출하여 중복 검색어와 유의어를 제거하여 선정한 대표어별 상세검색 키워드 10개에 대해 국가기록원 시소러스 지침 용어사용 기준을 적용하여 총 1,003개 용어를 초기 데이터로 선정하였으며, 신규 상위 검색어를 기준으로 용어를 갱신하고 있습니다.

 

연관검색어 발행 현황

연관검색어 LOD 발행 현황- 문서건수와 트리플수 정보를 나타내는 표
용어 113건 트리플수 2,378건 (2017.12.18. 기준)

 

URI의 개념

정보소통광장은 최초 구축되던 2013년부터 World Wide Web의 가치에 부합된 오픕 웹을 만들기 위하여 노력했습니다. 그 노력 중하나가 바로 개별 행정정보(문서)가 독립적인 URI를 갖도록 하는 것이었습니다. 당시 한국의 많은 공공기관이 매개변수 형태 혹은 프레임형태로 URL을 가리는 경우가 많았으나, 정보소통광장을 필두로 오픈웹의 저변이 넓어지게 되었으며, 미래지향적인 환경을 만들기 위하여 개별 행정정보마다 독립된 URI 주소체계를 갖도록 하였고, 이를 통하여 사람과 기계의 접근성을 대폭 높일 수 있었으며, 외부 검색 포털에서도 정보소통광장의 개별 행정정보로 바로 유입할 수 있었으며, 확산이 가능한 구조가 만들어졌습니다. 이러한 정보소통광장의 URI에 대한 철학은 LOD 구축이 용이하도록 한 기반이었습니다.

URI, 통합 자원 식별자(Uniform Resource Identifier)
통합 자원 식별자(Uniform Resource Identifier, URI)는 인터넷에 있는 자원을 나타내는 유일한 주소입니다. URI의 존재는 인터넷에서 요구되는 기본조건으로서 인터넷 프로토콜에 항상 붙어 다닙니다. 1994년 팀 버너스 리가 하이퍼텍스트를 제안하면서 하이퍼링크의 대상이 되는 자원을 대표하는 짧은 문자열로 URL의 개념을 암묵적으로 도입하였습니다.©wikipedia

 

정책연구자료의 메타데이터와 RDF 매핑결과

정책연구자료의 필드명, 기계명, RDF Property를 나타내는 표
연번 필드명 기계명 RDF Property
1제목titledc:title
2초록bodydc:abstract
3본문-dc:description
4목차field_tocdc:tableOfContents
5키워드field_keyworddc:subject
6유형field_clasdc:type
7생산년도field_creat_yrdcterms:temporal
8분야field_categoryschema:category
9지역field_regiondcterms:spatial
10발행일field_bgn_dtdcterms:issued
11생산기관field_sysiddc:publisher
12책임부서field_deptdcterms:rightsHolder
13책임자field_nmfoaf:givenName
14책임자 연락처field_telnofoaf:phone
15저작권:CCLfield_cclcc:license
16저작권:공공누리field_kogl(미표출)
17생산일field_creat_dtdcterms:created
18ISBNfield_isbnbibo:isbn
19문서IDfield_dociddc:identifier
20언어langdc:language
21원본문서urldcterms:source

 

연관검색어의 메타데이터와 RDF 매핑결과

연관검색어의 필드명, 기계명, RDF Property를 나타내는 표
연번 필드명 기계명 RDF Property
1어휘vcblr_valuedc:title
2어휘 아이디vcblr_iddc:identifier
3어휘 값vcblr_valueskos:prefLabel
4언어langdc:language
5원천srcskos:note
6생산기관"Seoul Metropolitan Government"dc:publisher
7등록일시regist_dtdcterms:created
8수정일시updt_dtdc:date
9저작권CCL"CC BY ND"cc:license
10연관어-skos:altLabel
11동의어-skos:exactMatch

아키텍처

정보소통광장의 LOD 시범 발행서비는 Apache의 Jena를 기반으로한 아키텍처로 구성되어 있습니다. 시범 서비스 구축과정에서의 노하우와 시행착오, 식별된 개선의 기회를 바탕으로 정보공개 서비스의 패러다임을 혁신할 수 있도록 아키텍처를 지속적으로 고도화할 계획입니다.

정보소통광장 LOD 시범 발행 서비스 아키텍처
정보소통광장 LOD 시범 발행 서비스 아키텍처 설명

정보소통광장 LOD 서비스 Beta는 Apache Jena를 통해 발행이 됩니다.

  1. 정보소통광장(@ opengov.seoul.go.kr)에서는 PostgreSQL(RDB)를 통해 Raw Data(In-memory, custom, TDB, SDB)들을 Apache Jena에 RDB2RDF 표준으로 제공합니다.
  2. Apache Jena에서는 이 Raw Data들을 Triple Store에 저장하고, 다시 Inference API(None, Built for reasoner, External reasoner)로 이동후 RDF API, Ontology API, SPARQL API의 세 가지 API로 저장합니다.
  3. 사용자와 Application code는 HTTP를 통해 Fuseki에 접속하고 Fuseki는 HTTP를 통해 위 세가지 API에 접근할 수 있게 해줍니다.
  4. Application code는 Fuseki를 통하지 않고 직접 위 세 가지 API에 접근 할수도 있습니다.

RDF API에는 Parsers와 writers가 있는데, RDF/XML, RDF/Json, Turtle, N-triples, RDFa 같은 다양한 파일 종류를 제공합니다.