결재문서

「공공데이터 신뢰성 향상을 위한」열린데이터광장 데이터 품질진단 계획

문서번호 통계데이터담당관-9727 결재일자 2017.8.30. 공개여부 부분공개(5) 방침번호 시 민 주무관 데이터인프라팀장 통계데이터담당관 정보기획관 차명호 백영희 안정준 08/30 정헌재 「공공데이터 신뢰성 향상을 위한」 열린데이터광장 데이터 품질진단 계획 2017. 8. 통계데이터담당관 지속 가능성 ● 정책·계획 등의 지속가능성을 검토하였습니까? 예) 지역경제 발전, 사회적 형평성, 환경의 보전 등 ■ □ 「공공데이터 신뢰성 향상을 위한」 열린데이터광장 데이터 품질진단 계획 열린데이터 광장을 통해 개방중인 공공데이터의 품질진단을 통해 신뢰성 있는 공공데이터를 제공 하고자 함 1 추진근거 ○「서울 열린데이터광장」개설 계획 : 시장 방침 제326호(‘11.12.31) ○ 공공데이터법」제22조(공공데이터의 품질관리) 및 동법 시행령 17조(공공데이터의 품질진단 및 개선) 등 ○ 서울특별시 데이터의 제공 및 이용 활성화에 관한 조례 제16조(품질관리) 2 운영현황 ?? 공공데이터 개방현황 (단위 : 건 / ‘17. 7 기준(누적)) 총계 서울시 자치구 민간 (기업) 본청/사업소 투자출연기관 데이터셋 4,607 2,109 167 2,330 1 OpenAPI 3,263 864 95 2,303 1 ?? 공공데이터 이용현황 (단위 : 천건 / 년도별) 구 분 2012년 2013년 2014년 2015년 2016년 2017년 (1~7) 합 계 85,470 237,500 309,564 511,352 875,692 613,225 교 통 83,783 232,320 237,057 207,207 367,721 234,441 환 경 209 1,430 67,900 298,294 498,193 371,300 안 전 84 83 2,589 2,917 3,455 2,666 문화관광 590 2,401 1,412 953 3,616 3,229 기 타 804 1,266 606 1,981 2,707 1,589 3 추진계획 ? 추진목적 ○ 공공데이터의 수집?생성?운영?제공 등과 관련된 기관차원의 품질관리 활동을 통한 품질관리 체계 확립 ○ 공공데이터 품질향상을 통한 열린데이터광장 대외 신뢰도 향상 ? 추진기간 ○ 데이터 품질진단 및 개선 : ‘17.8 ~ ’17.12 - 데이터 품질진단 : ‘17. 8 ~ ’17.9 - 데이터 품질개선 : ‘17.10 ~ ’17.12 ○ 데이터 품질인증 : ‘18. 1 ~ ’18. 3 ?? 추진체계 ○ 총괄기관 : 서울특별시 ○ 진단기관 : ○ 데이터 품질정비 : 서울시, 자치구, 투자출연기관 《 품질진단 수행체계 》 서울특별시 품질진단 계획수립, 데이터 품질관리(품질개선) ⇔ 진단대상 기관 (자치구 및 산하기관) 품질진단(품질심사원) ?? 진단대상 및 방법 ○ 진단대상 : 열린데이터광장을 통해 개방중인 4,606개 데이터셋 《 품질진단 대상 》 자치구 + 서울시 + 투자출연기관 ? 시스템 246종 ? 데이터셋 2,330개 ? 시스템 203종 ? 데이터셋 2,109개 ? 시스템 51종 ? 데이터셋 167종 ※ 폐기, 미개방, 민간 데이터셋 제외 ○ 진단방법 : 데이터 정합성 진단(데이터 오류율 산출 및 원인분석) 구분 수행 내용 수행주체 진단대상 선정 (8월) ? 진단대상 테이블, 컬럼 확정 및 분석 샘플링 ? 관련 문서 분석 및 실무자 면담 ※ 검토문서 : ERD, 도메인정의서, 코드정의서, 테이블 명세서, 컬럼 정의서 등 서울특별시 품질진단기관 ? 데이터 프로파일링 (8월) ?선정 테이블과 컬럼을 대상으로 통계적 기법 활용 ?지표별 오류추정 데이터 도출 ?데이터 현황 분석 대상 컬럼의 레코드에 대해 전수진단 품질진단기관 ? 업무규칙 도출 (8월) ?데이터 프로파일링 결과, 문서 분석 결과에 기초하여 업무 규칙 도출 품질진단기관 ? 품질측정 (9월) ?도출된 업무 규칙을 적용하여 규칙에 위배된 오류 추정 데이터를 도출 ?대상 컬럼의 레코드에 대해 전수검사 실시 품질진단기관 ? 오류데이터 분석 (9월) ?도출된 분석 결과를 통해 데이터 품질분석 확인 및 오류 데이터 확정 ?오류발생 원인 분석 진단 및 결과보고서 작성 서울특별시 품질진단기관 ?? 품질진단 절차 ?? 데이터 품질정비 ○ 정비기간 : ‘17.10 ~ ‘17.12 ○ 정비대상 : 품질진단 결과 정합성 오류로 진단된 데이터 ○ 정비내용 : 데이터 패턴, 허용범위, 코드값, 무결성오류 데이터 수정 ○ 제출내용 : 품질개선 내역 및 데이터 현행화 내역 4 향후계획 ?? 데이터 품질인증 추진 ○ 인증신청 : ‘18. (데이터 품질정비 완료 시점) ○ 인증기관 : ○ 인증기준 : 데이터 정합률 정합률 : 데이터 필드 규칙(데이터 패턴, 허용범위, 코드값, 무결성, 표준정의)에 위배되는 데이터 오류율 95.51% 이상 ○ 인증절차 5 행정사항 ?? 데이터 품질진단 결과통보 : ‘17.10 ○ 대상기관 : 데이터 제공기관(각 부서, 자치구, 투자출연기관) ○ 통보내용 : 품질진단 결과서(정합성 오류내역) ?? 데이터 정비결과 제출 : ‘17.12 ○ 대상기관 : 데이터 제공기관(각 부서, 자치구, 투자출연기관) ○ 제출내용 : 품질진단 결과에 대한 데이터 정합성 오류 수정결과 붙임 데이터 품질인증 소개 ?? 인증기관 : ○ ○ ○ ○ ?? 주요업무 ○ 데이터 산업동향 및 법,제도 연구, 데이터 관련 교육 및 자격검정 운영 ○ 데이터 관련 표준화 및 품질평가 인증, 데이터 유통 및 활용, 사업화 지원 ?? 인증항목 ○ 데이터 품질 : 데이터 유통, 데이터 개방을 위한 데이터 품질수준 점검 ○ 데이터 관리 : 데이터 관리프로세스, 데이터 관리정책 점검 ○ 데이터 보안 : 데이터 보안기술요소, 관리수준 점검 ?? 진단방법 ○ 업무규칙, 도메인을 기준으로 비즈니스 룰을 도출하고, 데이터 자체의 품질 영향요소를 전반적으로 확인, 심사 ○ 업무규칙 : 각 업무 분야별로 데이터의 표준, 업무규칙을 준수하여 데이터가 입력되어 있는지 확인 ○ 도메인 : 도메인별 데이터 패턴, 허용범위, 코드값, 무결성, 표준정의 점검 ?? 인증절차

문서 보기

문서보기는 문서변환기에 의해 텍스트로 변환된 문서를 보여주며, 스크린리더로 문서내용을 미리 확인하실 수 있습니다. 그러나 일부 문서의 경우(pdf파일) 변환 상태에 따라 스크린리더에서 제대로 읽히지 않을 수도 있습니다. 이때는 다음 헤딩3인 첨부파일 목록으로 바로가서 원문을 다운로드하신 후 이용하시면 스크린리더 이용이 더욱 용이합니다. 첨부파일목록 바로가기

   * 본 문서는 공문서로서의 법적 효력은 없으며, 위조·변조·도용 등 불법적 활용으로 인하여 발생된 모든 책임은 불법적으로 활용한 자에게 있습니다

첨부된 문서

문서 정보

「공공데이터 신뢰성 향상을 위한」열린데이터광장 데이터 품질진단 계획 - 문서정보 : 기관명, 부서명, 문서번호, 생산일자, 공개구분, 보존기간, 작성자(전화번호), 관리번호, 분류정보
기관명 서울시 부서명 정보기획관 통계데이터담당관
문서번호 통계데이터담당관-9727 생산일자 2017-08-30
공개구분 부분공개 보존기간 5년
작성자(전화번호) 차명호 (02-2133-4276) 관리번호 D0000031217968
분류정보 행정 > 정보자원관리 > 시스템개발운영 > 행정정보화지원 > 공공데이터개방및열린데이터광장운영같은 분류 문서보기
이용조건Creative Comoons License(저작자표시-변경금지) 3.0 마크공공누리 공공저작물 자유이용허락(제4유형 : 출처표시 + 상업적 이용금지 + 변경금지)