결재문서

- 데이터센터 정보자원 장애 관리체계 개선을 위한 -AI관제 및 장애 예측시스템 구축 계획

문서번호 정보자원운영과-23849 결재일자 2022. 8. 10. 공개여부 부분공개(2) 방침번호 시 민 주무관 정보자원운영과장 데이터센터소장 스마트도시정책관 최창학 김성국 추경수 08/10 박종수 협 조 기획관리과장 김진기 인터넷통신과장 代오승희 클라우드센터운영과장 하동수 IT투자심사팀장 代박경예 주무관 최성수 - 데이터센터 정보자원 장애 관리체계 개선을 위한 - AI관제 및 장애 예측시스템 구축 계획 2022. 8. 스마트도시정책관 (데이터센터) - 데이터센터 정보자원 장애 관리체계 개선을 위한 - AI관제 및 장애 예측시스템 구축 계획 데이터센터 정보자원 장애관리 분야에 인공지능, 딥러닝 기술을 접목한 「AI관제 및 장애 예측시스템」을 구축하여 장애관리체계를 개선하고자 함 1 추진근거 및 배경 추진근거 ○ 서울시 데이터센터 발전 방향 ISP 추진 계획(기획관리과-1103, ’21.02.01.) ○ 종합관제 운영 개선방안 보고(정보자원운영과-6471, ’21.08.20.) 추진배경 ○ 현행 분야별 관제체계는 신속한 장애원인 탐지 및 장애조치에 한계 존재 - 데이터센터의 장애관제는 SMS(시스템), APM(어플리케이션), NMS(네트워크), FMS(기반시설) 등 분야별 관제체계로 운영 중이나, - ? 분산 관제환경을 통합하여 신속한 장애인지 및 원인지점 파악 필요 ○ 과도한 관제메시지로 인한 정보자원 담당자의 피로도 증가 - 현 관제시스템에서 장애조치 시급성 등 판단 저하 우려 ? 장애의 시급성, 영향도 등을 고려한 정제된 관제메시지 전달 필요 ○ 장비별 세부 장애이력 DB화 추진에 따른 장애대응 개선 기반 마련 - 정보자원 자산관리시스템에 및 대한 분석기반 마련 ? 장애취약 장비의 교체 우선순위 선별 및 장애조치 자동화방안 마련필요 2 추 진 방 향 분야별 관제방식에서 서비스 중심의 지능형 통합관제 체계로 개선 ○ AI 머신러닝 기술을 접목하여 각 서버의 이벤트 로그 및 개별 관제시스템(SMS, FMS, APM 등)의 관제메시지 등을 통합한 장애유형 학습?분석 ○ 정보자원의 실시간 사용현황, 이상징후 등을 종합 고려하여 서비스 중심으로 장애발생 가능성 및 추정 원인지점, 점검 우선순위 전파체계 마련 장애 사전탐지 및 장애조치 자동화 단계로 점진적 확대 구축 ○ ○ 사전조치 가능한 일부 인적 관리유형의 장애는 자동조치 기능 구현 AI분석을 통해 장애발생 가능성 높은 노후장비 선별 및 우선 교체 ○ 정보자원 자산관리시스템의 장애이력 정보를 AI 연계·분석하여 장비별 장애발생 유형?빈도에 따라 사전대응 또는 노후장비 교체시 우선반영 ※ 매년 정보자원 통합구축 사업을 통해 해당 장애취약 노후장비는 우선 교체 추진 3 추 진 계 획 사업개요 ○ 사 업 명 : 데이터센터 AI관제 및 장애 예측 시스템 구축 ○ 사업기간 : 2023년 ~ 2025년 (3년) ○ 사업예산 : ○ 사업내용 ? 개별 관제시스템(SMS,FMS,APM 등)을 연계한 통합관제 환경 구축 ? 정보자원 AI분석을 통한 신속한 장애 원인지점 파악 및 조치체계 마련 ? 예측가능 장애의 사전탐지 및 장애조치 자동화 추진 ? 장비별 세부 장애이력 연계분석을 통한 장애 취약장비 관리체계 개선 연차별 추진계획 구 분 2023년(1차) 2024년(2차) 2025년(3차) 구축단계 파일럿 시스템 구축 AI관제 확대구축 AI 관제 고도화 소요예산 주요 추진내용 ? AI관제 인프라 및 통합관제 환경 구축 ? 실효성, 안정성 검증 (보완 필요사항 도출) ? 우수 분야 강화 (장애예측 정탐률 향상) ? 장애처리 자동화 도입 ? 시스템 안정화/고도화 ※ ○ AI 관제는 보안관제 및 금융권 등 특화된 분야의 구축 사례는 있으나, 공공분야 H/W 및 기반시설 인프라 대상의 구축 사례는 부족 ○ 1차 파일럿 구축 후 실효성?안정성 검증 후 점진적 확대 구축 주요 구축내용 분산된 관제시스템 연계를 통한 서비스 중심 통합관제 환경 구축 ○ 현행 서버별 자체 로그와 SMS, FMS, NMS 등 개별 관제 이벤트 기록 등으로 생성되는 활용 ○ 실시간 자원현황, 이상징후 등 서비스 관점의 통합모니터링 체계 구축을 위해 개별 관제시스템을 연계 분석한 통합 대시보드 구축 추진 ☞ 개별 H/W 및 이벤트 중심 ⇒ 서비스 중심 모니터링 체계 구현 정보자원 AI 분석을 통한 신속한 장애원인 파악 및 조치체계 마련 ○ 서비스 장애 발생시, 개별 관제 메시지를 참고하여 서버, 네트워크, 보안, S/W 설정값 등을 점검하여 정확한 원인지점 파악 후 장애조치 중이나, ○ ○ 현행 개별 관제시스템 및 정보자원 자산관리시스템의 로그정보와 장애 이력정보를 AI 통합분석하여 장애유형별 장애원인 및 조치사례 축적 ☞ AI기반 사례분석 및 이상패턴 검출 ⇒ 신속한 장애조치 체계 마련 장애 사전탐지 및 장애조치 자동화 단계로 점진적 확대 구축 ○ 장애발생이 불가피한 경우, 연관된 서비스 및 정보자원에 대한 신속한 영향도 분석을 통해 장애 전파 및 조치에 집중하되, ○ ☞ 자원사용량 추이분석 ⇒ 장애 사전탐지 및 장애조치 자동화 구현 장애 취약장비 관리체계 개선 ○ 현행 정보자원 자산관리시스템의 장애 이력정보를 AI 연계·분석하여 장애 발생률이 높은 장비/부품에 대해 사전 조치 또는 교체 ※ 세부 정보자원별 장애의 유형, 빈도 등 이력정보를 활용하여 유사장애 발생가능성 분석 ○ 내구연한 경과 노후장비는 장애발생률 및 장애발생 가능성을 고려하여 매년 정보자원 통합구축 사업을 통해 우선 교체 추진 ☞ 장비별 장애이력 분석 ⇒ 장애 취약장비 우선교체 등 관리체계 개선 4 단계별 추진일정 [1단계] AI 관제 환경 구축 (′23년) ○ AI 관제환경 구축을 위한 관련 솔루션 및 인프라 도입 - 는 현행 데이터센터 자원 활용 ※ 현행 관제시스템과 별도의 정보자원으로 구축하여 상호 영향도 최소화 ○ 각 관제시스템 및 정보자원 자산관리시스템을 연계한 AI 분석 추진 - ○ 관제 통합대시보드 구축 및 시각화 등 AI관제 파일럿시스템 구축 < ′23년 AI관제 환경구축 사업개요 > ◈ 사업기간 : `2023년 7월 ~ 12월(6개월) ◈ 사업예산(′23년) : - ◈ 입찰(낙찰)방법 : 일반공개경쟁입찰(협상에 의한 계약) ◈ 사업내용 - 개별 관제시스템(SMS, FMS, APM 등)을 연계한 AI 학습환경 구축 - 관제 통합대시보드 구축 및 시각화 등 AI관제 파일럿시스템 구축 - 장비별 세부 장애이력 연계분석을 통한 장애 취약장비 관리체계 개선 [2단계] AI관제범위 확대 구축 (′24년) ○ 우수 분야 강화 및 AI 관제 적용 확대 ○ 사전조치 가능한 장애에 대한 사전예측 및 자동화 조치 기능 구현 [3단계] AI관제 고도화 구축 (′25년) ○ 시스템 보완/고도화 및 AI 관제 적용 확대 ※ 데이터센터 서초 관제 구축 및 효과성 검증 후 상암 클라우드센터 확대검토 5 기 대 효 과 데이터센터 정보자원 장애에 따른 서비스 중단 시간 감소 기여 ○ 신속한 장애탐지/원인지점 파악으로 장애조치 및 서비스 중단시간 감소 AI 기술 접목한 장애분석 및 예측을 통한 장애 예방효과 제고 ○ 장애 사전탐지 및 장애조치 자동화 기술 도입으로 사전조치 강화 정보자원 사용률 분석?예측을 통한 정보자원 활용도 극대화 장애 취약장비 우선 교체 등 정보자원의 안정성?신뢰도 제고

문서 보기

문서보기는 문서변환기에 의해 텍스트로 변환된 문서를 보여주며, 스크린리더로 문서내용을 미리 확인하실 수 있습니다. 그러나 일부 문서의 경우(pdf파일) 변환 상태에 따라 스크린리더에서 제대로 읽히지 않을 수도 있습니다. 이때는 다음 헤딩3인 첨부파일 목록으로 바로가서 원문을 다운로드하신 후 이용하시면 스크린리더 이용이 더욱 용이합니다. 첨부파일목록 바로가기

   * 본 문서는 공문서로서의 법적 효력은 없으며, 위조·변조·도용 등 불법적 활용으로 인하여 발생된 모든 책임은 불법적으로 활용한 자에게 있습니다

첨부된 문서

문서 정보

- 데이터센터 정보자원 장애 관리체계 개선을 위한 -AI관제 및 장애 예측시스템 구축 계획 - 문서정보 : 기관명, 부서명, 문서번호, 생산일자, 공개구분, 보존기간, 작성자(전화번호), 관리번호, 분류정보
기관명 서울시 부서명 데이터센터 정보자원운영과
문서번호 정보자원운영과-23849 생산일자 2022-08-10
공개구분 부분공개 보존기간 30년
작성자(전화번호) 최창학 (02-3470-1360) 관리번호 D0000045985949
분류정보 행정 > 정보자원관리 > 시스템개발운영 > 행정정보화지원 > 정보시스템운영같은 분류 문서보기
이용조건Creative Comoons License(저작자표시-변경금지) 3.0 마크