내 손안에 서울

데이터가 정보인 시대, '서울지하철 공공데이터' 어떻게 이용할까?

문서 본문

알아두면 도움되는 교통상식 (270) 서울지하철 공공데이터 활용법
시민기자 한우진의 알아두면 도움되는 교통상식
지하철 공공데이터를 제공 중인 서울교통공사 홈페이지 ©서울교통공사
지하철 공공데이터를 제공 중인 서울교통공사 홈페이지 ©서울교통공사

데이터(data)는 숫자뿐만이 아니라 다양한 형태를 갖춘 자료를 말한다. 데이터란 수집된 상태에서는 ‘사실’에 불과하지만, 이를 분석하여 가공하면 의미를 갖춘 ‘정보’가 된다. 정보로 바뀐 데이터는 사람이 유용하게 활용할 수 있게 된다. 의사결정의 근거로 사용할 수 있으며, 새로운 서비스나 사업을 만드는 데 이용할 수도 있다.

이 같은 데이터 중에서 공공기관에서 만드는 데이터를 공공(公共)데이터라고 한다. 공공기관은 국민의 세금에 의해 운영되므로, 공공기관이 수집한 데이터를 국민들에게 개방하는 것은 당연히 해야 할 일이라고 할 수 있다. 이에 따라 정부에서는 ‘공공데이터의 제공 및 이용 활성화에 관한 법률’을 만들고, 공공기관들이 수집한 데이터를 국민들에게 체계적으로 제공하고 있다.

한편 서울시 산하 지하철 운영 공기업인 서울교통공사도 예외가 아니라서 다수의 공공데이터를 시민들에게 제공하고 있다. 서울지하철은 하루에 800만 명 이상이 이용하는 대형 서비스이다. 당연히 매일같이 다양한 데이터가 생성될 수밖에 없다. 시민 입장에서 이런 데이터를 잘 활용하면 지하철을 더욱 편리하게 이용할 수 있는 것은 물론이고, 사업에 뜻이 있는 사람들은 이런 데이터를 본인 사업에 활용하는 것도 가능하다.
공공데이터포털에서 제공 중인 서울교통공사 공공데이터 조회 모습 ©행정안전부
공공데이터포털에서 제공 중인 서울교통공사 공공데이터 조회 모습 ©행정안전부

서울교통공사가 제공하는 공공데이터를 확인하기 위해서는 공공데이터포털에 접속한다. 검색창에 지하철이나 도시철도를 넣는 방법도 있으나, 이 경우 지방지하철 자료까지 모두 나오기 때문에 복잡해진다. 서울교통공사 자료만 찾으려면 ‘데이터찾기 > 데이터목록 > 제공기관별 검색 > 서울교통공사 입력 및 선택’을 한다. 이러면 148건이 나타난다.

서울교통공사에서 제공하는 공공데이터는 파일데이터가 128건, 오픈API가 20건이다. ‘API’란 Application Programming Interface(애플리케이션 프로그램 인터페이스)의 약자인데, 주로 인터넷 서비스를 개발할 때 쓰인다. 따라서 일반인들은 주로 파일데이터를 열어 확인하는 것이 보통이다.

서울교통공사에서 제공하는 파일데이터는 크게 사실 자료와 통계 자료로 구분해볼 수 있다. 지하철 역간거리, 전동휠체어 급속충전기 자료, 역사심도(깊이) 자료 등은 자주 바뀌지 않는 사실자료이다.

대신 시간대별승하차인원이나 월별 수송인원 등은 매일의 이용객 수치가 누적되어 쌓이는 통계자료다. 아울러 승하차 순위, 공기질 순위처럼 통계자료를 다시 한 번 정리하여 보기 좋게 가공한 자료도 있다. 이에 따라 몇몇 흥미로운 자료를 살펴보면 다음과 같다.

어느 역에서 사람들이 많이 타고 내렸을까?

‘서울교통공사_승하차순위’에서는 각 역의 승하차 인원을 알 수 있다. 상하위 10개씩을 표로 정리하면 아래와 같다.(2023년 12월 기준)
지하철 각역 승하차 순위
(2023년 12월 기준)
순위 호선 역명 일평균
승하차인원
순위 호선 역명 일평균
승하차인원
1 2 잠실(2) 151,182 276 3 학여울 4,872
2 2 강남 147,450 277 2 용두 4,718
3 2 홍대입구 140,755 278 6 버티고개 4,188
4 2 구로디지털단지 106,373 279 4 동작 4,006
5 2 신림 104,686 280 9 한성백제 3,648
6 2 삼성 102,951 281 7 장암 3,641
7 1 서울역(1) 100,595 282 2 신답 3,349
8 2 역삼 95,440 283 2 도림천 2,498
9 2 신도림 94,988 284 4 남태령 2,465
10 3 고속터미널(3) 94,878 285 9 둔촌오륜 1,398

다만 데이터를 이용할 때 주의할 점이 있다. 일단 서울교통공사 자료이기 때문에 서울 안에 있더라도 서울교통공사가 운영하지 않는 지하철들은 나오지 않는다. 우이신설선, 신림선 등의 경전철도 나오지 않으며, 타 기관이 운영하는 수도권 광역전철들, 공항철도, 9호선 1단계(개화-신논현)도 나오지 않는다.

또한 승하차 인원은 환승역에서 실제와 다른 모습을 보일 수 있다는 점을 감안해야 한다. 환승역에는 개집표기가 노선마다 따로 있는데, 위치 문제로 인하여 특정 노선에 승하차 인원이 몰릴 수 있다. 예를 들어 위의 표에서 4호선 동작역은 승하차 인원수가 매우 적지만, 9호선 동작역은 그렇지 않을 수 있다.

아울러 승하차 인원수는 열차운행횟수를 반영하지 못한다는 점도 고려해야 한다. 한성백제역과 장암역은 승하차수는 비슷하지만, 열차운행횟수는 한성백제역이 훨씬 많다. 결국 실질적으로는 한성백제역이 더 한산한 역인 셈이다.

환승역에는 환승객이 얼마나 있나?

또 하나 흥미로운 자료는 바로 환승역의 환승인원이다. 환승객은 환승역 바깥으로 나오지 않는다. 따라서 승하차인원과 환승인원은 다를 수 있다. 개집표기에서 카드를 찍어야 승하차로 집계되는데 환승객은 카드를 찍지 않기 때문이다. 예를들어 주변에 역세권이 없는 곳에서 혼잡한 두 노선이 만난다면 승하차인원은 거의 없는데 환승인원만 많을 수 있다.

‘서울교통공사_환승역_환승인원정보’에서 환승역의 일평균 환승인원수를 알아볼 수 있으며, 상하위 5개역과 인원수는 아래 표와 같다. (2023년 기준)
지하철 환승역 환승인원 순위
(2023년 기준)
순위 역명 평일 토요일 일요일 순위 역명 평일 토요일 일요일
1 신도림 277,033 225,439 163,217 69 보라매 19,530 10,324 7,888
2 동대문역사문화공원 222,447 176,018 126,322 70 수서 18,186 11,573 8,215
3 고속터미널 183,118 155,969 111,961 71 신내 8,637 6,118 5,092
4 왕십리 176,330 133,349 93,099 72 효창공원앞 8,022 7,297 4,850
5 종로3가 154,890 131,204 88,443 73 강동 5,621 4,057 3,069

예상대로 혼잡한 환승역으로 유명한 신도림역이 압도적인 수치로 1위를 차지했다. 3개 노선 환승역인 동대문역사문화공원도 높은 수치로 2위를 하였으나, 신도림역이 2개 노선 환승역이므로 신도림역이 더욱 밀도 높은 환승역이라고 할 수 있겠다. 의외로 강남구의 대표 환승역인 강남역은 25위에 머물렀다. ☞ [관련 기사] '트리플역세권'을 넘어, '퀸튜플역세권'도 있다?

한편 경춘선과 6호선 모두 열차 운행횟수가 적은 신내역이나, 바로 옆에 대형 환승역(공덕역)이 있는 효창공원역, 바로 가는 버스에 비해 우회를 하게 되는 강동역 등은 낮은 수치 머물고 있음을 알 수 있다.

지하철 역사는 얼마나 깊은 곳에 있나?

서울교통공사 공공데이터에서는 실적을 수집한 통계자료 외에 현 상태를 그대로 알려주는 사실자료도 제공하고 있다. 예를 들어 ‘서울교통공사_역사심도정보’ 공공데이터에서는 각 역의 깊이를 알아볼 수 있다. 특이한 점은 지상의 다리 위에 있는 고가역은 심도를 음수(-)로 표시하여 높이를 알아볼 수 있게 한 것이다. 상위 5개와 하위 5개를 표로 정리하면 다음과 같다.
지하철 역사 심도(고도) 순위
순위 호선 역명 층수 정거장깊이(m) 순위 호선 역명 층수 정거장깊이(m)
1 8 산성 B4 54.69 272 2 신대방 고가 -18.38
2 6 버티고개 B5 44.65 273 2 대림 고가 -18.55
3 7 숭실대 B6 44.53 274 2 강변 고가 -19.05
4 5 신금호 B8 42.16 275 2 뚝섬 고가 -19.07
5 6 독바위 B6 36.84 276 4 동작 고가 -20.9

자료에 따르면 가장 깊은 역8호선 산성역으로 깊이가 54.69m나 된다. 물론 요즘 대심도급행철도인 GTX가 개통되었기 때문에 더 깊은 역이 있을 수 있다. 이 자료는 어디까지나 서울교통공사의 자료다. 특히 지하 층수와 깊이는 비례하지 않음을 알 수 있는데, 역마다 1개 층의 높이가 다를 수 있기 때문이다.

고가역 중에 가장 높은 역4호선 동작역이다. 한강 바로 옆에 붙어있기 때문으로 짐작된다. 실제로 동작역 2번 출구 쪽에는 한강둔치 쪽으로 바로 내려가는 출구가 있다.

데이터를 조합하여 새로운 데이터를 만든다

한편 공공데이터 이용의 백미는 기존의 데이터를 조합하여 새로운 자료를 만들어내는 데 있다. 예를 들어 ‘지하철역의 면적’과 ‘승하차 인원수+환승 인원수’를 조합하면 각 역의 실질적인 혼잡도를 알 수 있다. 역 구내에 있는 인원수가 같아도 역의 면적이 좁을수록 혼잡이 심하다는 논리다.

앞서 소개한 ‘일평균 승하차 인원수’와 ‘환승 인원수’를 합친 뒤 이를 ‘서울교통공사_역사면적정보’ 자료에서 찾은 ‘대합실+승강장 면적’으로 나누면, 각 역별 단위면적당 인원수를 알 수 있다. 이 값이 높을수록 실질적인 혼잡이 심하다는 뜻이다. 반대로 승하차 인원수가 많아도 역사 면적이 넓으면 실제 혼잡은 낮을 수 있다.

아래 표는 지하철역의 이용 면적(대합실+승강장)의 상하위 10개를 정리한 것이다. 단선 승강장을 사용하는 장암역과 신내역은 면적이 좁음을 알 수 있다. 특히 2호선 까치산역은 자체 대합실이 없고(5호선만 있음) 단선 승강장만 있는 구조라 면적이 제일 좁다.
지하철 역사 이용 면적 순위
순위 호선 역명 면적(m2) 순위 호선 역명 면적(m2)
1 5 영등포구청 23,053 272 3 지축 1,583
2 2 신도림 19,055 273 7 장암 1,503
3 5 강동 18,985 274 2 용답 1,423
4 2 종합운동장 18,506 275 6 신내 858
5 6 신당 18,195 276 2 까치산 791

이렇듯 서울교통공사에서 제공하는 공공데이터를 활용하면 흥미 있는 정보는 물론이고, 생활이나 사업에 도움이 되는 정보도 많이 찾을 수 있다. 승하차 인원이 많다는 것은 혼잡이 높다는 뜻이라 이용자 입장에서는 불편하지만, 소상공인 입장에서는 유동인구가 높다는 뜻이기도 하기 때문이다.

생활과 사업에 도움을 주는 도시철도 데이터

현대는 데이터의 시대라고 한다. 컴퓨터와 저장장치의 성능이 좋아지면서 과거와는 비교도 할 수 없을 만큼 많은 데이터를 수집하고, 저장, 처리할 수 있게 되었다. 위에서 소개한 데이터들은 PC의 스프레드시트 프로그램으로 쉽게 가공하고, 그래프도 그려볼 수 있게 되어 있다. 수많은 사람들이 이용하는 지하철의 데이터를 잘 활용한다면 누구나 생활을 편리하고 새로운 기회를 얻는데 도움이 될 것이다.

한편 서울교통공사 같은 공공기관에서는 공공데이터의 활용성 강화를 위하여 주기적으로 아이디어를 받고 신규 데이터 제안도 받고 있다. 관심 있는 사람이라면 참여해 보면 좋을 것이다.

2024년 서울교통공사 공공데이터 아이디어 공모

○ 공모기간 : 2024. 6. 17.(월) ~ 7. 14.(일) 28일간
○ 공모대상 : 관심 있는 시민 누구나
○ 참여방법: 서울교통공사 누리집 → 시민 아이디어
○ 공모주제
 - 서울교통공사 공공데이터 활용 기획 아이디어
 - 열차 이용 고객 서비스 제공을 위한 신규 데이터 발굴
○ 심사기준 : 창의성, 효과성, 파급효과, 실행가능성을 평가
○ 포상 : 최우수 30만원부터 입선 교통카드 5만원까지, 총 75만원 상당

문서 정보

데이터가 정보인 시대, '서울지하철 공공데이터' 어떻게 이용할까? - 문서정보 : 원본시스템, 제공부서, 작성자(책임자), 생산일, 관리번호, 분류
원본시스템 내손안에서울 제공부서 뉴미디어담당관
작성자(책임자) 시민기자 한우진 생산일 2024-07-09
관리번호 D0000051190701 분류 기타
이용조건타시스템에서 연계되어 제공되는 자료로 해당기관 이용조건 및 담당자와 협의 후 이용하셔야 합니다.