티스토리 뷰


며칠 전, data.seoul이 데이터를 한꺼번에 올리지 않고 굳이 끊어먹고 있다는 핀잔 섞인 글을 올렸는데, 불과 몇 시간 후 나머지 데이터가 올라왔다. 약오르게.

아무튼 댓글 제보에 감사하며. 업데이트된 데이터를 반영, 앞의 글에서와 동일한 방법으로 서비스 시작 시점부터 2018년 1분기까지의 대여기록 764.5만 건을 scatterplotting 해보았다.


 2015년 9월 19일 - 2018년 1분기 대여내역의 이동거리에 따른 scatterplot.


전체적으로는, 사실 몇 달 전 대여소 기준 데이터를 가지고 7편의 글을 작성하면서 탐색했던 바를 재확인해주는 그림이다. 다만 이 그림은 색의 농담 차이를 어떻게 이해할 것인가에 따라 여러 해석이 가능하기 때문에 자기완결적이지 않다. 가령, 2017년 연간 이용량이 2016년 대비 3.27배 늘어났다는 사실을 이 그림으로 (얼마나) 가늠할 수 있는가? 디스플레이 설정에 따라서 똑같은 이미지라도 계조 표현이 천차만별이기 때문에, 경우에 따라 당신은 그림의 설명력에 납득하지 못할 수 있다. 나름대로 그림의 설명력을 높이려고 각 점의 투명도를 수없이 바꿔 보았지만 위의 결과물이 최선이라고 자신할 수는 없다. 

어떤 면에서 나는 그림 자체의 회화적 측면을 지켜내기 위해 설명력을 다소 희생시킨 면도 있다. 그러나 반대로, 이 데이터에 더 깊고 테크니컬하게 파고들어가기 위한 흥미로운 출발지점으로 삼기에는 흡족한 그림이 나왔다고 본다.


다음으로 넘어가기 전에, 따릉이 관리자인 서울시설관리공단의 서버 고장으로 인한 서비스 불통 또는 기록 누락 문제를 지적하지 않을 수 없다. 서버 운영이 완벽했다면 위 그림에서 하얗게 비거나 희미한 부분은 계절 또는 날씨 요인의 결과로 이해할 수 있다. 그러나 서비스 자체가 문제를 일으켜 생긴 빈칸이 여럿 존재한다. 이 데이터로 이용 패턴 분석을 정교하게 하려면 서버 에러 로그까지 확인해야 하는 상황이다.


이제 주행거리 대신 주행시간을 y축에 놓고 같은 기록을 도시해보자. 그러면 위의 그림과 같은 듯 다른 패턴이 드러난다.


서비스 시작 - 2018년 1분기 대여내역의 이용시간에 따른 scatterplot.


먼저 눈에 띄는 건 두 개의 시간적 구분선이다. 따릉이 회원이라면 누구나 이해할 저 구분선은 1시간, 2시간에 맞춰져 있다. 이용권 종류에 따라 1시간 또는 2시간마다 자전거를 반납해야 패널티 요금을 물지 않기 때문이다. 이 정도로 뚜렷한 구분이 있을 줄은 미처 예상치 못했다. 좀 더 정확히 파악하기 위해 아래와 같이 이용시간별로 수를 세어 보았다.


서비스 시작 - 2018년 1분기 대여내역의 이용시간에 따른 막대그래프.


5분 단위로 200원씩 부과되는 패널티 요금을 누가 어떤 논리로 결정했는지 모르겠지만, 결과적으로 효과는 확실해 보인다. 그래프에서 보듯 51-55분 이용량과 66-70분 평균 이용량 차이가 거의 4배에 달한다.

물론 이 규제가 개별 이용자 행태에 구체적으로 어떤 영향을 주었는지 단정하기는 어렵다. 90분 넘게 탔을 사람을 55분에 멈추도록 했겠지만, 30분만 탔을 사람을 59분 채워서 타도록 했을 수도 있다.


패턴 자체의 재미와 별개로, 의도의 정당성과 수단의 합목적성은 좀 따져볼 일이다. 시간 제한을 두는 이유에 대해 공식 명시된 바는 찾을 수 없지만, 크게 두 가지로 보인다. 하나는 도난/분실의 빠른 확인이고, 다른 하나는 대중교통 보완재로서의 성격 유지다. 어차피 휴대전화 인증 등 이용자 개인정보가 관리자 측에 제출되는 시스템이기 때문에 첫째 이유는 큰 설득력이 없고, 둘째 이유가 핵심이 될 것이다.

그런데 따릉이가 대중교통 대체수단으로서의 정체성을 지키는 것은 얼마나 중요한 가치인가.. 공공자전거를 지하철역 가는 데 쓰는 것은 바람직하고 운동용으로 타는 것은 바람직하지 않은가? 애당초 그 둘은 명확히 구분되는 것인가? 그에 대한 서울시의 판단과 시민의 판단은 일치하는가? 

그리고 최대 이용시간을 하필 60분으로 묶는 것은 그러한 정체성을 지키는 데 얼마나 깊이 결부된 사안인가? 60분 규제로 인한 누군가의 자전거 이용성 저해는 다른 이용자 편의 증진과 따릉이 정체성 유지에 비하면 저렴한 것인가?

이것 또한 나 혼자서 칼로 베듯 단정하기는 쉽지 않다. 하지만 적어도 그 시간 제한이 과학적이거나 전략적으로 접근해 구한 값이 아닌 것은 분명하다. 한편 대여소 인프라 확충이 여전히 진행 중이고 대여소가 부족하다는 민원이 많은데도 기본 이용비의 2.4배 이상 패널티를 부과하는 것은 독점 민간기업의 마인드에 가까워 보인다.


이런 문제의식을 형성하기 위해 반드시 데이터 탐색과 시각화가 필요한 것은 아니다. 그냥 따릉이 며칠 타다 보면 절로 갖게 되는 불만일 수 있다. 그러나 데이터의 힘은 불만이 불만에 그치지 않고 그 다음 이야기를 논리적 생산적으로 펼 수 있게 해준다는 데 있을 것이다.

그러기 위해서 더더욱, 다시 지도로 돌아가야 할 것 같다.


댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday