티스토리 뷰

논의를 이어나가기 전에, 어떤 도로구간의 평균속도라는 것에 대해 다시 잠깐 이야기해야 할 것 같다. 앞서 서울시가 도로구간(링크)별 평균속도 데이터를 산출하는 방식에 대해 설명했지만, 평균속도란 일정 기간(이 데이터는 1시간) 도로구간을 지나간 택시 주행정보를 기초로 실제 도로상황을 추정하는 일종의 대리변수(surrogate variable)다. 이렇게 도출된 평균속도값이 실제를 얼마나 반영하는지는 따져볼 일이다.

한편 복수의 평균속도를 대변할 수 있는 하나의 값을 얻기 위해서는 다시 여러 값을 가지고 연산을 해야 한다. 그런데 이것도 계산기 두드리듯 명쾌하지는 않다. 어떤 도로구간의 매주 월요일 8-9시 평균속도값 1년치를 모았을 때, 그것을 가장 잘 대표하는, 가령 중심경향값(central tendency)이 (산술)평균이라는 법은 없다. 오히려 앞서 설명했듯 속도값에 대해서는 조화평균을 하는 것이 옳은 접근이다. 각 평균속도값 산출에 투입된 데이터의 양(측정값의 개수)에 명시적인 차이가 있다면 가중평균을 하는 것이 합리적이다. 또는 아예 교통공학에서 사용하는 K factor처럼 실질적인 의사결정에 유용한 다른 값을 찾는 것도 얼마든지 대안이 될 수 있다.

그런데 애초에 대리변수로 나온 값이 부정확하다면, 정확한 산식을 쓴다고 정확한 결과가 될 리는 없다. 현실세계에는 그런 숫자의 변신도 흔하지만.


요는, 이 데이터로 전반적 패턴을 읽는 이상의 계량적 시사점을 찾으려고 하는 것은 합리적이지 않아 보인다는 것이다. 이렇게 말하면서 과학의 표정을 한 그래프를 들이미는 것이 모순 같지만 말이다. 최소한 과도한 평균 사용은 피하고자 한다.

그 기사를 쓴 기자는 데이터의 이러한 한계를 감안하고 2015년과 2017년 어느 두 출근시간 데이터만을 뽑아 비교한 것일까? 차라리 그런 것이면 좋으련만.


이런 사정을 감안하고 다시 돌아와서. 고가도로 폐쇄를 유일한 요인으로 보고 시기를 나누어 평균했을 때 두 시기의 평균속도 패턴이 구분된다는 사실은 무엇을 의미하는가? 의미가 없지는 않다. 그러나 평균 내기로 디테일을 뭉개버린 그래프만 놓고 의미를 찾기에 이 패널데이터의 잠재성은 너무 풍부하다.

사실 앞의 그래프는 고가도로 폐쇄 전후 교통 흐름에 차이가 있다는 당연한 사실보다는, 시간대별·요일별 패턴에 대해 흥미로운 이야기를 해준다. 어떤 도로는 늘 막히는 반면, 어떤 도로는 출근/퇴근시간대 사정이 사뭇 다르다. 주말과 평일 도로 흐름에 별 차이가 없는 도로도 있고 차이가 두드러지는 도로도 있다.

이것도 매우 재미있는 주제지만, 글의 목적상 건너뛰고 시계열적 변화에 집중하려 한다. 그런 면에서 다음과 같은 형식의 시각화가 보다 적합해 보인다.

2014-2017년 퇴계로, 만리재로의 일일 출퇴근 시간대(7-8시, 8-9시, 17-18시, 18-19시) 평균속도 변화.


이제 그간 출퇴근 시간대 평균속도가 어떻게 변해왔는지를 실질적으로 말해주는 흐름이 보인다. 다만 평일과 분명히 다른 패턴을 보이는 주말 및 휴일의 속도가 그래프를 더 어지럽힌다. 4년간의 일일 데이터 중 토·일요일과 공휴일을 제외한 평일만을 추려 주변 도로구간의 그래프를 다시 뽑아 보았다.

2014-2017년 퇴계로, 만리재로, 통일로, 칠패로, 서소문로, 한강대로의 평일 출퇴근 시간대(7-8시, 8-9시, 17-18시, 18-19시) 평균속도 변화.


휴일을 제외해도 평균속도의 흐름은 마치 지진계의 스펙트럼 기록 또는 전파의 노이즈처럼 하루하루 부침이 있고 시기별 부침이 있다. 이런 다이나믹스를 무시하고 ‘평균’이라는 간편한 계산으로 도로 흐름의 변화를 설명하려 한다면 과한 편의주의로 비춰질 것이다. 하물며 특정한 몇 개 날짜의 출근시간대 속도를 들어 어떤 지역이 ‘교통지옥’이 되었는지를 판단하려는 시도는 무지의 소산이라고밖에는 이해할 길이 없다.

위의 그래프들에서 읽을 수 있는 메시지는 이렇다. 2015년 12월 이벤트의 강도가 가장 컸던 것은 분명하나, 그것만이 이 흐름을 설명하는 변수는 아닌 것 같다. 그 이후에도 해석을 기다리는 특정한 힘이 작용한 흔적이 곳곳에 보인다. 역시나 이런저런 해석이 필요하다.

그래서 한 번 더 끊고 가야겠다.


* 그래프가 많아지면서 이 지역 도로명에 밝지 않은 이들에게는 정리되기 힘든 내용이 되어버렸다. interactive contents로 만들어 제시하면 딱 좋겠는데 뚝딱 만들기는 어려운 분량이다. 일단 기사에 대한 피드백을 마무리하고 별도의 글에서 스크립팅을 해볼까 한다.


댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday