알고리듬. 주어진 문제 해결을 위한 명시적 절차.모든 인간은 이런저런 문제를 해결하며 살아간다. 그래서 '알고리듬 비전공자’라는 말은 마치 ‘보수의 품격’처럼 이율배반적이고 이상한 단어 조합이라는 생각도 든다. 그러나 여기에서 나는 알고리듬 비전공자다. 알고리듬 비전공자로 코딩을 시작한 이후 나를 괴롭힌 이슈 중 하나는 알고리듬을 공부할 분야로 보아야 하는가 였다. 프로그래밍 튜토리얼을 따라가면서는, 튜토리얼 끝나는 바로 다음날 시작해야 할 과정으로 믿기도 했다. 하지만 알고리듬은 일견 방대해 보였고, 정말 볼수록 방대했다. 또 다행히도 지난 몇 달간 내게 코딩을 필요로 하는 문제는 알고리듬 산행을 요구하지는 않았다. CPU 연산시간이나 메모리 등 computing power 비용을 생각할 필요도 없는 ..
굳이 교과서를 들출 필요도 없이, 도시 내 어떤 도로나 지역의 교통 흐름이 바뀌었을 때 의심해 보아야 할 이유는 상식적으로 하나가 아니다. 도로의 연결체계나 용량에 손을 대는 것과 같은 물리적 변화 외에도, 신호체계의 변경이나 대중교통의 (재)배치 같은 운영의 변화는 교통 흐름에 직접적인 영향을 준다. 보다 구조적인 변화요인도 많다. (재)개발과 같은 토지이용 변화는 교통 흐름에 새로운 균형을 찾기 위한 과정을 요구하는데, 그 영향은 주변지역에 국한되지 않을 수 있다. 도시 내 경기 순환, 산업구조 및 인구구조 변화도 수도권과 같이 변화 속도가 빠른 지역에서는 고려할 만한 변수다. 이 모든 변화의 흐름과 상호작용하며 도로 위 개인이 취하는 선택의 다이나믹스도 포착하기는 어렵지만 존재한다. 서울역 고가도로..
논의를 이어나가기 전에, 어떤 도로구간의 평균속도라는 것에 대해 다시 잠깐 이야기해야 할 것 같다. 앞서 서울시가 도로구간(링크)별 평균속도 데이터를 산출하는 방식에 대해 설명했지만, 평균속도란 일정 기간(이 데이터는 1시간) 도로구간을 지나간 택시 주행정보를 기초로 실제 도로상황을 추정하는 일종의 대리변수(surrogate variable)다. 이렇게 도출된 평균속도값이 실제를 얼마나 반영하는지는 따져볼 일이다.한편 복수의 평균속도를 대변할 수 있는 하나의 값을 얻기 위해서는 다시 여러 값을 가지고 연산을 해야 한다. 그런데 이것도 계산기 두드리듯 명쾌하지는 않다. 어떤 도로구간의 매주 월요일 8-9시 평균속도값 1년치를 모았을 때, 그것을 가장 잘 대표하는, 가령 중심경향값(central tenden..
이 글은 서울의 도로교통 패턴을 살펴보는 현재 작업의 일부인 동시에, 최근 눈에 띈 한 언론보도에 대한 나의 피드백이다.지난 12월 21일 공개된 '[단독] 고가도로 폐쇄 서울역, 교통지옥 됐다’라는 기사는 요약하면 이렇다: 도심 차도 축소로 “출근길이 오히려 빨라진다”는 서울시 홍보와 달리 지난 2년간 서울역 일대 교통혼잡이 크게 늘어났다.서울시는 고가도로 폐쇄 이튿날인 2015.12.14. 퇴계로(서울역-회현역), 만리재로(서울역-공덕역) 등 일대 도로 평균속도가 이전보다 개선됐다고 홍보하였다. 그러나 신문사가 단독 입수한 자료에 의하면 2015.12.14.에 비해 2017.12.11. 출근시간대 퇴계로와 만리재로 도로 평균속도가 20% 이상 감소하였다. 또한 이들 도로 통행량도 폐쇄 직후 일시 반감..
앞의 과정을 통해 내려받은 링크별 휴일/평일 평균속도 숫자들을 QGIS로 뿌려 보았다. 그리고 앞서의 속도구간 설정을 좀 바꾸었다. 40-60km/h, 60- km/h 대신 40-80, 80- 으로 나누어, 구간의 양적 비례를 조정하고 도시고속도로와 일반도로를 확실히 구분하였다. 6단계 이상으로 구분하는 길도 있었지만 가독성이 너무 떨어져 택하지 않았다.QGIS에서 지도를 한 장씩 뽑아낸 다음 Photoshop의 Motion 기능을 이용 - 뽀샵질하여 애니메이션으로 만들었다. QGIS에도 Time Manager와 같이 지도 애니메이션 제작을 도와주는 플러그인이 있다. 그러나 아직은 불안정하고 사용성이 떨어진다.흥미로운 포인트들을 포착하기에는 속도가 좀 빠르고 복잡하지만, 아무튼 일단 전체적 흐름은 이 영..
이제부터는 링크별 매시간 평균속도 데이터와 놀 차례다. 원시데이터의 신뢰성을 전제한다면 이것은 통계학적으로 놀 거리가 굉장히 풍부한 panel data다. 다만 나에게 어울려 놀 재주가 부족할 따름이다. 숫자가 내 눈앞에 보기 좋게 펼쳐지지 않으면 찌르고 들어갈 각이 보이지 않기에, 일단은 성실하게 펼쳐 볼 수밖에 없다.panel data가 대부분 그렇듯 이 데이터도 이 빠진 데가 있다. 가령 이번 작업에 사용할 2017년 10월의 데이터는 4797개 전체 링크 중 스무 개가 빠진 4777개를 포함하고 있다. 매시 평균속도가 빠짐없이 계산되어 4777×24×31 = 3,568,968개의 값이 있으면 좋겠지만 실제로는 28,314개가 결측으로 남아 3,525,774개의 유효값이 있다. 원칙적으로 해당 시간..
- Total
- Today
- Yesterday