서울의 도로교통 패턴 #3
이제부터는 링크별 매시간 평균속도 데이터와 놀 차례다. 원시데이터의 신뢰성을 전제한다면 이것은 통계학적으로 놀 거리가 굉장히 풍부한 panel data다. 다만 나에게 어울려 놀 재주가 부족할 따름이다. 숫자가 내 눈앞에 보기 좋게 펼쳐지지 않으면 찌르고 들어갈 각이 보이지 않기에, 일단은 성실하게 펼쳐 볼 수밖에 없다.panel data가 대부분 그렇듯 이 데이터도 이 빠진 데가 있다. 가령 이번 작업에 사용할 2017년 10월의 데이터는 4797개 전체 링크 중 스무 개가 빠진 4777개를 포함하고 있다. 매시 평균속도가 빠짐없이 계산되어 4777×24×31 = 3,568,968개의 값이 있으면 좋겠지만 실제로는 28,314개가 결측으로 남아 3,525,774개의 유효값이 있다. 원칙적으로 해당 시간..
visualization
2017. 12. 8. 02:33
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday