티스토리 뷰

서울시가 따릉이의 대여소별 데이터에 이어 지난 5월 자전거별 대여이력을 공개했다. 처음 data.seoul에 올라온 데이터 제목을 보고는 흥분감을 느끼며 다운로드를 시작했다. 대여자 정보와 이동경로가 포함되어 있는 줄 기대했던 것이다. 따릉이는 회원제이므로 모든 대여이력에는 이용자의 특성 관련 사항이 결합될 수 있다. 게다가 자전거에 GPS가 내장되어 있기에 서울시 서버에는 따릉이 이용자가 이용한 이동경로까지 저장되어 있을 것이다.

그러나 서울시의 개인정보 노출 공포증 때문인지, 아니면 대부분이 데이터를 소화 못할 것을 걱정해준 때문인지, 그런 데이터는 싹 날아가 있다. 공개된 데이터셋은 자전거 고유번호, 분 단위의 대여 시작 및 반납 시간, 대여 시작 및 반납 장소, 주행거리로 이루어져 있다. 그마저도 현재는 2017년 1분기까지의 이력만 올라와 있어, 대여소가 강남 지역으로 확대된 이후의 패턴은 알 수 없다.


불만스럽지만, 사실 이 정도의 정보만으로도 뽑아낼 수 있는 것들은 많고 많다. 일단 해보고 싶었던 것은 시작점과 도착점의 연결, 즉 따릉이 이용자들은 어디에서 출발해서 어디로 가는가를 모아보는 일이다.

시작점과 도착점을 연결한 직선의 오버랩 시각화는 고전적이면서도 맵시가 있는 접근이다. 비행기처럼 최단거리와 이동경로가 비슷한 경우에는 작은 정보량으로 이보다 잘 풀어낼 수 있는 방법이 없다. 그러나 지리적 제약을 받는 지상 교통의 경우는 완전히 다르다. 연결선은 그야말로 추상적 표현, 다이어그램에 지나지 않는다. 실제 이동경로와 아무 관련이 없을 뿐 아니라 사실을 왜곡한 표현일 수 있기 때문이다.

그러나 지금 주어진 건 딸랑 점 두 개뿐이라.. 이렇게라도 들어가보려 한다.


2017년 1분기(1월 1일 - 3월 31일) 대여이력 354,687건으로 시작해 보았다. 이 중 대여소 일련번호 정보가 유효하지 않아 data.seoul이 제공하는 대여소 위치정보에 매핑할 수 없는 8135건을 제외해야 한다. 그리고 대여한 것은 맞지만 같은 대여소에서 빌리고 반납한 경우, 즉 시작점과 도착점이 동일한 경우가 34,485건이나 된다. 흥미로운 이용 패턴이고 별도로 떼어 들여다 볼 만한 부분이지만, 이동경로가 없어 선을 생성할 수 없기 때문에 역시 제외할 수밖에 없다. 남은 312,067건을 가지고 지도 위에 뿌려보았다.


따릉이 2017년 1분기 주행이력의 출발점-도착점 연결


뭔가 열심히 움직였구나 하는 느낌은 주지만, 이동이 너무 추상화된 나머지 직관도 해석도 여지가 많지 않은 그림이다. 클러스터를 이루는 대여소들이 다각형을 만들어 빛을 내는 듯도 한데 너무 뭉개진다.

다행히 이 30만 개 선분마다 시간 정보와 거리 정보가 있어 이 얽히고설킨 그물을 입체적으로 펴볼 수 있다. 우선 주행거리를 반영해 보았다.


따릉이 2017년 1분기 주행이력의 출발점-도착점 연결. 주행거리별로 색을 달리 하였다.


이제 패턴이 윤곽을 드러내기 시작한다. 일단 하늘색의 연결망이 눈에 띄는데, 이 선들은 전체 대여의 74%를 차지하는 3km 미만의 단거리 이동에 해당한다. 이용자들이 자신의 생활권역 내 이동수단으로 따릉이를 택한 경우로 볼 수 있다. 그리고 그것이 일정하게 닫힌 계를 형성하는 것이 시각화로 드러난다. 대략 은평구의 6호선 링, 상암동, 여의도, 목동, 사대문안, 성수 등이 자전거 이동권으로서 그런 계를 갖는 것으로 보인다. 반면 한강변 대여소를 위주로 한 장거리 주행의 흔적이 뜨거운 별 외곽의 적색왜성단을 형성한다.


줌인해서 대여소별 패턴을 부각시킬 수도 있다. 가독성이 높지는 않지만, 대여소별로 도착한 근거리(하늘색)/원거리(빨간색) 주행의 지리적 방위를 대략 가늠할 수 있게 해보았다.


따릉이 2017년 1분기 은평구 지역 주행이력


따릉이 2017년 1분기 마포-여의도 지역 주행이력


시각화에 한정할 때 QGIS는 정말 사랑받을 자격이 있는 도구다.


댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday