티스토리 뷰

visualization

바이러스와 사회: 2

glasvase 2020. 10. 16. 05:18

도시는 이동의 결사체다. 동선의 효율을 높이기 위해, 혹은 편의를 유지하기 위해 매순간 어마어마한 사회적 비용을 지불하는 집합체다. 도시 교통이 생물체의 혈류에 비유되곤 하는 것은 시각적 유사성을 넘어 실제 그 멈춤이나 정체가 곧바로 도시 기능의 마비를 가져오기 때문이다. 그런 도시에서 살아온 현대인에게 이동의 제약은 기능적 마비와 더불어 기본권의 제약, 심리적 구속이라는 견디기 힘든 느낌을 가져온다.

covid-19에 대응한 사회적 거리두기 조치의 핵심은 외부 일상활동의 제한, 동선의 제약인데, 이는 도시의 구조와 정신에 정면으로 반한다. 그러므로 선량한 시민들과 방역당국의 바람에도 불구하고 이동을 제한하는 조치가 완벽하게 이행되리라고 기대하는 것은 불가능하거나 적어도 자연스럽지 않다.

그럼에도 불구하고 사회적 거리두기는 어느 정도 이루어지고 있다. 그러한 행동 변화를 추동한 힘은 무엇일까? 바이러스의 알려진 의학적 리스크만을 놓고 보면 건강한 사람들이 주눅들 정도는 아니다. 특히 활동량이 가장 많은 연령층이 인지하는 리스크가 가장 낮다. 그런데도 사람들의 행동 변화가 있다면 그것은 두려움에 의한 본능적 반응이라고만 할 수 없는, 다분히 의식적 현상이다.

 

그 의식적 현상에는 정부 등 공공부문이 취한 전방위적 조치, 여론 등이 미친 영향이 클 것이다. 학교가 문을 닫고 모든 행사가 취소되고 민간시설의 영업까지 제한되어버렸으니, 갈 곳도 이유도 줄어들었다. 감염자가 져야 하는 각종 의무와 실질적 불편은 그 자체로 상당한 스트레스임이 분명해졌다. 생활 동선과 신원의 노출이 소속 공동체나 지역사회를 넘어 전국적 가십거리가 될 수 있다는 두려움, 상황 모면을 위해 거짓말을 했다가 구상권 청구나 소송 등 경제적 파탄에 처할 수 있다는 두려움 등은 감염의 리스크 구조를 다층적으로 바꿔놨다.

대유행 초기에는 높은 불확실성 때문에, 이후에는 점점 복잡해지는 리스크 구조 때문에 사람들의 행동 변화는 어떤 패턴을 보일지 예측하기 어렵다. 그리고 사회과학자들은 이런 상황을 유심히 지켜보며 무언가 발견하려는 악취미가 있다.

 

도시의 이동을 통해 사람들의 covid-19 반응을 살피려는 접근은 많다. 구글애플은 자사 지도앱으로 수집하는 사용자 데이터로 전세계 각국 시민의 이동량을 지표화해 지난 4월부터 보고서를 제공하고 있다. 런던시는 관련 인포그래픽을 계속 업데이트하고 있다. 국내에서도 통계청이나 KBS 기자가 SKT 통신 데이터와 신용카드 사용 데이터로 모니터링한 결과를 발표한 바 있다. 논문도 보인다.

 

우선 나는 지금까지의 트렌드 전체를 보고 싶었다. 구하기 쉬운 서울 지하철 이용량부터 살펴보기로 한다. 서울 지하철은 서울 내 통행의 40%를 담당하는 교통수단이다. 지하철 이용량이 서울 내지 수도권 시민들의 이동행위를 잘 반영하고 있을까? 여기서는 그렇다고 치자.

아래는 작년 2019년부터 지난 10월 12일까지의 서울 지하철 승객 수다.

 

이런 교통 시계열은 일주일 주기의 seasonality를 띠므로, 전체적인 흐름을 읽기 쉽도록 하기 위해서는 이를 통제할 필요가 있다. 여러 가지 방법이 있지만 간단히 moving average(boxcar, window=7)을 적용하면 차트 아래쪽과 같이 흐름이 선명해진다.

 

2019년의 흐름을 보면 단기적 이용량 저하는 정도의 차이를 논외로 하면 휴일 이벤트의 존재로 완전히 설명된다. 반면 올해 2월 이후의 흐름은 그렇지 않다. covid-19 관련 이벤트를 함께 보아야 할 차례다.

 

 

첫 확진자 발생 이후 주요 집단감염 사건, 누적 확진자 자릿수 증가, 정부의 주요 거리두기 조치 시행일을 표시하였다. 지난 몇 달의 사건들이 주마등처럼 지나간다. 그러나 이용량 변화의 흐름이 이것만으로 설명되는 것 같지는 않다. 아무래도 확진자 발생 추이를 함께 보고 싶다.

 

 

이제 무언가 ‘관계’가 드러난 것 같다. 그림이 좀 복잡해졌지만 메시지는 간단하다. 대유행 이후 휴일 외 지하철 이용량이 크게 떨어지는 시기는 전국 확진자의 발생, 정확히는 증가 구간과 일치한다.

 

이러한 관계는 당연해 보이기도, 흥미로워 보이기도 한다. 앞에서 지적했듯 이 국면에서 그날그날의 활동 수준을 선택하기 위해 개인이 수행해야 하는 계산 — 리스크 평가 — 은 단순하지 않다. 3월의 1차 확산기에 서울시민은 바이러스의 리스크를 일관되게 평가할 객관적 정보가 거의 없었다. 이후 점차 의학적 불확실성은 줄어드는 한편 방역정책과 여론에 의해 부여된 리스크는 커지고 복잡해졌다. 그런 가운데 각자가 나름의 '산식'으로 리스크를 평가해왔고, 매일 수백만 명이 평가한 결과(의 주요한 일부)가 이 지하철 이용량 추이다. 리스크 평가 과정에서 전국 확진자 수 소식은 일관되게 적잖은 영향을 미친 것 같다.

그간 정부의 사회적 거리두기 단계 발표가 이용량에 변화를 일으키는 직접적 동인으로 작용하지 않아 보인다는 점은 사실 예상 가능하다. 한국 정부의 사회적 거리두기 단계 설정은 개인의 활동 지침 역할을 하기 위해서라기보다, 관할영역에 대한 방역행정 시행의 근거 역할을 하기 위한 것으로 여겨진다. 그리고 정부 조치의 세부 내용이 확진자 발생 추이와 동기화한 결과라 본다면, 조치의 영향은 확진자 변수 영향에 흡수되어 있는 것이다. 아무튼 이 문단의 결론은 서울 지하철 이용량 변화는 전국 확진자 수와 모종의 상관관계를 가진다는 것이다.

 

내친 김에 단순상관관계를 확인해본다. 단 OLS에 숫자를 밀어넣기 전에 생각해볼 점이 있다:

1. 사람들이 매일 발표되는 확진자 수를 어떻게 받아들이고 있느냐

2. 확진자 수 증가가 이동량 감소로 이어지는 만큼 확진자 수 감소가 이동량 증가로 이어진다고 볼 수 있느냐

내 생각은 이렇다:

1. 질병관리본부가 매일 발표하는 수치보다는 최근 m일 동안의 흐름을 보려고 한다

2. 그렇지 않다

 

내 가설의 검증 과정을 다 푸는 일은 생략하기로 한다. 잠깐의 시도로 찾은 input은, 휴일의 영향을 받는 기간을 제외하고 

$x:$ 확진자의 어제 기준 MA(7)과 그제 MA(7)과의 차이의 log

$y:$ 지하철 이용량의 전날과의 차이

에 해당하는 값이다. $x$가 0 이상인 날들의 데이터포인트로 OLS를 해보면 $r^2=.387$ 정도의 상관관계가 보인다.

 

 

outlier 빼고 다듬다 보면 수치는 약간 더 올릴 수 있을 듯하지만, 나의 관심이 회귀 모델링은 아니다. 이런 시계열 데이터에서 선형회귀가 딱히 어울리는 것도 아니다. 보다 어울리는 관심은 서울시민들이 상황 변화에 반응한 속도다.

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday