티스토리 뷰

visualization

바이러스와 사회: 1

glasvase 2020. 3. 31. 07:40
"군중은 이미지로만 사고 가능한 바 이미지에만 감응한다. 그들을 겁주거나 매혹하여 행동의 동기를 부여하는 것은 오직 이미지밖에 없다.
" Crowds being only capable of thinking in images are only to be impressed by images. It is only images that terrify or attract them and become motives of action. - Le Bon (1895), The Crowd: A Study of the Popular Mind

바다에 들어가 파도를 몸으로 경험해보면 파도의 성질이 눈짐작과 얼마나 다른지 깨닫게 된다. 코로나바이러스가 말그대로 인류를 휩쓸고 다니는 시국을 지켜보며, 처음 바다에서 파도를 경험한 그때 나의 아찔하고 짭쪼름한 기억을 떠올린다. 우리가 과연 ‘바이러스'라는 메타포를 즐겨 사용할 자격이 있는지 의문스럽기도 하다.

 

코로나바이러스에 대한 의학적 규명이 불충분한 현재 각국 사회와 개인이 행동의 주된 근거로 삼는 ‘팩트’는 매일 업데이트 되는 자국 및 전세계 확진자 통계치다. 역사상 글자당 가격이 가장 비싼 데이터로 기록될 이 숫자를 잘 쓰는 방법은 무엇일까. 사실 이 포스팅의 내용으로 생각했던 것들을 며칠 못 가 버리는 일이 반복될 만큼 이 사태는 정신 없이 전개되고 있다. 이런 때 인간은 합리보다 감정에, 추론보다 직감과 반응에 이끌리고는 한다 — 평소보다 더더욱. 실시간 데이터는 인간에 남은 야생 본능을 통제하는 항생제 역할을 할 수 있다.

 

다만, 데이터가 그 자체로 그런 항생제 역할을 해줄 거라고 기대하기는 어렵다. 주가 차트를 볼 때 주식을 안다면 훨씬 유리하듯, 감염병 현상에 대한 약간의 이해는 확진자 데이터를 유용하게 읽는 데에 도움이 된다.

 

인간은 어떤 수치의 추이를 직선 위에 놓는 데 익숙하다. 그러나 감염병과 같이 증식하는 현상을 설명하는 숫자들은 그런 관습에 잘 부합하지 않는다. 그 경우 변화율(rate of change)을 중심으로 보는 것이 결과적으로 이해에 유용하다. 변화율이란 말이 와닿지 않는다면, 돈의 이자를 떠올리면 된다. 어떤 기간 이자는 돈의 액수뿐 아니라 이자율(interest rate)이라고 부르는 숫자에 의해 결정된다.

현실에서 돈이 이렇게 늘어나는 경험을 맛본 이는 사채 쓴 경우 말고는 드물지만, 아무튼 그 관계는 아래와 같은 수식으로 옮길 수 있다: 이자율 $r$의 지배를 받는 돈은 단위시간이 증가할 때마다,  

$Money_{(t+1)} = Money_{(t)} + Money_{(t)} \times r = Money_{(t)} \times (1 + r)$

 

이런 식으로 늘어난다. 일정 기간 $k$ 후 액수를 계산하려면 위 식을 아래와 같이 살짝 바꾸면 된다.

$Money_{(t+k)} = Money_{(t)} \times (1 + r)^{k}$

 

이 관계는 감염병 현상에 그대로 적용할 수 있다. 돈이 돈을 만들어내듯 감염자가 감염자를 만들어내기 때문이다.

$Infected_{(t+k)} = Infected_{(t)} \times (1 + r)^{k}$

 

적절치 않은 비유였던 것 같으나, 아무튼 $r$에 의해 감염자 수가 어떻게 증가하는지를 그려보면 다음과 같다.

 

 

이 곡선의 ‘증가세'는 각국이 사태 초기에 보이는 확진자 수 추이와 비슷하다.

위 차트에서 즉각적으로 알 수 있는 것은, $r$이 약간만 커져도 수치가 급격하게 늘어나 눈으로 패턴을 읽어내기 어려워진다는 점이다. 흔히 지수함수적 증가라고 부르는 패턴이다. 이러한 패턴을 현재의 사태 맥락에서 이야기하면, 감염자가 일정 수 이상으로 늘어난 시점에서는 매일 큰 숫자의 감염자 증가도 놀랄 일은 아닌 것이다.

예를 들어 감염자 증가가 지수함수적이고 $r$ 이 0.2일 때를 상정하면, 감염자 1명이 1000명으로 늘어나는 데는 38일이 걸리지만, 감염자가 5000명일 때 새로운 1000명이 생기는 데는 하루가 걸린다. 한편 $r$이 0.2에서 0.18로 약간만 떨어지면, 38일째 감염자는 1021명에서 539명으로 감소한다.

 

확진자 통계치를 통해 우리가 가장 고대하는 정보 중 하나가 그 ‘증가세’라고 할 때, 그런 패턴을 보다 읽어내기 좋도록 도와주는 차트가 lin-log plot이다.

 

 

지수함수적 추이가 선형적 추이로 변환됨으로써 $r$ 즉 증가세가 어느 정도인지가 직선의 기울기로 드러난다. 또 증가세가 어떻게 변하는지 보다 쉽게 파악할 수 있다.

정말 증가세를 읽기 쉬워지는가? 3월 30일 기준 확진자가 5000명 이상 발생한 16개국 데이터를 lin-log plot에 올려보면 다음과 같다.

 

 

말했던 것만큼 쉽게 보이진 않는다.. 보다시피 각국 확진자의 수치를 lin-log plot에 그대로 옮겨서는 보기에 적절치 않다.

3월 11일부터 확진자 데이터의 lin-log plot 을 업데이트하고 있는 @jburnmurdock 은 초기 누적확진자가 n명 이상 발생한 날짜를 기준으로 plotting 하는 방식을 사용하였다. 그 방식을 인용하여 n=20으로 그려보았다.

 

 

이렇게 16개 나라 추이를 뭉쳐 보면 대체로 비슷한 증가세 변화를 이어나가는 것이 보인다.

개인적으로 관심을 갖는 국가들을 선별하여 보았다. 그리고 $r$을 나타내었던 점선의 의미도 좀 달리 해보았다. 증가세 $r$은 감염학에서 사용하는 compartmental modeling 방법론의 parameter 중 하나인 $R_e / day $(에서 1을 뺀 값)에 가깝다. 그러나 일반인에게는 가령 "$x$일마다 2배 증가한다”는 표현이 더 직관적으로 느껴질 것이므로, 그런 기준으로 $r$ 표시를 바꿀 수 있다.

 

 

잠깐 기울기를 이야기해 보자면, 미국, 영국, 캐나다 등 최근 무서운 상승세를 보이는 국가들이 대부분 3일마다 확진자 수가 2배 증가하는 선을 타고 있다. 이탈리아는 최근 5일 사이 $r$ 기준 0.1, 또는 "8일간 2배” 선 아래로 떨어져 증가세가 둔화된 경향을 보인다.

 

약간 다른 방식으로 증가세를 보는 것도 방법이다. $r$ 값을 뜯어내어 이를 기준으로 각국의 추이를 살펴보았다. 그날 그날의 전일 대비 $r$은 진폭이 크므로 7일 이동평균값을 취했다.

 

 

대체로 확진자 15명 발생 시점 기준 7일 이내에 전파력을 낮춘 것으로 보인다. (20일차 유난스런 혹은 한국의 것이다.) 단 위 차트에서 왼쪽에 적은 국가들은 7일 이동평균값 기준 한 번이라도 0.8을 건너간 적이 있는 경우다. 참고로 $r$ 0.8은 1.18일마다 확진자 수가 2배로 늘어나는 수준을 말한다. 가장 아찔한 상승세를 보인 나라들이자, 현재 인구 대비 확진률이 높은 나라들이 모인 것은 $r$이 뜻하는 바를 생각해 보면 당연한 결과다. 이제는 누구나 아는 이야기가 되어버렸지만 초기 전파력을 일정 수준 아래로 누르지 못하면 그 이후 효과적인 억제력을 갖추어도 감염자의 급증은 감수해야 한다.

그러나 covid-19은 이러한 경계심을 다소간 무력화하는 잠입 능력을 갖추고 있다. 지난 한 달간 겪었듯 확진자 판별을 위한 각국의 테스트 사정은 일관성이 없었다. 그런 것까지 감안해 데이터를 읽으려면 좀 다른 접근이 필요하다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday