예를 들어 약 5,000만명의 사망자를 낸 1918년 스페인독감의 대유행 양상은 데이터상 2009년 신종플루(H1N1)의 대유행과 꼭 닮았다.
두 인플루엔자는 실제로도 밀접한 연관성이 있다는 게 밝혀졌다.
이에 미 질병통제예방센터(CDC)의 역학자들은 현대의 인플루엔자 데이터 패턴을 과거 사례와 비교연구하고 있다.
과거를 거울삼아 어떤 백신을, 어떻게 제조해서, 어떻게 배포할지와 같은 최적의 대응법을 찾기 위함이다.
데이터 세트가 쌓일수록 미래에 나타날 인플루엔자들의 전파 양상 예측도 정확해진다.
더블 딥
계절성 인플루엔자는 보통 두 번 대유행한다. 12월 중순경 고점을 찍었다가 이음해 2월 초쯤 전파 비율이 2배로 뛰면서 더 높은 고점을 찍는 형태다.
결국 1차 대유행 기간의 전염률이 높을수록 2차 대유행에 대비가 철저해야 한다.
2007년과 2008년의 데이터를 비교해보면 이런 분석을 통해 바이러스에 대한 CDC의 대응력이 향상됐음을 알 수 있다.
최고점
인플루엔자 전파는 보통 2월에 최고점을 찍지만 2009년 신종플루의 최고점은 10월 중순이었다.
한겨울로 접어드는 동안 이미 많은 감염자들이 양산됐고 효율적 대응을 통해 예방백신도 충분히 보급된 덕분에 감염률이 급격히 떨어졌던 것이다.
CDC의 수치는 인플루엔자 추정 질환과 관련해 매주 의사 및 응급실을 찾은 환자 비율을 최대한 정확히 추산한 것이다. 구글은 검색어 데이터 표본 규모를 CDC 규모에 맞게 조정했다.