인공지능 기술을 활용한 코로나 데이터 분석


직책 : 세부과제 연구 책임자

기간 : 2022.01 ~ 2022.04


연구필요성

국내에서 처음 코로나 감염자가 발생한 2020년 1월부터 코로나 바이러스는 2022년 4월말까지 변이를 계속해 오면 국내에서만 1700만 여명을 감염시키며 사회 전 분야에 걸쳐 영향을 미치고 있다. 상대적으로 치명률이 낮은 오미크론변이의 확산으로 수년간 지속되어 오던 사회적 거리두기 등과 같은 방역대책이 해제되어 일상으로의 복귀를 앞당기고 있지만 최근 연구결과 및 전문가들의 의견으로는 코로나 바이러스와 같은 신종 바이러스의 창궐 주기가 짧아지고 있어 수년 안에 다시 팬데믹 상황에 직면 할 수 있다고 경고하고 있다. 따라서 추후 발생할 수 있는 감염병에 대응하기 위해서 현재까지 수집된 코로나 관련 데이터와 정부 및 공공기관에서 수집하고 있는 공공데이터 등과 연계를 통해 분석을 위한 데이터셋을 구축하고 이를 다양한 인공지능 기법을 활용해 데이터관점에서의 분석이 요구되는 상황이다. 이러한 분석은 추후에 발생할 수 있는 감염병 상황에서 실시간으로 수집되는 데이터를 통해 감염병 대응을 위한 체계 구축에 도움이 될 것이다.


연구 목적 및 내용

본 연구에서는 앞으로 다가올 수 있는 감염병에 대응하기 위한 대응체계 구축의 일환으로 국내 코로나 데이터와 접근할 수 있는 공공데이터의 융합을 통해 코로나 데이터 분석을 수행하였다. 연구에 활용된 기초데이터는 국내 코로나 확진자 데이터를 사용하였고 그 외에 공공데이터 포털, 서울 열린 데이터 광장, 기상청 등을 통해 수집한 추가데이터들과 함께 분석을 수행하였다. 분석은 수집된 데이터를 각 분석목적에 적합하도록 전처리를 수행한 뒤 다양한 인공지능 기법을 활용하여 확진자의 지역별 변이별 특징 분석, 확진자의 중증도 예측, 코로나 변이별 확진자 수, 사망자 수, 재생산지수 예측을 하였고 예측결과 및 예측에 활용된 주요변수들을 식별하였다.


기대효과

기초데이터 및 추가데이터를 통한 다양한 분석을 통해 감염병 대응단계에서 활용할 수 있는 분석기법을 식별하고 추후 더욱 정확한 예측 성능을 위해서는 어떠한 데이터를 함께 수집하고 분석하여야 할지 제안하여 향후에 발생할 수 있는 신규 감염병 상황에서 효과적으로 대응할 수 있는 대응체계 구축에 도움을 줄 수 있다.