[기고] 농업 위기의 해법, 농생명 빅데이터

김두호 농촌진흥청 차장

김두호 농촌진흥청 차장

제임스 왓슨과 프랜시스 크릭이 DNA 구조가 이중나선임을 밝히며 시작된 생명공학의 역사는 70년에 이른다. 생명공학은 우리 삶과 깊이 연관돼 있다. 코로나19 감염 여부를 유전자증폭(PCR)으로 확인하고 관련 기술로 백신이 생산된다. 농업 분야에서 과수화상병 의심 증상을 신속·정확하게 판단하는 데도 PCR 기술이 사용된다.


인류는 지난 1990년 ‘인간 게놈 프로젝트’를 시작했고 13년 후 30억 개 염기 서열에 달하는 인간 유전체 정보를 발표했다. 유전체 시대가 열리자 농촌진흥청은 2014년부터 주요 농작물·가축·곤충 등 40여 종의 농생명 유전체를 해독하고 있다. 해독이 완료된 농생명체의 DNA 데이터는 농진청 산하 농업생명공학정보센터(NABIC) 서버에 업로드되고 있다. 현재 NABIC 서버에는 50TB의 디지털화된 생명 정보가 저장돼 있다. 이는 인간 유전체의 약 1만 7,000배 분량이다. 인간 유전체 연구가 표준 유전체 해독을 넘어 개인 맞춤형 서비스로 발전하고 있듯 작물 유전체 분야도 농가 맞춤형 작물 개발을 위해 다양한 품종의 유전체를 해독하는 방향으로 나아갈 것이다.


농생명 유전체 정보는 기후변화에 대응할 단서도 제공한다. 농업 분야에서 탄소 중립을 실현하려면 비료를 적게 쓰고 이산화탄소를 더 많이 흡수하는 작물을 개발해야 하는데 전통적인 육종 방법으로는 한계가 있다. 빠르고 정확하게 신품종을 만들기 위한 대안이 바로 디지털 육종이다. 유전체와 표현체 정보를 분석해 교배를 위한 최적 조합을 예측하고 수백·수천 개 후보로부터 우수한 계통을 골라낼 수 있다.


이런 복합적 작업을 완수하려면 유전체 정보뿐 아니라 대량의 정밀 표현형 정보가 뒷받침돼야 한다. 농진청은 국내 최초로 가시광선과 근적외선·적외선 카메라를 이용해 수백 개의 식물체 영상 정보를 수집·분석해 생육 상태와 표현형을 디지털화하는 표현체 연구 시설을 설치·운영하고 있다. 벼에서 같은 조건일 경우 빨리 자라는 형질과 가뭄 스트레스를 정량적으로 판단할 수 있는 지표도 발굴했고, 다양한 작물과 형질로 적용 범위를 확대하고 있다.


디지털 육종을 원활하게 추진하려면 넘어야 할 산이 있다. 목표 형질에 작용하는 유전자는 여러 유전자가 얽혀 있는 경우가 많아 상호작용의 실타래를 풀어내려면 상당한 양의 컴퓨터 계산이 필요하다. 특히 정확한 결과를 얻으려면 투입 데이터를 늘려야 해 엄청난 컴퓨터 연산이 필요하다. 지난해 6월 관련 법 개정을 통해 농생명 분야 초고성능 컴퓨팅 활용 연구 개발의 법적 근거를 확보하고 슈퍼 컴퓨팅 센터 설립을 추진하는 이유다.


농진청은 농생명 정보 분석·관리 인프라를 바탕으로 농생명체의 대량·정밀 유전체와 표현체 정보에 데이터 과학과 인공지능(AI) 기술을 접목해 농업의 당면 난제를 극복하고 바이오산업을 육성하는 데 기여할 것이다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>