산업 IT

마크로젠-분당서울대병원, 동북아 최대 규모의 ‘동북아 유전체 DB’ 구축

韓, 바이오 빅데이터 의료산업에 활용 전망

동북아시아인 어드믹스쳐 분석 결과동북아시아인 어드믹스쳐 분석 결과



마크로젠이 동북아시아 최대 규모의 동북아시아인 참조 유전체 데이터베이스를 공개했다. 그동안 턱없이 부족했던 동북아시아인 참조 유전자 데이터베이스가 구축됨에 따라 앞으로 빅데이터 기반 의료산업을 위해 활용될 수 있을지 주목된다.

마크로젠과 분당서울대학교병원 공동 연구팀은 이 같은 내용의 연구결과가 오픈 액세스 저널인 ‘유전체 의학’ 온라인판에 10월 22자로 실렸다고 18일 밝혔다.

동북아시아인 참조 유전체 데이터베이스에는 한국인 850명을 포함한 몽골인 384명, 일본인 396명, 중국인 91명, 홍콩인 58명 등 총 1,779명의 전장 유전체 분석(WGS) 정보와 유전변이 정보가 포함돼 있다. 이는 한국, 몽골, 일본, 중국 등 동북아시아 4개국을 대표할 수 있는 참조 유전체 데이터베이스 중 최대 규모이며, 현재까지 국내외에서 공개된 참조 유전체 데이터베이스 중 동북아시아인 유전체 분석에서 정확도를 크게 높일 수 있는 것으로 나타났다.


참조 유전체(Reference Database)는 수천 명에서 수만 명에 이르는 사람들의 전장 유전체 염기서열 정보로 구성된 데이터베이스로, 전장 유전체 연관성 분석(GWAS) 연구에서 사용된다. 마크로젠에 따르면 그동안 동북아시아인을 위한 참조 유전체 데이터베이스는 턱없이 부족했다. 현재까지 세계에서 가장 큰 참조 유전체 데이터베이스로 알려진 하플로타입 레퍼런스 컨소시엄(HRC)에서 구축한 데이터베이스는 대부분 유럽인종으로 구성돼 있으며, 동북아시아인의 비중은 약 1%에 불과해 이들을 대상으로 한 전장 유전체 연관성 분석 연구에서 높은 정확도를 얻기가 매우 힘든 상황이다. 이에 대규모의 동북아시아인 참조 유전체 데이터베이스에 대한 필요성이 꾸준히 제기돼 왔다.



공동 연구팀은 이번 연구를 통해 동북아시아 4개국에서 각각 특이적으로 나타나는 유전체 특성이 있다는 것을 세계 최초로 규명했다. 동북아시아인 참조 유전체 데이터베이스에 주성분 분석(principal component analysis)과 어드믹스쳐(admixture) 분석을 진행한 결과, 한국인, 일본인, 중국인, 몽골인은 서로 다른 유전체 구성을 보였으며, 특히 한국인의 유전체 구성은 다른 동북아시아인의 유전체 구성과 뚜렷하게 구분되는 것으로 나타났다. 이는 동북아시아인과 같은 대륙별 인종뿐 아니라 국가별 인종에 대한 참조 유전체 구축이 필요함을 나타내며, 무엇보다 한국인에 대한 참조 유전체 데이터베이스의 필요성과 유의성을 과학적으로 입증한 중요한 결과라고 마크로젠은 설명했다.

서정선 분당서울대학교병원 석좌교수는 “이번 연구를 통해 동북아시아인의 유전적 특성을 확인했을 뿐만 아니라 전 세계적으로 독보적인 정확도를 자랑하는 참조 유전체 데이터베이스를 구축하는 데 성공했다”며 “현재 1만명 규모의 동북아시아인 2차 참조 유전체 데이터베이스 분석이 마무리돼 내년 초 추가로 공개할 예정”이라고 말했다. 그는 이어 “동북아시아인 질병 관련 유전자 발굴 및 질병 예측에 크게 기여할 수 있을 것으로 기대한다”고 덧붙였다.

한편 새롭게 구축한 동북아시아인 참조 유전체 데이터베이스는 ‘NARD 임퓨테이션’ 사이트를 통해 누구나 자유롭게 이용할 수 있다.


박홍용 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기