한국과학기술정보연구원(KISTI)은 국가슈퍼컴퓨터 5호기 누리온을 이용해 전장유전체 연관분석(GWAS)을 수행하고, 통계오류를 보정할 수 있는 거대규모 슈퍼컴퓨팅 소프트웨어를 개발했다.
전장유전체 연관분석 기술은 특정 질병과 관련된 유전자를 찾기 위해 한 생물체의 염기서열 전체를 해독하고, 유전체 전 영역에서 발생하는 유전변이를 찾아 통계적인 연관성을 분석하는 방법이다. 질병을 일으키는 원인 유전자뿐 아니라 개인 맞춤형 건강 관리, 농축산 분야에서 새로운 품종을 개량하는 데에도 널리 쓰이고 있다. 다만 워낙 계산량이 방대해 기존의 컴퓨터로는 한계가 있어 데이터 중 일부만 계산하고 나머지는 통계적으로 보완하는 방식으로 이루어졌다. 그래서 실제로 질병과 관련성이 낮은 유전자 변이가 질병 발병과 연관성이 높게 나타나는 문제가 있었다.
KISTI 슈퍼컴퓨팅응용센터 연구팀은 누리온을 이용해 최대 2500 노드를 동시에 사용해 기존 통계 프로그램보다 약 300% 이상 빠르게 계산할 수 있도록 계산 속도를 높였다. 2500 노드는 약 7.5 페타플롭스(1패타플롭스 = 1초당 1000조 회 계산) 정도의 고성능 연산이 가능한 수준으로 KISTI 슈퍼컴퓨터 5호기 성능의 약 25%를 차지하는 규모다.
이를 이용해 연구팀은 한국인 7523명과 영국인 4242명의 8만4295개 유전자 변이 중 당뇨, 고혈압과 관련된 유전자 변이를 전장유전체 연관분석을 통해 도출하고, 최대 70억 회 이상의 무작위 조합을 통해 통계상 나타나는 오류를 보정했다.
연구에 참여한 권오경 책임연구원과 백효정 선임연구원은 “이번 전장유전체 연관분석 관련 소프트웨어는 소스코드를 공개해 다양한 유전체 연구자들이 자유롭게 활용할 수 있도록 했다”며 “유전체 분야에 슈퍼컴퓨터를 활용한 연구 효율화가 기대된다”고 말했다. 이번 연구 결과는 국제학술지 ‘유전체학과 정보학(Genomics&Informatics)’ 3월 31일자에 실렸다.
'KISTI와과학' 카테고리의 다른 글
[KISTI의 과학향기X슈르연구소] 영수증이 자꾸 지워져요 (0) | 2022.04.27 |
---|---|
꿀벌 집단 실종, 인류를 위협한다 (0) | 2022.04.25 |
쓰디 쓴 커피와 다크 초콜릿, 잘 즐기는 비결은 바로 ‘유전자’ (0) | 2022.04.20 |
근력 늘리는 데 필요한 시간은 하루 단 3초? (0) | 2022.04.18 |
공격용 무인 드론, 이제 레이저로 격추한다 (0) | 2022.04.15 |