[쿠키뉴스 대구=김덕용 기자]DGIST(대구경북과학기술원 ·총장 신성철)는 연구팀이 빅데이터 기술을 적용한 올리고뉴클레오티드 설계 기술을 개발했다.
올리고뉴클레오티드(Oligonucleotide)는 A·C·T·G 네 가지 뉴클레오티드로 구성된 단일 나선의 짧은 염기서열을 말하는 것으로 유전자 진단, 신약 개발 등에 필수적으로 쓰인다.
DGIST 정보통신융합공학전공 김민수 교수와 뇌·인지과학전공 구재형 교수 융합연구팀은 구글 검색 방식의 빅데이터 기술을 적용해 정밀하고 빠른 성능을 나타내는 올리고뉴클레오티드 설계 기술(MRPrimerW)을 개발했다고 23일 발표했다.
이 기술은 사람이나 동식물의 전체 유전자 데이터베이스에 존재하는 모든 후보 올리고뉴클레오티드에 맵리듀스((MapReduce)에 기반을 둔
복잡 알고리즘을 적용해 특이성을 갖는 올리고뉴클레오티드만 선별해 저장한다. 맵리듀스는 대규모 데이터를 효율적으로 처리키 위해 여러 대의 컴퓨터를 활용하는 분산 데이터 처리 기술을 말한다.
1차 결과로 선별된 올리고뉴클레오티드는 다시 색인 구조로 변환해 2차 결과를 서버에 저장함으로써 사용자가 입력한 설계 조건과 목표 유전자에 부합하는 최적의 올리고뉴클레오티드를 정확하고 빠르게 설계할 수 있다. 검색 엔진인 구글에서 원하는 정보를 검색하는 것과 동일한 원리다.
적정한 올리고뉴클레오티드를 찾는 것은 이론적으로 하나의 목표 유전자에 약 30억번, 유전체 데이터베이스에 있는 모든 유전자에는 약 900경(京·10의 16승)번의 비교연산이 필요할 만큼 어렵다.
연구팀은 지난해 종 전체 유전자 데이터베이스에 존재하는 특이성을 만족하는 모든 올리고뉴클레오티드를 효율적으로 찾아내는 'MRPrimer' 기술을 세계 최초로 개발했다.
이 기술은 사용자가 설계 조건을 변경할 때마다 수십 시간이 걸리는 대규모 분산 컴퓨팅을 수행해야 하는 것이 단점이다. 'MRPrimerW' 기술은 이러한 단점을 해결했다.
이 기술을 적용하면 유전자 기반의 암 진단, 유전자 변형 농산물 탐지, 신종 바이러스 탐지 등 유전자 진단에 광범위하게 사용하는 올리고뉴클레
오티드를 정밀하게 설계할 수 있고 바이오 신약 개발에도 도움을 줄 것으로 보인다.
전 세계 올리고뉴클레오티드 합성 시장은 매년 10%씩 성장하고 있다. 오는 2020년에는 약 1조원 규모로 성장할 것으로 보여 MRPrimerW 기술은 큰 부가가치를 창출할 것으로 연구팀은 기대했다.
이번 연구 성과는 세계적 권위의 생물과학 학술지인 '뉴클레익 애시즈 리서치(Nucleic Acids Research)' 온라인판 5월 6일자에 실렸고 정보통신융합공학전공 김혜린 박사과정 학생과 뇌 인지과학전공 강나나 박사가 제1공동저자로 참여했다. 연구팀은 관련 기술을 웹사이트(http://MRPrimerW.com)로 전 세계에 무료 공개했다.
김민수 교수는 "MRPrimerW 기술은 빅데이터 분석 기술을 유전자 데이터에 가장 효과적으로 적용한 사례 중 하나로 평가받고 있다"며 "세계 생명정보 소프트웨어 시장을 선도할 수 있도록 지속적으로 노력하겠다"고 말했다. sv101@kukinews.com
"