미국 노스웨스턴대 연구진이 당뇨병, 암, 천식과 같은 질병의 근본 원인이 되는 유전자 조합을 식별하는 새로운 계산 도구를 개발했다./카밀라 펠릭스

당뇨병, 암, 천식과 같은 질환은 단순히 한 가지 유전자의 이상으로 생기지 않는다. 여러 유전자가 복합적으로 작용해 나타난다. 유전자들이 어떤 조합으로 작동해 질병을 일으키는지 알아내는 일은 오랫동안 과학자들에게 숙제로 남아 있었다. 가능한 조합의 수가 너무 많기 때문이다.

미국 노스웨스턴대 연구진이 유전자 발현 데이터를 활용해 복잡한 질병을 일으키는 유전자 조합을 찾아내는 새로운 인공지능(AI) 기반 분석 도구를 개발했다. 연구 결과는 국제 학술지 ‘미 국립과학원회보(PNAS)’에 10일 게재됐다.

기존 연구들은 대부분 특정 질병과 관련된 단일 유전자를 찾아내는 데 집중했다. 반면 노스웨스턴대 연구진은 질병을 유발하는 유전자 조합에 집중했다.

아딜슨 모터 노스웨스턴대 교수는 “암과 같은 질병은 비행기 추락 사고에 비유할 수 있다”며 “비행기 추락 사고가 대부분 여러 차례의 고장에 이어 발생하는 것처럼 질병도 여러 유전자의 조합에 의해 결정되기 때문에, 유전자 네트워크를 살피는 것이 중요하다”고 설명했다.

연구진은 ‘티웨이브(TWAVE)’라는 AI 모델을 개발했다. 제한된 유전자 발현 데이터를 바탕으로 건강한 상태와 질병 상태의 차이를 분석하고, 어떤 유전자들이 질병을 일으키는지 예측할 수 있는 모델이다.

유전자는 4가지 종류의 염기들이 연결된 형태이다. 이 순서대로 단백질을 합성해 생명 현상을 관장한다. 유전자를 해독하는 것은 이런 염기서열을 확인하는 과정이다. 이번에 개발한 AI는 단순히 유전자 서열을 분석하는 것이 아니라, 유전자가 실제로 얼마나 활발히 작동하는지 ‘유전자 발현’을 살핀다는 점이 다르다.

여러 질병에 걸쳐 AI를 시험한 결과, 기존 방법으로는 발견하지 못했던 유전자를 포함해 질병을 일으키는 유전자들을 찾아냈다. 또 같은 병이라도 사람마다 병을 일으키는 유전자 조합이 다를 수 있다는 점도 확인했다. 이를 활용하면 환자 개인의 유전자 특성에 맞춘 ‘정밀 의료’가 가능할 것으로 보인다.

특히 유전자 발현 데이터는 유전자 염기서열 정보에 비해 개인정보 보호 문제에 대한 우려가 적다. 유전자 염기서열은 개인의 고유한 정보지만, 유전자 발현은 환경 변화나 생활 습관에 따라 달라질 수 있기 때문이다. 동시에 유전자 발현 데이터를 활용하면 환경 요인의 영향까지 간접적으로 살필 수 있다는 장점도 있다.

모터 교수는 “두 사람에게서 같은 질병이 비슷하게 나타날 수 있지만, 유전적, 환경적, 생활 습관의 차이로 개인마다 다른 유전자가 관여할 수 있다”며 “이러한 정보는 개인 맞춤형 치료의 방향을 제시할 수 있다”고 덧붙였다.

참고 자료

PNAS(2025), DOI: https://doi.org/10.1073/pnas.2415071122