인공지능 희귀질환 진단 및 치료제 개발 기업 쓰리빌리언이 2021-2022년 개최된 글로벌 유전체 해석 인공지능 경진대회 CAGI6(Critical Assessment of Genome Interpretation 6)의 STK11 문제에 참가해 우수한 성과를 거둔 내용이 Human Genetics 저널에 게재 됐고 밝혔다.
CAGI6의 STK11 문제는 비소세포폐암(Non-small cell lung cancer) 환자에게서 발견된 STK11 유전자의 28개 변이에 대한 기능을 AI 모델로 예측하는 과제를 다뤘다. STK11 유전자는 암 억제자로서 폐암 발병에 중요한 역할을 하며, 변이 기능의 정확한 예측은 암 진단과 치료에 필수적이다.
쓰리빌리언은 AUC 93%라는 뛰어난 정확도로 참가팀 중 가장 우수한 예측 정확도를 내는 인공지능 모델로 꼽혔다. 이는 실제 반복 실험으로 확인된 최대 정확도 96%와 큰 차이가 없는 수준이다. gel-shift assay(겔 이동 분석) 실험 결과를 기준으로 평가했을 때는 AUC 100%를 기록하며, 대회 참가 팀 및 기존 변이 해석 툴을 모두 압도하는 성적을 달성했다고 회사측은 설명했다. 특히, 이 결과는 대회가 마무리 된 지 2년 후 발표된 구글 딥마인드(Google DeepMind)의 AlphaMissense 에 대비해 4.3% 더 높은 정확도를 보여주며, 쓰리빌리언의 기술이 글로벌 수준의 AI 유전체 해석 기술을 갖추고 있음을 증명했다고 덧붙였다.
논문 표지 이미지 (쓰리빌리언 제공)
쓰리빌리언은 2022년 개최된 CAGI6에서 금번 출판된 STK11 문제를 포함해 총 3개의 문제에서 참가팀 중 최고 성능의 인공지능 모델을 제출하며 우승했다. 유전변이의 병원성 예측, 유전변이로 인한 단백질 기능 예측, 희귀질환 환자의 WGS(전장유전체) 데이터에서 질병 원인 유전변이를 발굴하는 문제 등 유전체를 활용한 진단과 치료제 개발을 위한 인공지능 모델 기술에 있어 글로벌 수준에 도달해 있음을 증명했다.
쓰리빌리언의 인공지능 총괄을 맡고 있는 이경열 이사는 “CAGI6 우승 AI 모델들을 2021년 개발된 버전이고, 그 후로 4년간 AI 모델은 학습데이터 측면에서나 인공지능 알고리즘 측면에서 많은 고도화가 이뤄졌다. 이 모델은 현재 유전 변이로 인한 단백질 활성 변화를 훨씬 더 정밀하게 평가하고, 이를 바탕으로 신약 후보물질이 효과를 보이는 결합 위치를 발굴하는데 활용되고 있다”며 “유전체 그리고 단백질의 변이 해석 AI 기술 경쟁력을 바탕으로, 진단과 신약개발 모두에서 AI 로 혁신해 나갈 수 있도록 하겠다”고 포부를 밝혔다.