[Hinews 하이뉴스] 양경모 가톨릭대학교 여의도성모병원 소화기내과 교수와 한지원 서울성모병원 소화기내과 교수 연구팀이 대규모 언어모델(LLM)이 실제 간세포암 치료 결정에 어떤 역할을 할 수 있는지 평가한 결과를 발표했다.
연구팀은 국가 간암등록사업에 등록된 초치료 간세포암 환자 1만3614명의 임상 데이터를 활용했다. 종양 특성, 간기능, 전신 상태 등 구조화된 정보를 LLM(ChatGPT, Gemini, Claude)에 입력해 치료 권고를 생성하고, 실제 치료와 비교했다.
분석 결과, AI 권고와 실제 치료 일치율은 27~33%로 나타났다. 일부 병기에서는 AI 권고와 일치한 치료를 받은 환자가 더 나은 생존을 보였으나, 진행성 간암 환자에서는 일치군의 생존이 오히려 낮게 나타났다.
(왼쪽부터) 양경모 여의도성모병원 교수, 한지원 서울성모병원 교수 (사진 제공=여의도성모병원)연구팀은 AI가 종양 중심 변수를 중시하는 반면, 의료진은 간기능, 전신 상태, 합병증 위험 등 환자 개별 요소를 종합해 치료를 결정하는 경향이 있다고 설명했다. 이로 인해 임상 상황이 복잡할수록 AI 권고와 실제 치료 간 괴리가 커질 수 있다고 분석했다.
양경모 교수는 “이번 연구는 AI가 간암 치료 의사결정에서 어느 정도 보조 역할을 할 수 있는지와 한계를 실제 생존 자료로 확인했다는 점에서 의미가 있다”며 “AI는 가이드라인 기반 판단을 돕는 도구일 뿐, 치료 결정을 대신할 수는 없다”고 말했다.
한지원 교수는 “실제 진료에서는 간기능, 치료 내성, 전신 상태 등 정형화하기 어려운 요소가 치료 선택을 좌우한다”며 “이번 연구는 임상의 판단이 여전히 핵심임을 대규모 자료로 확인한 사례”라고 강조했다.
연구팀은 앞으로 영상과 임상 정보를 결합한 다중모달 AI 개발과 AI 보조 전향적 임상 연구의 필요성을 제시했다. 이번 연구 결과는 의학 분야 국제학술지 PLOS Medicine 2026년 1월호에 게재됐다.