▲ 건국대학교 의학과 김성영 교수 연구팀이 메타분석 기반 기계학습 알고리즘을 이용해 높은 신뢰도로 암을 구별할 수 있는 인공지능 플랫폼을 개발했다. 박경식 교수(좌)와 김성영 교수(우)

[기계신문] 최근 인공지능 의학의 관심이 크게 증가하고 다중오믹스 데이터와 기계학습을 활용한 예측 기술은 암 진단 및 치료의 혁신적인 미래의료 기술로 기대되고 있으나, 예측 인자 및 모델이 연구자별, 센터별 그리고 분석 플랫폼별로 상이해 보다 객관적이고 신뢰할 수 있는 모델의 발굴 및 검증 요구가 높아지고 있다.

또한 기계학습을 통한 모델링은 대부분 해석이 어려운 경우가 많아 예측의 정확도뿐 아니라 모델의 해석력 또한 모델의 성능을 평가하는 데 매우 중요한 요소로 인식되고 있다.

최근 국내 연구진이 미국 메모리얼 슬로언케터링 암센터 연구진과 함께 새로운 형태의 암 진단 인공지능 플랫폼을 소개했다. 건국대학교 의학과 김성영 교수 연구팀이 메타분석 기반 기계학습 알고리즘을 이용해 높은 신뢰도로 암을 구별할 수 있는 인공지능 플랫폼을 개발했다.

의학 분야에서는 동일한 주제에 대한 다양한 연구결과를 통합해 결과의 일관성을 평가하고 통계적 정확성을 높이는 기법으로 메타분석 연구가 활발하게 이루어지고 있다.

메타분석(meta-analysis)은 유사한 주제로 실시된 개별연구에 나타난 연구 추정치를 공통된 효과크기로 전환하여 실험결과를 객관적이고 일반화시키는 방법으로 근거중심의학의 핵심이 되는 통계기법이다.

근거중심의학(Evidence-based medicine)은 임상적인 의사결정의 근거로 단편적인 임상 경험이나 질병 메커니즘에 근거한 추론보다는 정교하게 설계되고 잘 수행된 연구, 즉 무작위 대조시험(randomized controlled trial)이나 메타분석 등의 결과를 바탕으로 한 과학적 근거에 기반을 둔 의학적 방법론이다.

건국대 연구팀은 암조직의 유전자 발현 및 관련 생물경로를 메타분석 기반의 알고리즘을 이용해 통합하고, 이를 인공지능을 위한 학습재료로 사용하였다.

▲ 개발된 메타분석 기반 기계학습 알고리즘 도식. 메타분석 기반 기계학습 알고리즘의 핵심과정으로 ▶표준화 다중 코호트를 비선형 주성분분석을 이용해 개별 생물경로에 매핑하고 ▶이를 이용해 벌점 기반의 기계학습과 파라미터 최적화 알고리즘을 적용 ▶핵심 예측인자를 추출한다.

연구팀은 기계학습 알고리즘을 메타분석과 결합시켜 보다 강건한 모델(MLMA, machine learning-based meta-analytic methods)을 구축하였다. 유전체 빅데이터는 보통 ‘차원의 저주’라 불리는 고차원 문제에 직면하는데, 연구팀은 비선형 주성분 분석과 생물경로를 이용한 차원축소 방법이 모델의 일반성과 해석력을 크게 끌어올리는 것을 확인했다.

이렇게 만들어진 알고리즘을 실제 암맹 갑상선암 샘플에 검증한 결과 거의 완벽한 분류 성능을 나타냈다. 갑상선암의 여러 아형을 테스트한 결과 높은 정확도로 이들 아형까지도 구분해냈다. 노화관련 질환인 점을 고려하여 노화인자를 교정한 고위험군에서도 이 모델의 성능을 확인하였다.

유전체 발현 데이터는 연구자 및 수행기관, 분석플랫폼 별로 예측인자와 모델이 상이해 메타분석 및 생물경로 기반의 알고리즘은 보다 객관적이고 해석력이 뛰어나다는 설명이다. 실제 연구팀은 다중오믹스 분석을 통해 갑상선암 관련 생물경로의 조절인자를 찾아내 모델의 해석력을 극대화했다.

김성영 교수는 “개발된 알고리즘은 갑상선암 이외의 다른 암으로도 쉽게 응용될 수 있다”며 “또한 회귀 및 경로 분석 기반의 알고리즘으로 원인분석 및 결과의 일관성을 중시하는 임상에서 선호될 것으로 내다보고 있다”고 설명했다.

과학기술정보통신부와 한국연구재단이 추진하는 기본연구사업 및 바이오·의료기술개발 사업의 지원을 받은 이번 연구 성과는 수학 및 컴퓨터생물학 분야 국제학술지 ‘브리핑스 인 바이오인포메틱스(Brief. Bioinform)’ 최신호에 게재될 예정이다.

기계신문, 기계산업 뉴스채널