AI 학습에 참여한 모든 기관, 범용 모델로 학습 가능
대규모 AI 모델 개발 비용 획기적으로 줄일 수 있어
(내외방송=정지원 기자) 의료 분야에서 인공지능 활용 시 환자의 개인정보가 침해될 수 있다는 우려가 앞으로 해결될 것으로 보인다.
DGIST(대구경북과학기술원)는 "박상현 로봇및기계전자공학과 교수 연구팀이 미국 스탠퍼드 대학 연구팀과 협력해 개인정보와 데이터 공유 없이 대규모 모델 학습이 가능한 연합학습 AI(인공지능) 기술을 개발했다"고 10일 밝혔다.
이 기술은 여러 기관이 함께 사용할 수 있는 모델을 효율적으로 학습할 수 있어 의료 영상 분석 분야에 큰 기여를 할 수 있을 것으로 연구팀은 기대하고 있다.
연구팀은 각 병원의 데이터를 모델에 전송하는 횟수를 최소화해 환자의 정보를 안전하게 보관하는 방법으로 '이미지 생성'과 '지식 증류(미리 잘 학습된 네트워크를 활용해 실제로 사용하고자 하는 네트워크를 학습)' 기술을 활용했다.
이 기술로 현미경 영상과 피부 영상, 병리영상과 X-ray 영상 등에 대한 분류를 수행했으며 그 결과, 기존 연합학습과 비교했을 때 우수한 분류 성능이 나타났다.
더 나아가 연구팀은 2D MRI(자기공명영상법) 슬라이드를 조건부(일정한 규칙)로 입력받아 3D 뇌 MRI를 생성하는 '조건 확산 모델'도 개발했다.
이 모델은 기존 모델과 비교해 적은 메모리만으로도 양질의 영상을 생성할 수 있어 의료 분야에 중요한 역할을 할 수 있을 것으로 평가된다.
박 교수는 "이번 연구를 통해 데이터와 개인정보를 공유하지 않고, 학습에 참여한 모든 기관에서 범용적으로 작동하는 모델을 학습할 수 있다"면서 "이 기술이 여러 의료 현장에서 대규모 인공지능 모델을 개발하는 비용을 획기적으로 줄일 수 있을 것"이라고 말했다.
한편, 이 연구는 한국연구재단 등의 지원을 받아 수행됐으며 국제학술지인 '의료영상기술학회(Medical Image Computing and Computer Assisted Intervention)'에 최근 게재됐다(논문명: One-shot Federated Learning on Medical Data using Knowledge Distillation with Image Synthesis and Client Model Adaptation).