[과학]레이블링 과정 없어도 정확도 높은 '관계 보존 학습'?

데이터 간 관계 정의해 학습...기존 연구의 엄격한 규제 완화 정점 분류 문제·간선 예측 문제서 그래프 신경망 성능 향상 확인

2022-10-25 정지원 기자

박찬영

(내외방송=정지원 과학전문 기자) 인공지능 훈련 데이터에 정답지를 만드는 레이블링 과정이 없어도 높은 예측 정확도를 달성할 수 있는 새로운 기술이 개발됐다.

KAIST는 25일 '내외방송'에 보낸 자료에서 "박찬영 산업및시스템공학과 교수 연구팀이 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성했다"고 밝혔다.

기존 연구에서는 A와 B, C 사이의 관계를 긍정이나 부정이라는 이진 분류를 통해 표상 공간에서 유사도가 작아지도록 훈련했다.

하지만, 연구팀은 이들의 관계를 정의해 그 관계를 보존하도록 학습하는 모델을 개발했다.

기존 연구가 갖는 엄격한 규제들을 완화해 그래프 데이터를 더 유연하게 만든 것이다.

연구팀은 이 학습 방법론을 '관계 보존 학습'이라고 명명했다.

이 방법은 다른 연구와 비교했을 때 정점 분류 문제에서 예측 정확도가 최대 3%, 간선 예측 문제에서도 6%가, 다중 연결 네트워크에서 3% 향상됐다.

박 교수는 "이 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점을 '관계 보존'이라는 개념으로 보완해 새로운 학습 패러다임을 제시했다"고 말했다.

이남경

이남경 석사과정이 제1저자로, 현동민 포항공대 박사, 이준석 석사과정이 제2, 3저자로 참여한 이 연구는 정보통신기획평가원의 지원을 받아 수행됐으며 국제 학술대회인 '정보지식관리 콘퍼런스(CIKM) 2022'에서 이달 발표될 예정이다(논문명: Relational Self-Supervised Learning on Graphs).