인공지능 접목해 성공률↑...KAIST, 단백질-리간드 상호작용 예측 모델 개발

기존 방법 대비 2배 향상된 스크리닝 성공률 향후 약물 설계·화학·바이오 분야에 인공지능 접목할 수 있을 것

2022-05-17     정지원 기자
단백질-리간드

(내외방송=정지원 기자) 물리화학적 아이디어를 인공지능 딥러닝에 접목해 기존의 방법보다 스크리닝(가상탐색) 성공률을 2배 높일 수 있는 기술이 개발됐다.

KAIST는 17일 "단백질-리간드 상호작용 예측 모델을 개발해 성공률을 높일 수 있게 됐다"고 밝혔다.

리간드는 수용체와 같은 큰 생체 분자에 특이하게 결합는 물질을 말하며 생체 내의 중요한 요소이자 의약품의 개발 등에 큰 역할을 한다.

김우연

김우연 KAIST 화학과 교수 연구팀은 교원창업 인공지능 신약 개발 스타트업인 HITS 연구진과 함께 물리를 기반으로 한 삼차원 그래프 심층 신경망을 이용해 일반화 성능을 높인 단백질-리간드 상호작용 예측 모델을 개발했다.

약물 후보 분자를 발굴하기 위해서 타깃(목표) 단백질과 강하게 결합하는 것을 찾기 위해서는 리간드를 찾는 것이 중요하다.

하지만 유효 물질을 찾기 위해서는 수백만~수천만 개의 무작위 리간드 라이브러리(집합체)를 대상으로 실험 전수 조사를 수행하는데, 이는 천문학적인 시간과 비용이 필요하다.

이러한 시간과 비용을 절감하기 위해 최근 단백질-리간드 상호작용 예측에 기반한 가상탐색 기술이 주목받고 있다.

기존의 상호작용 예측 인공지능 모델들은 학습에 사용한 구조에 대해서는 높은 예측 성능을 보여주지만, 새로운 단백질 구조에 대해서는 낮은 성능을 보이는 과적합이 문제가 됐다.

과적합 문제는 일반적으로 복잡한 모델에 데이터가 적을 때 발생한다.

이 연구는 과적합 문제를 해결함으로써 다양한 단백질에 대해 고른 성능을 보여주는 예측 모델을 개발하는 데 중점을 뒀다.

연구팀은 물리화학적 아이디어를 딥러닝 모델에 적용해 모델의 복잡함을 줄이면서 동시에 물리 시뮬레이션(모의 실험)을 통해 부족한 데이터를 보강해 이 문제를 해결하고자 했다.

단백질 원자와 리간드 원자 사이의 거리에 따른 반데르발스 힘(중성 분자에서 근거리에서만 작용하는 약한 인력)과 수소 결합력 등을 물리화학적 방정식으로 만들고, 딥러닝을 활용한 매개변수(변수들의 함수관계를 정하기 위해서 사용되는 또 다른 변수)로 물리 법칙을 만족하는 예측을 할 수 있게 됐다.

또 이 실험에 사용된 단백질-리간드 결정 구조가 가장 안정된 구조라는 것을 활용했다.

부족한 실험 데이터를 보강하기 위해 불안정한 단백질-리간드 구조로 이뤄진 수십만 개의 인공 데이터를 생성해 학습에 활용했다.

그 결과 생성된 구조에 비해 실제 구조를 안정적으로 예측할 수 있었다.

연구팀은 개발된 모델의 성능을 검증하기 위해서 대조군으로 'CASF-2016 벤치마크'를 활용했다.

이 벤치마크는 다양한 단백질-리간드 구조들 사이에서 실험적으로 판명된 결정 구조에 근접한 구조를 찾는 도킹과 상대적으로 결합력이 큰 단백질-리간드 쌍을 찾는 스크리닝 등 실제로 약물을 개발하는 과정에 필수적인 과제를 포함하고 있다.

검증 결과 기존에 보고된 기술보다 높은 도킹과 스크리닝 성공률을 보였는데, 특히 스크리닝은 약 두 배 더 높은 성능 수치를 보였다.

연구팀이 개발한 방법의 또 다른 장점은 예측의 결과를 물리적으로 해석 가능하다는 것이다.

딥러닝으로 최적화된 물리화학식을 통해 최종 상호작용 값을 예측할 수 있기 때문이다.

리간드 분자 내 원자별 상호작용 에너지의 기여도를 분석함으로써 어떤 작용기가 단백질-리간드 결합에 있어서 중요한 역할을 했는지 파악할 수 있으며 추후 약물 설계를 통해 성능을 높이는 데도 직접 활용할 수 있다.

정원호(왼쪽),

공동 제1저자로 참여한 문석현, 정원호 KAIST 화학과 박사과정, 양수정 MIT 화학과 박사과정 학생들은 "데이터가 적은 화학 및 바이오 분야에서 일반화 문제는 항상 중요한 문제로 강조돼왔다"며 "이번 연구에서 사용한 물리 기반 딥러닝 방법론은 단백질-리간드 간 상호작용 예측뿐 아니라 다양한 물리 문제에 적용될 수 있을 것"이라고 말했다.

한국연구재단의 지원을 받아 수행된 이번 연구는 국제 학술지 'Chemical Science(IF=9.825)'에 지난 4월 13일 표지 논문 및 금주의 논문으로 선정됐다.(논문명: PIGNet: a physics-informed deep learning model toward generalized drug-target interaction predictions)