플랫폼업체 디어젠, ‘약물-단백질 상호작용 예측 알고리즘’ 연구 성과 발표​
플랫폼업체 디어젠, ‘약물-단백질 상호작용 예측 알고리즘’ 연구 성과 발표​
  • 오지혜 기자
  • 승인 2019.08.12 10:37
  • 댓글 0
이 기사를 공유합니다

"Pubchem의 9700만 개 화합물 빅데이터로 FDA 승인 8개 EGFR 항암제 모두 예측"

인공지능(AI)기반 신약발굴 및 플랫폼 개발 전문업체 디어젠(대표 강길수)은 8일~10일  미국 미시간대에서 개최된 MLHC(Machine Learning for Healthcare)2019 학회에서 약물-단백질 상호작용 예측 알고리즘(MT-DTI, Molecule Transformer Drug Target Interaction) 개발 성과를 발표했다고 12일 밝혔다.

MLHC는 의료 빅데이터를 활용한 인공지능 기술 분야 최대 학회로,2011년부터 매년 개최되고 있다.

MT-DTI는 기존 DTI 예측 모델의 한계를 극복해 디어젠에서 자체개발 한 새로운 DTI 모델이다.

디어젠의 실험 결과 기존 DTI 예측 모델들 대비 월등한 성능을 보였으며, MT-DTI를 이용해 EGFR(상피세포 성장 수용체)를 타깃으로 하는 30개의 신약후보물질을 예측했을 때, 현재 FDA 승인된 8개의 EFGR 타깃 항암제가 모두 포함돼 있음을 확인했다는 것.

DTI는 질병을 유발하는 것으로 예측되는 타깃 물질과 약물 후보물질의 상호작용을 예측해 신약후보물질을 도출한다.

그러나 전통적인 실험실 기반의(in-vitro) DTI는 비용과 시간이 많이 필요한 과정일 뿐만 아니라, DTI로 도출된 신약후보물질 중 실제 신약으로 이어지는 경우는 10% 미만에 불고하다고 회사는 설명했다.

따라서 최근 신약개발 시장에서는 컴퓨터 시뮬레이션 기반의(in-silico) 기술을 이용한 DTI 예측이 요구되고 있다. 이는 신약개발 전체 프로세스에 드는 시간과 비용을 43%까지 감소시킬 수 있다는 것이다.

이런 최신 요구에 따라 여러 종류의 in-silico DTI 예측 모델들 (KronRLS, SimBoost, DeepDTA 등)이 제안되었지만, 이 방법들은 복잡한 화학구조를 제대로 반영하지 못하고 방대한 화합물 정보를 제대로 이용하지 못해 후보물질예측에 한계가 있는 것으로 알려져 있다.

이에 비해 MT-DTI는 Self-Attention 매커니즘을 모델에 반영해 복잡한 화학구조를 더욱 효과적으로 모델링했고, PubChem(화학 분자 및 생물학 논문 데이터베이스)의 약 9700만 개의 방대한 화합물 데이터베이스를 사전학습에 이용 가능하게 하여 모델의 정밀도를 높였다.

MT-DTI 모델 연구를 이끈 신봉근 최고 인공지능책임자는 “이번 연구를 통해 MT-DTI 모델이 신약후보물질을 제시하는 데 빠르고 정밀한 플랫폼으로 활용될 가능성이 확인됐다”며 “나아가 우리의 MT-DTI 모델은 적은 비용으로 신약을 개발할 수 있게 하며, 환자 맞춤 의료시대를 앞당길 것”이라고 밝혔다.​

디어젠의 강길수 대표는 “디어젠은 신약 개발에 필요한 화합물, 단백질, 유전체 및 다양한 의료 빅데이터를 활용해 AI 모델 개발과 데이터 기반 in-silico 플랫폼 기술을 개발 중”이라며 “현재 디어젠은 AI 기술을 활용해 'first-best in class'의 신약을 만들기 위해 여러 신약 개발 전문가들과 함께 협업하고 있다”고 말했다.

이번 연구 결과는 JMLR(Journal of Machine Learning Research)저널에 게재될 예정이다.

신봉근 인공지능책임자
신봉근 인공지능책임자가 약물-단백질 상호작용 예측 알고리즘 성과 결과를 발표하고 있다. [사진=디어젠]]

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.