Bionews

머신러닝 기반 약물 간 상호 작용으로인한 약동학 정량적 예측

Quantitative prediction of PK-DDI with machine learning

2024.06.03 | 조회 177 |
0
|

Bi.markey

밝히자, 바이오 세상

📜오늘 우리가 살펴볼 연구는?

Jang, H. Y., Song, J., Kim, J. H., Lee, H., Kim, I. W., Moon, B., & Oh, J. M. (2022). Machine learning-based quantitative prediction of drug exposure in drug-drug interactions using drug label information. NPJ digital medicine5(1), 88. 

논문바로가기⤴️

 

 

🤔DDI가 뭐야?

DDI는 Drug-drug interaction의 약자로, 약물과 약물 간의 상호작용을 의미해요!

이 때문에 기존에 약물이 갖는 의도된 약동학이나 약력학적인 특성이 변화하게돼요! 물론 DDI는 긍적적이거나 부정적인 방향으로 모두 일어날 수 있답니다!

하지만 일반적으로 negative DDI가 많고, 임상에서 심각한 부작용을 일으킬 수 있어서 발견되면 시장에서 해당 약물에 대한 사용이 제한되게돼요!

DDI 발견에 대한 이러한 중요성에도 DDI 탐구 임상시험은 높은 비용과 시간을 소요하고 작동 메커니즘이 복잡하고 다양하다는 점에서 충분히 연구되지 못했어요!

 

⏪이전 연구는 어땠을까?

이전에도 DDI에 대한 머신러닝 기반의 연구가 존재했어요. 하지만 두가지 한계점을 가지고 있었죠.

 

🤔 단순히 DDI의 존재 유무 파악과 각 DDI에 대한 분류만 가능

: 단순한 정보만을 제공해, 실제로 약물의 구체적인 복용량이나 대체 약물등을 선정해야하는 복잡한 임상 시험에서 활용될 수 없었어요

😶‍🌫️ 체계적으로 구축된 True-negative dataset의 부재

“A와 B 사이 DDI가 있다” 라는 정보는 있지만, “B와 C 사이 DDI가 없다”라고 정확히 명시하지 않고있어요! 그래서 B와 C 사이에 아직 밝혀지지 않은 DDI가 있을 수 있음에도 database에 존재하지 않는 정보이기 때문에 없다고 착각할 수 있어요

 


💯 새로운 연구는 어떨까?

 

새로운 연구의 궁극적인 목표는 '독립형 어플리케이션'을 배포하는데에 있어요.

그렇게 하기 위해서는 기존과 달리 '신뢰할 수 있는' 약물간 상호작용에의한 약동학적 정보를 담은 데이터베이스를 구축해야하고, 이를 기반으로 한 예측 모델을 개발해야해요! 이제부터 각 단계별로 자세히 한 번 알아볼게요!😊

 

🌟 신뢰할 수 있는 PK-DDI Database 구축

아래의 순서에 맞게 데이터베이스가 구축되고 이를 기반한 모델이 만들어졌어요! 이때, PK-DDI는 약물간 상호작용의 약동학적인 정보를 의미해요!

1️⃣ DailyMed 웹사이트를 통해 신뢰할 수 있는 38,711개의 FDA drug label 자료 수집. 10인의 숙련된 연구자에 의해 약물 상호작용 관련 문장, 그림, 표에서 DDI 정보 추출

 

 2️⃣ DrugBank에서 다양한 약물 특성 정보 수집 후, 가해-피해 약물 중심으로 다양한 polypeptide가 방사형으로 연결되도록 데이터정리. Polypeptide-PD-Drug-Type 토큰화를 통해 약물 쌍을 표현하고, 토큰 2,830개를 포함한 bag-of-words 얻어, 각 약물쌍을 bag-of-word의 TF-IDF 행렬을 통해 정규화해 2,830차원 벡터로 인코딩

 

3️⃣ 615개의 가지와 308개의 노드를 갖는 Bagged tree를 애플리케이션 모델 사용. 노드에서 fold change 값이 결정

 

4️⃣ PK-DDIP 모델을 활용한 독립형 애플리케이션 배포. 사용자는 예측/보고된 fold change 값, 약물의 폴리펩타이드 정보, SNP 작용, 4차 해부학적 치료 화학 수준에서의 대체 약물 추천 정보 얻을 수 o

 

 

✨새로운 DDI 데이터베이스로부터 얻은 정보

신뢰할 수 있는 FDA 약물 라벨 정보를 기반으로 PK-DDI DB 수작업으로 구축해 3,627개의 DDI 정보(1,189개는 positive, 2,438개는 negative DDI)를 얻었어요!

 

이때 약물 간 AUC fold change가 포함되어, PK-DDI를 정량적으로 예측할 수 있었답니다

 

📍 AUC fold change ?

AUC (area under time-concentration curve). 특정 시간 동안 측정된 데이터의 곡선 아래 면적. 특정 약물의 흡수, 분포, 대사 및 배설 과정을 평가. AUC fold change는 두가지 AUC값을 비교해 얻는 수치로 AUC2/AUC1으로 계산한다. 여기서는 victim drug만을 사용했을때 AUC값을 AUC1으로하고, perpetrator drug를 추가했을 때 나타나는 AUC를 AUC2로 설정한다. 예를 들어 AUC fold change값이 1보다 작다면 victim의 효능이 perpetrator 약물 투입 후 감소했음을 나타낸다.

 

🎭PK-DDI 예측 모델의 예측 결과

FDA 분류 기준에 따라 가해 약물이 피해 약물을 변화시킨 정도, 즉 DDI의 강도. 상호작용의 정도에 따라 네가지 그룹으로 나누어 비교하였어요! 

 

label이 실제 값을 의미하고, prediction은 PK-DDI 예측 모델을 이용해 예측한 값을 의미해요.

  • 부정적 예측(negative) : 정확도 90.2%
  • 강한 감소 : 22.4%만 정확하게 예측, 72.4%는 중간 감소로 예측
  • 강한 증가 : 1.2%만 정확히 예측, 79.5%는 중간 증가로 예측.

 

n : 데이터 포인트의 개수 / 𝑦𝑖 : 실제 값 / 𝑦^𝑖 : 예측 값
n : 데이터 포인트의 개수 / 𝑦𝑖 : 실제 값 / 𝑦^𝑖 : 예측 값

PK-DDIP 모델은 AUC fold change를 RMSE 0.5959 이내로 예측했어요! 하지만 이 경우에서도 AUC의 강한 증가와 강한 감소 카테고리에 대한 예측 정확도는 낮게 나타났어요

 

📍 RMSE (제곱평균오차)

예측 모델의 정확성을 평가하는 데 사용되는 통계적 지표로, n은 데이터 포인트의 개수, 𝑦𝑖 는 실제 값(label), 𝑦^𝑖 : 예측 값predication)을 나타냄. RMSE가 작을수록 모델의 예측이 실제 값에 더 가깝다는 의미.

 

 

✔️ PK-DDI 예측 모델의 외부 검증

 

1️⃣ 업데이트된 FDA 라벨과의 비교

피해 약물의 AUC 변화에 대해 새로운 정보가 포함된 21쌍의 약물쌍에 대해 예측과 실제값을 비교하였어요!

이때 10개의 DDI는 새로 승인된 약물은 그 중 7개가 정확히 예측되어 ‘Good’ 으로 나타났고, 나머지 11개 중 6개는 ‘Good’, 5개가 ‘Moderate’으로 평가되었어요.

=> 최소 ‘moderate’ 이상의 등급을 받았음을 확인할 수 있어, PK-DDIP 모델이 DDI의 방향, 정도를 적절히 예측한다

 

 

2️⃣ 실제 환자의 결과와 비교

이번에는 실제 환자들의 결과와 예측 모델을 이용한 예측값을 비교해보았는데요, 3차 병원에서 tacrolimus 사용한 환자 8,684 데이터 중 실험실 데이터 있는 2,143명을 포함하는 18개 cohort 분석이 시행되었어요!

예측값과 관찰 값 사이 상관계수는 76.9%로 나타났는데, 18개의 DDI pair 중 11개가 잘 예측되으나 7쌍은 실패함을 확인할 수 있었어요!

- 실패한 약물 : atorvastatin, ciprofloxacin, esomeprazole, finasteride,

fluconazole, fluvastatin, rifampin

PK-DDIP 모델은 업데이트된 FDA 라벨이나 실제 환자 데이터를 바탕으로 DDI를 예측하는데에 대체적으로 좋은 성능을 보였지만, 일부 약물쌍에 대해서는 정확도가 떨어짐이 확인되었다

 

 

🎀 독립형 어플리케이션 활용

앞에서 신뢰할 수 있는 DDI 데이터베이스를 구축했고, 그를 기반으로한 예측 모델을 만들고 검증했어요! 이젠 예측 모델을 활용한 어플리케이션을 만들어 배포하였는데, 어플리케이션을 통해 정말 다양하고 중요한 정보를 확인할 수 있답니다!

위와 같은 어플리케이션에는 가해 약물과 피해 약물을 검색할 수 있고, 그에대해 아래와같은 정보를 제공하고 있어요!

🪄 단백질간 상호작용 네트워크 가해-피해 약물간 fold change와 polypeptide 결합 관계 식별에 도움.

SNP 작용 정보 제공 입력된 약물간의 단일 염기 다형성 작용 정보 제공

🧬한국인 대립 유전자 빈도 정보물 관련 SNP의 한국인 대립 유전자 빈

🏴‍☠️ 임상 영향 정보 변이형 대립 유전자가 예상되는 임상적 영향 정보를 포함하고 있어서, 임상의가 DDI로 인한 부작용의 빈도에 대해 알 수 있음

💊 대체 약물 제안 가해-피해 약물과 동일한 ATC 4단계 수준의 약물을 선택한 결과를 제공

 

 

💛 보완 및 발전 방향

이제까지 살펴본 내용을 정리하자면, 신뢰할 수 있는 FDA 라벨 데이터를 사용해 구축된 PK-DDI DB를 기반으로 PK-DDI 예측 모델이 만들어졌고, 이는 평균제곱근 0.5959 이내의 준수한 예측 수준을 보였어요! 

새로 업데이트된 FDA 라벨과 실제 약물을 복용하는 환자의 데이터를 이용해 외부 검증을 받았고, 대체적으로 예측이 적절히 일어남이 확인되기도 했죠.

하지만 특정 약물에 대한 예측 정확도가 낮음이 확인되었고, 수집된 정보가 특정 조건에서 이루어진 점임을 감안하면 약물의 용량을 다르게 사용할 경우 다른 결과가 도출될 수 있다는 것을 생각해보아야 해요!

또한, PK 파라미터 변화가 언제나 약력학적인 변화나 부작용을 일으키지는 않다는 점에서 약물의 PK와 PD간 관계를 더 연구해보아야 해요

 

 


🖊️ 작성자 : 하예지 (hyj9095@naver.com)

🌟밝히자, 바이오 세상💡

💯 다음 글에서 만나요! 

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

Bi.markey 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

© 2024 Bi.markey

밝히자, 바이오 세상

자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관