논문 정보
- Title: AI-driven toolset for IPF and aging research associates lung fibrosis with accelerated aging
- Authors: Fedor Galkin, Shan Chen, Alex Aliper, Alex Zhavoronkov, Feng Ren
- Affiliation: Insilico Medicine
- Journal: Aging, Volume 17, Issue 8, pp. 1999–2014 (2025)
- DOI: 10.18632/aging.206295
- Preprint: bioRxiv 2025.01.09.632065
연구 배경 및 동기
특발성 폐 섬유증(Idiopathic Pulmonary Fibrosis, IPF)은 주로 고령층에서 발생하는 만성 진행성 폐 질환으로, 폐 조직이 점진적으로 반흔화(scarring)되어 호흡 기능이 저하된다. IPF 환자의 중위 생존기간은 진단 후 약 3~5년에 불과하며, 현재 FDA 승인 약물인 pirfenidone과 nintedanib도 질병의 진행을 완전히 멈추지는 못한다.
오래전부터 IPF와 노화(aging) 사이의 연관성은 관찰되어 왔다. IPF 환자의 대다수가 60세 이상이며, 폐 조직에서 텔로미어 단축(telomere shortening), 세포 노화(cellular senescence), 미토콘드리아 기능 장애(mitochondrial dysfunction) 등 노화의 전형적인 특징들이 관찰된다. 그러나 핵심 질문은 남아 있었다:
IPF는 단순히 폐에서 노화가 가속된 것인가, 아니면 노화와 구별되는 독립적인 병리 과정인가?
Insilico Medicine의 연구팀은 이 질문에 답하기 위해, 두 가지 상호보완적인 AI 도구 — 경로 인식 프로테오믹 에이징 클락(pathway-aware proteomic aging clock)과 ipf-Precious3GPT(ipf-P3GPT) — 를 개발하고 적용했다.
AI 도구 1: 경로 인식 프로테오믹 에이징 클락
아키텍처
첫 번째 도구는 UK Biobank의 대규모 프로테오믹 데이터를 활용한 에이징 클락(aging clock)이다. 기존 에이징 클락과 차별화되는 핵심은 경로 인식(pathway-aware) 설계로, 단순히 생물학적 나이를 예측하는 것을 넘어 어떤 생물학적 경로(pathway)가 노화에 기여하는지 해석할 수 있다.
이 클락의 신경망 아키텍처는 다음과 같이 구성된다:
- 특징 추출 레이어(Feature Extraction Layers): 단백질 측정값을 입력으로 받아 처리
- 이중 분기 구조: 나이 예측(age prediction)과 경로별 어텐션 메커니즘(pathway-specific attention mechanism)으로 분기
- 해석 가능한 노화 분석: 어텐션 가중치를 통해 특정 경로의 노화 기여도를 정량화
학습 데이터
| 항목 | 세부 사항 |
|---|---|
| 데이터 출처 | UK Biobank |
| 참가자 수 | 55,319명 |
| 연령 범위 | 50–85세 |
| 프로테오믹 플랫폼 | Olink NPX |
| 입력 특징 | 프로테오믹 프로파일 + 성별 |
성능
에이징 클락은 교차 검증에서 R² = 0.84의 높은 예측 성능을 보였다. 다만, 연령대별 편향(bias)이 관찰되었다:
| 연령대 | 특성 |
|---|---|
| 50–59세 | 약 +2.25세 과대 추정 (overestimation) |
| 80–89세 | 약 -4.07세 과소 추정 (underestimation), MAE 4.08세 |
이는 고령 그룹에서의 생물학적 변이(biological variability)가 더 크다는 점을 반영하며, 프로테오믹 에이징 클락의 일반적인 한계이기도 하다.
COVID-19 데이터셋을 통한 검증
IPF 환자 코호트에 직접 적용하기 전, 연구팀은 독립 데이터셋인 COVID-19 코호트에서 에이징 클락의 유용성을 검증했다. COVID-19 중증 사례는 종종 폐 섬유증과 유사한 병리를 동반하므로, 간접적인 검증 수단이 될 수 있다.
선형 회귀 분석 결과, 중증 COVID-19 환자는 건강한 대조군 대비 생물학적 나이가 +2.77세 높게 예측되었으며, 이는 통계적으로 유의했다 (P = 0.026). 이는 폐 섬유화를 동반하는 질환에서 실제로 생물학적 노화가 가속된다는 에이징 클락의 탐지 능력을 보여준다.
AI 도구 2: ipf-Precious3GPT (ipf-P3GPT)
모델 개요
두 번째 도구인 ipf-P3GPT는 Insilico Medicine이 개발한 멀티모달 생성 AI 모델 Precious3GPT를 IPF 연구에 특화시킨 버전이다. Precious3GPT는 텍스트 프롬프트로부터 유전자 발현 차이(differential gene expression) 프로파일을 생성할 수 있는 트랜스포머(transformer) 기반 생성 모델이다.
학습 데이터
ipf-P3GPT의 학습에는 원본 P3GPT 학습 프롬프트에서 필터링한 컬렉션이 사용되었다:
| 프롬프트 유형 | 수량 | 설명 |
|---|---|---|
| disease2diff2disease | 672개 | 질병 → 유전자 발현 차이 → 질병 예측 |
| age_group2diff2age_group | 3,201개 | 연령대 → 유전자 발현 차이 → 연령대 예측 |
| 전체 | 3,873개 | IPF 및 노화 관련 프롬프트 |
분석 방법
ipf-P3GPT는 다음과 같은 방식으로 IPF와 노화의 분자적 관계를 분석했다:
- IPF 환자의 유전자 발현 프로파일 생성
- 정상 폐 노화(30세~70세)에 따른 유전자 발현 변화 프로파일 생성
- 두 프로파일의 비교를 통해 공유 유전자(shared genes)와 고유 유전자(unique genes) 식별
- 경로 수준(pathway-level) 분석으로 생물학적 기전 해석
주요 결과
1. IPF와 노화의 분자 시그니처 비교
ipf-P3GPT 분석에서 가장 핵심적인 발견은 IPF와 노화의 유전자 시그니처가 상당 부분 독립적이라는 점이다:
| 시그니처 | 유전자 수 |
|---|---|
| IPF 관련 유전자 | 96개 |
| 노화 관련 유전자 | 93개 |
| 공유 유전자 (overlap) | 15개 (15.6%) |
특히 주목할 점은, 공유 유전자 15개 중 절반 이상(53.3%)이 IPF와 노화에서 반대 방향으로 조절되었다는 것이다. 이는 IPF가 단순히 노화를 가속시키는 것이 아니라, 정상 노화 경로를 교란(dysregulate)한다는 것을 의미한다.
2. 세포외 기질(ECM) 관련 유전자의 이중적 역할
IPF와 노화 시그니처 모두에서 세포외 기질(Extracellular Matrix, ECM) 관련 유전자가 유의미하게 풍부(enriched)했으나, 조절 패턴은 뚜렷하게 달랐다:
IPF 시그니처의 ECM 프로파일:
- 다수의 콜라겐 유형 변화: COL1A1↓, COL3A1↓, COL5A1↑, COL15A1↑
- 기질 분해 효소 상향 조절: MMP1↑, MMP13↑
노화 시그니처의 ECM 프로파일:
- 구조 단백질 감소: ELN(엘라스틴)↓, MFAP4↓, MFAP5↓
- 기질 관련 인자 변화: POSTN(페리오스틴)↓
특히 COL1A1(제1형 콜라겐)은 IPF에서는 하향 조절되지만 노화에서는 상향 조절되어, 기질 재구성 메커니즘이 근본적으로 다르다는 것을 시사한다.
3. TGF-β 및 염증 경로의 차이
연구팀은 IPF와 노화에서 공통적으로 중요한 4개의 핵심 경로를 식별했다:
- TGF-β 신호전달(TGF-β signaling)
- 산화 스트레스(Oxidative stress)
- 염증(Inflammation)
- 세포외 기질 리모델링(ECM remodeling)
그러나 유전자 수준에서는 뚜렷한 차이가 존재했다:
IPF 시그니처:
- TGF-β 경로 구성요소: TGFBR1↓, GDF15↓, BGN↑
- 염증 매개체: CXCL8↑, IL1B↓, CCL8↓
노화 시그니처:
- 공유 염증 매개체: IL6↑, IL1RL1↑
- 성장인자 프로파일: FGF7↓, CSF3↑
4. IPF 고유의 병리 기전
비공유 유전자(non-overlapping genes)가 압도적으로 많다는 사실은 IPF가 정상 노화와 구별되는 고유한 병리 기전을 가지고 있음을 보여준다:
- 비정상적 상처 치유 반응: MMP1, MMP13
- 변형된 성장인자 신호전달: TGFBR1, GDF15
- 조절 장애된 염증 매개체: CXCL8, IL1B
- IPF 고유 섬유화 인자: AKT3, IL-6 (IPF 시그니처에만 존재)
핵심 섬유화 유발 인자인 MMP1, MMP13, AKT3, IL-6가 IPF 시그니처에만 고유하게 존재한다는 점은, 노화가 IPF에 대한 취약성을 높이지만, 질병 자체는 노화와 독립적인 병리 과정을 따른다는 결론을 뒷받침한다.
의의 및 한계
의의
- 핵심 질문에 대한 답: IPF는 단순한 가속 노화(accelerated aging)가 아니라, 노화에 의해 형성되지만 고유한 분자적 경로를 가진 별개의 병리 상태(distinct biological condition)라는 것을 AI 기반으로 규명
- 두 가지 상호보완적 AI 도구: 프로테오믹 에이징 클락(단백체 수준)과 ipf-P3GPT(전사체 수준)를 결합하여 다중 오믹스 관점에서 분석
- 확장 가능한 프레임워크: 개발된 도구는 IPF뿐 아니라 간 섬유증(liver fibrosis), 신장 섬유증(kidney fibrosis) 등 다른 노화 관련 질환에도 적용 가능
- 치료 전략 시사점: IPF와 노화의 분자적 차이 규명은 IPF에 특화된 항섬유화 약물 개발과 anti-aging 전략의 분리/통합 여부에 대한 중요한 근거를 제공
한계 및 후속 연구 방향
- 실험적 검증 부재: 연구가 전적으로 계산 모델에 기반하며, 주요 발견에 대한 직접적인 in vitro/in vivo 검증이 이루어지지 않음
- 간접적 IPF 검증: COVID-19 코호트를 통한 검증은 IPF 병리를 완전히 대표하지 못할 수 있음
- 후성유전학적 요인 미반영: 전사체 및 단백체 데이터에 의존하여, IPF와 노화 관계에서 중요한 후성유전학적(epigenetic) 요인이 충분히 고려되지 않음
- 에이징 클락의 연령대 편향: 고령 그룹에서의 예측 정확도 저하는 실제 IPF 환자군(주로 60세 이상)에 적용할 때 주의가 필요함
개인적 소감
이 논문은 노화와 질병의 관계라는 근본적인 질문에 AI 도구를 활용하여 접근한 흥미로운 연구다. 특히 인상적인 부분은:
-
명확한 결론 도출: “IPF는 가속 노화인가?”라는 질문에 대해, 공유 유전자의 53.3%가 반대 방향 조절을 보인다는 정량적 근거를 통해 “아니다, IPF는 노화를 교란하는 독립적 과정이다”라는 명확한 답을 제시했다.
-
Precious3GPT의 활용 방식: 텍스트 프롬프트로부터 유전자 발현 프로파일을 생성하는 접근은, 기존의 데이터 마이닝과 근본적으로 다른 패러다임이다. 실험 데이터가 부족한 조건에서도 AI가 학습한 생물학적 지식을 바탕으로 가설을 생성할 수 있다는 점에서, 노화 연구의 새로운 도구가 될 수 있다.
-
프로테오믹 에이징 클락의 경로 인식 설계: 단순 나이 예측을 넘어 어떤 경로가 노화에 기여하는지 해석할 수 있는 아키텍처는, 노화의 이질성(heterogeneity)을 연구하는 데 유용하다.
다만, 실험적 검증이 전무하다는 점은 아쉽다. 특히 COL1A1의 반대 방향 조절이나 MMP1/MMP13의 IPF 특이적 상향 조절 같은 핵심 발견은, 환자 유래 조직이나 오가노이드 모델에서의 검증이 뒷받침되어야 설득력이 높아질 것이다. Insilico Medicine이 이미 임상 파이프라인을 보유하고 있는 만큼, 후속 연구에서 실험적 검증이 이루어지길 기대한다.
노화 연구 관점에서, 이 연구가 제시한 프레임워크는 IPF에 국한되지 않고 다양한 노화 관련 질환(알츠하이머, 골관절염, 2형 당뇨 등)에서 “가속 노화 vs. 독립적 병리”라는 질문에 체계적으로 답하는 데 활용될 수 있을 것이다.
References
- Galkin, F., Chen, S., Aliper, A., Zhavoronkov, A. & Ren, F. AI-driven toolset for IPF and aging research associates lung fibrosis with accelerated aging. Aging 17, 1999–2014 (2025). https://doi.org/10.18632/aging.206295
-
PubMed bioRxiv Preprint
💬 댓글