– 음성·호흡음 기반 의료 AI 연구 성과 국제적 인정 –
원광대학교 전자공학과 김준우(사진) 교수 연구팀이 음성처리 인공지능(AI) 분야 최고 권위 국제학술대회인 ‘Interspeech 2026’에 주저자 논문 3편을 동시에 채택시키는 성과를 거뒀다.
‘Interspeech’는 국제음성통신학회(ISCA)가 주관하는 세계적 권위의 학술대회로, 음성인식·음성분석·오디오 신호처리·의료 음성 AI 등 음성·언어처리 전 분야의 최신 연구 성과가 발표되는 학술대회다.
전자공학과 김준우 교수는 원광대 인공지능융합연구소와 원광대병원 메디컬AI센터에서 연구를 수행하고 있으며, 이번 성과를 통해 음성 기반 의료 AI와 생체신호 분석 분야의 국제적 연구 경쟁력을 다시 한 번 입증했다.
첫 번째 논문인 ‘음성 외상성 및 비외상성 발성 과기능 자동 분류를 위한 계층적 특징 공학 프레임워크(A Hierarchical Feature Engineering Framework for Automated Classification of Phonotraumatic and Non-Phonotraumatic Vocal Hyperfunction)’는 목 표면 가속도 신호를 활용해 음성 과사용 질환을 자동 분류하는 연구로, 연구팀은 정적·동적·비율 기반 특징과 생리학적 결합 특징을 계층적으로 설계해 음성질환 유형을 구분할 수 있는 해석 가능한 바이오마커 발굴 가능성을 제시했다.

두 번째 논문 ‘호흡음 분류를 위한 품질 적응형 각도 마진 학습(Quality Adaptive Angular Margin Learning for Respiratory Sound Classification)’은 호흡음 분류 성능 향상을 위한 품질 적응형 학습 기법을 제안했으며, 녹음 환경과 신호 품질 차이로 발생하는 성능 저하 문제를 해결하기 위해 오디오 품질을 반영한 학습 방식을 적용하고, 기존 모델 대비 우수한 성능과 높은 일반화 능력을 확인했다.

세 번째 논문 ‘호흡음 분류를 위한 스펙트럼 인식 정규화 오디오 DASS 모델과 이중 축 패치 혼합 대조학습(Lung-SRAD: Spectral-Aware Regularized Audio DASS with Dual-Axis Patch-Mix Contrastive Learning for Respiratory Sound Classification)’은 State Space Model 기반의 호흡음 분류 연구로, 연구팀은 비정상 호흡음의 국소적 특징을 효과적으로 학습할 수 있는 새로운 학습 기법을 제안해 기존 기준 모델보다 향상된 성능을 달성했다.

이번 연구들은 음성 및 호흡음과 같은 비침습 생체신호를 활용해 질환 관련 정보를 자동 분석하는 의료 AI 기술 개발에 초점을 맞추고 있으며, 특히 임상 현장에서 발생하는 데이터 품질 차이와 개인별 편차로 인한 일반화 문제를 해결하기 위해 신호처리, 표현학습, 대조학습 등 최신 인공지능 기법을 융합해 적용했다는 점에서 학술적 의미가 크다.
김준우 교수는 “이번 연구는 음성 및 호흡음과 같은 비침습 생체음향 신호를 활용해 질환 관련 정보를 보다 정확하게 분석하기 위한 연구”라며 “앞으로도 병원 및 산업체와의 공동 연구를 확대해 정신건강, 호흡기 질환, 퇴행성 질환 평가에 활용할 수 있는 신뢰도 높은 의료 AI 기술 개발에 힘쓰겠다”고 말했다.
한편, ‘Interspeech 2026’은 오는 9월 27일부터 10월 1일까지 호주 시드니에서 개최될 예정이다.