공유하기

카카오톡
블로그
페이스북
X
주소복사

KAIST, 공간 음향 AI 성능 입증…국제대회 1위

김소희 기자 (hee@dailian.co.kr)
입력 2025.07.11 09:07
수정 2025.07.11 09:07

IEEE DCASE 챌린지 2025 ‘음향 장면 분할’ 분야 첫 참가 우승

여러 소리가 혼합된 음향 장면의 예시. ⓒ한국과학기술원

한국과학기술원(KAIST)은 최정우 전기및전자공학부 교수 연구팀이 ‘IEEE DCASE 챌린지 2025’에서 ‘공간 의미 기반 음향 장면 분할(Spatial Semantic Segmentation of Sound Scenes)’ 분야 1위를 차지했다고 11일 밝혔다.


이번 대회는 음향 탐지 및 분석 분야의 국제 경진대회로, 올해 총 6개 분야에 86개 팀이 참가했다. KAIST는 첫 참가임에도 해당 분야에서 가장 높은 성과를 거뒀다.


참가 분야인 ‘음향 장면 분할’은 여러 음원이 혼합된 다채널 신호에서 공간 정보를 분석해 개별 소리를 분리하고 18개 카테고리로 분류하는 고난도 과제로, 연구팀은 신호 분리 정확도를 평가하는 ‘신호대 왜곡비 향상도(CA-SDRi)’에서 11dB를 기록했다.


CA-SDRi는 원 음향 대비 얼마나 명확하게 소리를 분리했는지를 dB(데시벨) 단위로 나타내며, 수치가 높을수록 정밀한 분리를 의미한다.


연구팀은 트랜스포머(Transformer)와 맘바(Mamba) 기반 아키텍처를 결합한 음원 분리 모델을 개발했고, 이후 파형 및 음원 종류를 단서로 2차 분리·분류를 수행하는 단계적 추론 방식 모델을 설계했다.


해당 모델은 사람이 복잡한 소리를 들을 때, 리듬이나 방향 등 단서를 활용해 소리를 구분하는 방식을 모사한 구조라는 설명이다.


연구팀은 오는 10월 바르셀로나에서 열리는 DCASE 워크숍에서 연구 성과를 발표할 예정이다.

김소희 기자 (hee@dailian.co.kr)
기사 모아 보기 >
0
0

댓글 0

로그인 후 댓글을 작성하실 수 있습니다.
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기