2024-04-28 21:18 (일)
GIST, 국제 AI 음향 인식 대회서 심사위원상 수상
상태바
GIST, 국제 AI 음향 인식 대회서 심사위원상 수상
  • 방계홍 기자
  • 승인 2023.10.12 17:01
  • 댓글 0
이 기사를 공유합니다

- GIST-한화비전 팀, ‘DCASE 챌린지 2023’ 워크숍에서 실내 음향 이벤트 탐지 부문 심사위원상 수상
- 일상적 실내 생활에서 발생하는 소리를 탐지하는 인공지능 모델 설계
GIST 김지원 학생, ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 논문 발표 / GIST 제공
GIST 김지원 학생, ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 논문 발표 / GIST 제공

[KNS뉴스통신=방계홍 기자] 광주과학기술원(GIST, 총장 임기철)은 전기전자컴퓨터공학부 오디오지능연구실(AiTeR, 김홍국 교수)과 한화비전(AI연구소 소장 노승인) 공동 연구팀이 세계 최대 전기·전자기술자협회(IEEE)의 신호처리소사이어티가 주관한 ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 심사위원상(Judges’ award)을 수상했다고 밝혔다. 

GIST 오디오지능연구실 소속 학생(석사과정 김지원, 손상원 학생, 석박통합과정 송윤아 학생)과 한화비전 연구원(송일훈,임정은수석연구원)으로 구성된 GIST-HanwhaVision 팀은 ‘DCASE(IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events) 챌린지 2023’에 참가해 ‘실내 음향 이벤트 탐지 부문(Task 4A)’에서 단일 모델 분야 1위와 앙상블 모델 분야 2위를 달성했으며, 특히 워크숍에서 ‘심사위원상’을 수상해 연구의 혁신성과 기술의 완성도 및 논문의 품질 등 다양한 기준에서 우수한 성과를 인정받았다.

심사위원상은 ‘DCASE 챌린지 2023’에 제출된 기술 리포트를 중심으로 연구의 독창성과 우수성을 검토해 Task별 1팀에게만 주어진다. 

GIST-한화비전 팀은 ‘실내 음향 이벤트 탐지 부문(Task 4A)’에서 중앙대, 샤오미, 삼성리서치 중국-난징 등 유수한 기관 15개 팀을 제치고 이 상을 수상했다.

‘실내 음향 이벤트 탐지 기술’은 실내 환경에서 발생할 수 있는 진공청소기 소리, 설거지하는 소리 등 10가지의 다양한 소리를 AI를 통해 탐지 및 구별하는 기술이다.

이 기술은 카메라를 통해 처리하는 데 제한이 있는 상황에서 소리만으로 음향 이벤트를 탐지할 수 있다는 강점을 통해 실내 상황 감시, AI스피커 등 다양한 어플리케이션에 활용될 수 있다.

이번 워크숍에서 GIST-HanwhaVision 팀은 문제를 해결하기 위해 다양한 오디오 지능을 표현할 수 있는 AI 기술들을 접목해 고성능 실내 음향 이벤트 탐지 기술을 개발했다.

(논문명: Label Filtering-Based Self-Learning for Sound Event Detection Using Frequency Dynamic Convolution with Large Kernel Attention)

구체적으로, ▴인공지능이 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▴사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술 ▴성능 향상을 위한 데이터를 정제하는 기술, 그리고 인공지능의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 인공지능 모델로 우수한 성과를 달성했다.

김홍국 교수는 “이번 대회를 통해 얻은 경험과 개발 기술은 한화비전의 CCTV내에서의 음향 이벤트 탐지에 적용될 예정이며, 나아가 소셜미디어 콘텐츠에서의 음성구간 및 음향 이벤트 검출을 통해 보다 효율적이고 사용자 친화적인 서비스 개발에 노력하겠다”고 말했다.

GIST-HanwhaVision 팀의 참여 학생들은 “한화비전 연구원들과의 긴밀한 협업과 김홍국 교수님의 전문적인 지원 덕분에 세계적인 대회에서 인정받는 성과를 창출할 수 있었다”며, “지금의 성과를 바탕으로 오디오 인공지능 분야에서의 연구를 더욱 심화시켜 오디오지능 기술의 실용화와 사회적 가치 창출에 기여할 계획”이라고 밝혔다.

한편 GIST-AiTeR 팀이 소속된 GIST 오디오지능연구실(AiTeR, 지도교수 김홍국)에서는 음성 음향을 위한 AI 모델을 연구하고 있으며, 음향 이벤트 탐지뿐만 아니라 음성 합성, 음성 잡음 제거, 음성 인식, 이상 상황 감지, 생체정보 처리 등의 다양한 연구를 국내 산학연 연구기관 및 매사추세츠공대(MIT) 등 해외연구기관과 공동으로 진행하고 있다.

이번 연구는 △2023년도 한화비전의 CCTV 내 딥러닝 기반 음원 분류 상품화 지원 사업, △과학기술정보통신부 및 정보통신기획평가원의 미디어 콘텐츠 음성 언어 현지화 기술개발 사업의 지원으로 수행되었다.  

DCASE 워크숍은 지난 9월 20일부터 22일까지 핀란드 탐페레에서 진행됐으며, 시상식은 22일 탐페레 홀에서 열렸다.

 

방계홍 기자 chunsapan2@naver.com


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
인기기사
섹션별 최신기사
HOT 연예