Home > Project Activity > Completed project  
지능형 로봇을 위한 음성인식 및 음원위치 추정용 청각엔진 개발
 
음성인식기술
음성인식기술은 화자가 어떤 말을 하는지 알아내는 speech recognition과 누가 말하는지를 알아내는 speaker identification으로 크게 나눌 수 있다. 그림 1.에서 보는 것과 같이 음성 신호가 마이크를 통해서 들어오면 음성 구간을 추출하고 그 음성 구간에서 특징 파라미터들을 뽑아내 기존의 reference와 비교해서 어떤 말을 하고 있는지 누가 말을 하고 있는지 알아내는 것이다.

그림 1. 청각엔진 모듈 개요도
 
음원인식기술
음원인식기술은 센서를 통해 받은 신호를 이용해서 음원의 위치를 알아내는 것을 통칭한다. 이는 로봇이나 감시카메라와 같은 기계와 인간의 커뮤니케이션에 필수적인 기술로 두 마이크 사이의 time delay를 구해서 음원의 위치를 알아내는 기술이다.

이 두 가지 기술(음성인식기술, 음원인식기술)을 통합하여 로봇의 청각 시스템을 구현하는 것이 본 연구의 목적이다. 이를 실제 로봇 플랫폼에 적용하여 시각 센서와 통합하여 구현하였다. (그림 2.)

 
 
그림 2. 청각엔진이 적용된 실제 로봇 플랫폼(PC 기반)