Speech Recognition

Keyword Spotting(KWS)이란?

Keyword Spotting은 연속적인 오디오 스트림에서 특정 단어 또는 구문을 감지하는 기술입니다. 음성 인식에서 가장 오래된 분야이지만 최근 딥러닝의 발전으로 빠른 처리 속도와 높은 정확도를 확보할 수 있게 되었습니다.

빠르고 정확한 KWS의 음성인식 기술

  • 음성의 파형만을 분석하여 단어를 감지하므로 가볍고 빠르다.
  • STT 기술과는 달리 언어에 대한 종속성이 없다.
  • 특정 단어나 구문 외에 비언어적 소리(비명, 기침, 박수 소리 등)를 감지할 수 있다.

GambaLabs KWS 모델의 성능과 이식성

  • SNR -20dB 수준의 소음 환경에서도 90% 이상의 인식률
  • 수십~수백KB의 가벼운 모델 크기로 중소형 단말은 물론 MCU를 사용하는 초소형 단말에서도 구동 가능
  • 100시간 이상의 음성 인식 테스트에서도 오인식 0건
Speech Recognition

KWS의 응용 사례

음성 제어형 프리젠터
보이스 프리젠터 프로토타입 데모영상
음성 제어형 선풍기 리모컨
선풍기 보이스 리모컨포로토타입 데모영상
긴급명령어 인식
긴급명령어 인식 프로토타입 데모 영상