Speech Recognition – Gamba Labs

Speech Recognition

Speech Recognition

초소형 음성인식 모델

Speech Recognitionwebplanningkr2024-04-12T18:31:05+09:00

Speech Recognition

Keyword Spotting(KWS)이란?

Keyword Spotting은 연속적인 오디오 스트림에서 특정 단어 또는 구문을 감지하는 기술입니다. 음성 인식에서 가장 오래된 분야이지만 최근 딥러닝의 발전으로 빠른 처리 속도와 높은 정확도를 확보할 수 있게 되었습니다.

Keyword Spotting-img

Keyword Spotting-img

빠르고 정확한 KWS의 음성인식 기술

음성의 파형만을 분석하여 단어를 감지하므로 가볍고 빠르다.

STT 기술과는 달리 언어에 대한 종속성이 없다.

특정 단어나 구문 외에 비언어적 소리(비명, 기침, 박수 소리 등)를 감지할 수 있다.

icon1

GambaLabs KWS 모델의 성능과 이식성

SNR -20dB 수준의 소음 환경에서도 90% 이상의 인식률

수십~수백KB의 가벼운 모델 크기로 중소형 단말은 물론 MCU를 사용하는 초소형 단말에서도 구동 가능

100시간 이상의 음성 인식 테스트에서도 오인식 0건

icon3

Speech Recognition

KWS의 응용 사례

음성 제어형 프리젠터

보이스 프리젠터 프로토타입 데모영상

음성 제어형 선풍기 리모컨

선풍기 보이스 리모컨포로토타입 데모영상

긴급명령어 인식

긴급명령어 인식 프로토타입 데모 영상