Rozpoznawanie głosu jest technologią, nad którą pracuje wiele firm. Jedną z nich jest Google. Do tej pory rozpoznawanie potrzebne było połączenie do Internetu. Google zrobiło jednak krok do przodu. Opracowało mechanizm, który działa w pełni offline i jest przy tym bardzo kompaktowy.

Cały mechanizm zajmuje 20,3 MB i jak udało mi się dowiedzieć działa siedem razy szybciej niż jego odpowiednik w wersji online. To niesamowity sukces. Obecnie, wszystkie komendy głosowe są przesyłane na serwery Google. Tam, poddaje się je analizie. Po jej zakończeniu ostaje wysłana odpowiedź. Dopiero wtedy, nasze urządzenie wykonuje określoną czynność. Sami widzicie, ile czasu to zajmuje. Dlatego właśnie system działający online wiąże się z takim opóźnieniem. Im gorszej jakości jest łącze, tym system na, tym bardziej cierpi. Na tę chwilę znaczna część funkcji, jakie obecnie znajdziemy w Androidzie, nie wymaga połączenia z siecią. Mechanizm już przetestowano. Szczęśliwym sprzętem był Nexusie 5:

  • czterordzeniowym CPU 2,26 GHz,
  • 2 GB RAM-u,

Wyniki są mocno zadowalające, jak mówi samo Google. Wynika to przede wszystkim z kompaktowych rozmiarów całego systemu. Google pokusiło się także o zastosowaniu dobrej kompresji. Całość poddano treningowi na 3 milionach anonimowych próbek głosu, a każda puszczana była w aż dwudziestu wariantach. Warianty te opatrzone zostały w różnego rodzaju zakłócenia w postaci dźwięków z filmów. Daje nam to w sumie, jak dobrze policzymy ok. 2 tys. godzin testów, a odsetek błędnie rozpoznanych słów wynosił 13,5 proc.

Wygląda na to, że już niedługo technologia będzie śmigała z naszych smartfonach i bardzo dobrze, bo patrząc po wynikach testów warto w nią inwestować. Rozpoznawanie mowy powinno być absolutnie uniezależnione od połączenia sieciowego. W naszym kraju są jeszcze miejsca, gdzie go nie ma, albo zasięg jest kolokwialnie mówiąc “dziadowski”. Taki system sprawdziłby się wtedy idealnie.