Qualche giorno fa vi abbiamo parlato del nuovo progetto di Google volto a rendere il riconoscimento vocale offline di Google Now molto più potente rispetto a quello attuale che necessita della connessione ad Internet, in quanto il processo di elaborazione avviene sui server di Google (Google Now presto in modalità always-on anche offline). Di recente abbiamo scoperto nuove informazioni su questo progetto che, grazie ad una serie di algoritmi neurali, permetterà di avere un riconoscimento vocale circa 7 volte migliore rispetto all’attuale.
We demonstrate that given similar size and computation constraints, we achieve large improvements in word error rate (WER) performance and latency by employing Long Short-Term Memory (LSTM) recurrent neural networks (RNNs), trained with connectionist temporal classification (CTC)
Nonostante il futuro della connettività ad Internet permetterà latenze molto basse e velocità di trasferimento dati molto elevate, Google sembra andare in controtendenza rispetto ai propri principi (spostare tutto sul cloud).
Ad ogni modo, considerando che i test effettuati su un Nexus 5 hanno portato già degli ottimi risultati, siamo certi che nel giro di qualche mese gli sviluppatori del colosso di Mountain View faranno passi importanti verso l’introduzione in forma stabile su Google Now di questa feature. Magari in Android “O” avremo la possibilità di gestire completamente lo smartphone attraverso la voce ed in maniera offline.