In rete è stato recentemente pubblicato un articolo sul riconoscimento vocale che fornisce alcuni interessanti spunti di riflessione sul modo in cui lavorano Siri e gli altri assistenti vocali.
Siri si basa sulla tecnologia di Nuance, il gruppo che ha prodotto Dragon Dictate per Mac, nonché Dragon Didaction e Dragon Go! per iOS. Le licenze Nuance di riconoscimento vocale e la tecnologia voice-synthesis vengono addirittura utilizzate in campo medico.
In iOS 7 su Siri è possibile impostare sia una voce maschile che femminile, ed Apple ha anche ampliato l’offerta per quanto riguarda le lingue disponibili. La maggior parte degli applicativi di sintesi vocali iniziano con un “suono di lettura“, che registra la voce umana e la fa processare.
Non è una questione di lettura di ogni possibile parola, ma di avere un catalogo di suoni, chiamati fonemi che possono essere utilizzati per la costruzione di nuove parole.
Con Siri e gli altri assistenti vocali di smartphone, come Google Search, il “calcolo” non viene fatto direttamente sul dispositivo, ma sui potenti server nel cloud. I prossimi anni sicuramente porteranno ulteriori progressi: migliore riconoscimento, voci più realistiche e una più rapida elaborazione.
Leggi o Aggiungi Commenti