iMore ha avuto l’opportunità di ascoltare e parlare con uno dei creatori di Siri, Dag Kittlaus, a proposito delle difficoltà e delle sfide che il team di sviluppo ha incontrato nel portare alla luce l’assistente vocale di casa Apple nonché del suo punto di vista sul futuro della tecnologia.
Tornando un po’ indietro, nel 2007 Kittlaus, che al tempo lavorava per Motorola, decise di mettersi in contatto – a causa di conflitti con le scelte della direzione – con lo Stanford Research Institute a Menlo Park, in California. Lì venne assunto come consulente tecnologico per capire quali prodotti da commercializzare potessero essere creati.
Fu proprio a Menlo Park che conobbe Adam Cheyer e Tom Gruber, con i quali fondò Siri.
Dopo questa introduzione, Kittlaus ha parlato del mondo della telefonia prima del terminale della Mela e di come le interfacce utente stessero rapidamente cambiando.
I telefoni erano semplicemente molto difficili da usare, specialmente prima che uscisse l’iPhone. Servivano circa 30 click per cercare una suoneria e scaricarla. Ma cosa sarebbe accaduto se fosse stato possibile parlare con il telefono? Se fosse stato sufficiente scrivere qualche parola per farsi capire dal terminale? È qualcosa di molto potente. Per quello che riguarda la parte della voce, non l’abbiamo cominciata se non dopo un anno. Non funzionava molto bene.
Poi ha spiegato cosa acccade quando si parla con Siri:
Per prima cosa, quando parli Siri trasforma i suoni in parole. Per questo passaggio utilizziamo un software di terze parti. Quello che mancava a questo punto era una macchina che potesse capire il significato delle parole e farne qualcosa. Ecco quello che fa Siri. Dopo tutte le ricerche e lo sviluppo, ci sono voluti tre anni per crearlo.
La sfida successiva che è stata affrontata fu quella di far interagire Siri con le persone e far capire loro di cosa si trattasse. Non era Google o un motore di ricerca, non c’era un input di testo e dei link in output. Si trattava di farlo comportare come un umano.
Come chiameremo questa cosa, come faremo in modo da far capire alla gente cos’è? Il primo slogan che mi è venuto in mente era “Siri, praticamente umano”. Beh, non era ancora umano allora e lasciava un po’ a desiderare. Ci serviva qualcosa di meglio. Quindi chiameremo questa versione “Siri, umano ogni tanto”. Poi abbiamo detto, a un certo punto: ok, la prossima versione sarà praticamente umana.
Siri, come si sarà capito, non è stato sviluppato né facilmente né in una notte. iMore ha chiesto, a tal proposito, quali sono state le maggiori difficoltà lungo il cammino.
All’inizio la domanda era: come è possibile fare in modo che tutta questa tecnologia lavori assieme per restituire effettivamente l’esperienza di “parlare” con la macchina? È molto difficile. Abbiamo impiegato i primi due anni per risolvere questo nodo. Dopo essere stati acquisiti da Apple, dovevamo rendere disponibile questa tecnologia a 100 milioni di utenti. È una sfida completamente diversa. Nessuno l’aveva fatto prima di allora, e il problema più grande era quello di far funzionare tutto. Ti servono le persone migliori, specialmente nel business dei software. È diverso da molti altri campi perché l’impatto che le persone giuste hanno è molto più grande che non in altri settori.
Successivamente, Kittlaus ha citato la cosiddetta “legge dei ritorni acceleranti“, che parla dello sviluppo tecnologico. Secondo questa teoria, elaborata da Raymond Kurzweil, ogni generazione di un prodotto tecnologico raddoppia la sua potenza rispetto a quella passata. In sostanza, nel 21esimo secolo – continuando al tasso attuale di sviluppo – avanzeremo tecnologicamente di 20000 anni.
Infine, l’uomo ha scherzato sulla prossima versione di Siri, lasciato presagire che ci sono parecchie novità all’orizzonte.
Via | iMore
Leggi o Aggiungi Commenti