Siamo di corsa, entriamo in auto e ricordiamo di dover fare una telefonata di routine, senza la quale può saltare una cena, l’appuntamento dal dentista o dal parrucchiere. Oggi una simile operazione non può che essere svolta manualmente, al massimo chiedendo all’assistente vocale sullo smartphone di comporre il numero. Ma c’è un futuro, già scritto, in cui il maggiordomo in forma di bit potrà fare molto altro, sostituendo l’utente in misura maggiore. Lo ha dimostrato Google quando pochi giorni fa, durante uno dei keynote dell’evento per sviluppatori (e non solo) I/O 2018, ha svelato Duplex. Di cosa si tratta? Scopriamolo insieme.
Duplex è un aggiornamento del Google Assistant, un nuovo algoritmo su cui si basa il machine learning di Big G, un’app che sposta più in là i limiti del possibile di ciò che una AI può compiere attualmente su uno smartphone (come i Pixel) o un normale computer. Duplex, in parole povere, è un Assistente 2.0, che oltre a dirci che tempo farà nelle prossime ore oppure raccontare le ultime notizie, può farsi carico di task ulteriori e molto più complessi.
La compagnia di Mountain View ha realizzato un video per far comprendere, meglio di qualsiasi altra parola, cosa può diventare per l’utente comune Duplex. Eccolo qui su YouTube. Google Duplex è un’estensione dell’app Google Assistant già presente su smartphone e tablet Android o iOS. Consente di chiedere all’Assistente di organizzare un semplice compito che spesso è time-consuming, ovvero ci porta via momenti preziosi durante la giornata.
Cosa può fare
Che si tratti di prenotare un posto al ristorante oppure bloccare uno slot dal barbiere, il prossimo Assistant potrà fare tutto da solo, semplicemente leggendo la richiesta sul calendario o dando seguito a quanto richiesto via voce. A quel punto, Duplex effettuerà la chiamata e avrà una vera conversazione dal vivo con chiunque risponda al telefono. Sembra un contesto molto artefatto e poco verosimile ma il gruppo americano conferma che il filmato demo è del tutto reale e che un domani l’algoritmo saprà imitare il linguaggio umano al punto che la persona all’altro capo della linea non si accorgerà mai di aver parlato con un software piuttosto che un individuo.
Limitato ma non banale
Google ha specificato che, almeno per il momento, Duplex non può intrattenere qualsiasi tipo di conversazione. Il focus resta sui servizi, ovvero chiacchierate finalizzate a un obiettivo ben specifico, sicuramente con alcune variabili e alternative ma sicuramente circoscritto. In un post sul blog che ha annunciato la novità, Big G ha chiarito le ragioni. “La tecnologia è diretta al completamento di compiti specifici, come la pianificazione di determinati tipi di appuntamenti. Uno dei principali spunti di ricerca è stato quello di vincolare Duplex a domini chiusi, che sono abbastanza ristretti da poter essere esplorati in modo approfondito. Duplex può effettuare conversazioni naturali solo dopo essere stato profondamente addestrato in tali ambiti”.
Cosa muove la tecnologia
Il cuore di Duplex è la cosiddetta rete neurale ricorrente (RNN), che funziona non solo con le parole pronunciate ma con il contesto in cui vengono utilizzate.
Per ottenere la massima precisione, abbiamo addestrato la rete su un database di telefonate anonime ma reali – scrive la compagnia – il network utilizza l’output del riconoscimento vocale automatico (ASR), le funzioni sonore, la cronologia delle conversazioni, i servizi attesi e altro ancora, per determinare le variabili e la tipologia di comunicazione basata su frasi. Abbiamo allenato il nostro modello di comprensione separatamente per ogni attività, incrociando però il training con informazioni condivise e non sempre uniche.
Eticamente corretto?
Il risultato delle dimostrazioni è, francamente, sorprendente, ma c’è già molta discussione sul fatto che il software che finge di essere umano sia qualcosa di eticamente scorretto. Come ti sentiresti se ti dicessero che la voce con cui hai appena parlato era in realtà di un robot? L’articolo che hai appena letto scritto da un programma automatico o i messaggi di WhatsApp di cui ti sei innamorato inviati da una AI al computer? Per ovviare al problema del “camuffamento”, pare che Google sia intenzionata a far annunciare Duplex all’inizio della telefonata, probabilmente con un avviso standard. Ma questo non comporterà problemi ulteriori? Ad esempio un diverso atteggiamento dell’interlocutore che saprà di star conversando con una macchina e non una persona. Philip Dick ne andrebbe matto.