Molti di noi, ascoltando questa telefonata (in lingua inglese), non noteranno niente di strano: si tratta di una persona che prenota un appuntamento dal parrucchiere. Il problema è che qualcosa di strano dovrebbe esserci, dato che stiamo ascoltando una conversazione in tempo reale tra un essere umano e una macchina.

La rivelazione ha colto tutti di sorpresa perchè, a differenza di altri ambiti (come il riconoscimento di persone), gli algoritmi di intelligenza artificiale hanno sempre trovato grossi limiti nella comprensione e nella produzione del linguaggio orale, tanto da configurare questo ambitocome la vera sfida dell’intelligenza artificiale. In fondo, tutti noi impieghiamo pochi secondi per riconoscere una telefonata vera da una fatta con una voce registrata. O almeno, fino ad ora.

Nel documento di presentazione di Google Duplex (questo il nome della tecnologia) potremo notare molte sfide che gli sviluppatori hanno dovuto affrontare (a quanto pare, risolvendole) e che noi che lavoriamo nell’ambito della comunicazione verbale conosciamo bene:

  • A differenza di una ricerca su Google, una prenotazione a voce è molto più imprecisa: contiene esitazioni, parole ripetute più volte, autocorrezioni. Uno dei compiti della macchina è dunque “ripulire” il segnale ed estrarre il contenuto informativo
  • Le persone parlano spesso in modo rapido e, quando sono al telefono, possono avere un rumore di sottofondo. Un altro compito della macchina è dunque identificare e isolare il messaggio
  • I contenuti possono essere ambigui: come nell’esempio fornito dalla pagina di Google, in inglese “Ok for 4” può voler dire “Ok per le 4:oo” o “Ok per 4 persone”. Compito della macchina è dunque quello di individuare e disambiguare queste possibili situazioni
  • Riconoscere gli aspetti pragmatici: a volte la macchina deve rispondere con azioni a richieste esplicite, ad esempio “Può aspettare un attimo?”, “Può ripetere?”, “Può dirlo lettera per lettera?”

È interessante notare il fatto che, per sembrare più naturale, il sistema deve essere più impreciso: la “ragazza” che prende l’appuntamento utilizza delle interiezioni, esitazioni e riformulazioni al solo scopo di sembrare più naturale.

Fortunatamente per noi, Duplex dovrà identificarsi come robot prima di avviare una conversazione telefonica con noi.

Resta il fatto che le scoperte effettuate per superare tutte le difficoltà descritte sopra possono avere un impatto enorme sui modelli di comprensione e produzione linguistica.

Contattaci

Non siamo attualmente disponibili, ma puoi contattarci scrivendo qui. Risponderemo appena possibile!

Inizia a digitare e premi Enter per effettuare una ricerca