Voce clonata in 15 secondi (mistergadget.tech)
Ormai sono mesi in cui si parla dell’intelligenza artificiale, e in maniera particolare delle preoccupazioni relative a un suo utilizzo improprio.
Adesso la questione sembra aver raggiunto un gradino successivo: OpenAI ha infatti annunciato un modello di intelligenza artificiale generativa che è in grado di clonare la voce in soli 15 secondi.
Tradizionalmente, si tratta di una metodica eccezionale. Il risvolto positivo è che si aprono le porte a degli avanzamenti tecnologici veramente interessanti. Chiaramente, bisogna considerare l’altro lato della medaglia: i pericoli che si celano dietro strumentazioni di questo tipo, soprattutto se di facile accesso a tutti.
Voce clonata in 15 secondi, il nuovo modello di AI ora fa paura
Il nuovo sistema, chiamato Voice Engine, è in grado praticamente di sintetizzare la voce, andandola a clonare con un campione audio anche molto breve. Parliamo di soli 15 secondi. In pratica, può ascoltare una voce e duplicarla, utilizzando poi quella voce per dire qualunque cosa, per fare un discorso, per far dire a quella voce parole che non sono mai state dette.
L’azienda ha anche fatto presente che questo è già stato inserito all’interno delle API text-to-speech. In pratica, ChatGPT, quando gli si dice “leggi ad alta voce”, adesso è in grado di farlo anche in maniera del tutto personalizzata.
Chiaramente, parliamo di un avanzamento che è stato reso possibile grazie a delle strumentazioni tecniche incredibili. Quindi è un successo per gli sviluppatori, per l’azienda e per gli utenti che ne vogliono beneficiare in senso positivo. Ma è chiaro che lo strumento di duplicazione della voce, se da un lato può avere grandi utilità e impieghi, dall’altro potrebbe essere utilizzato facilmente per determinare delle truffe pericolose.
In questi mesi abbiamo visto quanto siano dilagate proprio le truffe con il deepfake, con video generati dall’intelligenza artificiale che clonano il volto o la voce di altre persone. Il problema principale forse è che l’intelligenza artificiale a questi livelli è così facilmente accessibile che chiunque ovviamente può dare seguito a un video o a una voce falsa.
Al momento, nelle politiche di utilizzo c’è chiaramente il divieto di rappresentare un altro individuo o un’organizzazione senza consenso. Il consenso deve essere sempre esplicito e informato. Ma chiaramente, come sappiamo, questo purtroppo non è un argine sufficiente per bloccare le truffe online.
OpenAI non ha al momento dato una data certa su quando Voice Engine sarà effettivamente accessibile al pubblico. Probabilmente, la tecnologia potrebbe essere molto più vicina di quanto pensiamo. Gli sviluppi che si stanno attuando in questo periodo sono veramente molto rapidi, ben al di sopra forse di quello che avevamo previsto.