Project VoCo di Adobe: editare la voce come un testo

Adobe ha presentato alla conferenza Adobe MAX – tenutasi a San Diego – il Project VoCo, uno strumento sperimentale che consente di editare il parlato come se si trattasse di un testo, sulla base di un determinato modello vocale. Ecco come funziona: il Project VoCo richiede circa una ventina di minuti per fornire un campione […]


Adobe ha presentato alla conferenza Adobe MAX – tenutasi a San Diego – il Project VoCo, uno strumento sperimentale che consente di editare il parlato come se si trattasse di un testo, sulla base di un determinato modello vocale.
Ecco come funziona: il Project VoCo richiede circa una ventina di minuti per fornire un campione da un parlato. Analizza il linguaggio, lo frammenta in fonemi, lo trascrive e crea il modello vocale. Ascoltandolo da vicino è possibile distinguere quando sia stata cambiata una parola, ma probabilmente è una questione di tempo prima che si possa non distinguere una registrazione in presa diretta da una completamente simulata.
Come ha fatto notare Adobe nel corso della presentazione della demo, il progetto non si basa sulla tecnologia di sintesi vocale di tipo tradizionale, ma su quella che Adobe stessa definisce come “conversione vocale”.
Project VoCo Adobe
Ciò che rende questa tecnologia così interessante è che non viene richiesto alcun intervento manuale. È possibile correggere la trascrizione auto-generata per migliorare la sintesi, ma non è necessario che vengano impostate delle marcature temporali, ad esempio. L’algoritmo esegue questo compito autonomamente.
Questo tipo di tecnologia ha suscitato domande di ogni genere, come: che cosa succede nel momento in cui non puoi fidarti di quello che senti, ovvero se non puoi distinguere una registrazione genuina da una artificiale? Insomma, si tratta di una rivoluzione impattante l’immissione di questa tecnologia sul mercato.
Nel corso dello stesso evento Adobe ha mostrato anche due progetti di editing: il Project Quick Layout – che consente di editare i layout di stampa – e il Project Clover, uno strumento di editing per VR che lavora all’interno della realtà virtuale stessa.


Project VoCo di Adobe: editare la voce come un testo - Ultima modifica: 2016-11-06T12:00:53+00:00 da Francesco Marino
Arduino

Rachel, l'AI che ha chiamato 3.000 pub per scoprire quanto costa una pinta di Guiness

Quanto costa una pinta di Guinness in Irlanda? Sembra una domanda semplice, ma non lo è.

Il governo irlandese ha smesso di tracciare quel dato nel 2011. Matt Cortland, un americano di 37 anni, ha deciso che questo vuoto non doveva più esistere. Così ha costruito un agente AI, gli ha dato una voce nord-irlandese, un nome, e gli ha fatto chiamare tremila pub… per scoprire il prezzo medio della Guinness in tutte le 32 contee d'Irlanda.

You have Successfully Subscribed!