Project VoCo di Adobe: editare la voce come un testo

Adobe ha presentato alla conferenza Adobe MAX – tenutasi a San Diego – il Project VoCo, uno strumento sperimentale che consente di editare il parlato come se si trattasse di un testo, sulla base di un determinato modello vocale.
Ecco come funziona: il Project VoCo richiede circa una ventina di minuti per fornire un campione da un parlato. Analizza il linguaggio, lo frammenta in fonemi, lo trascrive e crea il modello vocale. Ascoltandolo da vicino è possibile distinguere quando sia stata cambiata una parola, ma probabilmente è una questione di tempo prima che si possa non distinguere una registrazione in presa diretta da una completamente simulata.
Come ha fatto notare Adobe nel corso della presentazione della demo, il progetto non si basa sulla tecnologia di sintesi vocale di tipo tradizionale, ma su quella che Adobe stessa definisce come “conversione vocale”.

Ciò che rende questa tecnologia così interessante è che non viene richiesto alcun intervento manuale. È possibile correggere la trascrizione auto-generata per migliorare la sintesi, ma non è necessario che vengano impostate delle marcature temporali, ad esempio. L’algoritmo esegue questo compito autonomamente.
Questo tipo di tecnologia ha suscitato domande di ogni genere, come: che cosa succede nel momento in cui non puoi fidarti di quello che senti, ovvero se non puoi distinguere una registrazione genuina da una artificiale? Insomma, si tratta di una rivoluzione impattante l’immissione di questa tecnologia sul mercato.
Nel corso dello stesso evento Adobe ha mostrato anche due progetti di editing: il Project Quick Layout – che consente di editare i layout di stampa – e il Project Clover, uno strumento di editing per VR che lavora all’interno della realtà virtuale stessa.


Project VoCo di Adobe: editare la voce come un testo - Ultima modifica: 2016-11-06T12:00:53+00:00 da Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Recent Posts

Processo Musk contro OpenAI, arriva il Dossier Sutskever: le 52 pagine che riaprono il caso Sam Altman

Nel Processo Musk contro OpenAI riemerge il Dossier Sutskever, 52 pagine di accuse interne che…

2 giorni ago

Anthropic affitta i datacenter da Musk: la fame di AI va nello spazio

Anthropic affitta tutta la capacità del data center Colossus 1 di SpaceX a Memphis: oltre…

2 giorni ago

Cloudflare licenzia 1.100 persone e annuncia una crescita del 34%, la spietata legge dell’AI-Agentic First

Cloudflare licenzia il 20% del personale perchè ha introdotto l'AI-Agentica, una spietata nuova efficienza algoritmica…

2 giorni ago

Brussels Economic Forum 2026: come costruire un’AI Europea

Il Brussels Economic Forum 2026 si apre con un discorso che non lascia dubbi: o…

4 giorni ago

La fibra dedicata di Ehiweb: l’infrastruttura per il mondo dell’AI

Quando un’azienda decide di investire sull’intelligenza artificiale si concentra su GPU, modelli, dati e spesso…

7 giorni ago

Digitalic © MMedia Srl

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011