Project VoCo di Adobe: editare la voce come un testo

Adobe ha presentato alla conferenza Adobe MAX – tenutasi a San Diego – il Project VoCo, uno strumento sperimentale che consente di editare il parlato come se si trattasse di un testo, sulla base di un determinato modello vocale.
Ecco come funziona: il Project VoCo richiede circa una ventina di minuti per fornire un campione da un parlato. Analizza il linguaggio, lo frammenta in fonemi, lo trascrive e crea il modello vocale. Ascoltandolo da vicino è possibile distinguere quando sia stata cambiata una parola, ma probabilmente è una questione di tempo prima che si possa non distinguere una registrazione in presa diretta da una completamente simulata.
Come ha fatto notare Adobe nel corso della presentazione della demo, il progetto non si basa sulla tecnologia di sintesi vocale di tipo tradizionale, ma su quella che Adobe stessa definisce come “conversione vocale”.

Ciò che rende questa tecnologia così interessante è che non viene richiesto alcun intervento manuale. È possibile correggere la trascrizione auto-generata per migliorare la sintesi, ma non è necessario che vengano impostate delle marcature temporali, ad esempio. L’algoritmo esegue questo compito autonomamente.
Questo tipo di tecnologia ha suscitato domande di ogni genere, come: che cosa succede nel momento in cui non puoi fidarti di quello che senti, ovvero se non puoi distinguere una registrazione genuina da una artificiale? Insomma, si tratta di una rivoluzione impattante l’immissione di questa tecnologia sul mercato.
Nel corso dello stesso evento Adobe ha mostrato anche due progetti di editing: il Project Quick Layout – che consente di editare i layout di stampa – e il Project Clover, uno strumento di editing per VR che lavora all’interno della realtà virtuale stessa.


Project VoCo di Adobe: editare la voce come un testo - Ultima modifica: 2016-11-06T12:00:53+00:00 da Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Recent Posts

BlueIT AI Accelerator: il 22 aprile l’AI entra nel castello e diventa industria

Il 22 aprile BlueIT porta l’AI Accelerator al Castello Visconteo di Pandino per la prima…

1 giorno ago

ASUS ExpertBook Ultra: il laptop da 0,99 kg che sfida la gravità del business

Presentato nella mostra Space Dreamers a Milano, l'ASUS ExpertBook Ultra pesa 0,99 kg, monta un…

4 giorni ago

NVIDIA GTC 2026, l’AI entra nell’era industriale

Alla NVIDIA GTC 2026 Jensen Huang ha presentato Vera Rubin, Groq 3, Dynamo 1.0 e…

1 settimana ago

ChatGPT-5.4 supera l’uomo nei task desktop: e adesso?

GPT-5.4 raggiunge il 75% su OSWorld-Verified, superando i dati fatti segnare dagli umani del 72,4%…

2 settimane ago

Sloply, il malware che nessuno può riconoscere: arriva il malware agentico

Arriva il malware agentico, polimorfo, in grado di cambiare in pochi secondi. L’intelligenza artificiale non…

2 settimane ago

Palo Alto Networks Ignite on Tour Milano 2026: la cybersecurity diventa il motore dell’innovazione

Ignite On Tour al Museo della Scienza di Milano, nelle sale dove Leonardo immaginava macchine…

2 settimane ago

Digitalic © MMedia Srl

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011