intelligenza artificiale

OpenAI lancia l’intelligenza artificiale vocale: Voice Engine

OpenAI ha svelato un nuovo strumento di intelligenza artificiale che può imitare le voci umane con sorprendente precisione. Il generatore di voci IA ha una serie di possibili applicazioni, compresi i servizi di accessibilità, ma potrebbe anche sollevare preoccupazioni in merito alla disinformazione (deepfake) e ad altre forme di truffa.

OpenAI Voice Engine

OpenAI ha condiviso alcuni dei primi test effettuati con il nuovo strumento, chiamato Voice Engine, che utilizza un campione di 15 secondi di una persona che parla per generare una convincente replica della sua voce. Gli utenti possono quindi registrare la lettura di un paragrafo di testo e lo strumento leggerà poi qualunque cosa con la voce generata dall’IA.

L’intelligenza artificiale vocale

Esistono già diversi servizi di voci generate dall’ AI disponibili ma, come ha fatto con il chatbot di grande successo di ChatGPT, OpenAI si è dimostrata particolarmente abile nel diffondere l’adozione di nuove tecnologie.
Una piattaforma di text-voice alimentata dall’AI potrebbe migliorare con le traduzioni, essere impiegata nell’assistenza alla lettura per i bambini o per ridare voce alle persone che l’hanno persa. Ma alcuni scettici temono che potrebbe anche alimentare la creazione di messaggi ingannevoli o facilitare le truffe. OpenAI afferma che Voice Engine è attualmente utilizzato solo da un “piccolo gruppo di partner fidati”, tra cui aziende tecnologiche nel settore dell’educazione e della sanità, e che utilizzerà i loro test per determinare se e come permettere un uso più diffuso. Questi tester hanno accettato di non ricreare le voci delle persone senza il loro esplicito consenso e di identificare chiaramente agli ascoltatori che ciò che stanno ascoltando è generato dall’IA, secondo quanto riferito dall’azienda.

I rischi della AI vocale

“Riconosciamo che generare un audio che somiglia alla voce di persone reali comporta seri rischi, che sono particolarmente presenti in un anno elettorale”, ha affermato OpenAI in un post sul blog. L’azienda ha riconosciuto la necessità di importanti cambiamenti man mano che l’audio generato dall’AI diventerà più diffuso, anche se non prevede di rilasciare immediatamente Voice Engine al pubblico. Addirittura l’azienda suggerisce di eliminare l’autenticazione vocale per i conti bancari.
“Qualsiasi implementazione su larga scala di voci sintetiche dovrebbe essere accompagnata da esperienze di autenticazione vocale che verificano che il soggetto originale stia consapevolmente aggiungendo la sua voce al servizio e un elenco di voci non ammesse che impedisca la creazione di voci troppo simili a figure di rilievo”, ha detto OpenAI.
Voice Engine può utilizzare un campione vocale in una lingua per creare una voce AI che può parlare in diverse altre lingue.
Il post sul blog di OpenAI mostra un esempio in cui il clip audio registrato una persona viene trasformato in spagnolo, mandarino, tedesco, francese e giapponese. Nelle registrazioni generate dall’intelligenza artificiale, sia il tono che l’accento del parlante originale vengono fedelmente preservati. Qui sotto ci sono alcuni esempi audio di OpenAI che mostrano come funziona Voice Engine.

Riferimento

Francese

Spagnolo

OpenAI lancia l’intelligenza artificiale vocale: Voice Engine - Ultima modifica: 2024-04-07T18:04:39+00:00 da Francesco Marino

Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Next Seeweb: l’AI “Made in Italy” può essere la svolta per le nostre Pmi »

Previous « Best Place To Work: le migliori aziende in cui lavorare in Italia, classifica 2024

Published by

Francesco Marino

2 anni ago

NVIDIA GTC 2026, l’AI entra nell’era industriale

Alla NVIDIA GTC 2026 Jensen Huang ha presentato Vera Rubin, Groq 3, Dynamo 1.0 e…

2 giorni ago

Tech-News

ChatGPT-5.4 supera l’uomo nei task desktop: e adesso?

GPT-5.4 raggiunge il 75% su OSWorld-Verified, superando i dati fatti segnare dagli umani del 72,4%…

5 giorni ago

intelligenza artificiale

Sloply, il malware che nessuno può riconoscere: arriva il malware agentico

Arriva il malware agentico, polimorfo, in grado di cambiare in pochi secondi. L’intelligenza artificiale non…

5 giorni ago

Cyber Security

Palo Alto Networks Ignite on Tour Milano 2026: la cybersecurity diventa il motore dell’innovazione

Ignite On Tour al Museo della Scienza di Milano, nelle sale dove Leonardo immaginava macchine…

5 giorni ago

intelligenza artificiale

Data poisoning: l’attacco invisibile che cambia il comportamento dell’AI

Data poisoning: come funziona il nuovo attacco che manipola gli LLM nel tempo, influenzando il…

2 settimane ago

Tech-News

Perché Apple ha lanciato il MacBook Neo proprio ora (e perché non l’ha fatto prima)

Il MacBook Neo a 699 euro segna una svolta strategica per Apple, che entra nella…

2 settimane ago

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011

OpenAI lancia l’intelligenza artificiale vocale: Voice Engine

OpenAI Voice Engine

L’intelligenza artificiale vocale

I rischi della AI vocale

Francesco Marino

Recent Posts

NVIDIA GTC 2026, l’AI entra nell’era industriale

ChatGPT-5.4 supera l’uomo nei task desktop: e adesso?

Sloply, il malware che nessuno può riconoscere: arriva il malware agentico

Palo Alto Networks Ignite on Tour Milano 2026: la cybersecurity diventa il motore dell’innovazione

Data poisoning: l’attacco invisibile che cambia il comportamento dell’AI

Perché Apple ha lanciato il MacBook Neo proprio ora (e perché non l’ha fatto prima)

Digitalic © MMedia Srl

OpenAI lancia l’intelligenza artificiale vocale: Voice Engine

OpenAI Voice Engine

L’intelligenza artificiale vocale

I rischi della AI vocale

Francesco Marino

Related Post

Recent Posts

NVIDIA GTC 2026, l’AI entra nell’era industriale

ChatGPT-5.4 supera l’uomo nei task desktop: e adesso?

Sloply, il malware che nessuno può riconoscere: arriva il malware agentico

Palo Alto Networks Ignite on Tour Milano 2026: la cybersecurity diventa il motore dell’innovazione

Data poisoning: l’attacco invisibile che cambia il comportamento dell’AI

Perché Apple ha lanciato il MacBook Neo proprio ora (e perché non l’ha fatto prima)

Digitalic © MMedia Srl