Riconoscimento vocale Microsoft, accurato come quello umano

Microsoft ha realizzato un software di riconoscimento vocale che è accurato tanto quanto quello umano. Lo sviluppo, illustrato attraverso una documentazione rilasciata lo scorso lunedì, rappresenta l’esempio più avanzato di riconoscimento vocale che si sia mai visto. Il tasso di errore si aggira attorno al 5.9%: uguale a quello dei trascrittori umani.

Ecco come lo raccontano direttamente da casa Microsoft:
“Il traguardo conseguito dai ricercatori non significa che il computer sia stato in grado di riconoscere ogni parola alla perfezione. Ma nemmeno gli umani riescono in un tale intento. Significa invece che il margine di errore – oppure la frequenza attraverso la quale il computer non distingue il verbo avere dal verbo essere, oppure l’articolo indeterminativo al posto di quello determinativo – è lo stesso che si rileva in una persona che trascriva la stessa conversazione.
Un mese fa circa la percentuale di errore era attorno al 6.3%, e faceva prevedere un accrescimento in termini di accuratezza nel riconoscimento”.

Il software si basa su reti neurali approfondite e GPU specifiche, un insieme di tecnologie che interpretano i dati in un modo molto simile a come funziona il cervello umano, consentendo al software di apprendere ad una velocità sorprendente.
Il prodotto Microsoft potrebbe migliorare esponenzialmente nel riconoscimento del parlato umano. Il team di ricerca ha evidenziato quanto Cortana e la Xbox potrebbero adottarlo già nell’immediato e quindi beneficiarne positivamente. Anche i servizi di trascrizione istantanea potrebbero sfruttare questo software. Ma se si pensa ad Office sono molte le applicazioni possibili, basti solo pensare a Word e alla dettatura di testi.

A prescindere dal mondo consumer, segna un importante pietra miliare anche in campo di ricerca AI, su cui Microsoft sta puntando.
Geoffrey Zweig di Microsoft ha sottolineato che la prossima fase consisterà nel costruire un software in grado non solo di trascrivere il parlato umano, ma persino di comprenderlo. Ovviamente si tratta di un’ipotesi lontana e i progressi attuali sono già dei grandi passi in avanti in questo ambito.


Riconoscimento vocale Microsoft, accurato come quello umano - Ultima modifica: 2016-10-20T08:08:26+00:00 da Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Recent Posts

Claude Fable 5: il modello più potente di Anthropic, rilasciato e ritirato in 3 giorni

Claude Fable 5 è il modello Mythos-class che Anthropic ha reso pubblico: novità tecniche, prezzi,…

2 minuti ago

Migliori alberghi del mondo: la classifica Tripadvisor degli hotel che trasformano il viaggio in memoria

Scopri i Migliori alberghi del mondo secondo Tripadvisor: la classifica Travellers’ Choice Best of the…

2 giorni ago

CollaboraSec, la protezione entreprise per le PMI da Collabora e Cisco pensata per il canale

Le minacce non distinguono più tra grandi e piccole aziende, ma solo chi ha le…

3 giorni ago

Nextcloud Summit 2026: vent’anni di promesse e 1,2 milioni di utenti, la sovranità digitale alla prova dei fatti

Nextcloud Summit 2026: Sachiko Muto avverte che l'open source ha vinto sulla carta; il Ministero…

4 giorni ago

Nextcloud Summit 2026: dieci anni di sovranità digitale e la scommessa di Karlitschek sull’AI

Al Nextcloud Summit 2026 di Monaco Frank Karlitschek racconta dieci anni di open source, il…

4 giorni ago

Progetti di AI Italiana

Progetti di AI Italiana: da Trieste a Genova, da Milano alla Puglia: le startup che…

7 giorni ago

Digitalic © MMedia Srl

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011