Google Cloud Video Intelligence: la ricerca nei fotogrammi video

Nel corso dell’evento Cloud Next, tenutosi a San Francisco, Google ha rivelato il proprio API (application programming interface, in italiano: interfaccia di programmazione di un’applicazione) che si chiama Cloud Video Intelligence. Lo strumento, che è attualmente disponibile per i soli sviluppatori in fase beta, analizza i video e rende i contenuti presenti in essi, materiale nel quale poter ricercare oggetti specifici.

La tecnologia di Google per i video è così avanzata da far sì che i ricercatori possano affermare di essere in grado di trovare oggetti specifici all’interno di un video o una serie di video.

Con questo strumento è possibile fare delle ricerche all’interno di uno o più video utilizzando parole chiave e portando ad un elenco di risultati che mostrano il fotogramma e dove si possano trovare gli oggetti rilevanti secondo termini di ricerca all’interno del video. Google ha reso disponibili alcune demo.

Google sostiene che l’API Video Intelligence consenta agli sviluppatori di poter beneficiare delle capacità di ricerca all’interno dei video anche in quei casi in cui non c’è un background in machine learning oppure computer vision.

Uno degli scienziati che ha preso parte al progetto e che è a capo della Google Cloud artificial intelligence and machine learning, Fei-Fei Li, ha commentato: “Questa API è destinata alle grandi organizzazioni multimediali e alle aziende che si occupano di tecnologia di consumo, nel momento in cui vogliano costruire dei propri cataloghi multimediali o trovare modi semplici per gestire i contenuti. L’API Cloud Video Intelligence utilizza potenti modelli di apprendimento approfondito, costruiti su framework come TensorFlow e applicati su larga scala su piattaforme di media come YouTube”.

Nonostante – per ora – l’API Video Intelligence sia limitata a coloro che dispongono della versione beta, lo strumento potrebbe avere implicazioni di vasta portata, com’è già successo per il riconoscimento facciale e quello vocale. Se Google dovesse portarlo su YouTube, per esempio, il contenuto di più di un 1 miliardo di video presenti nella piattaforma diventerebbe ricercabile, aprendo molte più possibilità in termini di scoperta. Le società hanno la possibilità di richiedere di poter accedere all’API.
I due maggiori concorrenti in ambito di cloud pubblici di Google sono Amazon Web Services (AWS) e Microsoft Azure, i quali attualmente non offrono questa funzionalità, fiora esiste solo una startup, la Clarifai, che offra qualcosa di simile.


Google Cloud Video Intelligence: la ricerca nei fotogrammi video - Ultima modifica: 2017-03-10T11:50:14+00:00 da Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Recent Posts

NVIDIA GTC 2026, l’AI entra nell’era industriale

Alla NVIDIA GTC 2026 Jensen Huang ha presentato Vera Rubin, Groq 3, Dynamo 1.0 e…

3 giorni ago

ChatGPT-5.4 supera l’uomo nei task desktop: e adesso?

GPT-5.4 raggiunge il 75% su OSWorld-Verified, superando i dati fatti segnare dagli umani del 72,4%…

6 giorni ago

Sloply, il malware che nessuno può riconoscere: arriva il malware agentico

Arriva il malware agentico, polimorfo, in grado di cambiare in pochi secondi. L’intelligenza artificiale non…

6 giorni ago

Palo Alto Networks Ignite on Tour Milano 2026: la cybersecurity diventa il motore dell’innovazione

Ignite On Tour al Museo della Scienza di Milano, nelle sale dove Leonardo immaginava macchine…

6 giorni ago

Data poisoning: l’attacco invisibile che cambia il comportamento dell’AI

Data poisoning: come funziona il nuovo attacco che manipola gli LLM nel tempo, influenzando il…

2 settimane ago

Perché Apple ha lanciato il MacBook Neo proprio ora (e perché non l’ha fatto prima)

Il MacBook Neo a 699 euro segna una svolta strategica per Apple, che entra nella…

2 settimane ago

Digitalic © MMedia Srl

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011