Un pc per vedere il mondo come fanno le persone o gli animali, deve fare affidamento sulla visione artificiale e riconoscimento delle immagini.
Insegnare a un computer come “vedere” non è un’impresa da poco, il riconoscimento delle immagini da parte di una intelligenza artificiale è uno dei compiti più complessi da affrontare per un computer. Si può installare una videocamera su un PC, ma questo non gli darà la vista. Affinché una macchina possa effettivamente vedere il mondo come fanno le persone o gli animali, deve fare affidamento sulla visione artificiale e sul riconoscimento delle immagini.
Indice dei contenuti
Cos’è la visione artificiale
La visione artificiale è ciò che consente la a uno scanner di codici a barre di “vedere” un codice identificativo in mucchio di strisce. È anche il modo in cui Face ID di Apple è in grado di stabilire se un volto nella sua fotocamera è il tuo. Fondamentalmente, ogni volta che una macchina elabora un input visivo grezzo, come un file JPEG o un feed fotografico, utilizza la visione artificiale per capire cosa sta vedendo. È più facile pensare alla visione artificiale come la parte del cervello umano che elabora le informazioni ricevute dagli occhi, non gli occhi stessi.
Come funziona il riconoscimento delle immagini
Uno degli usi più interessanti della visione artificiale, dal punto di vista dell’AI, è il riconoscimento delle immagini, che dà a una macchina la capacità di interpretare l’input ricevuto attraverso la visione artificiale e di classificare ciò che “vede”.
C’è anche un app, ad esempio, che utilizza la fotocamera dello smartphone per determinare se un oggetto è un hotdog o meno e si chiama Not Hotdog: utilizza la visione artificiale e il riconoscimento delle immagini per esprimere i propri giudizi. Potrebbe sembrare non molto impressionante, dopo tutto un bambino piccolo può dire facilmente se qualcosa è un hot dog o meno, ma il processo di formazione di una rete neurale per eseguire il riconoscimento dell’immagine è piuttosto complesso, sia nel cervello umano che nei computer.
Riconoscimento di immagini: come computer acquisiscono il senso della vista
L’AI, al momento, è molto simile a un bambino piccolo. La computer vision gli conferisce il senso della vista, ma ciò non avviene con una comprensione dell’universo fisico. Per questo, un’intelligenza artificiale ha bisogno di allenamento proprio come fanno i bambini. Se mostri a un bambino un numero o una lettera abbastanza volte, imparerà a riconoscere quel numero.
Sorprendentemente, molti bambini possono immediatamente riconoscere le lettere e i numeri capovolti una volta che li hanno appresi. Le nostre reti neurali biologiche sono piuttosto brave nell’interpretare le informazioni visive anche se l’immagine che stiamo elaborando non ha esattamente l’aspetto a cui siamo abituati.
È abbastanza facile fare in modo che un computer riconosca un’immagine specifica, come un codice QR, ma i computer non sono bravi a riconoscere immediatamente cose viste in prospettive e modalità inaspettate: da qui la necessità delle tecnologie più avanzate di riconoscimento delle immagini.
Il modo in cui funziona il riconoscimento delle immagini, in genere, comporta la creazione di una rete neurale (occorrono strumenti software specifici) che elabora i singoli pixel di un’immagine. I ricercatori alimentano queste reti con il maggior numero possibile di immagini pre-etichettate, al fine di “insegnarle” a riconoscere immagini simili.
Software riconoscimento immagini , esempi
Nell’esempio dell’hotdog, gli sviluppatori avrebbero nutrito una AI con migliaia di foto di hot dog. Attraverso un algoritmo riconoscimento immagini l‘intelligenza artificiale sviluppa quindi un’idea generale di ciò che dovrebbe essere un’immagine di un hotdog. Quando si fornisce all’AI un’immagine di qualcosa, confronta ogni pixel di quell’immagine con ogni immagine di hotdog che abbia mai visto e se l’input soddisfa una soglia minima di pixel simili, l’AI lo dichiara un hotdog.
Qualsiasi sistema di intelligenza artificiale che elabora le informazioni visive di solito si basa sulla computer vision e quelle in grado di identificare oggetti specifici o categorizzare le immagini in base al loro contenuto stanno eseguono un processo di riconoscimento delle immagini.
Questo aspetto è incredibilmente importante per i robot che hanno bisogno di riconoscere e classificare rapidamente e con precisione diversi oggetti nel loro ambiente. Le auto a guida autonoma, ad esempio, utilizzano la visione artificiale e il riconoscimento delle immagini per identificare pedoni, segnaletica e altri veicoli.