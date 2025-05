Meta userà i dati pubblici degli utenti europei per addestrare la sua IA. Il Garante italiano interviene, sollevando questioni su trasparenza, consenso e il nostro ruolo nell’era degli algoritmi

Meta userà i dati degli utenti europei per addestrare la propria AI. E’ stata l’azienda ad annunciarlo: a partire dalla fine di maggio 2025, Meta inizierà ad addestrare i propri sistemi di intelligenza artificiale utilizzando i contenuti pubblici condivisi dagli utenti europei adulti su Facebook e Instagram. L’informazione è stata diffusa con discrezione, in pieno stile “privacy policy update”.

Ma questa volta non si tratta solo di un aggiornamento tecnico: è un salto culturale. Il nostro profilo pubblico – post, commenti, like, perfino interazioni con il chatbot Meta AI – diventano materiale didattico per un’intelligenza artificiale che, per comprendere il mondo, vuole leggere quello che scriviamo. Per affinare una AI è infatti fondamentale raccogliere non solo grandi quantità di dati ma anche grandi quantità di interazioni, per capire come ragionano le persone.

Perché per addestrare l’AI Meta ha bisogno di usare i nostri post?

I post sui social sono fondamentali per addestrare un’intelligenza artificiale per diverse ragioni chiave:

1. Varietà linguistica autentica

I social offrono linguaggio reale, spontaneo, quotidiano. Le persone scrivono in modo informale, usano slang, abbreviazioni, emoji, sarcasmo e ironia. Questo permette all’IA di apprendere non solo la grammatica, ma anche le sfumature del linguaggio umano.

Esempio: un modello che impara solo da testi ufficiali (come articoli o documenti) rischia di risultare “accademico”, poco naturale.

2. Contesto culturale aggiornato

I post riflettono modi di dire, trend, meme, opinioni politiche, eventi, insomma: il “qui e ora” culturale. Sono una miniera d’oro per rendere l’IA più aggiornata sul contesto socio-culturale.

3. Emozioni e relazioni

Dai social emergono emozioni, reazioni, dinamiche relazionali. L’IA può imparare a riconoscere sentimenti, tono e intenzione dietro le parole. È essenziale per sviluppare AI empatiche o chatbot più umani.

4. Multimodalità e interazione

I post non sono solo testo. Sono commenti, immagini, video, interazioni (like, share, reaction). Addestrare un’IA con questi dati significa aiutarla a comprendere il comportamento umano digitale e ad agire di conseguenza.

5. Enorme quantità di dati

I social generano miliardi di contenuti ogni giorno. Per il machine learning, più dati = modelli migliori. E i social sono la fonte più ampia e continua di contenuti testuali disponibili pubblicamente.

Meta userà i dati degli utenti europei per addestrare l’AI

L’annuncio di Meta si può rintracciare nel Blog Post “Making AI Work Harder for Europeans”. Meta, nel post, afferma che inizierà ad addestrare i propri modelli di intelligenza artificiale utilizzando i contenuti pubblici condivisi dagli utenti adulti europei su Facebook e Instagram. Non si tratta di un’ipotesi futura o di un progetto pilota, ma di un’iniziativa che partirà concretamente entro la fine di maggio 2025. I dati che verranno utilizzati comprendono post, commenti pubblici e anche le interazioni con Meta AI, il chatbot recentemente lanciato in Europa.

L’azienda lo dichiara apertamente: “We’re announcing our plans to train AI at Meta using public content — like public posts and comments — shared by adults on our products in the EU. People’s interactions with Meta AI – like questions and queries – will also be used to train and improve our models.” L’obiettivo dichiarato è costruire un’intelligenza artificiale che sia davvero capace di comprendere le culture, le lingue e le storie delle comunità europee, rendendo il prodotto più utile, contestuale e rappresentativo. Come spiega Meta, questa scelta nasce dall’ambizione di “better support millions of people and businesses in the EU by teaching AI at Meta to better understand and reflect their cultures, languages and history.”

Per rendere tutto questo trasparente — almeno nelle intenzioni — Meta ha previsto l’invio di notifiche agli utenti europei, sia via app che tramite email. Queste comunicazioni spiegheranno il tipo di dati che verranno raccolti e in che modo serviranno a migliorare le funzionalità dell’intelligenza artificiale. All’interno delle notifiche sarà presente anche un link che porta a un modulo per esprimere il proprio dissenso. L’opposizione potrà essere inviata in qualsiasi momento e, secondo l’azienda, sarà sempre rispettata. Lo affermano chiaramente: “These notifications will also include a link to a form where people can object to their data being used in this way at any time. We have made this objection form easy to find, read, and use, and we’ll honor all objection forms we have already received, as well as newly submitted ones.”

Meta precisa anche alcuni limiti all’utilizzo dei dati. Non verranno usati i messaggi privati, né i contenuti pubblici pubblicati da persone di età inferiore ai diciotto anni. Una distinzione che serve a rassicurare, ma che non cambia la sostanza dell’operazione: l’intelligenza artificiale apprenderà dalla nostra attività pubblica sui social.

“We do not use people’s private messages with friends and family to train our generative AI models,” chiarisce Meta. E aggiunge: “Public data from the accounts of people in the EU under the age of 18 is not being used for training purposes.”

Il lancio europeo di Meta AI, avvenuto lo scorso mese, è stato solo il primo passo. L’azienda ora vuole rendere disponibile la chat AI in tutte le sue app di messaggistica — Facebook, Instagram, WhatsApp e Messenger — e per farlo sostiene di avere la responsabilità di costruire un’intelligenza “che non sia solo disponibile per gli europei, ma costruita per loro.” Per questo motivo, la varietà dei dati è essenziale: servono espressioni locali, modi di dire, umorismo e sfumature che possano essere apprese solo vivendo, o leggendo, l’Europa vera.

“That’s why it’s so important for our generative AI models to be trained on a variety of data so they can understand the incredible and diverse nuances and complexities that make up European communities,” si legge nel blog. Meta insiste sul valore della multimedialità e sulla necessità di preparare l’IA a gestire non solo testo, ma anche voce, immagini e video.

A chi solleva dubbi, Meta risponde che non sta facendo nulla di diverso da quanto già accade altrove. Secondo l’azienda, questo tipo di addestramento non è esclusivo né di Meta, né dell’Europa: è una pratica consolidata anche per aziende come Google e OpenAI. La differenza, sostengono, sta nella trasparenza. “We’re proud that our approach is more transparent than many of our industry counterparts.”

Infine, Meta afferma di essere in linea con le normative europee. Racconta di aver ritardato l’inizio di queste attività nel 2024 per attendere chiarimenti da parte dei regolatori, e di aver ricevuto un parere positivo da parte dell’EDPB, il Comitato europeo per la protezione dei dati, che ha confermato la conformità dell’approccio ai requisiti legali. “We welcome the opinion provided by the EDPB in December, which affirmed that our original approach met our legal obligations.”

“Utilizziamo solo contenuti pubblici degli utenti adulti per insegnare all’AI a comprendere e riflettere meglio culture, lingue e storie”, si legge nel documento ufficiale Meta About Meta AI.

Ma cosa si intende esattamente per “contenuti pubblici”? Quali diritti abbiamo per opporci? E chi decide se l’algoritmo sta solo imparando… o iniziando a influenzare?

Opporsi all’utilizzo dei propri post

Per opporsi a questo utilizzo si ha tempo solo fino a fine maggio 2025. Da quel momento, se non esprimiamo opposizione, Meta userà ciò che abbiamo pubblicamente condiviso per far evolvere i suoi modelli di linguaggio.

Il Garante per la protezione dei dati personali italiano ha espresso preoccupazioni riguardo all’iniziativa di Meta di utilizzare i dati personali degli utenti europei per l’addestramento dei suoi sistemi di intelligenza artificiale. In un comunicato stampa, l’Autorità ha annunciato l’avvio di un’istruttoria nei confronti di Meta, sottolineando che, a partire dalla fine di maggio, l’azienda inizierà ad addestrare i suoi sistemi utilizzando i dati personali degli utenti che non si saranno opposti.

Il Garante invita il pubblico a informarsi sulle conseguenze e gli effetti dell’eventuale utilizzo dei propri dati personali per l’addestramento dei sistemi di intelligenza artificiale e a esercitare i propri diritti. L’Autorità ha richiesto a Meta di fornire informazioni dettagliate sulle modalità di raccolta e utilizzo dei dati, sulle misure adottate per garantire la trasparenza e il rispetto dei diritti degli utenti, nonché sulle modalità con cui gli utenti possono esercitare il diritto di opposizione.

Il Garante sottolinea l’importanza di garantire che gli utenti siano adeguatamente informati e possano esercitare i propri diritti in modo semplice ed efficace, in conformità con il Regolamento generale sulla protezione dei dati (GDPR). L’Autorità continuerà a monitorare attentamente la situazione e adotterà le misure necessarie per garantire la tutela dei diritti e delle libertà fondamentali degli interessati.

Il Garante interviene: “Non c’è solo un consenso, c’è una dignità digitale”

Comunicato stampa del Garante (18 aprile 2025)

Come opporsi

Chi non vuole far parte dell’addestramento di Meta può compilare un modulo di opposizione. Il link sarà distribuito via notifiche in-app o email, ma già oggi è disponibile sulla pagina ufficiale di supporto di Meta (Facebook Help Center).

Attenzione: il diritto di opposizione si basa sull’art. 21 del GDPR, e permette di impedire che anche i dati già pubblicati vengano utilizzati. Ma va esercitato prima dell’attivazione del sistema, altrimenti la scelta varrà solo per i contenuti futuri.