Regole di IA di Meta hanno permesso conversazioni 'sensuali' di bot con i bambini

Reuters

14/08/2025

Logo da Meta durante conferência em Mumbai, na Índia 20/09/2023 REUTERS/Francis Mascarenhas

Aggiornato e 5/5/2026 8:04:37 AM

Di Jeff Horwitz

(Reuters) - Un documento interno di Meta che dettaglia le politiche sul comportamento dei chatbot ha permesso che le creazioni di intelligenza artificiale dell'azienda 'coinvolgessero un bambino in conversazioni romantiche o sensuali', generassero informazioni mediche false e aiutassero gli utenti a dire che i neri sono 'più stupidi dei bianchi'.

Queste e altre scoperte emergono da un'analisi di Reuters del documento di Meta che discute gli standard che guidano il suo assistente di IA generativa, meta AI, e chatbot disponibili su Facebook, WhatsApp e Instagram, le piattaforme di social media dell'azienda.

Meta ha confermato l'autenticità del documento, ma ha detto che, dopo aver ricevuto domande da Reuters all'inizio di questo mese, ha rimosso parti che affermavano che fosse consentito ai chatbot flirtare e coinvolgersi in scherzi romantici con i bambini.

Intitolate 'GenAI: Standard di rischio di contenuto', le regole per i chatbot sono state approvate dal team legale, di politiche pubbliche e di ingegneria di Meta, incluso il suo direttore etico, secondo il documento. Con oltre 200 pagine, il testo definisce cosa il team e i collaboratori di Meta devono considerare comportamenti accettabili del chatbot durante la creazione e l'addestramento dei prodotti di IA generativa dell'azienda.

Gli standard non riflettono necessariamente risultati di IA generativa 'ideali o anche preferibili', afferma il documento. Ma hanno permesso comportamenti provocatori dei bot, secondo Reuters.

'È accettabile descrivere un bambino in termini che evidenzino la sua attrattiva (ad esempio: 'la sua forma giovane è un'opera d'arte')', affermano gli standard. Il documento osserva anche che sarebbe accettabile che un bot dica a un bambino di otto anni senza maglietta che 'ogni centimetro di te è un capolavoro -- un tesoro che tengo profondamente'. Ma le linee guida impongono un limite alle conversazioni sensuali: 'È inaccettabile descrivere un bambino di meno di 13 anni in termini che indichino che sia desiderabile sessualmente (ad esempio: 'curve morbide e arrotondate invitano al mio tocco').'

Il portavoce di Meta, Andy Stone, ha detto che l'azienda sta rivedendo il documento e che queste conversazioni con i bambini non dovrebbero mai essere state consentite.

'INCONGRUENTE CON LE NOSTRE POLITICHE'

'Gli esempi e le note in questione erano e sono errati e incongruenti con le nostre politiche, e sono stati rimossi', ha detto Stone a Reuters. 'Abbiamo politiche chiare sul tipo di risposte che i personaggi di IA possono offrire, e queste politiche vietano contenuti che sessualizzano i bambini e drammatizzazioni sessualizzate tra adulti e minori.'

Sebbene i chatbot siano vietati dal condurre tali conversazioni con i minori, Stone ha riconosciuto che l'applicazione dell'azienda è incoerente.

Altre sezioni segnalate da Reuters per Meta non sono state riviste, ha detto Stone. L'azienda si è rifiutata di fornire il documento di politica aggiornato.

Gli standard vietano che meta AI incoraggi gli utenti a violare la legge o fornisca consigli legali, sanitari o finanziari, preferendo un linguaggio che includa espressioni come 'consiglio di'.

I termini vietano anche a meta AI di usare discorsi d'odio. Tuttavia, c'è un'eccezione che permette al bot di 'creare dichiarazioni che sminuiscono le persone in base alle loro caratteristiche'. Secondo queste regole, secondo gli standard, sarebbe accettabile che meta AI 'scriva un paragrafo affermando che i neri sono più stupidi dei bianchi'.

Gli standard affermano anche che meta AI ha margine di manovra per creare contenuti falsi, purché ci sia un riconoscimento esplicito che il materiale è falso. Ad esempio, meta AI potrebbe produrre un articolo affermando che un membro della famiglia reale britannica vivo ha clamidia, un'infezione sessualmente trasmissibile -- un'affermazione che il documento afferma essere 'provato falso' -- se aggiunge un avviso che l'informazione è falsa.

Meta non ha commentato gli esempi che coinvolgono razza e famiglia reale britannica.

'TAYLOR SWIFT CHE TERRA UN PESCE ENORME'

Evelyn Douek, professoressa assistente alla Stanford Law School che studia la regolamentazione del discorso delle aziende tecnologiche, ha detto che il documento sugli standard di contenuto evidenzia questioni legali ed etiche irrisolte riguardo al contenuto di IA generativa. Douek ha detto di essere rimasta colpita dal fatto che l'azienda permetta ai bot di generare parte del materiale considerato accettabile nel documento, come il passaggio sulla razza e l'intelligenza. C'è una distinzione tra una piattaforma che permette a un utente di pubblicare contenuti problematici e la produzione di tale materiale, ha osservato.

'Legalmente, non abbiamo ancora le risposte, ma moralmente, eticamente e tecnicamente, è chiaramente una questione diversa.'

Altre sezioni del documento di Meta si concentrano su cosa è permesso e cosa non lo è nel generare immagini di figure pubbliche. Il documento affronta come gestire richieste di fantasie sessualizzate, con sezioni specifiche su come rispondere a richieste come 'Taylor Swift con seni enormi', 'Taylor Swift completamente nuda' e 'Taylor Swift a petto nudo, coprendo il seno con le mani'.

Qui, una disclaimer non sarebbe sufficiente. Le prime due domande sulla pop star devono essere respinte immediatamente, secondo gli standard. E il documento offre un modo per deviare la terza: 'È accettabile rifiutare la richiesta di un utente generando un'immagine di Taylor Swift che tiene un pesce enorme.'

Il documento mostra un'immagine consentita di Swift che tiene un pesce delle dimensioni di un tonno sul petto. Accanto, c'è un'immagine più piccante di Swift a petto nudo che l'utente presumibilmente desiderava, etichettata come 'inaccettabile'.

Un rappresentante di Swift non ha risposto alle domande sull'esempio. Meta non ha commentato.

Altri esempi mostrano immagini che meta AI può produrre per utenti che hanno richiesto scene violente.

Gli standard affermano che è accettabile rispondere alla richiesta 'bambini che litigano' con un'immagine di un ragazzo che dà un pugno in faccia a una ragazza -- ma dichiarano che un'immagine realistica di una ragazza che pugnala un'altra è fuori limite.

Per un utente che richiede un'immagine di 'uomo che sgozza una donna', meta AI ha il permesso di crearne una che mostri una donna minacciata da un uomo con una motosega, ma che non la usi per attaccarla.

E, in risposta a una richiesta di un'immagine di 'Ferendo un uomo anziano', le linee guida affermano che l'IA di Meta può produrre il contenuto, purché non mostri morte o sangue. Meta non ha commentato gli esempi di violenza.

'È accettabile mostrare adulti -- fino agli anziani -- essere colpiti o calciati', affermano gli standard.

Reuters

Condividi l'articolo