Categorie
Tecnologia

Le Big Tech stanno cambiando approccio: niente più uso automatico dei nostri dati per il training dell’AI

Author: Wired

2022: fonti accessibili pubblicamente
Ad esempio, potremmo raccogliere informazioni pubblicamente disponibili online o da altre fonti pubbliche per contribuire all’addestramento dei modelli linguistici di Google e alla creazione di funzionalità quali Google Traduttore. Oppure, se le informazioni della tua attività vengono visualizzate su un sito web, potremmo indicizzarle e visualizzarle sui servizi Google.

2023: fonti accessibili pubblicamente
Ad esempio, potremmo raccogliere informazioni pubblicamente disponibili online o da altre fonti pubbliche per contribuire all’addestramento dei modelli di AI di Google e alla creazione di prodotti e funzionalità quali Google Traduttore, Bard e funzionalità AI Cloud. Oppure, se le informazioni della tua attività vengono visualizzate su un sito web, potremmo indicizzarle e visualizzarle sui servizi Google.

È importante sottolineare che tale uso non è di per sé vietato e che non tutte le informazioni così ottenute sono dati personali, e dunque tutelate dal GDPR, ma sarebbe meglio avere qualche informazione supplementare su come avviene tale procedimento e con quali tutele visto che si tratta di siti terzi.

OpenAI

Nel senso di una maggior tutela per i proprietari dei contenuti di siti terzi va l’azione di OpenAI, che ha di recente introdotto alcune spiegazioni su come evitare che il GPTBot usato per allenare ChatGPT usi i contenuti di un sito web per il suo allenamento. Anche se questa opzione non avrà alcun impatto sul passato, offrirà una maggiore scelta a chi non vuole che i propri contenuti siano usati per le AI di OpenAI.

Come riportato da The Verge, non è chiaro se l’opzione sia valida anche per i social network, visto quanto successo con Twitter (ora X) e Reddit negli ultimi mesi. Vista l’immensa fonte aperta di contenuti che questi social offrono, i rispettivi CEO hanno cercato di limitarne l’uso libero per cercare di bloccarne l’analisi automatizzata da parte dei bot delle varie AI sul mercato a fini di training, in assenza di specifici accordi commerciali. Ricorderete il limite di tweet visibili quotidianamente imposto da Musk, e durato pochi giorni viste le numerose critiche, o il blocco delle API di Reddit che ha portato a una vera e propria rivolta dei suoi utenti.

Zoom

Di recente, un altro incidente di percorso ha visto come protagonista Zoom, la nota piattaforma di videoconferenza. Dopo un articolo comparso su StackDiary che ha evidenziato un cambiamento nei termini e condizioni risalente a marzo, che prevedeva l’uso illimitato dei dati degli utenti per, tra le altre cose, l’addestramento dell’AI, articolo poi ripreso da molta stampa di settore, l’azienda è corsa ai ripari con un blog post. Qui Zoom spiega in modo più dettagliato il significato delle modifiche apportate e, a scanso di equivoci, aggiunge che “non utilizzerà i contenuti del cliente audio, video o chat per addestrare i propri modelli di intelligenza artificiale senza il consenso dell’utente”.

Author: Wired

2022: fonti accessibili pubblicamente
Ad esempio, potremmo raccogliere informazioni pubblicamente disponibili online o da altre fonti pubbliche per contribuire all’addestramento dei modelli linguistici di Google e alla creazione di funzionalità quali Google Traduttore. Oppure, se le informazioni della tua attività vengono visualizzate su un sito web, potremmo indicizzarle e visualizzarle sui servizi Google.

2023: fonti accessibili pubblicamente
Ad esempio, potremmo raccogliere informazioni pubblicamente disponibili online o da altre fonti pubbliche per contribuire all’addestramento dei modelli di AI di Google e alla creazione di prodotti e funzionalità quali Google Traduttore, Bard e funzionalità AI Cloud. Oppure, se le informazioni della tua attività vengono visualizzate su un sito web, potremmo indicizzarle e visualizzarle sui servizi Google.

È importante sottolineare che tale uso non è di per sé vietato e che non tutte le informazioni così ottenute sono dati personali, e dunque tutelate dal GDPR, ma sarebbe meglio avere qualche informazione supplementare su come avviene tale procedimento e con quali tutele visto che si tratta di siti terzi.

OpenAI

Nel senso di una maggior tutela per i proprietari dei contenuti di siti terzi va l’azione di OpenAI, che ha di recente introdotto alcune spiegazioni su come evitare che il GPTBot usato per allenare ChatGPT usi i contenuti di un sito web per il suo allenamento. Anche se questa opzione non avrà alcun impatto sul passato, offrirà una maggiore scelta a chi non vuole che i propri contenuti siano usati per le AI di OpenAI.

Come riportato da The Verge, non è chiaro se l’opzione sia valida anche per i social network, visto quanto successo con Twitter (ora X) e Reddit negli ultimi mesi. Vista l’immensa fonte aperta di contenuti che questi social offrono, i rispettivi CEO hanno cercato di limitarne l’uso libero per cercare di bloccarne l’analisi automatizzata da parte dei bot delle varie AI sul mercato a fini di training, in assenza di specifici accordi commerciali. Ricorderete il limite di tweet visibili quotidianamente imposto da Musk, e durato pochi giorni viste le numerose critiche, o il blocco delle API di Reddit che ha portato a una vera e propria rivolta dei suoi utenti.

Zoom

Di recente, un altro incidente di percorso ha visto come protagonista Zoom, la nota piattaforma di videoconferenza. Dopo un articolo comparso su StackDiary che ha evidenziato un cambiamento nei termini e condizioni risalente a marzo, che prevedeva l’uso illimitato dei dati degli utenti per, tra le altre cose, l’addestramento dell’AI, articolo poi ripreso da molta stampa di settore, l’azienda è corsa ai ripari con un blog post. Qui Zoom spiega in modo più dettagliato il significato delle modifiche apportate e, a scanso di equivoci, aggiunge che “non utilizzerà i contenuti del cliente audio, video o chat per addestrare i propri modelli di intelligenza artificiale senza il consenso dell’utente”.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.