Categories: HardwareSoftware

Reddit contro i crawler IA: bloccato il loro accesso alla piattaforma

Author: IlSoftware

Reddit ha preso una chiara posizione contro parte delle società che si occupano di Intelligenza Artificiale. Più nello specifico, il noto social network ha dimostrato una certa avversione nei confronti dei crawler IA, ovvero gli bot che girovagano in rete per cercare dati per l’addestramento dei modelli IA.

Sebbene la piattaforma abbia dimostrato una certa elasticità nei confronti di questa tecnologia emergente, tanto da stringere un accordo con OpenAI per quanto riguarda l’addestramento dei suoi modelli, in questo caso ha voluto proteggere i propri dati.

Negli scorsi giorni, infatti, il file robots.txt di Reddit è stato modificato andando ad escludere i principali crawler legati alle piattaforme IA. Questo particolare file viene utilizzato da tutti i siti Web per escludere specifici crawler di ricerca, impedendo l’indicizzazione dei contenuti.

Crawler IA, il blocco di Reddit e i casi di Perplexity

Se l’indicizzazione su un motore di ricerca, qualunque esso sia, di solito porta più visitatori (e dunque vantaggi), nel contesto dell’IA questa sorta di “scambio equo” non esiste. Ciò si traduce in vantaggi solo per le società di IA, con l’altra parte spesso che si limita a essere spettatore passivo di quanto succede.

Già in passato, aziende come Perplexity sono state criticate per aver agito scansionando un gran numero di siti, attingendo ai loro contenuti per poi offrire i risultati ai propri utenti. In questo caso specifico, per esempio, Wired e Forbes hanno segnalato come Perplexity abbia attinto ai loro articoli, tra l’altro offrendo risultati che sembrano essere plagi.

La questione dei crawler IA è molto delicata, in quanto questa tecnologia così nuova offre ancora molte zone d’ombra dove le società si muovono andando a “saccheggiare” con strategie molto aggressive. Metodi spesso discutibili, che nel corso dei prossimi mesi potrebbero causare non poche grane legali alle piattaforme che si occupano di IA.

Fonte: techcrunch.com

admin

Recent Posts

The Enermax PlatiGemini 1200W ATX 3.1 + ATX12VO PSU Review: The Swiss Army Knife

Author: AnandTech In the retail PC PSU space, most of the focus on new standards…

2 Luglio 2024

Partecipa al concorso Fanta Carrello di Henkel e prova vincere tante forniture di prodotti per la casa!

Author: Tom's Hardware Per coloro che amano i concorsi a premi, ecco una grande notizia:…

2 Luglio 2024

SEGA: il nuovo Crazy Taxi sarà MMO e open world, un vero e proprio progetto tripla A

Author: GAMEmag Con una nuova videointervista agli sviluppatori, sfortunatamente pubblicata solo in giapponese, SEGA ha…

2 Luglio 2024

Electrifier Program: Fostering Culture of Curiosity and Mastery

Author: Schneider Electric This audio was created using Microsoft Azure Speech Services Olivier Blum –…

2 Luglio 2024

È ancora possibile sviluppare un browser Web da zero? Il sogno Ladybird

Author: IlSoftware Il mercato dei browser Web è attualmente dominato da tre motori di rendering: Blink,…

2 Luglio 2024

Meta cambia l’etichettatura delle immagini realizzate o modificate con l’IA dopo le lamentele dei fotografi

Author: Hardware Upgrade Meta ha recentemente annunciato un cambiamento significativo nell'etichettatura dei contenuti potenzialmente generati…

2 Luglio 2024