New York Times e il Guardian sono tra gli editori che hanno impedito l’accesso a Internet Archive ai loro siti. Il motivo viene illustrato dai portavoce al sito Nieman Lab dell’Università di Harvard, in quanto i contenuti prodotti potrebbero essere utilizzati dalle aziende di intelligenza artificiale per allenare le loro macchine: “Non hanno l’autorizzazione” e prosegue “per questo abbiamo deciso di bloccarlo”.
La stessa misura è stata adottata da Reddit lo scorso agosto. Nieman Lab ha detto: “Si tratta di contenuti che proprio Reddit concede in licenza a Google come dati di addestramento per l’intelligenza artificiale, per decine di milioni di dollari”.
In merito a questa decisione è stato chiesto il parere di Brewster Kahle, fondatore di Internet Archive, che ha dichiarato: “se gli editori limitano le biblioteche, come Internet Archive, il pubblico avrà meno accesso ai documenti storici”. Nel 2023 Internet Archive è andato temporaneamente offline a causa di un sovraccarico dei server provocato da un’azienda di IA che stava estraendo contenuti dagli archivi.
