In unserem kürzlich veröffentlichten Artikel „Künstliche Intelligenz und Museumsdaten“ fordern Jamie Dau und ich einen verantwortungsvollen Umgang mit potenziell diskriminierender Sprache in digitalen Sammlungsbeständen im Hinblick auf deren Verwendung zum Training von KI. Ein zentrales Anliegen dabei ist, zu verhindern, dass problematische historische Begriffe von KI-Crawlern ausgelesen und unreflektiert für das Training von KI-Modellen genutzt werden. Denn gelangen diese Museumsdaten kontextlos in die Trainingsdaten von KI, besteht die Gefahr, dass KI-Systeme diese Begriffe und die damit verbundenen Denkmuster reproduzieren.
In diesem Zusammenhang verwiesen wir auch auf Werkzeuge von Cloudflare, die eine Steuerung und Blockierung von KI-Crawlern ermöglichen. Wir sprachen uns jedoch bewusst gegen eine pauschale Blockade der KI-Bots aus. Als öffentliche Kultureinrichtungen stehen wir für die Richtigkeit und Zugänglichkeit unserer Daten. Diese auch für KI-Anwendungen bereitzustellen, ist Teil unseres Bildungsauftrags, um eine ausgewogene und korrekte Informationsbasis zu fördern.
Nun hat Cloudflare, ein Gigant der Internet-Infrastruktur, eine richtungsweisende Änderung angekündigt: KI-Crawler werden künftig standardmäßig blockiert. Dies ist ein entscheidender Schritt, der die Debatte um KI-Trainingsdaten maßgeblich beeinflussen wird. Cloudflare ist für die Auslieferung von etwa 20 Prozent des weltweiten Internetverkehrs verantwortlich. Auch wenn das Unternehmen vielen nicht bekannt sein mag, wird diese Neuerung weitreichende Auswirkungen haben.
Die Begründung des Unternehmens für diesen Schritt ist primär wirtschaftlicher Natur und zielt auf den Schutz von Urhebern ab. Cloudflare schreibt dazu:
“Cloudflare [...] is changing the default to block AI crawlers unless they pay creators for their content. That content is the fuel that powers AI engines, and so it's only fair that content creators are compensated directly for it.”
Die Entscheidung von Cloudflare markiert einen Wendepunkt und erfordert von Museen eine proaktive Haltung. Anstatt abzuwarten, müssen wir jetzt unsere Rolle in der digitalen Infrastruktur neu definieren. Im Gegensatz zur Privatwirtschaft, die Cloudflare primär im Blick hat, verfolgen wir als öffentliche Institutionen mit unseren Sammlungen und wissenschaftlichen Inhalten keinen kommerziellen Zweck. Die grundlegende Veränderung der Spielregeln im Netz zwingt uns jedoch dazu, unsere Strategie für den Umgang mit digitalen Ressourcen zu überdenken. Es gilt, einen Weg zu finden, der unserem öffentlichen Auftrag gerecht wird und gleichzeitig sicherstellt, dass unsere wertvollen Daten verantwortungsvoll in KI-Systeme einfließen.