KI: Auch Apple nutzt unlizenziertes Material zum Training

Für "Apple Intelligence" bedient sich der Konzern an frei zugänglichem Content. Die Möglichkeit zum Opt-out verrät Apple erst jetzt.

In Pocket speichern vorlesen Druckansicht 20 Kommentare lesen
Apple-Logo, schief

(Bild: Sebastian Trepesch)

Update
Lesezeit: 2 Min.

Für das Training seiner neuen KI-Modelle "Apple Intelligence" nutzt Apple neben lizenzierten Inhalten auch öffentlich zugänglichen Web-Content, wie das Unternehmen nun einräumte. Man greife zur Erstellung der hauseigenen Foundation Models auch auf Inhalte zu, die der eigene Web-Crawler "AppleBot" erfasst. Das geschieht offenbar unabhängig von den auf der jeweiligen Website bestehenden Lizenzregeln.

Wer seine Texte und Bilder nicht zum Training von "Apple Intelligence" bereitstellen wolle, habe die Möglichkeit zum Opt-out, heißt es bei Apple. Wie viele und welche Daten bereits zum Training der Apple-KI verwendet wurden, bleibt unklar. Webseitenbetreiber und Inhalteanbieter müssen für das Opt-out den speziellen "Applebot-Extended" anweisen, die eigenen Inhalte zu ignorieren. Das "Crawling" von Webseiten durch den AppleBot bleibt auch beim Opt-out bestehen, wenn es nicht parallel ebenfalls in der robots.txt-Datei abgelehnt wird, merkt der Konzern an.

Update

Persönliche Daten von Nutzern und "Nutzerinteraktionen" sollen laut Apple nicht in das Training der KI-Modelle einfließen. In frei zugänglichen Quellen erfasste persönlich identifizierbare Informationen wie etwa Kreditkartendaten würden zudem gefiltert. Auch "Obszönität" und andere qualitativ minderwertige Inhalte will Apple ausklammern.

Damit geht Apple ähnlich vor wie andere große KI-Anbieter, die sich ebenfalls an frei zugänglichen Web-Inhalten zum Training ihrer Modelle bedient haben und damit auf Kollisionskurs mit Verlagen, Publishern und Content-Erstellern gegangen sind. Vorausgehenden Berichten zufolge hat Apple im vergangenen Jahr mehrere US-Großverlage wegen einer Lizenzierung von Inhalten angesprochen und zahlt bereits für Bildinhalte zum KI-Training. In der Branche wurde deshalb spekuliert, dass Apple sich bei der Erstellung von KI-Modellen möglicherweise ganz auf lizenzierten Content beschränkt.

Journalisten riet Apple-Chef Tim Cook jüngst in einem Interview, ihre Inhalte für KI-Training zu lizenzieren. Das sei "richtig schlau für manche Leute", so Cook gegenüber der Washington Post. Es sei nicht klar, was an einer Lizenzierung schlecht sein könnte – "außer man bekommt keinen guten Deal".

Andere KI-Firmen wie der Apple-Partner OpenAI pochen darauf, dass KI-Training mit frei zugänglichen Inhalten grundsätzlich "fair" sei und ohne Zugriff auf urheberrechtsgeschützte Inhalte zudem praktisch "unmöglich". Parallel werden auch dort immer mehr Deals mit Publishern und Webseitenbetreibern geschlossen.

Unter Kreativen und Inhalteerstellern, oft Stammkundschaft bei Apple, regt sich zunehmend Widerstand gegen die ungefragte Nutzung ihrer Werke zum KI-Training. Wie groß die Verärgerung inzwischen ist, musste Apple jüngst spüren: Für einen iPad-Werbespot, in dem eine riesige Schrottpresse unter anderem Musikinstrumente zermalmt, entschuldigte sich der Konzern nach einem Entrüstungssturm.

(lbe)