KI-Training: Große US-Seiten schließen Apple aus

Medienhäuser und große Websites in den USA wollen Apple nichts schenken. Für den iPhone-Hersteller stellt dies eine Hürde für seine KI-Bemühungen dar.

In Pocket speichern vorlesen Druckansicht 17 Kommentare lesen
Logo und Icon von Apple Intelligence

(Bild: Apple)

Lesezeit: 3 Min.

Mehrere große Internetportale und Medienhäuser in den USA sperren offenbar Apple aus, um zu verhindern, dass das Unternehmen Texte und Bilder von deren Websites zum KI-Training verwendet. Laut einem Medienbericht könnte es dabei aber vor allem darum gehen, dass die Anbieter Lizenzkosten von Apple erhalten wollen und die bisherigen Angebote der Kalifornier nicht gut genug fanden. Da Apple noch am Anfang seiner KI-Bemühungen steht, sei der Zugang zu qualitativen Trainingsdaten gerade jetzt besonders wichtig.

Der Bericht von Wired nennt unter anderem Facebook, Instagram, Craigslist, Tumblr, die New York Times, Financial Times, Vox Media, USA Today und Condé Nast als Unternehmen, die den Bot Apples auf ihren Internetseiten ausgesperrt haben. Apple hat die Möglichkeit zur Selbstbestimmung, ob eine Website für Trainingsdaten herangezogen wird, bei der Vorstellung der Apple Intelligence auf der Entwicklerkonferenz WWDC explizit hervorgehoben, um Befürchtungen zu zerstreuen, dass das Unternehmen Inhalte Dritter gegen deren Willen verwendet. Allerdings hatte Apple offenbar schon vor der Bekanntgabe Daten von frei zugänglichen Seiten eingesammelt.

Um Daten zu erfassen, nutzt Apple eine Erweiterung seines Applebots namens "Applebot-Extended", die über die robots.txt ausgeschlossen werden kann. Der ursprüngliche Applebot diente dazu, Daten für Siri und die Suchfunktion Spotlight zu sammeln. Die vom Applebot gesammelten Daten werden von Apple zum Training seiner eigenen Large-Language-Modelle (LLM) verwendet. Die Apple Intelligence soll im Oktober in den USA an den Start gehen. Europäische Nutzer müssen wahrscheinlich noch bis nächstes Jahr warten, bis sie zum Zuge kommen.

Insgesamt gesehen machten aber noch vergleichsweise wenige der bekannten, hochfrequentierten Websites von der Möglichkeit Gebrauch, Apple auszusperren, berichtet Wired. Das KI-Start-up "Originality AI" gab sich als Applebot aus und wurde nur in sieben Prozent der Fälle bei 1000 getesteten Seiten zurückgewiesen. Die Internetseite "Dark Visitors" kam auf sechs Prozent der Seiten, die Apple den Zugang verweigern. Der Datenjournalist Ben Walsh fand heraus, dass ein Viertel von 1167 getesteten englischsprachigen US-Nachrichtenseiten Apple den Zugang verwehrt. Dies sei verglichen mit OpenAI (53 Prozent) und Google (43 Prozent) noch sehr wenig – allerdings steige die Zahl, was Walsh darauf zurückführt, dass Apple noch neu im KI-Markt ist.

Experten gehen davon aus, dass Medienhäuser und große Internetanbieter eine Gelegenheit wittern, mit strategischen Partnerschaften neue Einkünfte zu generieren. So ist OpenAI zum Beispiel schon etliche Zusammenarbeiten mit Medienhäusern eingegangen. Auch Apple könnte versucht sein, solche Partnerschaften zu schließen, um die Güte seiner Trainingsdaten und damit die Qualität seiner KI zu erhöhen.

(mki)