Open Source Initiative legt KI-Definition vor

Die Open Source Initiative hat festgelegt, welche Informationen KI-Anbieter offenlegen müssen, um tatsächlich Open-Source zu sein.

16

Die Welt in Daten.

(Bild: Outflow_Designs / Shutterstock.com)

29.10.2024, 07:20 Uhr

Lesezeit: 3 Min.

Von

Eva-Maria Weiß

Metas KI-Modell-Familie Llama gilt nach der neu vorgelegten Definition der Open Source Initiative (OSI) nicht als Open-Source. Dabei hat Meta sehr viele Informationen dazu preisgegeben, wie ihre KI aufgebaut ist, etwa Architektur und die Gewichte. Nur: Die Trainingsdaten fehlen. Das dürfte noch zu Diskussionen zwischen der OSI und Meta sowie anderen KI-Anbietern führen. Dabei ist auch der AI Act schon von einer Art Freifahrtschein für Open-Source-Modelle abgerückt. Die neue Definition (OSAID) könnte für weitere Einschränkungen sorgen.

Laut OSI muss KI, die als Open-Source gilt, Zugang zu den Trainingsdaten bieten, damit andere sie verstehen können. Zudem muss der gesamte Code verfügbar sein. Alle Einstellungen und Gewichte gehören zu den Informationen, die frei zugänglich sein müssen. Schlussendlich geht es um die Frage, ob ein Modell nachgebaut werden kann. Monatelang hatte die OSI nach Einreichungen und Meinungen für die Definition gefragt. Dadurch sollten sowohl Tech-Unternehmen als auch Anwender und die Politik ins Boot geholt werden.

Zur Definition gehört auch, dass man Open-Source-KI nutzen und verändern, sowie darauf aufbauend etwas Eigenes erschaffen kann. KI-Modelle, die den Anforderungen nicht entsprechen, aber behaupten, Open-Source zu sein, will die OSI künftig anprangern. Sanktionen oder Strafen kann die Initiative allerdings nicht aussprechen, wenn jemand den Titel Open-Source in ihren Augen missbraucht.

Llama ist nicht Open-Source, Gemma ist nur offen

Meta bezeichnet die Llama-Familie zwar als Open-Source, und tatsächlich haben sie deutlich mehr Informationen bereitgestellt als andere Anbieter. Dennoch sind die Trainingsdaten nicht bekannt. Außerdem verlangt Meta, dass Anbieter, die Llama für Plattformen mit mehr als 700 Millionen monatlichen Nutzern zur Verfügung stellen, die Erlaubnis einholen. Auch das erlaubt die Definition nicht. Auf Hugging Face gibt es zahlreiche frei verfügbare KI-Modelle, Aleph Alpha und Stability AI etwa bezeichnen ihre KI-Modelle ebenfalls als Open-Source. Auch sie werden das zumindest prüfen müssen.

Google bietet mit Gemma ein offenes Model an. Im Unterschied zu Meta sagen sie nicht konkret, es sei Open-Source, sondern eben nur, es sei offen. OpenAI erklärt, man könne die eigenen Modelle aus Sicherheitsbedenken nicht offen zur Verfügung stellen.

Der im August in Kraft getretene AI Act sieht Ausnahmen für KI-Modelle vor, die Open-Source sind. Nun stellt sich also die Frage, ob sich die Politik der neuen Definition von Open-Source-KI anpasst. Es hat jedoch auch zuvor schon Ausnahmeregeln gegeben. KI-Modelle mit einem zu hohen Risiko sollten auch dann unter bestimmte Pflichten fallen, auch wenn sie Open-Source sind. Wer eine Gebühr für die Nutzung von KI-Modellen nimmt, kann ebenfalls nicht gleich ein Open-Source-Anbieter sein.

Update 01.11.2024, 08:54 Uhr

Eine Sprecherin von Meta sagt auf Anfrage von heise online: "Wir stimmen mit unserem Partner OSI in vielen Punkten überein, aber wir sind, wie andere in der Branche auch, mit ihrer neuen Definition nicht einverstanden. Es gibt keine alleingültige Open-Source-KI-Definition, und die Definition ist eine Herausforderung, da frühere Open-Source-Definitionen die Komplexität der heutigen, sich schnell entwickelnden KI-Modelle nicht abdecken. Wir stellen Llama kostenlos und offen zur Verfügung, und unsere Lizenz und Nutzungsbedingungen tragen mit einigen Einschränkungen dazu bei, die Menschen zu schützen. Wir werden auch weiterhin mit OSI und anderen Industriegruppen zusammenarbeiten, um KI unabhängig von technischen Definitionen verantwortungsvoll zugänglicher und freier zu machen."

(emw)