Zahlen, bitte! Linux wächst mit jeder Version um 290.000 Codezeilen

In 25 Jahren Entwicklungszeit ist nicht nur der Kernel und dessen Versionsnummer gewachsen, sondern beispielsweise auch die Zahl der Beteiligten ... und die der Schimpfworte im Quelltext. Kernel-Logger Thorsten Leemhuis gibt einen Einblick.

In Pocket speichern vorlesen Druckansicht 250 Kommentare lesen
Zahlen, bitte! Linux wächst mit jeder Version um 290.000 neue Codezeilen
Lesezeit: 5 Min.
Von
  • Thorsten Leemhuis
Inhaltsverzeichnis
Zahlen, bitte!

In dieser Rubrik stellen wir immer dienstags verblüffende, beeindruckende, informative und witzige Zahlen aus den Bereichen IT, Wissenschaft, Kunst, Wirtschaft, Politik und natürlich der Mathematik vor.

Mit jeder neuen Version wächst der gerade 25-jähriges feiernde Linux-Kernel um ungefähr 290.000 Zeilen an. Dreizehn Monate nach Durchbrechen der 20-Millionen-Marke besteht der Kernel dadurch mittlerweile aus 22.068.879 Zeilen Text (Leerzeilen, Dokumentation, Build-Skripte & Co. mitberechnet).

Neue Kernel-Versionen des Hauptentwicklungszweigs erscheinen typischerweise alle 63 Tage. Vereinzelt ist es mal eine Woche weniger, manchmal eine, ganz selten auch mal zwei mehr. Gelegentlich müssen noch Probleme beseitigt werden, wenn Linus Torvalds eine Woche einschiebt, meist sind aber Urlaubs- oder Konferenzreisen des Linux-Begründers die wahre Ursache.

Die größten Umbauten gibt es direkt nach der Freigabe einer neuen Kernel-Version, denn in den zwei darauf folgenden Wochen integriert Torvalds das Gros der Änderungen für den Nachfolger. In diesem "Merge Window" des im September erwarteten Linux 4.8 gab es alle 99 Sekunden eine Anpassung, durch die der Kernel letztlich um knapp 17 Zeilen pro Minute wuchs. Am Ende gab es in den zwei Wochen insgesamt 12.423 Commits im Quellcodeverwaltungssystem, durch die der Kernel um 341.825 Zeilen wuchs.

Zu neuen Versionen steuern derzeit meist 1600 Entwickler Änderungen bei. Seit 2005 haben sich ungefähr 14.000 Programmierer eingebracht, die bei mindestens 1300 Firmen oder Institutionen arbeiten. Der Anteil der Entwickler, die in ihrer Freizeit am Linux-Kernel mitarbeiten, sinkt seit Jahren. Das geht aus einer Studie der Linux Foundation hervor, laut der zuletzt nur mehr 7,7 Prozent der Beiträge von Entwicklern stammen, die ihre Brötchen nicht mit Kernel-Programmierung verdienen; 2012 waren es noch 14,6 Prozent gewesen.

Eine Studie der Linux Foundation liefert einen Einblick in den Entwicklungsprozess von Linux.

(Bild: Screenshot der Studie)

Laut der neuesten Studie haben insgesamt 4986 Entwickler Änderungen zu den Kernel-Versionen 3.19 bis 4.7 beigesteuert; 2355 davon haben in der Zeit das erste Mal einen Patch in den Kernel integriert. Darunter war auch ein extrem kleiner Beitrag vom Autor dieser Zeilen – genau wie die meisten anderen Mitglieder dieser Gruppe hat er nur diese Änderung beigetragen und ward danach nicht mehr gesehen ... zumindest bisher.

Ein kleiner Teil der Kernel-Hacker stemmt dafür einen wichtigen Teil der Entwicklung: Die 10 seit der Freigabe von Kernel 2.6.11 aktivsten Programmierer haben 7,5 Prozent aller in diesem Zeitraum vorgenommenen Änderungen beigesteuert; die 30 aktivsten Entwickler zeichneten sich für 16 Prozent der Commits verantwortlich. Manchmal sind das kleine, nur Tippfehler korrigierende Änderungen, manchmal aber auch ein großer Patch mit vielen neuen Code-Zeilen.

Linus Torvalds gehört nach dieser Auswertung übrigens nicht zu den aktivsten Entwicklern; das ist aber auch kein Wunder, denn er beschäftigt sich vornehmlich mit dem Zusammentragen, Begutachten und Koordinieren der von anderen programmierten Änderungen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes Video (Kaltura Inc.) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Kaltura Inc.) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Seit mittlerweile der Hälfte seiner Existenzzeit nutzt der Kernel das aktuelle und anfangs äußerst kritisch beäugte Entwicklungsmodell. Der zuvor verwendete Ansatz mit Unstable- (2.1, 2.3, 2.5) und Stable-Series (2.2, 2.4, 2.6) wurde letztlich einige Monate nach der Freigabe von Linux 2.6 Ende 2003 aufgegeben. Das führende "2.6" blieb der Welt danach viele Jahre erhalten. Nach der Veröffentlichung von 2.6.39 wurde Torvalds die letzte Zahl allerdings zu groß. Dem Nachfolger verpasste er daher die Nummer 3.0, obwohl die darin enthaltenen Änderungen nicht wichtiger waren als bei den vorangegangenen Versionen.

Ebenso war es beim nächsten Sprung, den es nach 3.19 gab, weil Torvalds die "Finger und Zehen zum Zählen ausgehen". Ohne diese beiden Hüpfer würde die derzeit aktuelle Kernel-Version nicht 4.7.2 heißen, sondern 2.6.67.2. Groß werden die Zahlen aber manchmal trotzdem: Das 2009 erschienene Linux 2.6.32 hat sich bis 2.6.32.71 hochgearbeitet, bevor dessen Wartung kürzlich eingestellt wurde; der nach wie vor gepflegte 3.4er-Kernel ist sogar schon bei 3.4.112 angekommen.

Neue "Fucks" gibt es in letzter Zeit kaum noch.

(Bild: Linux kernel swear count )

Trotz aller Umbauten und des steten Wachstums: Der Anteil der in Kernel-Quellen auftretenden Schimpfwörter sinkt, da solche kaum noch den Weg dorthin finden. Einen guten Überblick zu diesem Ausschnitt der Entwicklung liefert der Linux kernel swear count. Der Auswertung zufolge traf man "Fuck" bei den ersten 2.6er-Kernel noch häufiger an als heute; seit einigen Jahren bleibt der Wert auf dem Niveau von knapp über 40. Jeweils knapp über 150 Mal finden sich "shit" und "crap"; bei diesen beiden Schimpfwörtern ist aber mehr Bewegung drin, denn deren Vorkommen steigt ganz langsam an.

Zur Entwicklung von Linux 4.8 und dem 25sten Geburtstag von Linux siehe auch:

(thl)