HTTP Archive legt Web-Jahrbuch 2022 vor – mit einigen kuriosen Erkenntnissen

Die größte Website ist 678 MByte "schwer" und ein Prozent nutzt noch immer das Marquee-Tag: Diese und weitere Einblicke fördert der 2022 Web Almanac zutage.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen

Über 8 Millionen Websites und 43 TByte Daten durchsuchte das HTTP Archive für den 2022 Web Almanac

(Bild: HTTP Archive, Apache 2.0)

Lesezeit: 2 Min.
Von
  • Christian Liebel

Der 2022 Web Almanac ist seit wenigen Tagen verfügbar, das kostenfreie Jahrbuch des HTTP Archive. Das HTTP Archive ist Teil des Internet Archive, das vor allem durch die Wayback Machine bekannt ist. Es erfasst, wie Webinhalte verbreitet werden: Verwendete Technologien, Leistungs- und Nutzungsdaten. Dazu durchsucht das HTTP Archive monatlich knapp 8,4 Millionen Websites mithilfe der Tools WebPageTest und Lighthouse.

Für die diesjährige Ausgabe des Jahrbuchs haben sich 108 Beitragende aus der Web-Community zusammengeschlossen. In über 20 Kapiteln beleuchten sie den Zustand des Web aus unterschiedlichsten Blickwinkeln. Der Almanach stützt sich dabei auf die Daten des Crawls aus dem Juli 2022, insgesamt wurden 43,88 TByte an Daten verarbeitet.

Das Web-Jahrbuch zeigt Trends auf, fördert aber auch kuriose Erkenntnisse zutage:

  • Das Markup-Kapitel zeigt, dass das div-Element, das mit Abstand meistverwendete Element ist. Rund ein Prozent aller mobilen Websites verwenden sogar noch das veraltete marquee-Element aus den Zeiten des Internet Explorer 2.
  • Das Kapitel Page Weight untersucht den Umfang von Websites und stellt fest: die durchschnittliche Seitengröße steigt kontinuierlich weiter an. Die größte gefundene Desktopwebsite ist 678 MByte groß, die größte gefundene Schriftartendatei umfasst 110 MByte.
  • Der Einsatz von WordPress als Content Management System nimmt weiter beständig zu, während der Marktanteil von Joomla und Drupal langsam schrumpft.
  • Im Kapitel CSS ist nachzulesen, dass die beliebteste CSS-Klasse active heißt, die beliebteste ID ist content.
  • Das Kapitel Capabilities bestätigt, dass die Verwendung moderner Webschnittstellen wie der Async Clipboard API oder des Service Workers ebenfalls weiter zunimmt.

Alle Kapitel haben ein Peer Review durchlaufen, die Rohdaten sind jeweils am Seitenende verlinkt. Den 2022 Web Almanac gibts kostenlos beim HTTP Archive. Seit 2019 wird er jährlich herausgegeben.

(map)