US-Kongressbibliothek sammelt und archiviert öffentliche Tweets

Das im Jahr 2010 angekündigte und etwa 170 Milliarden Tweets umfassende Kurznachrichten-Archiv der US-Kongressbibliothek ist einsatzbereit. Derzeit kommen täglich 500 Millionen neue Nachrichten hinzu,

In Pocket speichern vorlesen Druckansicht 19 Kommentare lesen
Lesezeit: 1 Min.
Von
  • Reiko Kaps

Die Library of Congress sammelt seit Februar 2011 alle öffentlichen, auf Twitter auflaufenden Nachrichten und archivierte so bislang bereits mehr als 170 Milliarden Tweets. Das gab die öffentliche Bibliothek des US-Kongresses gestern in einer Mitteilung bekannt.

Bereits im Jahr 2010 hatte der Kurznachrichtendienst Twitter der US-Kongressbibliothek den Zugang zu seinen Archiv aus öffentlich zugänglichen Kurzbotschaften gewährt – damals umfasste es etwa 21 Milliarden Nachrichten (2006 bis 2010). Seither stieg die Zahl der Tweets deutlich an. Inzwischen umfasst das Archiv etwa 170 Milliarden Nachrichten.

Insgesamt handele es sich dabei um einen Datenmenge von 133 Terabyte, die zudem täglich anwachse. Wie Gayle Osterberg, Pressesprecher der Bibliothek, schreibt, kamen im Oktober 2012 täglich 500 Millionen Tweets dazu. Anfang 2011 seien es nur 140 Millionen pro Tag gewesen.

In einem Whitepaper (PDF-Datei) beschreibt die US-Bibliothek das Projekt selbst, die dabei auftretenden Probleme sowie die möglichen Nutzungsarten. Im Unterschied zu Twitters Archivfunktion sollen nur Wissenschaftler das Twitter-Archiv der Bibliothek für die Forschung nutzen können. Laut der Mitteilung reichen die bei der Bibliothek eingereichten Fragen dazu vom Bürger-Journalismus über das Impfverhalten bis zur Vorhersage der Börse. (rek)