300 Terabyte Musik und Metadaten von Spotify heruntergeladen

Spotify ist ungehalten, weil Anna’s Archive einen Teil der Spotify-Datenbank heruntergeladen hat und veröffentlichen möchte. 300 Terabyte.

vorlesen Druckansicht 75 Kommentare lesen
Ein liegendes Smartphone zeigt Spotify-Logo und -Schriftzug, angesteckt ist ein paar weißer In-Ohr-Kopfhörer

(Bild: norazaminayob/Shutterstock.com)

Lesezeit: 6 Min.
Inhaltsverzeichnis

„We backed up Spotify (medatada and music files)”, meldet das Archiv-Projekt Anna’s Archive. Es hat 86 Millionen Musikstücke heruntergeladen. Das entspricht den Angaben zufolge etwa 37 Prozent aller bei Spotify gehosteten Aufnahmen, aber 99,6 Prozent aller Spotify-Streamingvorgänge. Vielleicht noch wertvoller sind die fast vollständig kopierten Metadaten, von 256 Millionen Aufnahmen und 186 Millionen einzelnen ISR-Codes (International Standard Recording Codes).

Die Datensammlung von insgesamt rund 300 Terabyte wurde im Wesentlichen im Juli beendet. Legal ist sie nicht, denn Zustimmung Spotifys oder der Rechteinhaber gab es keine. Der Streaminganbieter ist entsprechend erbost. Er spricht von einem „Anti-Copyright-Angriff” und gibt an, die für die Zugriffe verwendeten Nutzerkonten deaktiviert zu haben. Neue Sicherheitsmaßnahmen sollen weitere Massendownloads hintanhalten.

Finanziell wird es für die weit überwiegende Mehrheit der Rechteinhaber keinen Unterschied machen, ob sie von Spotify oder von Anna’s Archive keine Tantiemen erhalten. Seit Anfang 2024 schüttet Spotify nichts mehr aus, wenn eine Aufnahme in einem Jahr nicht mindestens 1.000 mal gestreamt wird. Das betrifft laut Anna’s Archive über 70 Prozent aller Musikstücke. Damit gehen insbesondere Nischenkünstler und Neulinge leer aus.

Zusätzlich hat Spotify Maßnahmen gesetzt, um den an Musik-Rechteinhaber ausgeschütteten Anteil des Umsatzes zu reduzieren. Einerseits soll Spotify insgeheim Musik unter Tarnnamen produziert haben, an der es selbst die Rechte hält, und die von Spotifys Algorithmen gerne eingestreut wird.

Videos by heise

Andererseits hat das schwedische Unternehmen Hörbücher hinzugefügt und dann eine Vertragsklausel aktiviert, um unter Verweis auf die Hörbücher die Ausschüttungen an die US-Musikverwertungsgesellschaft MLC fast zu halbieren. Ein US-Bundesbezirksgericht hat diesen Tantiementrick als vertragskonform festgestellt. In der Folge konnte Spotify nach 17 Jahren erstmals Nettogewinn melden.

Anna’s Archive möchte die rund 300 Terabyte Daten schrittweise mit dem Torrent-Protokoll online stellen. Den Anfang machen die Metadaten. Sie sind bei Insidern begehrter als die Musik, die man ja bei Streaming-Diensten finden kann.

Eine öffentliche, zentrale Sammlung aller ISRC-Datensätze fehlt hingegen bislang. Selbst der Branchenverband IFPI (International Federation of the Phonographic Industry), der seit 1988 seinen Mitgliedern die Verwendung ISRCs empfiehlt, betreibt kein Verzeichnis. Somit können Forscher keine Marktanalysen machen, Musikliebhaber nur bedingt Einblick nehmen, und die Urheber vieler in Umlauf befindlicher Aufnahmen bleiben im Dunkeln.

Am Nächsten dürfte die private Firma Word Collections kommen, die bei kooperierenden digitalen Musikdiensten Metadaten einsammelt und monatlich aktualisiert. Diese Datenbank ist allerdings nicht öffentlich. Word Collections vertritt Rechteinhaber gegenüber Streamingdiensten unter Ausklammerung von Verwertungsgesellschaften, wodurch Künstler deutlich mehr verdienen sollen. Wie heise online in Erfahrung bringen konnte, hat die jüngste ISRC-Datenbank dieser Firma 240 Millionen unterschiedliche Einträge.

Das ist ein Stück mehr als die 186 Millionen, die sich Anna’s Archive beschafft hat. Allerdings wächst Word Collections Datensammlung seit drei Monaten enorm, weil digitale Musikdienste von Dritten mit KI-generierten Dateien eingedeckt werden. Die Sammlung Annas’ Archives reicht nur bis Juli; die KI-Flut erklärt einen Teil der Differenz. Den anderen Teil erklärt die nicht lückenlose Sammlung der Metadaten von Stücken, die bei Spotify kaum gespielt werden.