Musikerkennung durch Datenkompression

Niederländische Wissenschaftler verwenden ein Datenkompressionsprogramm, um Musikstücke verschiedenen Genres zuzuordnen.

In Pocket speichern vorlesen Druckansicht 123 Kommentare lesen
Lesezeit: 3 Min.

Wissenschaftler des Dutch National Research Institute in Amsterdam haben Experimente angestellt, ob sich Datenkompressions-Software zur Unterscheidung von Musikrichtungen einsetzen lässt. Dazu haben Rudi Cilibrasi, Paul Vitanyi and Ronald de Wolf Stücke von Beethoven, Miles Davis und Jimi Hendrix durch das Linux-Programm Bzip2 geschickt, berichtet NewScientist. Auch könnten Programme wie Winzip oder Stuffit verwendet werden, um klassische Musik, Jazz und Rock unterscheiden zu können. Dadurch könnte es unter Umständen auch möglich sein, anonyme Musikstücke einem Verfasser zuzuordnen.

Zunächst haben die Wissenschaftler alle Daten, die nicht zum Rhythmus und der Melodie der eigentlichen Musik gehören, entfernt. Nach dem Packen überprüften sie, wie groß die Ähnlichkeit der Musikstücke untereinander ist. Dann trugen sie die Ergebnisse in einer Grafik auf, bei der ähnliche Stücke als Nachbarn dargestellt werden.

In einem Versuch mit je zwölf Musikstücken aus drei Genres konnten sie zehn erfolgreich Jazz zuordnen, neun der Rockmusik und mehr als die Hälfte der Klassik. Bei einem weiteren Testlauf ließen sich 32 klassische Stücke den jeweiligen Komponisten zuordnen. In dem Bericht wird Jeremy Summerly von der Royal Academy of Music in London zitiert, der davon träumt, allein anhand der Noten die jeweiligen Komponisten identifizieren lassen zu können. Er arbeitet derzeit daran, diverse Fragmente von Kompositionen aus dem 16. Jahrhundert zuzuordnen. Das neue Verfahren sei vielversprechend und könne dazu herangezogen werden, beispielsweise den tatsächlichen Anteil des Mozart-Schülers Franz Xaver Süßmeier an der zweiten Hälfte von Mozarts Requiem herauszufinden.

Die niederländischen Wissenschaftler haben auf eine Methode zurückgegriffen, die vergangenes Jahr italienische Kollegen vorgestellt haben. Bei ihnen ging es darum, per Software die Sprache eines Textes und den jeweiligen Autor zu identifizieren. Für solche Probleme lässt nach den Ergebnissen der italienischen Wissenschaflter eben der Lempel-Ziv-Algorithmus (LZ77) einsetzen, der normalerweise zur Komprimierung von Dateien verwendet wird.

Der Quotient aus der Länge eines komprimierten Textes und der unkomprimierten Länge strebt gegen die Entropie des Zeichenstroms. Der Algorithmus legt beim Komprimieren eine Art Wörterbuch für bereits bekannte Zeichenfolgen an. Wenn eine solche Zeichenfolge im Verlauf des Textes wiederholt auftritt, so wird nur noch auf den entsprechenden Eintrag im Wörterbuch verwiesen. Die Längendifferenz zwischen zwei komprimierten Zeichenabfolgen liefert ein Maß dafür, wie nahe sich die beiden ursprünglichen Zeichenreihen stehen. Eine minimale Längendifferenz trat nur dann auf, wenn die Sprachen der beiden Texte identisch waren. (anw)