TimescaleDB setzt nun auch auf Vektordatenbanken

Timescale Vector setzt auf die Postgres-Bibliothek pgvector und Approximate-Nearest-Neighbor-Algorithmen um den Markt für Vektordatenbanken aufzumischen.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen

(Bild: vs148/Shutterstock.com)

Lesezeit: 1 Min.

Angespornt von der großen Nachfrage für generative KI setzt TimescaleDB jetzt auf das Speichern und die Suche von Vektoren. Ursprünglich bekannt für seine Open-Source-Datenbank für Zeitreihen und Ereignisse, bietet das Unternehmen mit Timescale Vector nun auch eine Vektordatenbank. Das Produkt ist für neue und Bestandskunden als Early Access Version verfügbar.

Im Einsatz mit großen Sprachmodellen fungieren Vektordatenbanken als eine Art Langzeitgedächtnis. Sie speichern und indexieren mathematische Repräsentationen der in Token umgewandelten Eingabetexte in Form von n-dimensionale Vektoren. Hierbei spricht man von Vektor-Embeddings.

TimescaleDB setzt bei Timescale Vector auf die Postgres-Vektor-Bibliothek pgvector und kombiniert das mit einem Algorithmus für den Approximate Nearest Neighbor (ANN). In internen Benchmarks erreicht TimescaleDB damit eine bessere Leistung als die reine pgvector-Bibliothek und will auch schneller sein als diverse Mitbewerber am Markt für Vektordatenbanken.

In internen Benchmarks erreicht Timescale Vector über 1200 Approximate-Nearest-Neighbour-Abfragen pro Sekunde und schlägt sich damit besser, als die zugrundeliegende Postgres-Bibliothek pgvector. Besser als die Konkurrenz ist man natürlich sowieso. Wie die Zahlen in freier Wildbahn aussehen, bleibt abzuwarten.

(Bild: TimescaleDB)

Der Einsatz von Vektordatenbanken im Zusammenspiel mit großen Sprachmodellen ist mittlerweile etabliert, weswegen mittlerweile viele Produkte und Angebote aus dem Boden sprießen. Auch Oracle verkündete jüngst diverse Funktionen für MySQL, die mit dem Ablegen und Suchen von Vektoren zusammenhängen.

Weitere Details zu Timescale Vector finden sich im Blogbeitrag zur Produktankündigung.

(pst)