Vektordatenbank und mehr Flexibilität: Databricks optimiert Plattform für LLMs​

Databricks bietet neue Tools für den Einsatz von Generative AI und eine Vector Search, um Large Language Models mit Unternehmensdaten zu erweitern.​

In Pocket speichern vorlesen Druckansicht
Illustration mit Aktenordnern und einem Notebook

(Bild: Stokkete/Shutterstock.com)

Lesezeit: 1 Min.

Der Anbieter Databricks hat bekannt gegeben, dass die Funktion Vector Search für seine Data-Intelligence-Plattform ab sofort uneingeschränkt zur Verfügung steht. Vector Search ist eine speziell für den Unternehmenseinsatz entwickelte Serverless-Vektordatenbank. Sie ermöglicht es, Large Language Models (LLMs) mit eigenen Unternehmensdaten zu erweitern. Darüber hinaus kündigt die von den Apache-Spark-Schöpfern gegründete Firma umfassende Ergänzungen für das Model Serving im Kontext von Retrieval Augmented Generation (RAG) an. So erhalten Unternehmen über die Foundation Model API beim Model Serving die Möglichkeit, LLMs über einen Serving-Endpunkt zu nutzen und abzufragen.

Die vorgestellten Neuerungen sollen dazu beitragen, den Bau und den produktiven Einsatz von Anwendungen mit generativer KI zu vereinfachen und einen hohen Qualitätsstandard zu gewährleisten. Anwenderinnen und Anwender erhalten dazu unter anderem Unterstützung durch eine neu gestaltete Bedienoberfläche sowie eine flexibler gestaltete Schnittstelle zur Qualitätskontrolle für das Beobachten von RAG-Anwendungen im Produktivbetrieb. Neben der neuen Vektorsuche lassen sich auf der Data-Intelligence-Plattform auch zusätzliche Sprachmodelle wie Claude3, Gemini, DBRX und Llama3 einbinden. Databricks verspricht zudem eine höhere Leistungsfähigkeit beim Bereitstellen und der Abfrage von LLMs sowie Verbesserungen im Hinblick auf Governance und Auditierbarkeit der Anwendungen.

data2day 2024: Von Data Mesh bis GenAI – eine neue Ära in Data Science

Wie verändern LLMs, GenAI und Knowledge Graphs die Data Science und welche Datenarchitektur bewährt sich in der Praxis? Auf diese und viele weitere Fragen liefert die data2day Antworten. Die Konferenz für Data Scientists, Data Engineers und Data Teams findet am 18. und 19. September 2024 in Heidelberg statt.

Weitere Informationen sowie Details zu Vector Search, dem Model Serving und der Foundation Model API finden sich in der Ankündigung auf dem Databricks-Blog.

(map)