Oracle-Datenbank 23c ist da: SQL-Abfragen in natürlicher Sprache

KI auch für Oracles neue Datenbank 23c: Mit den Features sollen Entwickler produktiver werden und Sachbearbeiter ihre Datenberge selbst auswerten können.

In Pocket speichern vorlesen Druckansicht 44 Kommentare lesen

(Bild: Titima Ongkantong / Shutterstock.com)

Lesezeit: 6 Min.
Von
  • Harald Weiss
Inhaltsverzeichnis

Oracle will seine neue Datenbank 23c um eine sogenannte AI Vector Search erweitern. Dazu gehören ein neuer Vektordatentyp, Vektorindizes und neue SQL-Operatoren zur Vektorsuche. Mit diesen Ergänzungen soll es laut Oracle möglich sein, den semantischen Inhalt von Dokumenten, Bildern und anderen unstrukturierten Daten zu erkennen.

Basis dafür ist die Umwandlung der Rohdaten von Bildern, Texten, Videos oder Tonaufnahmen in mathematische Darstellungen, Embeddings genannt, die als n-dimensionale Vektoren vorliegen. Dabei kann jeder Vektor je nach Komplexität der Rohdaten zehntausende Dimensionen enthalten. So kann man alle derartigen Objekte basierend auf Ähnlichkeiten organisieren. Die zugehörige Indizierung erlaubt das schnelle Auffinden von gleichen oder ähnlichen Objekten. Hierfür gibt es viele Anwendungsmöglichkeiten, etwa das Anzeigen von ähnlichen Produkten in Online-Shop, die Suche nach ähnlichen Bildern im Internet oder der Hinweise auf vergleichbare Videos auf einer Streaming-Seite. Spezifische Einsatzmöglichkeiten sind das Auffinden von ähnlichen genetischen Sequenzen, Betrugsmuster in der Finanzbranche oder die Analyse der Sensordaten von IoT-fähigen Geräten. Insofern ist die Vektorsuche eine wichtige Funktion für die wirtschaftliche Nutzung von KI.

Oracles neue Vektorsuche unterstützt auch Retrieval Augmented Generation (RAG), eine generative KI-Technik, die Large Language Models (LLMs) mit individuellen Business-Daten kombiniert, sodass Antworten und Fragen in natürlicher Sprache möglich sind. Ziel ist es, dass Datenanalysten und Sachbearbeiter ihre Abfragen zukünftig direkt, also ohne IT-Support, stellen können. "Unsere Autonomous Database verfolgt einen offenen API-Ansatz zur Integration von beliebigen LLMs, sodass die Entwickler das jeweils beste LLM nutzen können, um automatisch SQL-Abfragen zur Beantwortung von Fragen zu generieren", sagt Juan Loaiza, Executive Vice President, Mission Critical Database Technologies, bei Oracle.

Oracle will seine Datenbanktools, wie der Low-Code-Plattform APEX und dem SQL-Developer, schon bald um generative KI-Funktionen erweitern. Damit sollen Entwickler SQL-Abfragen in natürlicher Sprache formulieren können, die das System automatisch in SQL übersetzt. Die Arbeiten hieran seien schon sehr weit fortgeschritten: Laut Andy Mendelsson, Executive Vice President, Database Server Technologies Development, beträgt die gegenwärtige Richtigkeit bei solchen automatisch generierten SQL-Abfragen 60 bis 70 Prozent. "Die KI-Experten sagen mir, dass 70 Prozent ein sehr guter Wert ist, der auch bei besseren Trainingsdaten kaum noch gesteigert werden kann", lautet seine Einschätzung bezüglich der Genauigkeit von Abfragen in natürlicher Sprache. Hauptursache dafür sei, dass natürliche Sprache nicht so präzise ist wie SQL. Folglich muss jede automatisch generierte SQL-Abfrage noch manuell überprüft werden. Doch wenn nur in 30 bis 40 Prozent der Fälle eine manuelle Korrektur erforderlich sein sollte, bedeutet das bereits eine erhebliche Zeitersparnis bei der Anwendungsentwicklung.

Oracles Cloud-Service MySQL HeatWave bekommt jetzt ebenfalls einen Vector Store und neue generative KI-Funktionen. MySQL HeatWave kombiniert OLAP (Online-Analyseverarbeitung), OLTP (Online-Transaktionsverarbeitung), maschinelles Lernen und KI-gesteuerte Automatisierung. Zu den neuen generativen KI-Features gehört eine LLM-Schnittstelle, dank der Sachbearbeitern in natürlicher Sprache mit der Datenbank interagieren können, einschließlich der Suche nach verschiedenen Dateien. Hierbei identifiziert Vector Store die ähnlichsten Dokumente, indem eine vektorbasierte Ähnlichkeitssuche über alle enthaltenen Dateien durchgeführt wird. Die gefundenen Dokumente werden dann an die LLM-gesteuerte Schnittstelle übergeben, sodass eine kontextbezogene Antwort in natürlicher Sprache ausgegeben wird.

Oracles MySQL HeatWave Lakehouse, das letztes Jahr im Oktober erschien, unterstützt jetzt auch AutoML, inklusive einem verbesserten Empfehlungssystem und einem Trainingsfortschrittsmonitor. Laut Oracle bietet die KI-Unterstützung von Textspalten die Lösung von verschiedenen ML-Aufgaben, wie Anomalieerkennung, Prognose, Klassifizierung und Regression. Die Empfehlungs-Engine innerhalb von AutoML wurde für ein breiteres Feedback aktualisiert – einschließlich des impliziten Feedbacks, wie frühere Käufe und der Browserverlauf sowie dem expliziten Feedback, wie Bewertungen und Likes, um eine genauere personalisierte Empfehlung zu generieren. Eine weitere neue Funktion von AutoML ist die automatische Komprimierung: Damit lässt sich für jede Spalte automatisch der optimale Komprimierungsalgorithmus festlegen, was die Abfrageperformance verbessert und in Folge die Kosten senkt.

MySQL HeatWave unterstützt jetzt auch JavaScript, sodass JavaScript-Prozeduren und -Funktionen in HeatWave gespeichert und ausgeführt werden können. Zu den weiteren Updates gehören die JSON-Beschleunigung, neue Analyseoperatoren für die Migration weiterer Workloads sowie ein Bulk-Ingest-Feature. Dieses dient der parallelen Erstellung von Index-Untergruppen beim Laden von Daten aus CSV-Dateien, was zu einer Leistungssteigerung bei der Datenaufnahme führt.

Weitere Updates betreffen MySQL Autopilot. Hier sind jetzt adaptive Abfrageausführungen und ein automatisches Laden und Entladen möglich. Die adaptive Abfrageausführung bedeutet, dass der Ausführungsplan einer Abfrage optimiert wird, um die Leistung zu verbessern. Das automatische Laden und Entladen verbessert die Leistung, indem die Spalten, die gerade verwendet werden, automatisch in HeatWave geladen werden und dafür die Spalten entladen werden, die selten verwendet wurden. Darüber hinaus wurde APEX um eine neue integrierte Workflow- und Prozessautomatisierung erweitert, mit der Entwickler den Anwendungen verschiedene Funktionen hinzufügen können, etwa das Aufrufen von bestimmten Aktionen, das Auslösen von Genehmigungen oder das Versenden von E-Mails.

Zu guter Letzt erhalten Unternehmen, die ihre Oracle-Datenbanken auf Oracle-Hardware betreiben wollen, die neue Database Appliance X10. Sie soll eine bessere Ende-zu-Ende-Automatisierung und eine bis zu 50 Prozent höhere Leistung bieten als die vorherige Generation.

Alle Informationen zur Oracles neuer Datenbank 23c finden sich in der Ankündigung, auch die anderen Updates gab es auf der Hausmesse des Anbieters zu sehen. Insgesamt dominierte das Thema KI die diesjährige Oracle-Veranstaltung.

(fo)