Big Data: Microsoft verbindet SQL Server mit Hadoop

Mit Zwei-Wege-Konnektoren lassen sich strukturierte und unstrukturierte Daten zwischen der Big-Data-Technik Apache Hadoop und Microsofts SQL Server sowie dem Data-Warehouse-Produkt der Redmonder transferieren.

In Pocket speichern vorlesen Druckansicht 25 Kommentare lesen
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Microsoft hat zwei Community Technology Previews (CTP) von Konnektoren für Hadoop angekündigt. Hadoop ist eine unter dem Dach der Apache Software Foundation entwickelte Big-Data-Technik zur Verwaltung und Analyse großer Datenmengen. Die Konnektoren funktionieren offenbar mit Microsofts Datenbanksystem SQL Server 2008 R2 sowie mit SQL Server Parallel Data Warehouse (PDW).

Über die Konnektoren lassen sich große Mengen in Hadoop-Systemen abgelegte strukturierte und unstrukturierte Daten mit Microsofts Datenbanksystemen verwenden. Beispielsweise können Kunden die unstrukturierten Daten in Hadoop analysieren und die daraus gezogene Erkenntnisse in das Data-Warehouse-Produkt der Redmonder integrieren. Für den Datentransfer in beide Richtungen kommt SQOOP (SQL to Hadoop) zum Einsatz, das eine Verknüpfung zwischen dem Hadoop File System (HDFS) und den relationalen Datenbanken herstellt.

Laut der Ankündigung ist der SQL-Server-Konnektor auch mit Denali kompatibel. Unter diesem Codenamen läuft Microsofts nächste Version des SQL Server, die derzeit in einer dritten Community Technology Preview vorliegt. Kunden erhalten die Testversion für PDW auf Anfrage über Microsofts Kundenservice, für den SQL-Server-Konnektor gibt es eine Download-Seite.

Hadoop ist ein Java-Framework zur parallelen Datenspeicherung und -verarbeitung sehr großer Datenmengen, die verteilt in Clustern gespeichert sind. Die Grundidee des Frameworks geht Googles MapReduce-Ansatz zurück. Die britische Zeitung Guardian hatte im März dieses Jahres die Technik als "Innovator of the Year" ausgezeichnet. (ane)