Datenbank: DuckDB erhält lokale Web-BenutzeroberflächeDie In-Process-Datenbank DuckDB lässt sich ab Version 1.2.1 alternativ zur CLI komfortabel über ein lokales UI bedienen, das als Extension installiert wird.
Ente gut, alles gut? DuckDB ist eine besondere DatenbankDuckDB ist in Version 1.0 erschienen. Was hat es mit dieser Datenbank auf sich, die einiges anders macht als andere Datenbanken?
heise+ JubiläumsspecialSichern Sie sich unser exklusives Aktionsangebot: heise+ 7 Monate für 7 € pro Monat lesen und zusätzlich zu allen Inhalten auf heise online unsere Magazin-Inhalte entdecken. Nur für kurze Zeit!
Data Science: Cloudera startet All-in-one-Datendienst in der CloudDie Cloudera Data Platform One bündelt alle für Datenanalyse und -erkundung erforderlichen Tools als Software-as-a-Service auf Basis der Lakehouse-Architektur.
Machine Learning: SynapseML automatisiert .NET-Anbindung an Apache SparkMit dem neuen API-Satz ermöglicht Microsofts ML-Bibliothek den Sprachen der .NET-Familie wie C# und F# verteiltes Machine Learning mit Apache Spark.
JetBrains' Big Data Tools 1.6 behalten Flink-Jobs im AugeDie Big Data Tools 1.6, ein Plug-in für Zugriff auf Zeppelin Notebooks, beherrscht nun auch das Monitoring von Apache Flink und bindet den Hive Metastore ein.
Data Science: Apache SystemDS 3.0 erhält ein Backend für Multi-TenancyDas neue Release der Data-Science-Software SystemDS führt ein Federated Backend für Mehrmandantenfähigkeit ein und vollzieht das Update auf Java 11 und Spark 3.
Machine Learning: Databricks gibt AutoML für den uneingeschränkten Einsatz freiDer in die Databricks-Plattform integrierte Dienst AutoML soll Data Scientists helfen, ML-Modelle schneller produktionsreif zu entwickeln.
PipelineDP: Differential Privacy Framework für das Python-UniversumGoogle und OpenMined machen die Vorzüge des differenzierten Datenschutzes auch der Python Developer Community als Open Source zugänglich.
Online-Workshop: Skalierbare Data Science mit Python und SparkÜber die PySpark-API spricht man Spark aus eigenen Python-Programmen an, um so skalierbare Big-Data- und Machine-Learning-Analysen zu entwickeln.
Online-Workshop: Data Science mit Python und SparkDaten sprechen Bände – holen Sie mehr aus Ihren Unternehmensdaten hraus mit Python und Apache Spark. 10 % Frühbucherrabatt bis 6. Oktober.
Big Data: Apache Spark erhält erste stabile Kotlin-APIJetBrains hat die erste Hauptversion der Kotlin-API für Spark fertiggestellt. Sie gilt als Feature-komplett und soll kompatibel sein zu den Kern-APIs von Spark.
Online-Workshop: Data Science mit Python und SparkData Scientists lernen in diesem Kurs, skalierbare Big-Data- und ML-Analysen in Python auf Basis von Apache Spark zu entwickeln – Frühbucherrabatt bis 7.7.
Big Data Tools: JetBrains-Plug-in für Apache Zeppelin verlässt die Preview-PhaseDie Erweiterung zum Zugriff auf Zeppelin Notebooks und für das Monitoring von Spark- und Hadoop-Anwendungen ist nun in Version 1.0 verfügbar.
NetApp Spot holt Big Data auf die Kubernetes-WelleAls Serverless Container Engine soll Wave die Infrastrukturverwaltung für containerisierte Spark-Anwendungen auf Kubernetes vereinfachen.
Datenverarbeitung: Apache Spark 3.1 will zum Zen-Meister für Python werdenUnter dem Schlagwort Project Zen soll Spark den Einsatz von PySpark vereinfachen, um Python für die Analytics-Engine zu nutzen.
Databricks erhält Finanzspritze von einer Milliarde US-DollarÜppig ausgestattet mit Risikokapital bereitet sich das Unternehmen hinter dem Big-Data-Framework Apache Spark auf einen Börsengang vor.
.NET for Apache Spark verbindet .NET-Entwicklung mit der Big Data EngineMicrosoft stellt die erste Hauptversion des Open-Source-Pakets zur Verfügung und macht Spark-Anwendern die UDFs von .NET zugänglich.
Cloudera startet Cloud-nativen Dienst für Data EngineeringDie Tools für ETL-Prozesse, Data-Pipeline-Orchestrierung, Automatisierung und Monitoring sind als Spark-Service in die Cloudera Data Platform integriert.
Datenanalyse: JetBrains stellt Kotlin-API für Apache Spark vorDas Open-Source-Projekt will eine Kompatibilitätsschicht zwischen der Programmiersprache Kotlin und dem Big-Data-Framework Apache Spark bieten.
Online-Workshop: Big-Data-Analysen mit Python und SparkLernen Sie, wie Sie Apache Spark für Big-Data-Analysen aus Python-Programmen heraus nutzen. Bei Buchung bis 21.8. winken 10% Frühbucherabatt.
Apache Spark 3.0 liefert erweiterte SQL-Funktionen und ein Update der Python-APIDas Major-Release der Big-Data-Engine hat viele Verbesserungen, aber auch neue Ansätze im Gepäck, die höhere Performance und mehr Kompatibilität versprechen.
Big Data Tools: JetBrains gibt Plug-in für IntelliJ, PyCharm und DataGrip freiNutzer der IDEs erhalten über das Plug-in direkten Zugriff auf Zeppelin Notebooks, Spark-Anwendungen sowie Dateien auf S3-Speicherinstanzen