RStudio Connect 1.8 erweitert die Python-Anbindung

Die Plattform zum Veröffentlichen und Teilen von Data-Science-Analysen verbessert unter anderem die Anbindung an Jupyter Notebooks.

In Pocket speichern vorlesen Druckansicht
RStudio Connect 1.8 erweitert die Python-Anbindung

(Bild: Adrian Grosu/Shutterstock.com)

Lesezeit: 3 Min.
Von
  • Rainald Menge-Sonnentag
Inhaltsverzeichnis

Das Softwareunternehmen RStudio hat Version 1.8 von RStudio Connect veröffentlicht. Das kommerzielle Werkzeug ist eine Plattform zum Veröffentlichen von Data-Science-Analysen, die in R oder Python verfasst sein können. Das aktuelle Release bringt unter anderem eine einfachere Einbindung von Jupyter Notebooks. Außerdem bietet das Pin-Paket eine Form des Caching, und RStudio Connect erweitert die Funktionen zum Generieren von E-Mails mit Reports.

Administratoren können mit dem 1.8-Release zudem die Security Assertion Markup Language (SAML) 2.0 zum Übertragen von Authentifizierungsinformationen verwenden. RStudio Connect verbindet sich dazu mit einem passenden Identity Provider und übernimmt die Rolle eines Service Provider.

Das vor einem Jahr erschienene RStudio Connect 1.7 hatte erstmals eine Anbindung an Python und Jupyter Notebooks an Bord. Das aktuelle Plug-in für Jupyter Notebooks rsconnect-jupyter ermöglicht das direkte Veröffentlichen der Inhalte eines Notebooks in RStudio Connect. Data Scientists können dabei auswählen, ob sie nur die Ergebnisse oder auch den Sourcecode übertragen. Zusätzlich zu den Inhalten des Notebooks können sie externe Dateien einbinden.

Das Jupyter-Plug-in kann Daten mit oder ohne Sourcecode an RStudio Connect übertragen.

(Bild: RStudio)

Neben dem manuellen Weg lässt sich das Veröffentlichen auch an Git-Repositorys koppeln. Dazu erstellt das Plug-in die benötigten Dateien manifest.json und requirements.txt, sofern sie nicht bereits existieren. Anschließend kann RStudio Connect die Inhalte aus dem Repository abfragen und bei Änderungen automatisch aktualisieren.

Pins sind ein Konzept von RStudio und RStudio Connect, um Ressourcen für die Veröffentlichung vorzuverarbeiten und die Ergebnisse quasi anzuheften. Das pins-Paket ermöglicht zum einen das Cachen von entfernten Dateien und zum anderen das einmalige oder regelmäßige Ausführen aufwendiger Berechnungen und Ablegen der Ergebnisse.

Der Befehl pin(url) lädt eine Datei herunter und speichert sie im lokalen Cache. Wenn sich die Datei ändert, lädt das Paket sie automatisch erneut herunter. Sollte sie Remote nicht mehr verfügbar sein, bleibt sie im Cache erhalten. Mit pin_find lassen sich zudem im Netzwerk CRAN-Pakete (Comprehensive R Archive Network), Kaggle und RStudio Connect nach spezifischen Inhalten durchsuchen.

RStudio Connect 1.8 erweitert das automatische Erstellen von E-Mails. Das dazu verwendete blastula-Paket hat im vergangenen Herbst mit dem 0.3.x-Release zahlreiche neue Funktionen eingeführt, die nun in der Veröffentlichungsplattform von RStudio zur Verfügung stehen und das automatisierte Erstellen und Versenden von E-Mails vereinfachen.

Die neue Funktion suppress_scheduled_email() unterbindet das Versenden der Mail. So lässt sich beispielsweise eine E-Mail mit einem Report erstellen, die RStudio Connect aber nur versendet, wenn ein bestimmter Schwellenwert über- oder unterschritten ist.

E-Mails lassen sich als Kombination aus Markdown und Plots erstellen.

(Bild: RStudio)

Weitere Neuerungen in RStudio Connect lassen sich dem Beitrag auf R-Bloggers entnehmen. Die Veröffentlichungsplattform ist im Gegensatz zur Open-Source-Entwicklungsumgebung RStudio nur kommerziell verfügbar. Der Preis startet bei 15.000 US-Dollar pro Jahr für 20 Nutzer. (rme)