Google Sheets kalkuliert dank TensorFlow mit Machine Learning
Das Add-on Simple ML for Sheets nutzt das ML-Framework TensorFlow, um abweichende Werte zu erkennen, fehlende vorherzusagen oder Modelle zu trainieren.
Das TensorFlow-Team hat ein Add-on für Google Tabellen veröffentlicht, das Machine Learning (ML) in die Tabellenkalkulation integriert. Simple ML for Sheets nutzt TensorFlow und lässt sich direkt in Sheets verwenden. Die Erweiterung ist derzeit noch als Beta gekennzeichnet.
Erklärtes Ziel des Add-on ist es, Machine Learning auf einfache Weise in die Tabellenkalkulation zu integrieren. Es bietet einerseits einfache Funktionen, die direkt die Daten in der Tabelle verarbeiten und andererseits erweiterte Funktionen, um anhand der Werte ein Modell zu trainieren und zu evaluieren. Das Add-on arbeitet direkt im Browser und erfordert keine Installation des Open-Source-Frameworks TensorFlow.
Fehlende und abweichende Werte
Zum Start bietet Simple ML for Sheets zwei Basisfunktionen, die versuchen fehlende Werte vorherzusagen beziehungsweise Ausreißer unter den Werten zu identifizieren. Für beide Funktionen wählt man zunächst die Spalte aus, in der die Werte fehlen oder von der Norm abweichen. Anschließend bestimmt man die zugehörigen Spalten und wahlweise einen passenden ML-Algorithmus.
Das Add-on bietet Entscheidungsbäume (Decision Trees), Random Forest und Gradient Boosted Trees. Es weißt darauf hin, dass letzterer Algorithmus üblicherweise die zuverlässigeren Ergebnisse liefert, während sich die Resultate der Entscheidungsbäume am besten nachvollziehen lassen.
Modell zum Mitnehmen
Für Fortgeschrittene lässt sich Simple ML for Sheets zum Trainieren, Evaluieren, Verwalten und Exportieren einfacher Modelle nutzen. Das Add-on greift dafür auf dieselben Algorithmen zu wie für die einfachen Funktionen. Grundlage ist die Library TensorFlow Decision Forests (TF-DF). Das Modell lässt sich anschließend direkt exportieren – zunächst ausschließlich in Google Colab.
Die gesamte Verarbeitung der Daten erfolgt sowohl beim Modelltraining als auch für die einfachen Funktionen direkt im Browser. Die Daten verlassen die – ohnehin bei Google gehostete – Tabelle also während des Trainings nicht.
Weitere Informationen lassen sich dem TensorFlow-Blog entnehmen. Auf der Projektseite findet sich neben der Dokumentation ein Tutorial mit einem Beispiel-Sheet. Simple ML for Sheets befindet sich in Entwicklung und hat Betastatus. Wer Wünsche oder Anregungen hat, kann sie in einer öffentlichen Benutzergruppe einbringen.
(rme)