Tutorial Programmieren mit Julia, Teil 2: Data Science und ML
Julia ist fĂĽr Data Science gebaut, das stellen sowohl das Tooling als auch die Syntax unter Beweis. ML und Deep Learning sind integraler Bestandteil.
- Stephan Sahm
Data Science ist als Begriff noch gar nicht so alt, und doch gibt es immer wieder neue Hypes wie generative KI, die das Feld umkrempeln und der Data Science ein neues Gesicht verleihen. FĂĽr dieses Tutorial werden solche Deep-Learning-Methoden als Teilbereich der Data Science verstanden.
Data Science umfasst verschiedene Aspekte. Das Arbeiten mit tabellarischen strukturierten Daten ist eine der wichtigsten Grundlagen. Man spricht von Statistik und Analyse, aber auch von ETL-Prozessen (Extract Transform Load).
Julia besitzt hierfür ein exzellentes Tooling. Ihre Syntax eignet sich für Vektoren und Matrizen. Neben der leicht handhabbaren Syntax ist die hohe Performance ein großer Gewinn. Wer mit Python arbeitet, muss zu NumPy greifen, um numerische Datentypen performant zu verarbeiten. In Julia hingegen lässt sich dazu die komplette Sprache verwenden, einschließlich der individuellen Funktionen und Datenstrukturen, ohne Leistungseinbußen hinnehmen zu müssen.
Das war die Leseprobe unseres heise-Plus-Artikels "Tutorial Programmieren mit Julia, Teil 2: Data Science und ML". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.