Mit Python große Datenmengen verarbeiten: NumPy für Anfänger

NumPy ist die Grundlage, damit Python effizient mit großen Datenmengen umgehen kann. Der Numpy-Array ist dabei sehr viel schneller als eine Python-Liste.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 16 Kommentare lesen
Lesezeit: 13 Min.
Von
  • Marvin Strathmann
Inhaltsverzeichnis

Das Open-Source-Projekt NumPy gehört zu den wichtigsten Python-Bibliotheken, wenn man große Datenmengen verarbeiten möchte. NumPy erlaubt es, effizient mit Vektoren und Matrizen zu arbeiten und bildet etwa die Grundlage für Grafiken mit Matplotlib, Analysen mit Pandas und Machine-Learning-Projekte mit Python.

Das zentrale Element von NumPy ist der Array. Er ähnelt einer Python-Liste, bietet aber mehr Funktionen und ist deutlich schneller. Gerade bei großen Datenmengen spielt der Array von NumPy seine Stärken aus und erleichtert das Arbeiten.

Programmieren in Python

Wir zeigen die wesentlichen Aspekte von NumPy: Wie man einen NumPy-Array erstellt, mit mehreren Dimensionen arbeitet und den Datentypen sowie den Shape ermittelt und ändert. Da es um die Grundlagen geht, muss man kein Datenwissenschaftler sein, um die Programmierbeispiele nachzuvollziehen – lediglich einige Kenntnisse in Python sind hilfreich, um die Syntax zu verstehen.