Webseiten anzapfen und Dateien herunterladen mit Curl

Daten auf Webseiten zu nutzen ist schwierig: Logins und Cookies sind oft Voraussetzung für den Zugriff. Mit dem Open-Source-Tool Curl gelingt das trotzdem.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 11 Kommentare lesen

(Bild: Thomas Kuhlenbeck)

Lesezeit: 15 Min.
Von
  • Tim Schürmann
Inhaltsverzeichnis

Daten aus Webseiten abzuschöpfen ist kompliziert, denn Website-Betreiber möchten ihre Schätze nur selten teilen und ergreifen verschiedene Maßnahmen, um ein Abfischen von Informationen zu verhindern. Genügte es früher meist, die gewünschte URL mit einem beliebigen Download-Tool abzurufen, überprüfen Webserver häufig den vorgeblichen Browsertyp oder erfordern Cookies und Logins. Mit Curl können Sie auch Daten oder Dateien solcher Websites herunterladen, aber auch auf viele andere Serverdienste zugreifen, denn Curl unterstützt neben HTTP und HTTPS etliche weitere Protokolle, darunter IMAP(S), SMB, (S)FTP und SCP.

Curl gibt es für Windows, macOS und Linux. Unter Linux gehört Curl oft zur Standardinstallation oder ist in den Standard-Paket-Repositories der Distribution enthalten, für macOS, Windows und viele andere Plattformen finden Sie auf der Projektseite curl.se eine Liste mit Download-Links, teilweise zu externen Anbietern. Die Parameter, und davon benötigt man mitunter etliche gleichzeitig, sind für alle Plattformen gleich.

Mehr zum Thema cURL

Im einfachsten Fall rufen Sie Curl mit der herunterzuladenden URL als einzigen Parameter auf, etwa unserem Security-RSS-Feed: