Turndown: HTML in Markdown verwandeln via JavaScript

HTML eignet sich für das Web, aber weniger für weiter zu verarbeitenden Text. Dafür überführt ein Bookmarklet markierte HTML-Teile einer Webseite in Markdown.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 4 Min.
Von
  • Christian Kirsch
Inhaltsverzeichnis

Notizen-Apps haben in den letzten Jahren viele Anhängerinnen gewonnen: Sie erlauben es, den Link der aktuellen Webseite samt einer Erklärung zu sichern, die ganze Seite für später aufzuheben oder nur einen Teil davon. Wer allerdings nur Ausschnitte speichern will, möchte in der Regel nicht das originale HTML aufbewahren: Dessen zahlreiche Markierungen machen den Text unleserlich.

Als Format für Notizen hat sich inzwischen Markdown etabliert. Es ist einerseits gut lesbar und gestattet andererseits einfache semantische Formatierungen mit wenigen Zeichen. Soll der Text weniger spartanisch aussehen, kann man ihn leicht in HTML oder PDF konvertieren. Diese Funktion bieten die meisten Markdown-Editoren von Haus aus. CSS-Anweisungen regeln wie in der HTML-Welt die Details der Darstellung.

Es bietet sich also an, Fragmente von HTML-Seiten so als Markdown aufzuheben, dass möglichst viele semantische Informationen erhalten bleiben. Lösen lässt sich diese Aufgabe mit JavaScript: Es kann die aktuelle Auswahl aus dem Browserfenster lesen, doch danach wird es etwas schwieriger. Denn diese Daten können nahezu beliebige Zusammenstellungen von reinem Text und HTML-Elementen enthalten. Das mit den DOM-Methoden von JavaScript auseinanderzunehmen und als Markdown wieder zusammenzusetzen, dürfte mühsam sein.