Java Einzeiler des Tages: Lesen einer Webseite mit jsoup den Open source HTML Parser

Erstellt am 1. März 2020 von It_berater

Mit JSoup kann ganz einfach eine Webseite gelesen werden. Dazu einfach in der pom.xml:

<dependency>
			<groupId>org.jsoup</groupId>
			<artifactId>jsoup</artifactId>
			<version>1.12.2</version>
</dependency>

ergänzen und folgenden Einzeiler:

System.out.println(„Webseite: “ + Jsoup.connect(„http://wenzlaff.info“).get().html());

Das Ergebnis ist dann die HTML Seite. Mit JSoup können auch einfach Filter und Selektoren erstellt werden. Es unterstüzt leider kein JavaScript.
Dafür kann dann HtmlUnit oder Selenium verwendet werden.

Ähnliche Artikel:

  1. Java: Parsen von HTML-Dateien mit JSoup 1.9.2 in zwei Java Zeilen
  2. Automatische Überprüfung auf Sicherheitslücken im Java Code auf Basis der Internationalen National Vulnerability Database (NVD)
  3. Quellcode Open Source Software „U-Boot“ für Speedport W 921 auf der Update Seite der Telekom!