Mit JSoup kann ganz einfach eine Webseite gelesen werden. Dazu einfach in der pom.xml:
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.12.2</version> </dependency>
ergänzen und folgenden Einzeiler:
System.out.println(„Webseite: “ + Jsoup.connect(„http://wenzlaff.info“).get().html());
Das Ergebnis ist dann die HTML Seite. Mit JSoup können auch einfach Filter und Selektoren erstellt werden. Es unterstüzt leider kein JavaScript.
Dafür kann dann HtmlUnit oder Selenium verwendet werden.
Ähnliche Artikel:
- Java: Parsen von HTML-Dateien mit JSoup 1.9.2 in zwei Java Zeilen
- Automatische Überprüfung auf Sicherheitslücken im Java Code auf Basis der Internationalen National Vulnerability Database (NVD)
- Quellcode Open Source Software „U-Boot“ für Speedport W 921 auf der Update Seite der Telekom!