📜  jsoup-设置HTML(1)

📅  最后修改于: 2023-12-03 15:02:26.377000             🧑  作者: Mango

使用Jsoup设置HTML

Jsoup是一种流行的Java HTML解析器和文档操作库。它可以用于从HTML中提取数据、操作和修改HTML文档。以下是如何使用Jsoup设置HTML的一些介绍。

添加依赖

首先,需要在项目中添加Jsoup依赖。

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.14.3</version>
</dependency>
创建HTML

可以使用Jsoup来创建HTML文档。

Document doc = Document.createShell("");
doc.head().append("<title>Jsoup HTML document</title>");
doc.body().append("<h1>Welcome to Jsoup</h1>");
System.out.println(doc);

这个例子创建了一个空的HTML文档,并向文档头添加了一个标题,向文档主体添加了一个标题。

修改HTML

可以使用Jsoup来修改HTML文档。

Document doc = Jsoup.connect("http://example.com").get();
Element link = doc.select("a").first();
link.attr("href", "http://new.url.com");
System.out.println(doc);

这个例子从http://example.com下载HTML文档,并将第一个<a>元素的href属性修改为http://new.url.com

从HTML中提取数据

可以使用Jsoup从HTML中提取数据。

Document doc = Jsoup.connect("http://example.com").get();
Elements links = doc.select("a");
for (Element link : links) {
    System.out.println(link.attr("href"));
}

这个例子从http://example.com下载HTML文档,并打印所有<a>元素的href属性。

过滤HTML

可以使用Jsoup过滤HTML元素。

Document doc = Jsoup.connect("http://example.com").get();
Elements images = doc.select("img[src~=(?i)\\.(png|jpe?g|gif)]");
for (Element image : images) {
    System.out.println(image.attr("src"));
}

这个例子从http://example.com下载HTML文档,并打印所有PNG、JPEG和GIF图像的src属性。

以上是使用Jsoup设置HTML的一些介绍。如果你需要更多的信息,可以参考Jsoup官方文档。