📜  jsoup-概述

📅  最后修改于: 2020-11-13 05:52:49             🧑  作者: Mango


jsoup是一个基于Java的库,用于处理基于HTML的内容。它提供了一个非常方便的API,可以使用DOM,CSS和类似jquery的最佳方法来提取和处理数据。它实现WHATWG HTML5规范,并将HTML解析为与现代浏览器相同的DOM。

jsoup libary实现WHATWG HTML5规范,并将HTML内容解析为与现代浏览器相同的DOM。

jsonp库提供以下功能。

  • 多重读取支持-它使用URL,文件或字符串读取和解析HTML。

  • CSS选择器-它可以使用DOM遍历或CSS选择器来查找和提取数据。

  • DOM操纵-它可以操纵HTML元素,属性和文本。

  • 防止XSS攻击-它可以根据给定的安全白名单清除用户提交的内容,以防止XSS攻击。

  • 整洁-输出整洁的HTML。

  • 处理无效数据-jsoup可以处理未关闭的标签,隐式标签,并可以可靠地创建文档结构。