jsoup常用操作
Jsoup是一款用于处理HTML文档的Java库,它提供了方便的API来从HTML中提取和操作数据。以下是一些Jsoup库的常用操作:
1. 获取一个HTML文档:
```java
Document doc = t("").get();
```
2. 从字符串中解析HTML:
```java
String html = "<html><head><title>标题</title></head><body>内容</body></html>";
Document doc = Jsoup.parse(html);
```
html href属性3. 通过CSS选择器获取元素:
```java
Elements links = doc.select("a[href]"); // 获取所有带有href属性的<a>标签
```
4. 获取元素的文本内容:
```java
String title = doc.title(); // 获取文档的标题
Element element = doc.select("div").first();
String text = (); // 获取<div>标签内的文本内容
```
5. 获取元素的属性:
```java
String linkHref = element.attr("href"); // 获取href属性的值
```
6. 遍历元素集合:
```java
for (Element link : links) {
System.out.println(link.attr("href"));
}
```
7. 通过标签名称获取元素:
```java
Element div = doc.select("div").first();
```
8. 通过属性值获取元素:
```java
Element link = doc.select("a[href=]").first();
```
9. 修改元素内容:
```java
("新的文本内容");
```
10. 添加新元素:
```java
Element newElement = ateElement("p");
("新的段落");
doc.body().appendChild(newElement);
```
11. 移除元素:
```java
ve();
```
12. 处理HTML中的表单数据:
```java
FormElement form = (FormElement) doc.select("form").first();
Elements elements = form.select("input");
```
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论