/*package test;
import java.util.HashMap;
如何查看html代码import java.util.Map;
import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.tags.LinkTag;
import org.htmlparser.util.NodeList;
*//**
* JAVA中使用Htmlparse解析HTML文档,使用htmlparse遍历出HTML文档的所有超链接(<a>标记)
* @author
*//*
public class Test {
public static void main(String[] args) {
try {
首先我们先使用HttpRequester类和HttpRespons类获得一个HTTP请求中的数据(HTML文档)。 可以从(download.csdn/source/321516)中下载htmlloader,该库中有上述类;或从我的《JAVA发送HTTP请求,返回HTTP响应内容,实例及应用》一文中摘取上述两JAVA类的代码。htmlparse可以从(download.csdn/source/321507)中下载
Map<String, String> map = new HashMap<String, String>();
//HttpRequester request = new HttpRequester();
// HttpResponse hr = request.sendGet("www.baidu");
//Parser parser = Content(), hr.getContentEncoding());
try {
// 通过过滤器过滤出<A>标签
NodeList nodeList = actAllNodesThatMatch(new NodeFilter()
{
//实现该方法,用以过滤标签
public boolean accept(Node node) {
if (node instanceof LinkTag)//<A>标记
return true;
return false;
}
});
// 打印
for (int i = 0; i < nodeList.size(); i++) {
LinkTag n = (LinkTag) nodeList.elementAt(i);
System.out.StringText() + " ==>> ");
System.out.actLink());
}
} catch (Exception e) {
e.printStackTrace();
}
} catch (Exception e) {
e.printStackTrace();
}
}
}*/
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论