/*package test;
import java.util.HashMap;
如何查看html代码import java.util.Map;
import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.tags.LinkTag;
import org.htmlparser.util.NodeList;
*//**
* JAVA中使用Htmlparse解析HTML文档,使用htmlparse遍历出HTML文档的所有超链接(<a>标记)
* @author
*//*
public class Test {
    public static void main(String[] args) {
        try {
首先我们先使用HttpRequester类和HttpRespons类获得一个HTTP请求中的数据(HTML文档)。 可以从(download.csdn/source/321516)中下载htmlloader,该库中有上述类;或从我的《JAVA发送HTTP请求,返回HTTP响应内容,实例及应用》一文中摘取上述两JAVA类的代码。htmlparse可以从(download.csdn/source/321507)中下载
            Map<String, String> map = new HashMap<String, String>();
            //HttpRequester request = new HttpRequester();
        //    HttpResponse hr = request.sendGet("www.baidu");
            //Parser parser = Content(), hr.getContentEncoding());
            try {
                // 通过过滤器过滤出<A>标签
                NodeList nodeList = actAllNodesThatMatch(new NodeFilter()
                {
                            //实现该方法,用以过滤标签
                            public boolean accept(Node node) {
                                if (node instanceof LinkTag)//<A>标记
                                    return true;
                                return false;
                            }
                        });
                // 打印
                for (int i = 0; i < nodeList.size(); i++) {
                    LinkTag n = (LinkTag) nodeList.elementAt(i);
                    System.out.StringText() + " ==>> ");
                    System.out.actLink());
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}*/

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。