st;
2import Matcher;
3import Pattern;
java技术介绍百度百科decraft.webmagic.Page;
decraft.webmagic.Site;
decraft.webmagic.Spider;
decraft.webmagic.pipeline.ConsolePipeline;
decraft.webmagic.processor.PageProcessor;
9/**
10 * @author信1605-1 hjj
11 *
12*/
13public class implements PageProcessor{
14
()
16)
17)
18);
19 @Override
20public Site getSite() {
21// TODO Auto-generated method stub
22return site;
23 }
24
25public static void main(String[] args) {
26new PaChong2())
27//这⾥填写你第⼀次要爬的⽹址(后⾯直接跟你要查的词汇名称把互联⽹改了就⾏)28new ConsolePipeline())
29)
30 .run();
31
32}
33
34 @Override
35public void process(Page page) {
36//这段代码重复获取
37 System.out.println(mySplitBaiDu(page));
38unicodeToString(mySplitBaiDu(page)));
39 }
40
41//爬取百度解释为unicode⽂本
42public static String mySplitBaiDu(Page page)
43 {
44];
46];
47return content;
48 }
49
50//unicode 转中⽂
51public static String unicodeToString(String str) {
52
53);
54 pattern.matcher(str);
55char ch;
56while (matcher.find()) {
57//group 6728
58);
59//ch:'⽊' 26408
60char);
61//group1 \u6728
62);
63);
64 }
65return str;
66 }
67
68
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论