PHP爬取⽹页中表格数据
      public function spider_j($page)
{
$url="aaa/bbb".$page."_0/";
$fcontents=file_get_contents($url);
$table_data = preg_match_all('#<table>(.*?)</table>#si',$fcontents,$match);
$table_data = $match[0][0];
$table_array = explode('<tr>',$table_data);
$data = array();
for($i=2;$i<count($table_array);$i++){
$data[$i] = explode('</td>',$table_array[$i]);
for($j = 0;$j<count($data[$i]);$j++){
$data[$i][$j] = preg_replace('/\s(?=\s)/','',trim(strip_tags($data[$i][$j])));
}
$data[$i][6] = date('Y-m-d');
}
$kname = array('ID', 'GAMENAME', 'GATEGORY','BETA', 'DATA', 'DOWNLOAD','THEDATE');
foreach($data as$key=>&$val){
$val = array_combine($kname,$val);
表格网站php源码
}
for($i=2;$i<(count($data)+2);$i++){
$this->db06->insert('TBL_J',$data[$i]);
}
}
  public function spider()
{
for($i=1;$i<11;$i++){
$this->spider_j($i);
}
}
逻辑:把⽹页代码读到字符串中,通过正则表达式筛选出指定的数据,然后变成⼆维数组,插⼊到数据库⾥。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。