关于火车头使用方法
目录
目录 (2)
一、原理描述 (3)
1.火车采集器数据抓取原理: (3)
2.火车采集器数据发布原理: (3)
3.火车采集器工作流程: (3)
二、术语解释 (4)mysql下载完如何使用
三、下载地址 (5)
四、安装升级与卸载 (6)
五、操作步骤 (7)
一、原理描述
1.火车采集器数据抓取原理:
火车采集器如何去抓取数据,取决于您的规则。您要获取一个栏目的网页里的所有内容,需要先将这个网页的网址采下来,这就是采网址。程序按您的规则抓取列表页面,从中分析出网址,然后再去抓取获得网址的网页里的内容。再根据您的采集规则,对下载到的网页分析,将标题内容等信息分离开来并保存下来。如果您选择了下载图片等网络资源,程序会对采集到的数据进行分析,出图片,资源等的下载地址并下载到本地。
2.火车采集器数据发布原理:
在我们将数据采集下来后数据默认是保存在本地的,我们可以使用以下几种方式对数据进行处理。
1、不做任何处理。因为数据本身是保存在数据库的(access、db3、mysql、sqlserver),您如果只是查看数据,直接用相关软件打开查看即可。
2、Web发布到网站。程序会模仿浏览器向您的网站发送数据,可以实现您手工发布的效果。
3、直接入数据库。您只需写几个SQL语句,程序会将数据按您的SQL语句导入到数据库中。
4、保存为本地文件。程序会读取数据库里的数据,按一定格式保存为本地sql或是文本文件。
3.火车采集器工作流程:
火车采集器采集数据是分成两个步骤的,一是采集数据,二是发布数据。这两个过程是可以分开的。
1、采集数据,这个包括采集网址,采集内容。这个过程是获得数据的过程。我们做规则,在采的过程中也算是对内容做了处理。
2、发布内容就是将数据发布到自己的论坛,CMS的过程,也是实现数据为已有的过程。可以用WEB在线发布,数据库入库或存为本地文件。
具体的使用其实是很灵活的,可以根据实际来决定。比如我可以采集时先采集不发布,有时间了再发布,或是同时采集发布,或是先做发布配置,也可以在采集完了再添加发布配置。总之,具体过程由您而定,火车采集器的强大功能之一也就是体现在灵活中。
二、术语解释
三、下载地址
四、安装升级与卸载
火车采集器系统需求
火车采集器可以运行于Windows 2000或以上操作系统,CPU 的速度为 "奔腾133 MHz" 或以上,128 MB 内存容量或以上。
火车采集器的安装
火车采集器2010版是绿软件。如果您电脑上安装了微软的.NET FrameWork 2.0框架或更高版本,安装时直接解压缩到您电脑的任何地方即可完成采集器的安装--安装过程不操作注册表和系统文件,不产
生任何垃圾文件!如果您安装后程序无法启动,那可能是您电脑没有安装.NET FrameWork 2.0,请下载微软的.NET FrameWork 2.0框架或更高版本并安装。附2.0下载地址:
framework 2.0下载地址:
download.microsoft/download/5/6/7/567758a3-759e-473e-bf8f-5215443856
解压完成后,双击目录内的文件启动主程序开始采集之旅。
火车采集器的升级
从火车采集器V3.2SP5,V2008或V2009版本升级到V2010:请运行程序目录下的 程序,按提示进行操作。
火车采集器卸载
由于种种原因,您暂时不想使用火车采集器了,那么您直接到火车采集器的安装文件夹删除即可以完成火车采集器的卸载。在卸载前强烈建议您先备份,User,Plugins,Data和Module 文件夹(即用户配置,插件目录,采集数据和模块)以便下次使用!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论