火车头使用说明--688IT编程网

火车头使用说明

别的不说了，直接开始使用。(ps:开始之前，最好把爬虫的原理了解一下)

咱们用的是免费版，功能什么的很多受到限制，免费版网页只能抓到两级，而且无法定时执行任务。

1、安装完火车头后，直接双击图标打开，此时会弹出一个登录页面，什么都不要管，直接点击登录就进入了主界面，主界面如下：

你会发现它有一些内置的分组，分组下面有内置的测试任务，这里要强调一点，每个任务从上到下对应着火车头安装目录data目录下的以数字开头的文件夹，里面放着各自的数据文件，大概内置测试任务有38个，所以data目录下有对应从1到38的38个文件夹，你以后新建任务后，会自动再data目录下建立文件夹，序号依次递增。

2、新建任务和分组。你可以新建分组，也可以再已有的测试分组下面建立任务，但是有一点要注意，任务不能脱离分组而存在，必须把任务存在分组里面，这里咱们新建一个名字叫做腾讯的分组。

3、右键单击腾讯，选择新建任务，弹出新建任务对话框

4、下面我们以腾讯新闻采集为例说一下如何去配置，任务名叫做腾讯新闻

可以看到，这里分为四步，第一部就是采集网址规则(这一步就相当于爬虫里面设置种子url并且入队的过程)，在出现的起始网址，添加单条网址，并点击”添加“按钮。

我们在网页中，通过分析，发现国内新闻的第二页及以后都是以数字递增的方式显示的，我们现在添加等差数列形式的网址

最后点击完成，查看效果

下载好的mysql文件无法双击下载

起始网址的添加就是种子URL的设置过程，这里可以添加多个种子URL，我这里设置了六页

下面就是多级网址获取，点击添加按钮，出现如下画面（这一步相当于提取网页所有连接的过程）

如果直接点击保存，相当于提取网页中所有链接，但真实情况下我们并不需要所有的链接，所以需要对链接进行过滤，可以从该选定区域提取网址，也可以对结果网址过滤，这里我们设置结果网址必须包含news.qq/a，然后点击保存。

发表评论

688IT编程网

火车头使用说明

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

火车头使用说明

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法