火车头采集器使用教程
的有关信息介绍如下:对SEO人员来说,火车头是常用的采集工具,学会熟练的使用火车头采集器也会让SEO人员工作起来事半功倍。下面我来详细演示火车头采集器的使用方法。
下载安装火车头采集器,有付费与免费版,百度查找下载地址。(这里不细说)
安装后,双击打开,进入程序主页面,新建分组。
选中刚才新建的分组,然后右键创建任务。
编辑任务名称,然后添加要采集的目标页面链接。
选择批量/多页采集
网址采集的规则设置:
注意:采集的量根据自己的需求来改
添加采集规则
进入采集的目标页面,点右键查看源代码。找到要采集的文章的标题,然后往上找div,逐个查找,找到页面中唯一的一个div,然后复制下来。
同理再找到最后一个div。
这样做目的是缩小采集目标的范围。
然后以第一个div开始,最后一个div结尾。
把代码复制到对应的选定区,然后可以保存,先测试一次
测试成功。那么采集的大致范围选定了,下面来修改采集规则,让采集的内容达到我们想要的内容。
先找到内容页链接的规律,然后去掉不想要的其他代码。
然后来进行采集的第二部:内容规则的设置
设置标题替换
标题替换设置好后,测试效果
设置内容部分的替换
去页面的后台代码,找到文章内容上面唯一的一个div,和文字结尾后面唯一的一个div,然后复制代码放到对程序对应的设置框里。
再设置html代码的过滤,留下需要的,去掉不需要的。然后点击确定,保存,去测试一下。
以上测试成功后,进行最后一步发布的设置。
在web发布配置管理,里面进行配置
主要是配置网站后台的登陆信息和要发布的栏目,然后保存配置 ,全部保存,就OK了,可以正式批量采集文章了。
最后检查文章标题,文章内容是否采集成功。