文章自动采集功能的使用
的有关信息介绍如下:在淘宝客程序V3.0中,加入了文章自动采集功能。可以满足需要采集文章的用户,下面介绍一下该功能如何使用。
首先进入后台-文章管理-文章采集,点击"采集规则"
在采集前,首先要准备好要采集的目标,然后查看目标页面的源文件。下面对采集规则进行简单介绍:
规则名称:可以添加多个采集任务,并为规则取一个名称;
采集地址:要采集的目标页面;
目标编码:查看目标页面的源代码,这里的编码一定要和目标页的编码一致,一般是gb2312或utf-8编码;
采集区间:区分出采集的内容列表;
地址规则:解析出列表中文章的链接地址;
地址包含:不重要,可以不填;
地址补全:如果列表中的文章链是相对路径,要补全成绝对路径;
信息测试:不重要,可以不填;
文章标题:解析出文章的标题;
文章来源:自定义,如:网络;
文章作者:自定义,如:Admin;
文章内容:解析出文章的正文;
导入分类:可以选择采集的文章属于哪个分类。
添加采集规则后,回到“文章采集”管理界面,可以看到我们刚才添加的采集规则,如图:
点击“开始采集”,会出现要采集的目标网页的文章链接列表,如图:
选择所有的链接,点击“批量采集”即可完成文章采集。回到“管理文章”页面,可以看到刚才采集的文章,如图:
最后对采集的文章生成静态即可。
编码选择必须与要采集的目标网页一致
被采集的目标网页没有作防采集处理