酷酷问答>百科问答>文章自动采集功能的使用

文章自动采集功能的使用

2024-09-21 16:33:17 编辑：zane 浏览量：557次

的有关信息介绍如下：

文章自动采集功能的使用

在淘宝客程序V3.0中，加入了文章自动采集功能。可以满足需要采集文章的用户，下面介绍一下该功能如何使用。

首先进入后台-文章管理-文章采集，点击"采集规则"

在采集前，首先要准备好要采集的目标，然后查看目标页面的源文件。下面对采集规则进行简单介绍：

规则名称：可以添加多个采集任务，并为规则取一个名称；

采集地址：要采集的目标页面；

目标编码：查看目标页面的源代码，这里的编码一定要和目标页的编码一致，一般是gb2312或utf-8编码；

采集区间：区分出采集的内容列表；

地址规则：解析出列表中文章的链接地址；

地址包含：不重要，可以不填；

地址补全：如果列表中的文章链是相对路径，要补全成绝对路径；

信息测试：不重要，可以不填；

文章标题：解析出文章的标题；

文章来源：自定义，如：网络；

文章作者：自定义，如：Admin；

文章内容：解析出文章的正文；

导入分类：可以选择采集的文章属于哪个分类。

添加采集规则后，回到“文章采集”管理界面，可以看到我们刚才添加的采集规则，如图：

点击“开始采集”,会出现要采集的目标网页的文章链接列表，如图：

选择所有的链接，点击“批量采集”即可完成文章采集。回到“管理文章”页面，可以看到刚才采集的文章，如图：

最后对采集的文章生成静态即可。

编码选择必须与要采集的目标网页一致

被采集的目标网页没有作防采集处理