3.2.1 文章采集 · 建站系统使用手册

为减轻网站编辑人员的工作量，本套系统新增了文章采集功能，可以一键采集其他网站的文章，同时支持将图片保存在本地服务器。
接下来介绍如何使用采集功能
1.找到一个其他网站的文章列表页，作为采集源头比如 http://mil.news.sina.com.cn/roll/index.d.html?cid=57918&page=1

2.获取列表页的采集区域（推荐使用谷歌浏览器，右键-查看源代码）

开始标记和结束标记在每个页面都不一样，需根据自己的实际情况来填写
说明：开始标记和结束标记必须为页面中唯一或者第一次出现

3.如果新闻列表页有分页，还可以设置采集某几页，使用通配符{page}代表页数
比如 http://mil.news.sina.com.cn/roll/index.d.html?cid=57918&page={page}

4.进入内容页，获取内容页的采集区域（推荐使用谷歌浏览器，右键-查看源代码）

开始标记和结束标记在每个页面都不一样，需根据自己的实际情况来填写
说明：开始标记和结束标记必须为页面中唯一或者第一次出现

5.查看内容页编码（在中国，网页编码一般有gb2312和utf-8两种，可以从源代码顶端查看，一般都有标注）

6.采集任务设置完成后，可以先测试执行，如果能准确的获取到第一篇文章，那么就可以开始执行采集任务了。