帝国cms后台采集管理 - 采集正则详解

时间：2016-03-30 01:42:05

帝国CMS的采集正则

1、作用：通过设置采集正则以便使系统识别你要采集的内容。

2、帝国CMS的采集正则是什么样的，下面我们用实例讲解：

(1)、假如我们要采集页面的内容页为如下页面：

图1：HTML页面

图2：查看页面源代码为如下：

(2)、由上图的源代码内容我们可以得出帝国CMS的采集正则：

新闻标题正则：

<td>标题：<strong>[!--title--]</strong></td>

新闻内容正则：

<td>内容：<font color="#FF0000">[!--newstext--]</font></td>

上面中的“[!--title--]”与“[!--newstext--]”分别为“标题”字段与“内容”字段的正则变量。用于指定我们要采集的内容位置。

(3)、由上面我们得出了，帝国CMS采集正则是把正则变量替换要采集内容后的代码内容。格式：

识别代码头部[!--变量名--]识别代码尾部

注意事项：上面的“识别代码头部”一定是要唯一的标记。

3、帝国CMS正则还有表示任意内容的字符：“*”

如果“识别代码头部”中有内容是变化的，那么我们可以用*代替它。如页面源代码为如下，我们要采集下面的链接地址：

通过使用“*”任意内容表示字符，我们可以用下面的正则忽略可变内容，获得链接地址：

附加说明：[!--newsurl--]为页面链接地址的正则变量。

4、其他说明：

(1)、正则要找出唯一性的开头字符。有时候空格都会成为识别的依据。

(2)、对于特殊字符请在前面加上“\\”，当然直接将特殊字符改为“*”最合适了。特殊字符如下：
“ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。

帝国cms后台采集管理 - 管理采集节点功能详解

管理采集节点 1、登录后台，单击“栏目”菜单，选择“管理采集节点”子菜单，进入管理采集节点界面：&nbs

2019
帝国cms后台采集管理 - 增加采集节点功能详解

增加采集节点增加采集节点：也可以说是新&nbs

2306
帝国cms后台采集管理 - 采集流程及检测服务器是否支持采集详解

采集操作流程 1、增加采集节点； 2、预览采集正则是否正确； 3&nbs

1767
帝国cms后台管理 - 信息结合项功能详解

一、结合项功能介绍为了使信息列表可实现按多种条件输出数据，帝国CMS独创可设置无限条件的模型结合项功能。帝国CMS的&nbs

2256
帝国cms后台管理 - 签发信息功能详解

一、签发信息功能说明签发信息是对工作流流转的信息进行审核的操作。有关工作流设置可以看“管理员手册”&nbs

1701