帝国cms采集常用技巧
网络 作者:本站 点击:
1、过滤文章内容的 |
广告正则:“<a [!--ad--]>”;调换“</a>”为空。 |
2、同上班得出,过滤font之类的标签: |
广告正则:“<font[!--ad--]>”;调换“</font>”为空。其他依此类推。 |
3、扫除采集时的空白内容的数据: |
“在统设置”-》“履行SQL语句”运行下面SQL语句即可: delete from phome_ecms_news where newstext=''; |
4、同一链接的页面如何二次采集: |
到“管理采集节点”那清空节点即可。 |
采集的一些特别字段阐明: |
1、“下载地址正则”、“在线观看地址正则”、“图片集正则”。 |
阐明:下面的两个正则是离开的,并且是用“[!empirecms!]”格开。 |
下载地址正则 |
格式:地址正则([!--ecmsdownpathurl--])[!empirecms!]名称正则([!--ecmsdownpathname--]) |
阐明:名称正则可以不设置,由在统本人命名。 |
在线观看地址正则 |
格式:地址正则([!--ecmsonlinepathurl--])[!empirecms!]名称正则([!--ecmsonlinepathname--]) |
阐明:名称正则可以不设置,由在统本人命名。 |
图片集正则 |
格式:缩略图([!--ecmsspicurl--])[!empirecms!]大图([!--ecmsbpicurl--])[!empirecms!]名称([!--ecmspicname--]) |
阐明:大图与名称正则可以不设置。 |
2、只要字段“输入表单显示元素”是“图片(img)”、“FLASH文件”、“文件(file)”均支撑远程保存文件到本地。 |
|