您当前的位置:首页 > 编程技术

帝国cms采集常用技巧

时间:2021-07-27 10:58:11  来源:网络    编辑:本站  点击:
1、过滤文章内容的
广告正则:“<a [!--ad--]>”;调换“</a>”为空。
2、同上班得出,过滤font之类的标签:
广告正则:“<font[!--ad--]>”;调换“</font>”为空。其他依此类推。
3、扫除采集时的空白内容的数据:
“在统设置”-》“履行SQL语句”运行下面SQL语句即可:
delete from phome_ecms_news where newstext='';
4、同一链接的页面如何二次采集:
到“管理采集节点”那清空节点即可。
采集的一些特别字段阐明:
1、“下载地址正则”、“在线观看地址正则”、“图片集正则”。
阐明:下面的两个正则是离开的,并且是用“[!empirecms!]”格开。
下载地址正则 格式:地址正则([!--ecmsdownpathurl--])[!empirecms!]名称正则([!--ecmsdownpathname--])
阐明:名称正则可以不设置,由在统本人命名。
在线观看地址正则 格式:地址正则([!--ecmsonlinepathurl--])[!empirecms!]名称正则([!--ecmsonlinepathname--])
阐明:名称正则可以不设置,由在统本人命名。
图片集正则 格式:缩略图([!--ecmsspicurl--])[!empirecms!]大图([!--ecmsbpicurl--])[!empirecms!]名称([!--ecmspicname--])
阐明:大图与名称正则可以不设置。
2、只要字段“输入表单显示元素”是“图片(img)”、“FLASH文件”、“文件(file)”均支撑远程保存文件到本地。
点赞
返回首页
返回
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
栏目导航

| 传统文化 | 武术天地 | 编程技术 | 好听音乐 | 养生中医 | 智慧人生 | 常用工具 | 写作园地 | 影视娱乐 | php专栏 | 道德经专栏 |
最新推荐
python内建函数大全(built-in functions)
python内建函数大…
点击按钮(button)打开新窗口(window)
点击按钮(button)…
帝国cms网络视频引用代码--具体操作教程
帝国cms网络视频引…
相关文章
栏目更新
栏目热门