本节建站教程是关于采集使用的技巧,大家可以借鉴一下:
1、过滤文章内容的链接:
广告正则:“<a [!–ad–]>”;替换“</a>”为空。
2、同上得出,过滤font之类的标签:
广告正则:“<font[!–ad–]>”;替换“</font>”为空。其他依此类推。
3、清除采集时的空白内容的数据:
“系统设置”-》“执行SQL语句”运行下面SQL语句即可:
delete from phome_ecms_news where newstext=”;
4、同一链接的页面如何二次采集:
到“管理采集节点”那清空节点即可。
帝国CMS高效采集秘籍:实用小技巧大公开,轻松玩转内容抓取
未经允许不得转载:搬瓦工中文网 » 帝国CMS高效采集秘籍:实用小技巧大公开,轻松玩转内容抓取
相关推荐
- CentOS 5下使用Yum安装配置vsFTPd FTP服务器的完整教程与详细步骤
- 如何快速硬盘安装Ubuntu 12.04:详细步骤指南及常见问题解答
- 如何配置Cloudera Manager实现Linux系统开机自动启动的详细步骤
- 如何去除Discuz!X1.5底部Powered by Discuz!版权信息
- Ubuntu系统下LAMP环境安装与配置全攻略
- 如何在phpCMS V9中去除后台登录验证码功能?
- Ubuntu 20.04/22.04 配置 SSH Server 教程:从零开始的安全远程访问设置指南
- 详解WordPress后台如何高效实现图片上传功能
- Ecshop二次开发技巧揭秘:掌握这些常见方法,轻松提升商城功能与用户体验
- 如何在PHPCMS V9后台添加文章时调用其他模型信息实现相关文章选择