本节建站教程是关于采集使用的技巧,大家可以借鉴一下:
1、过滤文章内容的链接:
广告正则:“<a [!–ad–]>”;替换“</a>”为空。
2、同上得出,过滤font之类的标签:
广告正则:“<font[!–ad–]>”;替换“</font>”为空。其他依此类推。
3、清除采集时的空白内容的数据:
“系统设置”-》“执行SQL语句”运行下面SQL语句即可:
delete from phome_ecms_news where newstext=”;
4、同一链接的页面如何二次采集:
到“管理采集节点”那清空节点即可。
帝国CMS高效采集秘籍:实用小技巧大公开,轻松玩转内容抓取
未经允许不得转载:搬瓦工中文网 » 帝国CMS高效采集秘籍:实用小技巧大公开,轻松玩转内容抓取
相关推荐
- dedecms数据恢复后系统基本参数空白问题详解及高效解决方案
- 如何高效去除DedeCMS友情链接中的LI标签
- 开启DedeCMS软件源码及分类信息采集功能详解
- 批量删除织梦DedeCMS文档搜索关键词教程:高效清理网站冗余信息指南
- dedecms后台登录成功却返回登录界面问题详解及高效解决方案
- dedecms tags页面显示错位修复技巧:一步解决标签错位问题
- 高效清理dedecms平台垃圾会员的实用技巧大全
- DedeCMS V5.7模块MVC框架深度解析与应用指南
- 如何高效使用DedeCMS:全面解析任意页面调用栏目内容标签{dede:field.content/}的技巧
- 如何在DedeCMS内容页高效调用栏目链接和名称
搬瓦工中文网






