本节建站教程是关于采集使用的技巧,大家可以借鉴一下:
1、过滤文章内容的链接:
广告正则:“<a [!–ad–]>”;替换“</a>”为空。
2、同上得出,过滤font之类的标签:
广告正则:“<font[!–ad–]>”;替换“</font>”为空。其他依此类推。
3、清除采集时的空白内容的数据:
“系统设置”-》“执行SQL语句”运行下面SQL语句即可:
delete from phome_ecms_news where newstext=”;
4、同一链接的页面如何二次采集:
到“管理采集节点”那清空节点即可。
帝国CMS高效采集秘籍:实用小技巧大公开,轻松玩转内容抓取
未经允许不得转载:搬瓦工中文网 » 帝国CMS高效采集秘籍:实用小技巧大公开,轻松玩转内容抓取
相关推荐
- 如何解决WordPress 3.7更新后DB-Cache插件冲突
- 如何在DedeCMS中使用键盘方向键轻松实现上一篇与下一篇内容翻页功能
- 如何在DedeCMS 5.1-5.7版本中快速调用首页专题模块
- WordPress 导航设置详细教程 轻松打造高效网站导航
- 如何在DedeCMS中实现文章列表每5行自动添加横线
- 如何在WordPress中集成新浪天气插件以打造个性化侧边栏天气预报
- WordPress图片上传不生成缩略图问题详解及快速解决方案
- 深入了解WordPress数据库结构:各表功能解析与应用技巧
- 如何使用DedeCMS实现Tag标签随机颜色和字体大小
- 如何有效防范WordPress主题植入后门代码以窃取管理员权限
搬瓦工中文网







