最全的dedecms采集规则整理 最全的狗狗趣事整理

dedecms采集系统确实很不错,可以免去一些站长手工添加信息的麻烦,设置一下采集规则、采集点,然后点采集,OK,几百篇文章就搞定了!呵呵,确实很省事的!下面介绍几种常用的采集规则的过滤方法:

应用示例一:标题中空格的过滤
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤

{dede:trim} {/dede:trim}

应用示例二:来源作者中连接的过滤
在采集文章的时候,有时会碰到作者混淆时,推荐采集时指定文章作者,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

应用示例三:文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

应用示例四:过滤GG广告代码
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

下面是在综合论坛上网友的各种正则的一个全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
最全的dedecms采集规则整理 最全的狗狗趣事整理
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}

好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!

  

爱华网本文地址 » http://www.413yy.cn/a/25101018/370630.html

更多阅读

dedecms如何采集文章 dedecms采集规则

dedecms如何采集文章——简介如果要从其他站点转载文章,我们无需复制来复去,dedecms自带了文章和图片采集功能,对于不熟悉的人员来,采集规则配置起来很麻烦,常常在采集时出错,或者乱码,现在就向大家介绍dedecms的采集功能。

盘点十大搞笑的狗狗图片 高加索的视频

盘点十大搞笑的狗狗图片——简介狗狗似乎已经大部分人们生活中不可缺少的乐趣,有它们的存在更为我们生活增添了不少光彩,下面我们就来一起来看看狗狗搞笑的地方在什么地方吧。盘点十大搞笑的狗狗图片——工具/原料摄像机盘点十大搞

常见的狗狗种类 狗的品种大全

常见的狗狗种类——简介整理我们常见的狗狗的分类和主要习性常见的狗狗种类——工具/原料宠物狗常见的狗狗种类——方法/步骤常见的狗狗种类 1、常见狗狗之一:阿拉斯加,雪橇犬的一种。属于大型犬。我家养的就是这种狗。这种狗狗最大

9SiR火车头采集器教程:1 怎样写采集规则

9SiR火车头采集器教程:[1]怎样写采集规则——简介火车头采集器是一款非常不错的数据采集软件,也是互联网上最流行的采集工具,但是使用相对比较专业,很多火车头采集器新手感到无从下手,今天教新手朋友们如何快速使用火车采集数据。9SiR火

声明:《最全的dedecms采集规则整理 最全的狗狗趣事整理》为网友成为你的例外分享!如侵犯到您的合法权益请联系我们删除