DedeCMS采集教程:过滤替换的技巧

softyun3年前cms教程62


DedeCMS采集教程:过滤替换的技巧
根据我个人织梦dedecms采集过程总结了一些经验,写出来供大家参考。
1.采集去除链接

[Copy to clipboard]CODE: 
 
{dede:trim}]*)>([^<]*){/dede:trim} 
 
-------------------------------- 
 
让field:title 标题突破30这个长度,修改代码的方法 
 
找到./include/inc_arcpart_view.php 
 
行291 : 
 
if($titlelen=="") $titlelen = 30; 
 
修改为 
 
if($titlelen=="") $titlelen = 60; 
 
就可以了,然后,你可以这样调用了 
 
{dede:channelArtlist typeid='0' col=1 tablewidth='100%'} 
 
{dede:arclist row="10"} 
 
[field:title function="cn_substr('@me',38)" /] 
 
{/dede:arclist} 
 
{/dede:channelArtlist} 
 
把这个延伸一下:关于inc_arcpart_view.php 
 
function GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160, 
 
$imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword="", 
 
$innertext="",$tablewidth="100",$arcid=0,$idlist="") 
这里的参数都可以更改你实际需要的模板元素尺寸大小.

2. 采集过虑中去掉链接保留文字的方法!

柏老大的方法是{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}

这样做会去掉<a hf.......>与</a>之间的字符!这样整个文章就少了部分字符,不完整了!

后来我多次测试,总算找到了正确的使用方法!如下:

{dede:trim}<a([^>]*)>{/dede:trim} 
 
{dede:trim}</a>{/dede:trim} 
 
做成两条采集规则就可以了! 
 
在实际使用中好像([^<]*)([^>]*)两条一起使用才行! 
3. 过滤div

{dede:trim}]*)>{/dede:trim} 
 
{dede:trim} 
 
{/dede:trim} 
 
过滤js 
 
{dede:trim}]*)>([^<]*){/dede:trim} 
 
过滤未知变量字符 
 
固定(.*)固定 
4.dede万能过滤代码

以下是常用的正则表达式标签

{dede:trim}<tbody(.*)>{/dede:trim} 
 
{dede:trim}</tbody>{/dede:trim} 
 
{dede:trim}<table(.*)>{/dede:trim} 
 
{dede:trim}</table>{/dede:trim} 
 
{dede:trim}<tr(.*)>{/dede:trim} 
 
{dede:trim}</tr>{/dede:trim} 
 
{dede:trim}<td(.*)>{/dede:trim} 
 
{dede:trim}</td>{/dede:trim} 
 
{dede:trim}<font(.*)>{/dede:trim} 
 
{dede:trim}</font>{/dede:trim} 
 
{dede:trim}<a(.*)>{/dede:trim} 
 
{dede:trim}</a>{/dede:trim} 
 
{dede:trim}<param(.*)>{/dede:trim} 
 
{dede:trim}<embed(.*)</embed>{/dede:trim} 
 
{dede:trim}<object(.*)</object>{/dede:trim} 
 
{dede:trim}<iframe(.*)</iframe>{/dede:trim} 
 
{dede:trim}<form(.*)</form>{/dede:trim} 
 
{dede:trim}<input(.*)>{/dede:trim} 
 
{dede:trim}<script(.*)</script>{/dede:trim} 
 
{dede:trim}<style(.*)</style>{/dede:trim} 
 
{dede:trim}<!--(.*)-->{/dede:trim} 
 
以下为不常用的正则表达式标签 
 
{dede:trim}<div(.*)>{/dede:trim} 
 
{dede:trim}</div>{/dede:trim} 
 
{dede:trim}<center(.*)>{/dede:trim} 
 
{dede:trim}</center>{/dede:trim} 
 
{dede:trim}<p(.*)>{/dede:trim} 
 
{dede:trim}</p>{/dede:trim} 
 
{dede:trim}<span(.*)>{dede:trim} 
 
{dede:trim}</span>{dede:trim} 
 
{dede:trim}<img(.*)>{/dede:trim} 
以上内容仅供大家学习参考,希望对你有所帮助。

免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。

相关文章

织梦dedecms增加英文栏目名称

在做外贸SEO优化的时候,有时候因为网站功能需求,经常会用到中文站和英文站。这里有一个栏目添加英文名称的方法,下面和大家分享一下。1.数据库新增加字段 typenameen       这里说的字段不...

【Channel 标记使用实例】-DedeCMS模板制作使用实例教程(3)

 【Channel 标记】主要用于获取栏目列表,用法非常简单,主要是区分“type = top,sun/son,self ”的所调用的对象就行了。  说明:为了便于下面内容的理解,我将数据库中网站频道...

如何利用二行代码解决全部网页木马(含iframe/script木马)

相信大多数朋友都是iframe木马的受害者,有朋友的网站被注入了N回iframe,心情可想而知。而且现在ARP攻击,注入iframe也是轻而易举的事,仅局域网里都时刻面临威胁,哎,什么世道。在阅读本文...

PhpCms系统设置:我的面板

一、常用操作 位置:我的面板----常用操作我的面板,是为了管理员更方便、快捷的管理网站,把一些常用的菜单添加到“常用操作”,“个人信息”是对于自己信息的修改“常用操作”,是放置我们经常操作的菜单按钮...

FCK编辑器,弹出'未知工具栏项目'的解决方法

 在Google Chrom内核的浏览器下,编辑内容的时候总是提示 未知工具栏项目 XX.然后新增加的FCK编辑器插件无法使用,但是在IE下没有这个问题.找遍整个网络没找到解决方法,自己研究半天,总算...

dedecms后台(反应特别慢)点击就卡住的最终解决方法

dedecms后台 反应特别慢点击就卡住的最终解决方法织梦dedecms后台 反应慢菜单不显示,dede后台系统首页打开慢故障可能好多朋友都遇到过。在网上搜索没有找到相关的解决方法。经过排查发现问题出...