一个页面标题和过滤输出的解决方案

首先要提到一个东西:Response.Filter,这个filter可以让你捕到最后的html输出,之后,就是对输出的html进行文本替换的问题了,当然了,为了能获得每次请求的输出,这里请出了Global.asax,在Global.asax的Application_BeginRequest事件里截取html,事件代码很简单,就一行代码如下:

protected void Application_BeginRequest(object sender, EventArgs e)
        {
            HttpContext.Current.Response.Filter = new HttpResponseFilter(HttpContext.Current.Response.Filter,new ReplaceTextList());
        }

从以上的一行代码里看出,多了一个自定义的HttpResponseFilter类,这类主要实现的功能是,从原来的Filter接收后,然后替换文本,最后又返回一个Filter,由于Response.Filter 是一个Stream类,所以新的类HttpResponseFilter继承自Stream,然后复写Write方法,所有的文本替换都在这Write方法里处理了。

方法代码主要表现为如下:

public override void Write(byte[] buffer, int offset, int count)
        {
            //读出写的文字

            byte[] data = new byte[count];

            Buffer.BlockCopy(buffer, offset, data, 0, count);

            string inputText = Encoding.UTF8.GetString(data);

            //开始替换
            if (replaceTextList != null && replaceTextList.Count > 0)
            {
                foreach (KeyValuePair values in replaceTextList)
                {
                    inputText = Regex.Replace(inputText, values.Key, values.Value, RegexOptions.Singleline);
                }
                replaceTextList.Clear();
            }
            replaceTextList = null;

            //将替换后的写入response
            byte[] newdata = Encoding.UTF8.GetBytes(inputText);
            filterStream.Write(newdata, 0, newdata.Length);
        }

看说明就知道分三步走:读取原来的,然后替换,最后写回去,当然了,要注意你的网站编码是UTF8还是GB2312,简单改一下,这里的重点是,我扩展了替换那一块,我用了一个Dictionary,然后循环替换,当然支持正则,所以替换的原始文字和替换后的文字就对应上两个string上了,为了可扩展与方便大伙,我定义了一个抽象类,先实现了三个正则用于截取标题,说明,和关键字,如果还要过滤其它文本.....

上面说到:为了可扩展与方便大伙,我定义了一个抽象类,先实现了三个正则用于截取标题,说明,和关键字。

这里抽象类代码如下:

public abstract class ReplaceTextListBase
    {
        ///
        /// 将被返回的替换文本集合列表
        ///
        public Dictionary replaceTextList = new Dictionary();
        ///
        /// 获取当前请求页面的url信息
        ///
        public Uri PageUrl { get { return HttpContext.Current.Request.Url; } }
        ///
        /// 获取html的title的正则
        ///
        public string TitleRegex { get { return ".*"; } }
        public string TitleFormat(string titleText)
        {
            return "";
        }
        ///
        /// 获取html的Description的正则
        ///
        public string DescriptionRegex { get { return "]+name=[\"\']description[^<>]*[/]>"; } }
        public string DescriptionFormat(string descriptionText)
        {
            return "";
        }
        ///
        /// 获取html的Keyword的正则
        ///
        public string KeywordRegex { get { return "]+name=[\"\']keywords[^<>]*[/]>"; } }
        public string KeywordFormat(string keywordText)
        {

;        return "";
        }
        ///
        /// 复写此方法,调用replaceTextList.add()方法后,return replaceTextList;
        ///
        ///
        public virtual Dictionary GetReplaceTextList()
        {
            return replaceTextList;
        }
    }

 

看完这抽象类后,发现一个虚方法GetReplaceTextList(), 重点就在了

现在看一下我的实例中的子类的实现

public class ReplaceTextList:ReplaceTextListBase
    {
        public override System.Collections.Generic.Dictionary GetReplaceTextList()
        {
            replaceTextList.Add(TitleRegex,TitleFormat("TitleRegex"));
            replaceTextList.Add(DescriptionRegex,DescriptionFormat("descriptionttest"));
            replaceTextList.Add(KeywordRegex,KeywordFormat("keywordadfdfdf"));
            return replaceTextList;
        }
    }

这个例子中的子类实现很简单,就复写了一个虚方法,然后最终页面的输出就是标题为:

 

 

TitleRegex,其它两个一看就知了,当然还有如果要替换其它或过滤文件,只要写多几个add方法把要替换的文字给替换掉就行了,替换的文字可以结合数据库.

其实,只是我例子上的简单,直接就定死了标题为TitleRegex

所以,其实在这里才是真正给用户自己扩展的地方

看到我的抽象类里留下了一个PageUrl吧,其实这里就是重点了,如何根据Url查出Title和description和keyword,这就是用户自己的实现的了

当然这里可以给出一些思路:

1.建数据库表,然后对url主机头进行分类管理,自己定义替换字符等

其实就一查询,接下来自己爱怎么弄就怎么弄了。。。。

你可能感兴趣的:(解决方案)