过滤规则介绍

  • 基本过滤规则

最简单的过滤规则当然就是您想阻挡的横幅广告地址,但是这些地址常常会在您每次打开页面时改变。例如: http://example.com/ads/banner123.gif,其中123是一个随机数字。在这里阻挡整个图片地址是没用的,您需要创建一条更通用的过滤规则 —— 如 http://example.com/ads/banner*.gif。或者更为通用一些的,如 http://example.com/ads/*。

注:不要使用通配符来代替过多的字符。过滤规则 http://example.com/* 固然可以阻挡所有的横幅广告, 但也会阻挡 example.com 下其它一些您想看的内容。

  • 定义例外规则

有时您可能会发现某个过滤规则平时挡广告挡得很好,但在某些情况下,会阻挡一些不该挡的内容。您不想移除这条过滤规则,但也不希望它阻挡不该挡的内容。

这就是例外规则的好处——它们允许您定义过滤规则不被使用的情况。例如,您不满意过滤规则adv 阻挡了 http://example.com/advice.html,您就可以定义一条例外规则 @@advice 。例外规则和过滤规则没什么两样,您可以使用通配符或正则表达式。您只需在规则前添加 @@ 来声明这是一个例外规则。

例外规则不止可以处理这些。如果一条例外规则以 http:// 或 https://(也可以在前面加上管线符号(|))开始,这会使所有的页面都是例外。例如:如果您的规则是 @@|http://example.com 您浏览 example.com 的页面时,广告终结者 就被禁用了,这将不会阻挡任何东西。

  • 匹配网址开头/结尾

通常 广告终结者 处理过滤规则时,会自己假设在过滤规则的开头与结尾都有一个通配符,例如,过滤规则 ad 和 *ad* 是一样。 正常情况下这没什么问题,但有时您可能想要定义可以匹配以网址开头或结尾的过滤规则。例如,您想要阻挡所有的 Flash,但如果您添加过滤规则 swf 地址 http://example.com/swf/index.html 同样也将被阻挡。

这个问题的解决方法:使用管线符号(|)来表示地址的最前端或最末端。例如这条过滤规则 swf| 会阻挡 http://example.com/annoyingflash.swf 但不会阻挡 http://example.com/swf/index.html。这条过滤规则 |http://baddomain.example/ 会阻挡 http://baddomain.example/banner.gif 但不会阻挡 http://gooddomain.example/analyze?http://baddomain.example。

有时您想阻挡 http://example.com/banner.gif 以及 https://example.com/banner.gif 和 http://www.example.com/banner.gif。这时只需在过滤规则的域名前面加上两个管线符号(||):||example.com/banner.gif 将会阻挡上面的地址而不会阻挡 http://badexample.com/banner.gif 或者 http://gooddomain.example/analyze?http://example.com/banner.gif

  • 标记分隔符

通常您需要接受过滤规则的任何分隔符。例如,您可能写这样一个规则阻挡 http://example.com/ 和 http://example.com:8000/ 但不能阻挡 http://example.com.ar/。在这里,符号(^)用作一个分隔符。 http://example.com^

分隔符可以是除了字母、数字或者 _ - . % 之外的任何字符。 这个地址的结尾也是作为一个分隔符,下面的例子中所有的分隔符以红色标记出:http://example.com:8000/foo.bar?a=12&b=%D1%82%D0%B5%D1%81%D1%82。所以这个地址可以通过这些过滤规则过滤 ^example.com^ 或 ^%D1%82%D0%B5%D1%81%D1%82^ 或 ^foo.bar^ 。

  • 注释

任何以感叹号 (!) 开始的规则,都被视为注释。在过滤规则的列表中,仍然会显示这些规则,但会用灰色的字来显示,而不是黑色。广告终结者 在判断规则时,会忽略这些注释,所以我们可以写下任何我们想写的东西。您可以在一条规则上面写下这条规则是做什么用的。也可以在过滤列表的上方写上作者信息(大多数过滤列表的作者已经这样做了)。

  • 指定过滤规则选项

广告终结者 允许您指定某些选项来改变某条规则的行为。您列举这些选项的时候将它们放在美元符号 ($) 后面并用逗号 (,) 分割这些选项,放在过滤规则的最后面,例如:

*/ads/*$script,match-case

这里的 */ads/* 是真实的过滤规则 script 和 match-case 是其指定的选项。下面是目前支持的选项:

  • 类型选项:判定过滤规则(或例外规则)过滤元素的类型。过滤规则可以指定多个类型选项来过滤指定的元素类型。可以指定的类型包括:

    • script —— 外部脚本,由 HTML script 标签加载

    • image —— 正常图片,通常由 HTML 的 img 标签所载入

    • stylesheet —— 外部 CSS 样式文件

    • object —— 由浏览器插件处理的内容,例如 Flash 或 Java

    • xmlhttprequest —— XMLHttpRequest 对象

    • object-subrequest —— 插件的请求,比如Flash

    • subdocument —— 内嵌的页面,通常通过 HTML 的框架方式内嵌

    • document —— 网页本身(只适用于 例外规则 )

    • elemhide —— 只适用于例外规则,类似于document 但是只禁用页面上的隐藏规则而不是所有规则

    • other —— 其他不在上面的类型的请求

  • 反转类型选项:指定过滤规则不应用的元素类型。可以指定的类型选项: ~script, ~image, ~stylesheet, ~object, ~xmlhttprequest, ~object-subrequest, ~subdocument, ~document, ~elemhide, ~other

  • third-party/first-party 请求限制:如果指定了 third-party 选项, 则过滤规则只适用于来源与当前正在浏览的页面的不同的请求。类似地,~third-party 适用于来源与当前浏览页面相同的请求。

  • 域名限定:选项 domain=example.com 指过滤规则只适用于 "example.com"下的页面。多个域名可以用 "|" 分隔: 过滤规则 domain=example.com|example.net 将只适用于 "example.com" 或 "example.net"的页面。如果一个域名是前面有"~",则该过滤规则不适用于这个域名的页面。例如:domain=~example.com 指过滤规则适用于除了 example.com之外的任何域名的页面而domain=example.com|~foo.example.com 限定了过滤规则适用于 "example.com" 但不包括 "foo.example.com" 。

  • match-case —— 使过滤规则只适用于匹配地址,例如:过滤规则 */BannerAd.gif$match-case会阻挡 http://example.com/BannerAd.gif 但不会阻挡 http://example.com/bannerad.gif。

  • collapse — 这个选项将覆盖全局"隐藏已屏蔽元素的占位符"选项,并确保过滤规则总是隐藏这些元素。类似地,~collapse 选项将确保过滤规则不隐藏这些元素。

  • donottrack —— 对有该选项的阻挡规则匹配到且有该选项的例外规则未匹配到的地址会发送一个 Do-Not-Track 头

  • 使用正则表达式

如果您想更好地控制您的过滤规则,什么匹配,什么不匹配,您可以使用正则表达式。例如过滤规则 /banner\d+/ 会匹配 banner123 和 banner321 而不会匹配banners。您可以查看正则表达式的文档来学习如何写正则表达式。

元素隐藏

  • 基本规则

有时您可能会发现无法阻挡某些内嵌在网页中的文字广告。如果查看源码的话,可能发现类似这样的代码:


  Cheapest tofu, only here and now!
  Really cheap tofu, click here!