haha_yong

SpamAssassin配置指南

Mail::SpamAssassin::Conf - SpamAssassin配置指南

中国反垃圾邮件联盟王兴宇译

2007/11/27

名称
修订与译者注
格式
描述
文件格式
使用者参考
- 评分选项
- 白名单和黑名单选项
- 基本消息标记选项
- 语言选项
- 网络测试选项
- 学习选项
- 其它选项
规则定义与特权设置
管理员设置
预处理选项
模板标记
- 正常字串/垃圾字串标记格式
本地化
参见

名称

Mail::SpamAssassin::Conf - SpamAssassin 配置指南

英文版原地址－

http://spamassassin.apache.org/full/3.2.x/doc/Mail_SpamAssassin_Conf.html

修订与译者注

2004/11/13 第一次发布，适用于 SpamAssassin 3.0.x 版本
2007/11/5 更新至 SpamAssassin 3.2.x 版本，并修改了大量用语

中文版翻译－中国反垃圾邮件联盟 (http://anti-spam.org.cn) 王兴宇

如果译文中有任何错误，欢迎给我发邮件指出，不胜感激。如果希望讨论 SpamAssassin 的相关内容，请到中国反垃圾邮件联盟论坛的 SpamAssassin 版讨论。

译文版本－ 2.0 (最后更新日期：2007/11/27)

名词注释：

邮件服务器和中继服务器

邮件服务器，即 MX （Mail Exchange），是域或主机的 MX 记录所指向的主机，从功能上来说，邮件服务器（MX）是指接收从其它使用 SMTP 协议发过来邮件的主机。
中继服务器，即 Relay，是指用来从上游接收邮件，然后将其发送到下游的主机。

通常，邮件服务器（MX）和中继服务器是同一个主机，并使用同一个 IP 地址，但是经常也会有分别处于不同主机和 IP 的情况。

本文中，个别情况下，邮件服务器也统称这两种情况，请依据上下文语义判断。

正常邮件和垃圾邮件

正常邮件，即 ham ，是指被认定为非垃圾邮件的电子邮件。
垃圾邮件，即 spam ，是指被认定为垃圾邮件的电子邮件。

格式

  # 注释文本

  rewrite_header Subject          *****SPAM*****

  full PARA_A_2_C_OF_1618         /Paragraph .a.{0,10}2.{0,10}C. of S. 1618/i
  describe PARA_A_2_C_OF_1618     Claims compliance with senate bill 1618（根据上议院第1618号法令）

  header FROM_HAS_MIXED_NUMS      From =~ /\d+[a-z]+\d+\S*@/i
  describe FROM_HAS_MIXED_NUMS    From: contains numbers mixed in with letters（From: 信头中混和了数字）

  score A_HREF_TO_REMOVE          2.0

  lang es describe FROM_FORGED_HOTMAIL Forzado From: simula ser de hotmail.com（西班牙语：“信件假称其来自Hotmail.com”）

  lang pt_BR report O programa detetor de Spam ZOE [...] ( 波兰语: 检测到了垃圾邮件)

描述

SpamAssassin 使用传统的UNIX风格的配置文件，并从 /usr/share/spamassassin 和 /etc/mail/spamassassin 目录中读取这些配置文件。

以下地址列出了 SpamAssassin 配置中最重要的选项，建议初次使用者首先阅读：

  http://wiki.apache.org/spamassassin/ImportantInitialConfigItems

文件格式

以 # 开始的一行是注释。 注意：如果 # 字符用于规则或配置选项中，必须使用斜线转义，即：\#

文件中的空白字符是无所谓的，但是最好不要放在行首，因为将来可能使用行首空白来表示续行。

不过在当前，每个规则或配置必须放在一行，多行仍然不被支持。

文件和目录的路径中能使用 ~ 字符来表示用户的主目录，但是不支持其它的 shell 风格的路径扩展，如通配符或 ~user/。

以下在适当的情况下，默认值会被列在括号中。

使用者参考

以下选项能被用于站点级配置（local.cf）和用户级配置（user_prefs）中，通过它们可以定制 SpamAssassin 处理进入的邮件的方式。

评分选项

required_score n.nn (默认值： 5): 设定一个邮件被判定为垃圾邮件的分数线。 n.nn 可以是整数或者实数。默认值为5.0，这是很严厉的设置了，它适用于单个用户使用；但是对于应用于整个服务器，应该设置得更保守一些（更高一些），比如设置为8.0或10.0等等。通常不推荐设置为自动删除或丢弃那些被判定为垃圾邮件的邮件，否则可能招致用户的强烈抗议；除非评分特别的高，比如15.0或者更高，才可以考虑直接删除。这个选项以前称之为 required_hits ，现在虽然还可以用，但是不推荐使用旧的名称。
score 测试规则名 n.nn [ n.nn n.nn n.nn ]: 指定一个测试规则的评分（命中后的评分）。评分可以是正的或者负的整数或实数。 测试规则名是一个测试规则的名称，如： FROM_ENDS_IN_NUMS 。
: 如果只列出了一个评分，那么测试后总是返回该评分。; 如果列出了4个评分，那么 SpamAssassin 在不同的使用情况下返回不同的评分。第一个评分用于贝叶斯测试和网络测试都被取消的情况下（0号评分集）；第二个评分用于贝叶斯测试被取消，但使用网络测试的情况下（1号评分集）；第三个评分用于使用贝叶斯测试，但网络测试被取消的情况下（2号评分集）；第四个评分用于贝叶斯测试和网络测试都使用的情况下（3号评分集）。; 设置一个测试规则的评分为0会取消该规则的测试。; 如果评分使用括号“()”括起来，那么该行所有其后的评分都被增加同等的比例。例如，“(3)”表示在所有的评分集中提高该评分3点。“(3) (0) (3) (0)”表示只提高0号和2号评分集3点评分。; 如果一个测试规则没有给定评分，它将会被指定一个默认评分1.0；除非是以“T_”开头的测试规则（用于指出该测试规则还在试验中），它会被指定为评分0.01。; 注意，以“__”开头的测试规则名是一个间接规则，它被用于组成元匹配规则和作为其它规则的前置测试，这些规则不会被计算评分也不会列在“命中的测试”报告中。注意，虽然间接规则的评分不会被计算，但是设置间接规则的评分为0会取消该规则的测试。

白名单和黑名单选项

whitelist_from 邮件地址

它用于指定通常被误判为发送的垃圾邮件的发信地址。

并不推荐使用这个选项，垃圾邮件或钓鱼邮件的发送者非常简单的就可以制造一些让它盲目信任的邮件。推荐的解决方法是使用 whitelist_auth 或其它认证的白名单方式替代，或使用 whitelist_from_rcvd。

白名单和黑名单都可以使用通配符。如 [email protected] 、 *@isp.com 或 *.domain.net 都是可以的。需要注意的是只支持 * 和 ? （匹配单个字符），但是不支持其他的元字符匹配。由于一些安全的原因，这里也不支持正则表达式。

可以在一行中使用空格分隔开写入多个邮件地址，也可以使用多个 whitelist_from 行来指定。

信头的白名单检查按照如下顺序：如果信头设置了 Resent-From 地址，那么就检查它；否则检查来自下列信头的全部地址：

        Envelope-Sender
        Resent-Sender
        X-Envelope-From
        From

此外，如果SMTP通讯中的信封信息可用的话，那么“信封发件人（envelope sender）”也会被检查。参见 envelope_sender_header 。

范例：

  whitelist_from [email protected] [email protected]
  whitelist_from *@example.com

unwhitelist_from 邮件地址

它用于覆盖一个默认的 whitelist_from 选项。举例说，在 local.cf 中指定了一个站点级通用的白名单地址 whitelist_from ，用户可以在他的 user_prefs 中可以使用这个选项来覆盖那个通用的白名单地址选项。这个选项所匹配的邮件地址也必须同样被前面的 whitelist_from 选项所匹配。

范例：

  unwhitelist_from [email protected] [email protected]
  unwhitelist_from *@example.com

whitelist_from_rcvd 邮件列表地址中继服务器的反向解析名

它是对 whitelist_from 的补充，用来对“Received”信头进行检查。第一个参数是一个白名单的地址，第二个参数用于匹配该邮件的中继服务器的反向DNS解析名称。

第二个参数用于在邮件从互联网发送到你的内部网的邮件服务器（MX）时进行的反向DNS查询匹配。它可以是一个完全限定的主机名或主机名的域部分，换言之，如果连接到你的邮件服务器（MX）的主机的IP可以被反向解析为“sendinghost.spamassassin.org”，那么你可以写为 sendinghost.spamassassin.org 或 spamassassin.org 。

注意，这需要你的 internal_networks 被正确配置。简言之，除非在一个复杂的网络里，设置这个参数可以得到不错的效果。

同时，也要求你的邮件服务器（MX）可以对连接进来的服务器的IP地址进行反向查询，且将查询结果记录在“Recevied”信头中。

范例：

  whitelist_from_rcvd [email protected]  example.com
  whitelist_from_rcvd *@axkit.org      sergeant.org

def_whitelist_from_rcvd 邮件列表地址中继服务器的反向解析名

类似于 whitelist_from_rcvd，但是它用于在 SpamAssassin 发行包中指定默认白名单。这个白名单的评分较低，它常常是垃圾邮件发送者假称的地址。

whitelist_allows_relays 邮件地址

指定 whitelist_from_rcvd 中的哪些邮件地址可以不使用 white_from_rcvd 中对应的邮件中继发信，而使用其它的中继服务器发信。默认情况下，发信地址在 white_from_rcvd 中，但是中继服务器却不是列出的那个，这种情形会触发一个测试伪造的规则。将该地址放入到 white_allows_relay 中防止触发。

白名单和黑名单都可以使用通配符。如 [email protected] ， *@isp.com ，或 *.domain.net 都是可以的。需要注意的是只支持 * 和 ? （匹配单个字符），不支持其他的元字符匹配。由于安全的原因，这里不支持正则表达式。

可以在一行中使用空格分隔写入多个邮件地址，也可以使用多个 whitelist_allows_relays 行来指定。

这里列出的邮件地址不必被前面的 whitelist_from_rcvd 所完全匹配，它只需要匹配信头中的地址就行。

范例：

  whitelist_allows_relays [email protected] [email protected]
  whitelist_allows_relays *@example.com

unwhitelist_from_rcvd 邮件地址

它用于覆盖 whitelist_from_rcvd 选项。举例说， SpamAssassin 发行包中的默认 whitelist_from_rcvd 能够被 local.cf 中的这个选项覆盖，或者用户也可以在他的 user_prefs 中使用这个选项来覆盖 whitelist_from_rcvd 。

所匹配的地址也必须同样被前面的 whitelist_from_rcvd 选项所匹配。

范例：

  unwhitelist_from_rcvd [email protected] [email protected]
  unwhitelist_from_rcvd *@axkit.org

blacklist_from 邮件地址

它用于指定那些通常被漏判为正常邮件的垃圾邮件发送地址。格式与 whitelist_from 相同。

unblacklist_from 邮件地址

它用于覆盖 blacklist_from 选项。举例说， SpamAssassin 发行包中的默认 blacklist_from 能够被 local.cf 中的这个选项覆盖，或者用户也可以在他的 user_prefs 中使用这个选项来覆盖 blacklist_from 。

所匹配的地址也必须同样被前面的 blacklist_from 选项所匹配。

范例：

  unblacklist_from [email protected] [email protected]
  unblacklist_from *@spammer.com

whitelist_to 邮件地址

如果给定的地址出现在信头中的收信人那里（Resent-To, To, Cc, 明显的信封收件人等），邮件将作为正常邮件处理。它常用于整个站点使用了 SpamAssassin 但是某些用户不希望他们的任何邮件被过滤。与 whitelist_from 的格式相同。

有三个级别的接收白名单： whitelist_to 、 more_spam_to 和 all_spam_to 。在第一个接收白名单中的用户仍然可能会被过滤一些垃圾邮件，但是在 all_spam_to 的用户不会被过滤任何垃圾邮件。

白名单信头检查将按照如下顺序，如果设置了 Resent-To 或 Resent-Cc 就使用它们；否则检查来自下列信头中的全部地址：

        To
        Cc
        Apparently-To
        Delivered-To
        Envelope-Recipients
        Apparently-Resent-To
        X-Envelope-To
        Envelope-To
        X-Delivered-To
        X-Original-To
        X-Rcpt-To
        X-Real-To

more_spam_to 邮件地址

参见上面。

all_spam_to 邮件地址

参见上面。

blacklist_to 邮件地址

如果给定的地址出现在信头的收件人中（Resent-To, To, Cc, 明显的信封收件人等），邮件将被作为垃圾邮件处理。 与 blacklist_from 的格式相同。

whitelist_auth 邮件地址

它用于指定通常被误判为发送的垃圾邮件的发信地址。与 whitelist_from 和 whitelist_from_rcvd 不同的是，在监测白名单前会首先会检查邮件是否是授权的发信人。

授权检查是通过安装的发信人授权检查模块之一进行的： SPF （使用 Mail::SpamAssassin::Plugins::SPF）、 Domain Keys （使用 Mail::SpamAssassin::Plugins::DomainKeys）或 DKIM （使用 Mail::SpamAssassin::Plugins::DKIM）。注意，使用这个选项前这些插件必须激活并可以正常工作。

使用 whitelist_auth 基本上等同于使用 whitelist_from_spf 、 whitelist_from_dk 和 whitelist_from_dkim 来指定每个发信地址。

范例：

  whitelist_auth [email protected] [email protected]
  whitelist_auth *@example.com

def_whitelist_auth 邮件地址

类似于 whitelist_auth ，但是它用于在 SpamAssassin 发行包中指定默认白名单。这个白名单的评分较低，它常常是垃圾邮件发送者假称的地址。

unwhitelist_auth 邮件地址

用于覆盖 whitelist_auth 项。所匹配的地址也必须同样被前面的 whitelist_auth 选项所匹配。

范例：

  unwhitelist_auth [email protected] [email protected]
  unwhitelist_auth *@example.com

基本消息标记选项

rewrite_header { subject | from | to } 标记字符串

默认情况下，SpamAssassin 不会对那些被判定为垃圾邮件的信件主题、发信人和收信人等信息进行修改，以标识其是垃圾邮件。如果设置了这个选项，信件主题、发信人和收信人会被加上特定的字符串来表明该邮件是垃圾邮件。对于发信人和收信人的修改是在地址后面增加一个括在括号里面的RFC 2822格式的注释；对于信件主题的修改则是在原先的主题前添加。注意，在 report_safe 设置为0时，你只能使用 _REQD_ 和 _SCORE_ 标记来重写信件主题，否则你也许不能通过正常的方式去掉 SpamAssassin 的标记。关于标记的更多信息可以参见下面的 模板标记部分。

在重写发信人和收信人时，字符串不能包含圆括号（会被转换为方括号）。

如果使用 rewrite_header subject ，但是被重写的邮件没有包含 Subject 信头，会自动添加一个 Subject 信头。

如果标记字符串指定为空，任何已有的重写将从信头里去掉。

add_header { spam | ham | all } 信头名字符串

可以对各种类型的信件（垃圾邮件、正常邮件和全部邮件）增加 SpamAssassin 的定制信头。所有的定制信头都会以 X-Spam- 开始（如信头 Foo 将显示为 X-Spam-Foo ）。信头只能使用下列字符：所有的大小写英文字符、所有的数字和下划线及中划线。([A-Za-z0-9_-])。

字符串中可以包含下面描述的模板标记。如果需要的话，还可以使用\n和\t来增加回车符和制表符。使用\\来表示一个反斜线字符。其它的转义字符无效，只被简单的去掉反斜线。

如果 fold_headers 被设置为1，所有的信头会被折叠起来（即通过行首空格进行续行，以避免较长的行）。但是注意，通过\n手工换行的信头将不会被自动折叠（即可能会出现很长的信头），即使这个信头需要折叠起来。

你能够通过 add_header 来定制已有的信头（仅指定要修改的信件子集）。

清除全部的定制信头请参见 clear_headers 。

以下是一些例子（这些是默认增加的，注意 Checker-Version 不能修改或删除）：

  add_header spam Flag _YESNOCAPS_
  add_header all Status _YESNO_, score=_SCORE_ required=_REQD_ tests=_TESTS_ autolearn=_AUTOLEARN_ version=_VERSION_
  add_header all Level _STARS(*)_
  add_header all Checker-Version SpamAssassin _VERSION_ (_SUBVERSION_) on _HOSTNAME_

remove_header { spam | ham | all } 信头名

可以删除各种类型的信件（垃圾邮件、正常邮件和全部邮件）中的 SpamAssassin 的定制信头，这些信头是以 X-Spam- 开头的（所以这里指定信头名时应该前缀以 X-Spam- ）。

清除全部的定制信头请参见 clear_headers 。

注意， X-Spam-Checker-Version 信头是不能删除的，因为邮件管理员和开发人员需要使用它来诊断问题。如果没有这个信头，甚至都不知道 SpamAssassin 是否在运行。

clear_headers

清空全部的 SpamAssassin 定制信头。你可以在任何的 add_header 前使用这个，以防止默认的 SpamAssassin 信头被添加到信头中。

注意， X-Spam-Checker-Version 信头是不能被删除的，因为邮件管理员和开发人员需要使用它来诊断问题。如果没有这个信头，甚至都不知道 SpamAssassin 是否运行。

report_safe ( 0 | 1 | 2 ) (默认值： 1)

如果这个选项被设置为1，当收到的信件被判定为垃圾邮件时，不修改原信件，而是创建一个新的报告信件，并且将原信件作为一个RFC 822格式的附件附上（确保原信件保持原样，不直接打开，且容易恢复）。

如果这个选项被设置为2，原信件以文本方式附加到报告信件中。之所以采用这个选项是由于安全的原因，某些不完善的邮件客户端会在用户没有要求的情况下自动的载入附件，这可能会带来一些安全问题。这个选项也许会导致附加的信件和原信件保存出来或看起来并不太一样。

如果这个选项设置为0，收到的垃圾邮件只在信头中增加一些 X-Spam- 信头而不修改信体。此外， X-Spam-Report 信头会被增加到垃圾邮件中，你可以设置 report_safe 为0后使用 remove_header 来去掉这些 SpamAssassin 的定制信头。

如果你要复制原信件的信头到被判定的邮件中，参见 report_safe_copy_headers 。

语言选项

ok_locales xx [ yy zz ... ] (默认值： all)

这个选项指定了那些地区性（国家代码）的邮件被认为是正常邮件。使用这些国家的 语言字符集的邮件不会被标记为外文垃圾邮件。

如果你收到了很多外文的垃圾邮件，而且绝不会收到用这种语言写的正常邮件，这个选项也许会有帮助。注意，所有的ISO-8859-*字符集和Windows代码页字符集默认总是允许的。

设置为all可以允许所有的字符集。这是默认值。

这个选项的设置决定了规则 CHARSET_FARAWAY、 CHARSET_FARAWAY_BODY 和 CHARSET_FARAWAY_HEADERS 的触发条件。

范例：

  ok_locales all         (允许全部地s)
  ok_locales en          (仅允许英文)
  ok_locales en ja zh    (仅允许英文、中文和日文)

注意，如果指定了多个 ok_locales 行则只有最后一个有效。

可用的地区如下：

en - 西方通用字符集
ja - 日语字符串
ko - 韩语字符集
ru - 斯拉夫与字符集
th - 泰语字符集
zh - 中文（包括简体和繁体）字符集

normalize_charset ( 0 | 1) (默认值： 0)

是否检测字符集并转换邮件内容为 Unicode。需要有 Encode::Detect 模块、 HTML::Parser 3.46 及其以上版本，且 Perl 5.8.5 及其以上版本。

网络测试选项

trusted_networks 网络地址[/掩码] ... (默认值：无)

这个选项设置可信任的网络或主机（可信网络或可信主机）。 可信任是指这些网络上的中继服务器确信不会被垃圾邮件发送者所操纵、也不会是开放转发（open relay）和开放代理（open proxy）。一个可信主机能够毫无顾忌的转发垃圾邮件而不会被识别，甚至不需要伪造信头。SpamAssassin 甚至也不会在 DNS黑名单中查询可信网络中的主机。

参见 http://wiki.apache.org/spamassassin/TrustPath 获取更多信息。

在你的域中的邮件服务器和内部中继服务器应使用 internal_networks 指定。当有除了你的邮件服务器和内部中继服务器外的可信主机时，应该仅在 trusted_networks 指定它们。

如果指定了一个 / 及其后的掩码，这是一个CIDR风格的网络地址；如果没有指定掩码，但是有少于4个的IP地址单元并后缀以一个点的话，它是指所有前面的IP地址单元相同的网络地址；如果没有指定掩码也没有后缀的点，它是指一个单一IP地址，就像指定了/32掩码一样。

如果在网络或主机地址前前缀 ! ,表示该地址被排除（或包括）在第一个匹配中。

注意：与你的配置无关，127/8 总是包括在可信网络中。

范例：

   trusted_networks 192.168/16            # 全部的 192.168.*.*
   trusted_networks 212.17.35.15          # 仅指该地址
   trusted_networks !10.0.1.5 10.0.1/24   # 全部的 10.0.1.*，但是除了 10.0.1.5

trusted_networks 的定义是叠加的，多个选项指定的可信网络都会作为可信网络。可以使用 clear_trusted_networks 清除前面定义的可信网络。

如果没有设置这个选项，但是设置了 internal_networks ，那么 internal_networks 的值将作为这个选项的默认值。

如果既没有配置 trusted_networks ，也没有配置 internal_networks ，SpamAssassin 会自行分析判断，流程如下：

如果“from”主机位于私有保留网段（RFC 1918），那么它是可信的
如果在 received 信头中有认证串，且前一个主机是可信任的，那么这个主机也是可信任的。
否则，这个主机及其之后的主机都被认为是不可信任的。

clear_trusted_networks

清空前面定义的可信网络列表。

internal_networks 网络地址[/掩码] ... (默认值：无)

这个选项设置内部网络或主机。内部是指在该网络的中继服务器是你的域中的邮件服务器或内部中继服务器。它的格式同上面的 trusted_networks 一样。

该选项用于在检查拨号或动态IP地址黑名单时，用来检测“单跳发送（direct-to-MX）”的垃圾邮件。

可信任的中继服务器会直接从拨号连接接受邮件而不需要它们列在 internal_networks 中，它们只需列在 trusted_networks 中。

如果设置了 trusted_networks 而没有设置 internal_networks，那么 trusted_networks 的值将作为这个选项的默认值。

如果既没有指定 trusted_networks 也没有指定 internal_networks ，即没有本地地址。换言之，任何连接到运行 SpamAssassin 的主机的主机都被认为是外部的。

internal_networks 中的地址都会出现在 trusted_networks 中，换言之， internal_networks 总是可信主机的一个子集。

注意：与你的配置无关，127/8 总是包括在可信网络中。

clear_internal_networks

清空前面定义的内部网络列表。

msa_networks 网络地址[/掩码] ... (默认值: 无)

这个选项设置 MSA 网络或主机。 MSA 指位于这些网络的中继服务器会接受来自认证用户的邮件。这些中继服务器不会接受认证未通过的主机的邮件。认证方式如 IP 地址列表、SMTP 发信认证和POP-before-SMTP等。

所有邮件信头中列在 MSA 之后的中继服务器都将同 MSA 一样被看做 trusted_networks 和 internal_networks 中定义的可信网络和内部网络。

举例说，如果 MSA 是可信的和内部的，那么之前的所有中继服务器也应该都是可信的和内部的。

当用 msa_networks 来标识一个 MSA 时，建议也将其放入到可信网络和内部网络中。当一个 MSA 没有被包括在 msa_networks 中时，你应该将其放入可信网络而不是内部网络。无论如何，如果一个 MSA 也作为邮件服务器（MX）或中继服务器时，你总应该将其放入可信网络和内部网络内，并确保 MSA 在 Received 信头中包含认证标识来识别合法的客户。

警告：当一个 MSA 同时也作为邮件服务器（MX）或中继服务器或接受非认证用户邮件时，绝不要将其加入到 msa_networks 中。这样做结果是未知的外部中继也将被视作可信网络。

clear_msa_networks

清空前面定义的 MSA 网络列表。

always_trust_envelope_sender ( 0 | 1 ) (默认值： 0)

如果邮件通过了一个或多个可信中继服务器，信任其信封发件人。参见 envelope_sender_header 。

skip_rbl_checks ( 0 | 1 ) (默认值： 0)

默认情况下 SpamAssassin 会做 RBL 查询。如果你的 ISP 已经做过了这个检查，可以设置为1跳过再次检查。

dns_available { yes | test[: 名字1 名字2...] | no } (默认值： test)

默认情况下， SpamAssassin 会查询一些默认主机以判断 DNS 是否工作正常。做这个测试的原因是有可能因为网络链接断开导致的延时和某些情况下由于连接失败导致的 DNS 不可用。SpamAssassin 默认包括了13个测试的服务器，并且每次随机取出其中3个测试。

你可以指定你自己的测试列表：

  dns_available test: domain1.tld domain2.tld domain3.tld

注意，DNS检查的是NS记录。

SpamAssassin 的网络规则测试是并发进行的。这也许会导致需要打开的文件描述符超过了系统限制，安全起见推荐将文件描述符的限制至少增加到256以上。

dns_test_interval n (默认值： 600 秒)

如果 dns_available 设置为 'test' （默认），SpamAssassin 将在 dns_test_interval 秒后重新测试 DNS 是否工作。

学习选项

use_bayes ( 0 | 1 ) (默认值： 1)

是否使用 SpamAssassin 内建的朴素贝叶斯（Bayes）风格的分类器。这是SpamAssassin 里所有的贝叶斯相关的选项的主开关。

use_bayes_rules ( 0 | 1 ) (默认值： 1)

是否使用 SpamAssassin 内建的朴素贝叶斯风格的分类器规则。这个选项允许你打开自动学习和手动学习的情况下禁止使用贝叶斯规则。

bayes_auto_learn ( 0 | 1 ) (默认值： 1)

设置 SpamAssassin 是否自动通过高评分邮件（或低评分邮件，用于正常邮件）的“学习”提高系统识别能力。目前“学习”只支持朴素贝叶斯风格的分类器。

关于贝叶斯自动学习默认实现的细节，参见 Mail::SpamAssassin::Plugin::AutoLearnThreshold 插件模块的文档。

bayes_ignore_header 信头名

如果你收到的邮件被上游邮件系统过滤过，比如ISP的邮件过滤或邮件列表的过滤，且这些过滤增加了新的信头（多数如此），这些信头可能会给贝叶斯分类器一些不正确的指示。为了避免这种情况，可以使用这个选项列出这些信头：如：

        bayes_ignore_header X-Upstream-Spamfilter
        bayes_ignore_header X-Upstream-SomethingElse

bayes_ignore_from 邮件地址

贝叶斯分类器和自动学习功能不会处理来自这里列出地址的邮件。如果 sa-learn 使用 --use-ignores 选项的话，也会忽略这些邮件。可以列出一个或多个地址，格式参见 whitelist_from 。

来自特定发件人的垃圾邮件也许包含了许多经常出现在正常邮件中的词汇。举个例子，某个人也许会收到他常光顾的书店发来的邮件，但是不希望收到来自其他书店的类似邮件。如果那些不想收到的信件作为垃圾邮件被学习的话，那么任何讨论书籍的邮件，包括来自他想收到的那个书店发来的邮件也很可能被判定为垃圾邮件。这些让人讨厌的书店的邮件地址应该列在这里。（他们无视你的许可，并且不发任何邮件就将你加入了他们的会员。）

那些发送许可的垃圾邮件的人，或收到了包含了垃圾邮件中常见词汇的正常邮件的人，可能会担心一些垃圾邮件被作为正常邮件处理。那些发送垃圾邮件的邮件列表和地址等可以放到这个列表中。

bayes_ignore_to 邮件地址

贝叶斯分类器和自动学习功能不会处理发送到这里列出地址的邮件。参见 bayes_ignore_from 。

bayes_min_ham_num (默认值： 200)

bayes_min_spam_num (默认值： 200)

为确保正确，贝叶斯分类器在一定数量的垃圾邮件和正常邮件被学习之前不会被启用。他们的默认值是200，你可以针对需要调高或降低这两个数值。

bayes_learn_during_report (默认值： 1)

贝叶斯系统默认情况下会学习那些被分析并报告为垃圾邮件的邮件（ spamassassin -r ）。你可以设置这个选项为0来关闭学习功能。

bayes_sql_override_username

用于 BayesStore::SQL 存储。

如果设置了这个选项， BayesStore::SQL 模块所设置的 username 将被覆盖。这个选项用于实现一个全局或分组的贝叶斯数据库。

bayes_use_hapaxes (默认值： 1)

指定贝叶斯分类器是否使用 hapaxes (仅仅出现了一次的词汇/字串）。它能提高命中率但是会增大数据库的大小到8到10倍。

bayes_journal_max_size (默认值： 102400)

SpamAssassin 将不定时的同步日志和数据库。通常是一天做一次同步，但是如果日志文件大小超过了这个选项所设置的值，将会同步更多次。该值的单位是字节。如果该值设置为0，不定时同步就不再进行。

bayes_expiry_max_db_size (默认值： 150000)

指定了贝叶斯字串数据库的最大的大小。当达到了最大的大小时，贝叶斯系统将视乎大小，保留原来的75%或10万个字串。一般15万个字串的数据库会占用8M的空间。

bayes_auto_expire (默认值： 1)

如果设置为1，贝叶斯系统将自动丢弃旧的字串。仅在数据库中的字串数量超过了 bayes_expiry_max_db_size 时才会自动丢弃旧的字串。

bayes_learn_to_journal (默认值： 0)

如果设置了这个选项，那么 SpamAssassin 在学习的时候会将结果写入到日志而不是直接写入到数据库中。降低了更新时对数据库的锁定情况的发生，但是也导致了对日志文件的更多读写和数据库更新的延迟。

其它选项

lock_method 方式

选择一个文件锁定方式来保护磁盘上的数据库文件。默认情况下，在UNIX上 SpamAssassin 会使用“NFS安全”锁定方式；不过，如果你确认你用于贝叶斯和自动白名单的数据库决不会通过NFS方式来访问，你可以“非NFS安全”的锁定方式。

这会相对快一些，但是如果同时有一个或多个通过NFS方式访问的客户端访问时，可能会造成数据库文件的破坏。

注意，不同的操作系统使用不同的锁定方式。

支持下列锁定方式：

nfssafe - “NFS安全”的锁定方式
flock - 简单的 UNIX flock() 锁定方式
win32 - Win32 平台上使用 sysopen (..., O_CREAT|O_EXCL)锁定方式

nfssafe 和 flock 只能用于 UNIX 上，win32 只能用于 Windows 。默认情况下，SpamAssassin 根据操作系统的不同使用 nfssafe 或 win32 锁定方式。

fold_headers ( 0 | 1 ) (默认值： 1)

默认情况下，SpamAssassin 添加的信头会使用行首空白进行折叠。换言之，它们将会断成多行而不是使用一个很长的行，其后的行添加前置的制表符来表示对前一行的续行。

可以通过这个选项来禁止自动折叠，不过要注意可能会生成很长的行。

report_safe_copy_headers 信头名 ...

如果使用 report_safe，一些原邮件的信头被复制到封装邮件的信头里面（From, To, Cc, Subject, Date 等）。如果你希望其他的信头也被复制到这里，你可以使用这个选项。你可以在一行里面使用空格分隔开列出多个信头，或者使用多个此选项。

envelope_sender_header 信头名

如果SMTP服务器提供了“MAIL FROM:”通讯信息（信封发信人），SpamAssassin 会试图从邮件中发现该信息。这个选项用于指定信封发信人这个“伪信头”，这个“伪信头”可用于各种检查，比如SPF等。

默认情况下，几种MTA使用不同的信头，如：

    X-Envelope-From
    Envelope-Sender
    X-Sender
    Return-Path

如果可以通过查找一些特征（比如邮件的信头，或 fetchmail 的特征等）可以安全的确定这些，那么 SpamAssassin 会使用它们。然而，某些邮件服务器的配置可能会导致选择了错误的信头。（更多的讨论请参见 SpamAssassin 的 BugZilla 里面的2142号和4747号错误。）

为了避免选择错误，可以使用 envelope_sender_header 来指明这个信头。这个信头包含的是你的 MTA 在 SMTP 对话过程中 MAIL FROM 命令里的邮件地址。

如果信头像在SMTP通讯中一样在右边的邮件地址两端包含了“ < ”或“ > ”字符，这两个字符将被去掉。

如果该信头没有找到或者信头中没有包含“ @ ”符号， SpamAssassin 将在日志中记录一个警告，并采用其默认方式来来确定信封发信人。

（给 MTA 开发者的提示，我们希望将来使用一个单独的与其后的垃圾邮件扫描器不同的信头。 http://wiki.apache.org/spamassassin/EnvelopeSenderInReceived 提出了一个更好建议，使用 Received 信头在每一跳中记录信封发信人）

范例：

    envelope_sender_header X-SA-Exim-Mail-From

describe 测试规则名描述 ...

用于描述一个测试规则。这个描述会出现在用户看到的细节报告中。

注意，以“__”开始的测试是为元规则所保留，它们不会被计分和列出在“命中的测试”报告中。

同时注意，习惯上描述文本不要超过50个字符。

report_charset 字符集 (默认值：未设置)

设置附加了垃圾邮件原信件的报告邮件（ text/plain 格式）的 MIME Content-Type 的字符集。

report 报告模板

设置附加了文本（text/plain）的垃圾邮件的报告邮件的报告模板，参见 /usr/share/spamassassin 中的 10_misc.cf 中的例子。

如果你设置了这个，请不要超过每行78个字符。每个 report 行累加到已有的模板定义上（前面的 report 行），可以使用 clear_report_template 来清除前面的模板定义。

能够使用上述的特定标记。

clear_report_template

清除前面定义的 report 模板。

report_contact 联系地址

设置上面报告中使用的 _CONTACTADDRESS_ 的值。默认值是“the administrator of that system”，后跟上运行本软件的系统的主机名。

report_hostname 使用的主机名

设置上面报告中使用的 _HOSTNAME_ 的值。默认情况下是 SpamAssassin 动态检测到的运行本软件的主机名。

unsafe_report 报告模板

设置附加了包含非文本（text/plain）部分的垃圾邮件的报告邮件的报告模板，参见 /usr/share/spamassassin 中的 10_misc.cf 中的例子。

每个 unsafe-report 行累加到已有的模板定义上（前面的 unsafe_report 行），可以使用 clear_unsafe_report_template 来清除前面的模板定义。

能够使用上述的特定标记。

clear_unsafe_report_template

清除 unsafe_report 模板。

规则定义与特权设置

这些设置与上面的设置不同，它们被称之为“特权设置”。只有用户在通过 procmailrc 文件或 forward 文件调用 SpamAssassin 时，或在系统管理员编辑

/etc/mail/spamassassin 下的配置文件时才能使用它们。出于安全性及效率的考虑，通过 spamc 来访问 spamd 的用户是不允许在他们的 user_prefs

文件中使用这些“特权设置”，除非设置了 allow_user_rules 选项（而且，也只能使用下面列出的这些特权设置）。

allow_user_rules ( 0 | 1 ) (默认值： 0)

这个选项允许用户在他们的 user_prefs 中创建可以用于 spamd 的规则（也只能创建规则）。默认是不允许用户创建规则的，因为这样可能会造成一些安全漏洞，如果 spamd 是以 root 身份运行的话，就有可能授予了用户 root 级别的访问权限。这并不是一个好的做法，除非你能够通过别的方法确保用户的规则是安全的。如果不是很有把握，不要打开这个选项。此外，这个选项会导致每当一封邮件递交给用户时，如果他的 user_prefs 里面有自己定义的规则，那么 SpamAssassin 每次都会重新编译所有的规则，这会显著的增大服务器的负载。所以强烈建议不要允许用户自己定义规则！

注意，现在即便打开了这个选项， spamd 也不会使用 user_prefs 中的规则来修改系统现存的规则定义。

redirector_pattern /模式/修饰符

用来匹配 URI 中的重定向站点部分和目标站点部分的正则表达式。

注意：目标 URI 必须使用小括号包含起来，模式的其它部分可以创建一个反向引用。

范例： http://chkpt.zdnet.com/chkpt/whatever/spammer.domain/yo/dude

  redirector_pattern    /^https?:\/\/(?:opt\.)?chkpt\.zdnet\.com\/chkpt\/\w+\/(.*)$/i

header 测试规则名信头名操作符 /模式/修饰符 [if-unset: 字符串]

这个选项用于定义一个信头测试规则。 测试规则名 是一个测试规则的名称，如“FROM_ENDS_IN_NUMS”。信头名是一个邮件信头的名称，如 “Subject”、“To”等。

信头后面加上“ :raw”后缀可以防止使用 quoted-printable 或 base-64 编码的字符串自动进行解码。

信头后面加上“

:addr”后缀可以去掉除了信头中的第一个邮件地址外的其他部分。例如，以下所有信头处理后都只剩下“

example@foo”了：

example@foo
example@foo (Foo Blah)
example@foo, example@bar
display: example@foo (Foo Blah), example@bar ;
Foo Blah <example@foo>
``Foo Blah'' <example@foo>
``'Foo Blah''' <example@foo>

信头后面加上“ :name”后缀可以去掉除了信头中第一个真实名字外的其他部分。例如, 以下所有信头处理后只剩下“Foo Blah”了：

example@foo (Foo Blah)
example@foo (Foo Blah), example@bar
display: example@foo (Foo Blah), example@bar ;
Foo Blah <example@foo>
``Foo Blah'' <example@foo>
``'Foo Blah''' <example@foo>

可以使用以下的几个“伪”信头：

ALL 表示任何信头的文字。
ToCc 表示“To”和“Cc”信头。
EnvelopeFrom 是在递交邮件的 SMTP 通讯过程中，“MAIL FROM：”中的地址（如果可用）。如何设置的更多信息参见 envelope_sender_header。
MESSAGEID 表示信件中所有的 Message-Id 信头。一些邮件列表软件会将原来的 Message-Id 信头改名为 Resent-Message-Id 或 X-Message-Id ，然后使用自己的 Message-Id 信头。这个“伪”信头返回以上全部三种信头，使用回车符分隔开。
X-Spam-Relays-Untrusted, X-Spam-Relays-Trusted, X-Spam-Relays-Internal 和 X-Spam-Relays-External 表示一个可移植的、预解析的邮件网络路径。像 Received 信头的信息一样，分别是“可信”与“不可信”和“内部”与“外部”。更多细节参见 http://wiki.apache.org/spamassassin/TrustedRelays。

操作符是 =~ （匹配其后的正则表达式）或 !~ （不匹配其后的正则表达式）。模式是一个 Perl 风格的正则表达式，修饰符是对正则表达式的修饰（请参见 Perl 中有关正则表达式的部分）。注意，即便你使用了 x 修饰符，也不支持多行的正则表达式。还要注意，“#”字符必须转义成“\#”，否则会被认为是一行注释。

如果使用了 [if-unset: 字符串] 标记，那么如果邮件中没有发现该信头，就会使用该字符串来进行模式匹配。

测试规则名不能用数字开头，只能使用英文字母、数字和下划线。按照惯例不要使用小写字母、名字不要超过22个字符。也不能使用中划线。

注意，以“__”（两个下划线）开头的测试规则被保留用于元规则，他们不会被计分和列在“命中的测试”报告中。以“T_”开头的测试规则被保留用于QA测试，它们应该给予很低的评分。

如果你增加或修改一个测试规则，请使用 spamassassin --lint 来测试一下是否有语法错误。这可以避免出现错误消息或导致其它的测试被忽略。

header 测试规则名 exists:信头名

定义一个“信头存在”测试规则。信头是一个要测试存在与否的信头名。这是上面的信头测试规则的一个简化版本。

header 测试规则名 eval:评估行数([参数])

定义一个邮件信头的评估测试。 评估函数是 Mail::SpamAssassin::EvalTests 中定义的测试函数。参数是可选的。

header 测试规则名 eval:check_rbl('名单名称', '名单地址' [, '返回码'])

检查一个 DNSBL （以 DNS 方式运行的黑名单或白名单）。它会从邮件的 Received: 信头中取出所有的IP地址，如果IP地址不在 trusted_networks 中，那么对这些IP地址进行DNSBL查询。以下几点需要注意：

重复或保留的 IP 地址: 重复的IP地址仅仅被查询一次。保留的IP地址（如192.168.0.1、127.0.0.1等）不查询。保留的IP地址列在 < http://www.iana.org/assignments/ipv4-address-space>, < http://duxcw.com/faq/network/privip.htm>, < http://duxcw.com/faq/network/autoip.htm>, 或 < ftp://ftp.rfc-editor.org/in-notes/rfc3330.txt> 中
名单名称: 它也称作“zone ID”（译者注：即给所查询的DNSBL的一个名字，如用 CBLPLUS 代表 cblplus.anti-spam.org.cn. ）。如果你要查询像 NJABL 或 SORBS 这样的由多个黑名单合并而成的多重 DNSBL ,你可以通过 check_rbl_sub() 来比较查询返回的结果。; 如果上面取出的多个IP地址的DNSBL查询不止一个返回了命中结果，并不会重复计分，因为对于每封邮件来说，该规则只被触发一次（译者注：即只要有一个 IP 地址在黑名单中就算触发了该规则）。
黑白名单地址: 这是DNSBL的根区（译者注：即DNSBL的服务地址，如cblplus.anti-spam.org.cn.），使用点结尾。
返回码: 这是一个和下面的 check_rbl_sub() 一样的返回码，它是可选的。
查询除了第一跳外的所有 IP 地址: 可以在“名单名称”后加上“-notfirsthop”后缀来查询除了第一跳外的所有IP地址。它被用于在查询动态地址黑名单（译者注：动态地址是用于动态的分配给拨号、ISDN、ADSL等连接的IP地址）。邮件的第一跳也许是动态地址，但是至少应该有一跳以上（通过他们的 SMTP 服务器）的邮件递交跳数，这是合理的，所以在这种情况下不应该因第一跳在动态地址黑名单里面而增加评分。但是如果只有一跳，那么无论如何都会被查询的，因为邮件应该通过它的外发邮件服务器进行递交，而不是直接投递到你的邮件服务器。
按 IP 是否可信查询: 当查询一个“正向”的DNSBL（DNS白名单）时，你不能盲目信任那些“Received”信头中的没有被列在可信任的中继服务器名单中的IP地址（译者注：除了你的可信中继服务器及连接到它们的IP以外，其它地址有可能是伪造的；连接到你的可信中继服务器的 IP 地址是无法伪造的，该地址的真实可靠的）。为了查询第一个可信的 IP 地址，可以在“黑白名单名称”后加上“-firsttrusted”后缀，这会查询连接到最远的一个可信中继服务器的IP地址。; 注意，这需要 SpamAssassin 能知道那个中继服务器是可信任的。在简单的环境里， SpamAssassin 能够很好的自行推测。在复杂的环境，你可以通过手工设定 trusted_networks 可以得到更好的结果。; 此外，你能够通过在“名单名称”后加上“-untrusted”后缀来查询所有不可信的IP地址。重要提示：这 不包括最近的一个“不可信行”，如上述的“-firsttrusted”所指的地址。因为我们在这里讨论的是IP地址是否是可信任的，而不是信头的来源；而且最近的一个信头（即“firsttrusted”），其包含的数据是可信的。更多细节参见 http://wiki.apache.org/spamassassin/TrustedRelays。
只查询最后的外部 IP: 在“名单名称”后加上“-lastexternal”后缀，你可以只查询连接到你的内部网络的外部主机或使用公开 IP 地址的最后一个外部主机。

译者注：中国反垃圾邮件联盟所推出的DNSBL服务的设置如下，它们可以放到 /etc/mail/spamassassin/local.cf 中，但是不必全部放入和使用，通常根据需要使用其中一个就可以了，推荐使用CBL-。设定的评分可以自己的情况自行调整：

CBL（返回值是127.0.8.2）:: header   RCVD_IN_CASA_CBL eval:check_rbl('CBL','cbl.anti-spam.org.cn.','127.0.8.2')
describe RCVD_IN_CASA_CBL Relay has be listed in CASA CBL, http://anti-spam.org.cn/
tflags   RCVD_IN_CASA_CBL net
score    RCVD_IN_CASA_CBL 3.0
CDL（返回值是127.0.8.4）:: header   RCVD_IN_CASA_CDL eval:check_rbl('CDL','cdl.anti-spam.org.cn.','127.0.8.4')
describe RCVD_IN_CASA_CDL Relay has be listed in CASA CDL, http://anti-spam.org.cn/
tflags   RCVD_IN_CASA_CDL net
score    RCVD_IN_CASA_CDL 4.0
CBL+（返回值是127.0.8.6）:: header   RCVD_IN_CASA_CBLPLUS eval:check_rbl('CBLPLUS','cblplus.anti-spam.org.cn.','127.0.8.6')
describe RCVD_IN_CASA_CBLPLUS Relay has be listed in CASA CBL+, http://anti-spam.org.cn/
tflags   RCVD_IN_CASA_CBLPLUS net
score    RCVD_IN_CASA_CBLPLUS 4.0

虽然CBL+是CBL和CDL的综合，但是CBL+不是一个多重列表，其返回值是固定的一个 127.0.8.6。
CBL-（返回值是127.0.8.5）:: header   RCVD_IN_CASA_CBLLESS eval:check_rbl('CBLLESS','cblless.anti-spam.org.cn.','127.0.8.5')
describe RCVD_IN_CASA_CBLLESS Relay has be listed in CASA CBL-, http://anti-spam.org.cn/
tflags   RCVD_IN_CASA_CBLLESS net
score    RCVD_IN_CASA_CBLLESS 4.0
CML（返回值是127.0.8.1）:: header   RCVD_IN_CASA_CML eval:check_rbl('CML','cml.anti-spam.org.cn.','127.0.8.1')
describe RCVD_IN_CASA_CML Relay has be listed in CASA CML (whitelist), http://anti-spam.org.cn/
tflags   RCVD_IN_CASA_CML net nice
score    RCVD_IN_CASA_CML -5.0

这是一个白名单，评分是负值，可以降低计分。

此外，由于国内一些 ISP 的 DNS 存在劫持问题（即在查询一个不存在的地址时候，总是返回一个特定的地址，用于将用户错误的访问导向到一个特定网站），这种情况下，用户会发现其所查询的任何地址都被列入到了 RBL 中。因此，我们建议，尽可能的情况下都设置返回码验证，以避免这个问题。当然，更换一个没有被劫持的 DNS 也可以。

header 测试规则名 eval:check_rbl_txt('名单名称', '名单地址')

类似于 check_rbl() ，只是查询的是 TXT 类型的 DNS 记录而不是 A 类型的 DNS 记录。如果所查询的DNSBL支持TXT查询，返回的结果是一行文字，用来说明该地址被列入黑名单的原因，通常是一个可以查询黑名单数据库的链接。

header 测试规则名 eval:check_rbl_sub('名单名称', '返回码')

创建某个 DNSBL 查询的子测试。如果你要查询一个像 relays.osirusoft.com 那样的多重DNSBL，你可以使用对应的“名单名称”来比较 chek_rbl 查询得到结果。如果DNSBL查询返回多个 A 记录时，“返回码”可以设置为一个用点分隔的 IPv4 地址；如果DNSBL查询返回一个包含掩码的IP地址时，“返回码”可以是一个代表掩码的正十进制整数；如果是一个SenderBase查询（对 sa.senderbase.org 的TXT查询），“测试结果”是一个以“sb:”开头的表达式；如果前面的都不符合，它还可以是一个正则表达式。

注意：这个“名单名称”必须和前面的 check_rbl() 中的名字完全一样，包括后缀的“-notfirsthop”等。

body 测试规则名 /模式/修饰符

定义一个信体模式测试。模式是一个Perl的正则表达式。注意，“#”字符必须转义成“\#”，否则会被认为是一行注释。

这里“body”指的是邮件信体里面的普通文本；任何非文本的MIME部分都会去掉，如果需要的话， Quoted-Printable 或 Base 64 编码的文本都会被解码。邮件的主题信头也作为了邮件信体的第一个段落处理。在模式匹配前，所有的HTML标记和换行都会被去掉。

body 测试规则名 eval:评估函数([参数])

定义一个邮件信体的评估测试，参见上面。

uri 测试规则名 /模式/修饰符

定义一个uri的模式测试。模式是一个Perl的正则表达式。注意，“#”字符必须转义成“\#”，否则会被认为是一行注释。

这里“uri”指的是邮件信体中所有的URI，测试会对每一个URI进行测试，如果发现了匹配，增加其对应的评分。当需要测试URI时，可以用这个测试来替代使用“body”测试来匹配信体中的URI，它会更精确的匹配在URL的两端，同时也速度更快。

rawbody 测试规则名 /模式/修饰符

定义一个原始信体模式测试。模式是一个Perl的正则表达式。注意，“#”字符必须转义成“\#”，否则会被认为是一行注释。

这里“raw body”指的是邮件信体里面所有的文本。Quoted-Printable 或 Base 64 编码的文本都会被解码，但是HTML代码和换行仍旧保留。模式是逐行进行匹配的。

rawbody 测试规则名 eval:评估函数([参数])

定义一个原始邮件信体的评估测试，参见上面。

full 测试规则名 /模式/修饰符

定义一个整个邮件的模式测试。模式是一个Perl的正则表达式。注意，“#”字符必须转义成“\#”，否则会被认为是一行注释。

整个邮件包括完整的信头和信体，其中包括MIME编码的数据，如图像、其它附件、MIME边界等等。

full 测试规则名 eval:评估函数([参数])

定义一个整个邮件的评估测试，参见上面。

meta 测试规则名逻辑表达式

定义一个逻辑表达式来测试其他的测试是否命中或未命中。例如：

meta META1 TEST1 && !(TEST2 || TEST3)

注意，英语的操作符（“and”、“or”）会被作为测试规则名处理，另外，不支持异或（XOR）操作。

meta 测试规则名逻辑运算表达式

还能够定义一个逻辑运算表达式来计算其他的测试结果的运算结果，未命中的值是“0”，命中的值是非零值。命中的元测试的值是它的运算表达式；命中的评估函数测试的值是它返回的值；测试标志设置为“multiple”的命中的信头、信体、原始信体、uri或整个邮件的测试的值是测试命中的次数；其它的命中测试的值是“1”.

例如：

meta META2 (3 * TEST1 - 2 * TEST2) > 0

注意，不能使用Perl内建的运算符和函数，如abs()等，它们会被作为测试规则名处理。

如果你要定义一个元规则，但是不希望在测试每个子规则时将其评分计算到总的评分上，只在整个元规则匹配时才将元规则的评分计算到总的评分上时，可以给子规则名前加上“__”（两个下划线），SpamAssassin 不会计入这些子规则的评分。

tflags 测试规则名 [ {net|nice|learn|userconf|noautolearn|multiple} ]

用于设置一个测试规则的标志。这些标志用于评分驱动的后台系统的测试行为细节。关于这些标志对那些系统的作用的更多信息请参见 bayes_auto_learn 。有下列标志：

net: 该测试是一个网络测试，在大量测试的系统或使用 -L 参数时，他们不会被运行，所以它的评分不会被计算进总的评分。
nice: 该测试被用于补偿误判的邮件评分，它应该被指定为负值。
userconf: 该测试在使用前需要用户配置（如 language- 类的测试）。
learn: 该测试使用前要求经过学习。
noautolearn: 该测试的评分不会被学习系统所学习。
multiple: 该测试将被运行多次，用于元规则测试。只影响信头、信体、原始信体、uri和整个邮件的测试规则。

priority 测试规则名 n

指定一个测试的优先级。除了DNS和元测试外的所有测试都按照优先级的顺序进行测试（负优先级的测试运行在所有正优先级测试之前）。默认值是0。

不能使用 -99999999999999 和 -99999999999998 ，它们在内部有特殊用途。

管理员设置

这些设置与上面的设置不同，它们甚至比上面的“ 特权设置”还要“更特权”。无论 allow_user_rules 是否设置，它们不能用于供 spamc/spamd 所读取的用户的 user_prefs 文件中。不过，所有的设置都可用在用户直接运行的本地程序中。

version_tag 版本标签

版本标签会后缀到 X-Spam-Status 中的 SA 的版本号后面。你应该在修改规则集的同时也修改这个版本标签，特别是你计划公开发布你的规则集时。可以考虑用你的姓或名字缩写并加上一个递增的表示修改次数的数字来组合成这个字符串。

这个字符串会转换成小写的，任何的非字母/数字和标点符号会被转换成下划线。

范例：

  version_tag myrules1    # version=2.41-myrules1

test 测试规则名 (ok|fail) 用于测试的字符串

定义一个回归测试字符串。你能给每个测试规则定义一个以上的回归测试字符串。简单的说，就是定义一个测试规则所匹配的字符串。

这些测试仅仅在测试环境中使用，它们不会影响到 SpamAssassin 的正常使用。

rbl_timeout n (默认值： 15)

所有的DNS查询都是在整个测试开始的时候进行，并且在整个测试结束时候读取结果。这个选项设置了最大的DNS查询等待时间。在大多数DNS查询都成功完成的情况下， SpamAssassin 将不会浪费时间来等待剩下的那些查询，可能它们根本没有回应了。当剩余没有完成的请求越少时，等待的时候也越短。对于默认的15秒的等待时间，下面是一个表格说明了当剩余请求有多少时会等待多少时间：

剩余的查询	100%	90%	80%	70%	60%	50%	40%	30%	20%	10%	0%
等待时间	15	15	14	14	13	11	10	8	5	3	0

此外，当更多的查询结果返回时，剩余时间会变得更短，在超时前，未完成的查询会给至少1秒钟的查询时间，但是等待时间总不会超过 rbl_timeout 所指定的时间。

举个例子，如果邮件检查开始时候有20个查询，当有16个（剩下20％）返回了结果后，剩下的4个查询必须在开始后的5秒钟内完成，否则就会放弃这几个查询。

util_rb_tld 顶级域顶级域 ...

用于给 RegistrarBoundaries 列表里增加新的顶级域（TLD）。这个列表的更新通常与 SpamAssassin 发布新版本时一同更新，不过可以用该选项在新版本发布前就更新这个列表。顶级域如 com 、 net 、 org 等等。

util_rb_2tld 二级域二级域 ...

用于给 RegistrarBoundaries 列表里增加新的二级域（2TLD）。这个列表的更新通常与 SpamAssassin 发布新版本时一同更新，不过可以用该选项在新版本发布前就更新这个列表。二级域如 co.uk 、 fed.us 等等。

bayes_path 路径 (默认值： ~/.spamassassin/bayes)

指定贝叶斯数据库的目录和文件名。使用这个路径，并加上“_toks”、“_seen”等后缀创建几个数据库：默认情况下就是 ~/.spamassassin/bayes_seen 、 ~/.spamassassin/bayes_toks 等。

默认情况下，每个用户都在自己的 ~/.spamassassin 目录里面存放这些数据库，权限模式为0700或0600。如果整个站点应用 SpamAssassin ，你可以让所有用户共享同一个数据库，从而降低磁盘的占用。（不过，贝叶斯过滤器在用户使用自己单独的数据库时更加有效。）

bayes_file_mode (默认值： 0700)

指定贝叶斯数据库的权限模式。

确保你指定的权限包含“x”（执行）权限，因为在创建目录时，它需要执行权限才能正常使用。不过，如果创建的是文件，该文件并不会有任何执行权限（umask 被设置为111）。

bayes_store_module 模块名称

如果设置了该选项，该模块用于提供替换默认的贝叶斯存储方式。该模块必须遵循公布的存储规范。（参见 Mail::SpamAssassin::BayesStore ）。例如，可以设置为 Mail::SpamAssassin::BayesStore::SQL 来使用通用的 SQL 存储模块。

bayes_sql_dsn DBI::数据库类型:数据库名:主机名:端口

该选项用于 BayesStore::SQL 存储方式。

这个选项指定的DSN用于连接到基于SQL方式的贝叶斯数据库。

bayes_sql_username 用户名

该选项用于 BayesStore::SQL 存储方式。

这个选项指定上述的DSN的连接用户名。

bayes_sql_password 密码

该选项用于 BayesStore::SQL 存储方式。

这个选项指定上述的DSN的连接密码。

bayes_sql_username_authorized ( 0 | 1 ) (默认值： 0)

设置是否在 BayesSQL 中调用 services_authorized_for_username 插件。如果这个插件没有检测到用户被授权使用贝叶斯功能或该模块不可用，数据库不会进行初始化。

注意：默认情况下用户是未授权的，除非插件返回真值。如果使用该插件，但是插件不能正确载入执行，所有的用户都被认为是未授权的。

传递到插件用于检测的用户名能使用 bayes_sql_override_username 选项来覆盖。

user_scores_dsn （LDAP连接 | DBI:数据库类型:数据库名:主机名:端口)

如果你从一个 SQL 数据库中载入用户自定义的评分，那么在这里定义连接的DSN。例如： DBI:mysql:spamassassin:localhost

如果你从一个 LDAP 目录服务里面载入用户自定义的评分，那么也在这里定义连接的DSN。你需要写成LADP的URL格式，包含下列部分：LDAP主机、端口、用于查找的基 DN、搜索范围（base、one 或 sub）、一个用来存储配置的多值属性（空格分隔开的键值对，像在文件中一样），最后是一个过滤表达式来过滤出所要的用户名。注意，过滤表达式用在 sprintf 语句中，只有一个用户名参数：“__USERNAME__”，它会替换成实际的用户名。

例子： ldap://localhost:389/dc=koehntopp,dc=de?spamassassinconfig?uid=__USERNAME__

user_scores_sql_username 用户名

连接到上述DSN的用户名。

user_scores_sql_password 密码

连接到上述DSN的密码。

user_scores_sql_custom_query 查询语句

这个选项可以让你定制查询用户的评分和配置的SQL查询语句。查询结果需要按顺序返回配置名、配置值这两个字段才行。此外，你可以在SQL中使用以下的“变量”，它们会在查询时候被替代成当前值。当前支持以下变量：

_TABLE_: 存储用户评分和配置的表名。当前它的值指定为“userpref”，如果需要，可以在定制查询里使用另外的表名。
_USERNAME_: 当前用户的用户名。
_MAILBOX_: 当前用户的用户名的“@”前的部分。
_DOMAIN_: 当前用户的用户名的“@”后的部分。这个值也许是空的。

查询语句必须是一个连续的行，以便能正常工作。

下面是几个查询语句的例子。注意，有一些为了阅读方便进行了换行，但是在你的配置中应该是一行。

当前的默认查询语句：: SELECT preference, value FROM _TABLE_ WHERE username = _USERNAME_ OR username = '@GLOBAL' ORDER BY username ASC
使用全局和域级别的默认值：: SELECT preference, value FROM _TABLE_ WHERE username = _USERNAME_ OR username = '@GLOBAL' OR username = '@~'||_DOMAIN_ ORDER BY username ASC
使用用户配置来覆盖全局配置：: SELECT preference, value FROM _TABLE_ WHERE username = _USERNAME_ OR username = '@GLOBAL' ORDER BY username DESC

user_scores_ldap_username 用户名

指定用于连接到 LDAP 服务器的绑定 DN。默认是空字符串（“”），即允许匿名绑定。

例子： cn=master,dc=koehntopp,dc=de

user_scores_ldap_password 密码

指定用于连接到 LDAP 服务器的密码，默认是空字符串（“”）。

loadplugin 插件模块名 [模块路径]

装入一个 SpamAssassin 插件模块。模块名是一个Perl的模块名，用于创建插件模块对象。

模块路径是装入模块的路径，包含模块的 Perl 代码。如果指定的是一个相对路径，那是相对于当前配置文件的位置而言的。如果省略了路径参数，会从Perl的查找路径（@INC数组）中找到并载入。

参见 Mail::SpamAssassin::Plugin中的更多细节来写自己的插件。

tryplugin 插件模块名 [模块路径]

同 loadplugin 一样，但是当不能找到模块文件（.pm）时会直接忽略。

预处理选项

include 文件名

包含 文件中的配置选项。相对路径是相对于当前配置文件或用户的配置文件的位置。

if (Perl 的条件表达式)

用于支持按条件选择的配置。在它到 else 或 endif 之间的配置仅在条件表达式为真值时有效（对于Perl而言，就是该值是有定义的且非0）。

由于安全的原因，条件表达式只接受 Perl 的限定的部分，只能进行基本的算术比较。允许下列输入：

数字、空白、算术运算符和括号

即以下字符：

  ( ) - + * / _ . , < = > ! ~ 0-9 空白

version

它被替换为当前运行的 SpamAssassin 的版本号。注意，SpamAssassin 内部使用的版本号是 x.yyyzzz 格式，这里 x 是主版本号， y 是辅版本号， z 是修订号。所以3.0.0是 3.000000，3.4.80是 3.004080。

plugin(插件名)

如果该插件被载入，那么该函数返回1，否则返回 undef。

如果一个文件直到结束也没有使用 endif 来结束 if 语句，那么会触发一个警告，但是下一个配置文件将会继续进行处理（译者注：相当于在上个文件中末尾自动用 endif 结束了）。

例子：

        if (version > 3.000000)
          header MY_FOO ...
        endif

        loadplugin MyPlugin plugintest.pm

        if plugin (MyPlugin)
          header MY_PLUGIN_FOO  eval:check_for_foo()
          score  MY_PLUGIN_FOO  0.1
        endif

ifplugin 插件模块名

同 if plugin(PluginModuleName) 一样。

else

用于支持按条件选择的配置。在它到 endif 之间的配置仅在条件表达式为假值时有效（对于Perl而言，就是该值是未定义的和0）。

require_version 版本号

指定包含该配置的文件需要运行在特定版本的 SpamAssassin 下。如果不同版本（旧的或者新的）试图从这个文件中读取配置，它会输出一个警告并忽略该配置文件。

注意，SpamAssassin 内部使用的版本号是 x.yyyzzz 格式，这里 x 是主版本号， y 是辅版本号， z 是修订号。所以3.0.0是 3.000000，3.4.80是 3.004080。

模板标记

下列标记可以作为变量在几个选项中使用。它们会被替换为相应的值。

一些标记可以使用扩号包括参数。参数是可选的，下面列出了它们的默认值。

_YESNOCAPS_	根据是否是垃圾邮件返回：“YES”/“NO”
_YESNO_	根据是否是垃圾邮件返回：“Yes”/“No”
_SCORE(PAD)_	邮件的评分。如果指定了PAD参数，且是空格或数字0时，评分会用空格或数字0进行填充（默认情况下是不填充）。例如 _SCORE(0)_ 将2.4填充成02.4，而 _SCORE(00)_ 将其填充成002.4。12.3则会分别填充成12.3和012.3
_REQD_	垃圾邮件评分标准线（译者注：即 require 的值）
_VERSION_	版本号（如：3.0.0或3.1.0-r26142-foo1）
_SUBVERSION_	子版本号或代码修订日期（如：2004-01-10）
_HOSTNAME_	处理邮件的主机的主机名
_REMOTEHOSTNAME_	发送邮件的主机的主机名，只在 spamd 中可用
_REMOTEHOSTADDR_	发送邮件的主机的IP地址，只在 spamd 中可用
_BAYES_	贝叶斯评分
_TOKENSUMMARY_	所找到的新的、中立的、垃圾邮件的、正常邮件的字串数量
_BAYESTC_	所找到的新的字串数量
_BAYESTCLEARNED_	所找到的出现过的字串数量
_BAYESTCSPAMMY_	所找到的垃圾邮件倾向的字串数量
_BAYESTCHAMMY_	所找到的正常邮件倾向的字串数量
_HAMMYTOKENS(N)_	前N个最重要的正常邮件字串（默认是5个）
_SPAMMYTOKENS(N)_	前N个最重要的垃圾邮件字串（默认是5个）
_DATE_	扫描时间，使用 rfc-2822 格式
_STARS(*)_	每一分的评分分值使用一个“*”代表（可以使用任何字符）（限制最多有50个星号）
_RELAYSTRUSTED_	使用的可信任中继服务器（参见 X-Spam-Relays-Trusted）
_RELAYSUNTRUSTED_	使用的非信任中继服务器（参见 X-Spam-Relays-Untrusted）
_RELAYSINTERNAL_	使用的内部中继服务器（参见 X-Spam-Relays-Internal）
_RELAYSEXTERNAL_	使用的外部中继服务器（参见 X-Spam-Relays-External）
_LASTEXTERNALIP_	从外部投递到内部的客户端的 IP 地址
_LASTEXTERNALRDNS_	从外部投递到内部的客户端的反向DNS解析名称
_LASTEXTERNALHELO_	从外部投递到内部的客户端的 HELO 字符串
_AUTOLEARN_	自动学习状态（“ham”、“no”、“spam”、“disabled”、 “failed”或“unavailable”）
_AUTOLEARNSCORE_	用于自动学习的邮件分值
_TESTS(,)_	使用逗号（或其它字符）分隔开的命中的测试列表
_TESTSSCORES(,)_	如上，只是加上了相应的分值（如：AWL=-3.0,...）
_SUBTESTS(,)_	使用逗号（或其它字符）分隔开的命中的子测试列表
_DCCB_	DCC 的“Brand”
_DCCR_	DCC 的结果
_PYZOR_	Pyzor 的结果
_RBL_	正向RBL查询的完整的原始结果（使用DNS URI格式）
_LANGUAGES_	邮件中可能使用的语言
_PREVIEW_	内容预览
_REPORT_	命中的测试规则的简要报告（用于信头报告中）
_SUMMARY_	命中的测试规则的标准报告（用于邮件报告中）
_CONTACTADDRESS_	report_contact 的值
_HEADER(NAME)_	包括信头的值。值与信头规则中匹配的一样（参见文档中其它部分）

如果引用的标记不在上述列表中，也没有在载入的模块中定义，标记将保持不变。

HAMMYTOKENS 和 SPAMMYTOKENS 标记有一个可选的用于指定特定格式的第二个参数，参见下面的 正常字串/垃圾字串标记格式 部分。

正常字串/垃圾字串标记格式

正常字串（HAMMYTOKENS）和垃圾字串（ SPAMMYTOKENS）有一个用于指定特定格式的可选的第二个参数： _SPAMMYTOKENS(N,FMT)_, _HAMMYTOKENS(N,FMT)_ 。可用格式如下：

short: 只列出字串。例如，配置文件中加上：; add_header all Spammy _SPAMMYTOKENS(2,short)_; 信头中会出现：; X-Spam-Spammy: remove.php, UD:jpg; 指出了最高的两个垃圾邮件字串： “remove.php” 和 “UD:jpg”。（最后一个冒号后面的是字串，冒号前的标识符表示该字串的一些特性，这里 UD 的意思是“该字串看起来像是域名的一部分”）
compact: 列出字串的概率、一个缩写的保留权重（declassification distance，译者注：表示在贝叶斯字串库中何时被删除，当该值小于1时，该字串被删除）（参见例子）和字串。例如，在配置文件中加上：; add_header all Spammy _SPAMMYTOKENS(2,compact)_; 信头中会出现：; 0.989-6--remove.php, 0.988-+--UD:jpg; 分别指出了最高的两个垃圾邮件字串的概率是 0.989 和 0.988。第一个字串的保留权重的数量是6，意思是这个字串至少在6封没有被判定为垃圾邮件的邮件中出现过。第二个字串中的+表示保留权重的数量超过了9。
long: 列出字串的概率、保留权重的数量、出现在正常邮件中的次数、出现在垃圾邮件中的次数和字串的存在时间。; 例如，在配置文件中加上：; add_header all Spammy _SPAMMYTOKENS(2,long)_; 信头中会出现：; X-Spam-Spammy: 0.989-6--0h-4s--4d--remove.php, 0.988-33--2h-25s--1d--UD:jpg; long 比 compact 提供了更多的信息，第一个字串出现在0个正常邮件中（0 ham）和4个垃圾邮件中（4 spam）,最后出现是在4天前（4 day）；第二个字串出现在两个正常邮件中（2 ham）和25个垃圾邮件中（25 spam ），最后出现是在1天前（1 day）。（不像 compact ，long 显示超过9个的保留权重数量而不是显示一个+。）

本地化

使用 lang xx 开始的行仅在用户使用该语言时有效，允许在测试规则的描述和模板中使用特定的语言。

本地化字符串可以使用语言和国家来定义，如 lang pt_BR；或仅使用语言，如 lang de 。

参见

Mail::SpamAssassin spamassassin spamd

你可能感兴趣的:(mail,指南,休闲,spamassassin,RBL)

Angular Material 17版本升级指南 t0_54manong 编程问题解决手册 angular.js 前端 javascript 个人开发
最近，我在将项目从AngularMaterial的15.0.3版本升级到17.0.4版本时，遇到了一个有趣的错误。错误发生在主题设置过程中，尤其是在尝试使用background值时。在旧版本中，主题设置一切正常，但升级后出现了如下错误信息：(status-bar:#e0e0e0,app-bar:#f5f5f5,background:#fafafa,hover:rgba
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
2025实战指南：基于VMware 17与Linux的Dify私有化部署——从零构建企业级AI开发平台 Tec_Bit 人工智能 centos linux 人工智能 chatgpt
一、环境准备与系统配置1.1VMware17虚拟机创建‌新建虚拟机‌：选择“典型”安装模式，指定CentOS7镜像文件（建议使用阿里云镜像源获取最新稳定版）‌1‌硬件资源配置‌：内存：≥4GB（推荐8GB）处理器：2核以上磁盘空间：≥40GB（选择“将虚拟磁盘存储为单个文件”）安装完系统使用远程工具连接centos，我这里使用的是华为的远程工具codearts,纯属个人习惯！！！其他工具也可以使用
Flutter IconButton完全指南：高效使用与性能优化秘籍帅次 Flutter flutter android ios android studio macos kotlin swift
目录一、引言二、IconButton的基本用法三、进阶技巧3.1自定义形状与背景3.2带文本的IconButton（使用Column组合）3.3自定义交互反馈3.4动态图标切换3.5组合式按钮（图标+文字）四、高级应用4.1与主题深度整合4.2手势扩展（长按/双击）4.3动画增强点击效果五、性能与最佳实践5.1避免重建5.1.1声明常量图标5.1.2带参数的常量图标5.1.3常量图标按钮5.1.4
基于云效Flow落地自动化构建——构建集群云效DevOps平台场景实践云效云效Flow 构建器构建集群研发团队研发管理
基于云效Flow落地自动化构建，构建集群，云效流水线Flow是持续交付的载体，通过构建自动化、集成自动化、验证自动化、部署自动化，完成从开发到上线过程的持续交付。通过持续向团队提供及时反馈，让交付过程高效顺畅，基于云效Flow自动化构建工具，构建集群操作群指南。立即体验云效构建集群，云效Flow支持用户个性化的构建场景，提供三种类型的构建集群的能力支持。用户在流水线编排时，可以为任务设置不同的构建
3.5 Spring Boot邮件服务：从基础发送到模板邮件进阶 Sendingab Spring boot 从入门到精通零基础7天精通Spring Boot spring boot python 后端
SpringBoot邮件服务：从基础发送到模板邮件进阶引言在现代企业级应用中，邮件服务是不可或缺的基础能力。从用户注册验证、密码重置，到订单通知、系统告警，再到营销推广等场景，邮件始终扮演着关键角色。SpringBoot通过spring-boot-starter-mail模块，将JavaMail的复杂配置简化为几行代码即可实现的便捷操作。本文将手把手带您实现从基础文本邮件发送到高级模板邮件的完整开
matsim开发教程若木胡大数据信息可视化
以下是基于MATSim的二次开发教程指南，结合交通仿真框架的核心功能和开发实践，提供从环境搭建到高级开发的完整路径：一、MATSim简介MATSim（Multi-AgentTransportSimulation）是一个基于Java的开源交通仿真框架，专注于大规模多智能体（Agent）交通行为模拟，支持动态需求建模、路径规划优化、政策评估等应用场景。二、开发环境搭建1.基础依赖JavaJDK11+：
双均线量化策略实战指南：基于 iTick 外汇API、股票API报价源的 Python 实现算法pythonai开发
在量化交易领域，iTick报价API凭借其强大的多市场覆盖能力，已成为专业交易员的首选数据解决方案。其外汇API支持全球主要货币对（如EURUSD、GBPUSD）的毫秒级行情推送，包含Bid/Ask深度报价和实时波动率数据；股票API则覆盖A股、港股及美股市场，提供Level-2逐笔成交和十档盘口信息。通过统一的RESTful接口，开发者可轻松获取标准化的OHLCV数据，实现外汇、股票等多资产策略
在Ubuntu上安装MEAN Stack的4个步骤 ubuntu
在Ubuntu上安装MEANStack的4个步骤为：1.安装MEAN；2.安装MongoDB；3.安装NodeJS，Git和NPM；4.安装剩余的依赖项。什么是MEANStack？平均堆栈一直在很大程度上升高为基于稳健的基于JavaScript的开发堆栈。名称的意思是指其组件;MongoDB，ExpressJS，Angularjs和NodeJS。第1步：安装MEAN对于此安装，我们将在本指南中使用
Julia语言的饼图尤宸翎包罗万象 golang 开发语言后端
Julia语言的饼图：全面剖析与实战指南引言在数据可视化的领域中，饼图作为一种经典的可视化工具，广泛用于展示各个分类在总体中的占比关系。尽管饼图在一些数据分析师中被视为相对简单和直观的图形，但它在实际运用中依然扮演着重要角色。本文将重点探讨如何使用Julia语言实现饼图的绘制，分析其背后的逻辑，并通过实例帮助读者掌握这一基本技能。Julia语言简介Julia是一种高性能、高级别的编程语言，适用于数
Lianwei 安全周报|2024.12.9 联蔚盘云安全
新的一周又开始了，以下是本周「Lianwei周报」，我们总结推荐了本周的政策/标准/指南最新动态、热点资讯和安全事件，保证大家不错过本周的每一个重点！政策/标准/指南最新动态01美国消费者金融保护局提案：限制“数据经纪人”出售个人信息当地时间12月3日，美国消费者金融保护局（CFPB）宣布，计划针对“数据经纪人”出售美国人个人信息的行为，出台更加严格的监管措施。根据新提案，“数据经纪人”将受到更加
Lianwei 安全周报|2025.1.2 联蔚盘云安全
以下是本周「Lianwei周报」，我们总结推荐了本周的政策/标准/指南最新动态、热点资讯和安全事件，保证大家不错过本周的每一个重点！政策/标准/指南最新动态01国家数据局等五部门印发《关于促进企业数据资源开发利用的意见》为充分释放企业数据资源价值，构建以数据为关键要素的数字经济，近日，国家数据局联合中央网信办、工业和信息化部、公安部、国务院国资委印发了《关于促进企业数据资源开发利用的意见》。详情：
httpcanary动态注入_HttpCanary使用指南——正则匹配注入火锅大魔王 httpcanary动态注入
HttpCanary于v2.11.0版本上线了正则匹配注入功能。顾名思义，就是使用正则表达式或者匹配字符串，动态修改网络请求数据中的部分数据。举个例子：{"date":"30日星期天","high":"高温30℃","fengli":"","low":"低温23℃","fengxiang":"西南风","type":"多云"}复制代码我们希望将网络请求体中这段数据中的符号℃修改为中文摄氏度，即：{
代替Windows系统的最佳系统开发：开源、国产与跨平台的选择指南夏末之花 windows 开源
近年来，随着技术自主化和隐私安全需求的提升，越来越多的用户开始寻求Windows系统的替代方案。本文结合国内外热门操作系统及开发工具，分析其核心优势与适用场景，助你找到最适合的开发与日常使用平台。一、开源之王：Linux发行版1.Ubuntu与LinuxMint作为最受欢迎的Linux发行版，Ubuntu和LinuxMint以用户友好性著称，尤其适合从Windows迁移的用户。其内置的软件包管理器
【商城实战(43)】探秘知名商城架构：解锁电商成功密码奔跑吧邓邓子商城实战架构微服务 spring boot 商城实战商城架构
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
Pandas完全指南：数据处理与分析从入门到实战 xiaoyu❅ python python pandas 开发语言
目录引言一、Pandas环境配置与核心概念1.1安装Pandas1.2导入惯例1.3核心数据结构二、数据结构详解2.1Series创建与操作2.2DataFrame创建三、数据查看与基本操作3.1数据预览3.2索引与选择3.3数据排序四、数据清洗实战4.1处理缺失值4.2处理重复值4.3数据类型转换4.4字符串处理五、数据处理进阶5.1数据筛选5.2列操作5.3应用函数六、数据分组与聚合6.1基础
（六一）HarmonyOS Design 的用户引导设计小_铁 Harmony OS Next Harmony OS Next
HarmonyOSDesign的用户引导设计在HarmonyOS应用生态中，用户引导设计犹如新用户探索应用世界的指南针，其重要性不言而喻。精心构建的用户引导不仅能帮助新用户快速上手应用，更能在初次交互中建立起良好的用户体验，为应用的长期留存和口碑传播奠定基础。接下来，我们深入剖析用户引导的重要性，并结合HarmonyOS的特性，探讨如何设计出切实有效的引导流程，同时辅以代码示例，让开发者能够更直观
常见Linux指令详解：新手入门指南 PS下载安装免费教程 Linux linux 网络服务器
一、文件和目录管理1.ls：列出目录内容功能：显示指定目录中的文件和文件夹。常用选项：-l：以详细列表形式显示-a：显示所有文件，包括隐藏文件-h：以人类可读的格式显示文件大小示例：ls-lh/home/user2.cd：改变当前工作目录功能：切换当前的工作目录。示例：cd/var/www3.mkdir：创建新目录功能：创建一个或多个新目录。示例：mkdirmy_projectmkdir-ppro
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
PyCINRAD 安装和配置指南颜欢钰Edith
PyCINRAD安装和配置指南PyCINRADDecodeCINRAD(ChinaNewGenerationWeatherRadar)dataandvisualize.项目地址:https://gitcode.com/gh_mirrors/py/PyCINRAD1.项目基础介绍和主要编程语言项目基础介绍PyCINRAD是一个开源的气象雷达数据处理和可视化库，专门用于解码中国新一代天气雷达（CINR
印度、马来股票K线接口与实时数据对接文档金融数据出海数据分析金融 python3.11 数据库
概述本文档旨在为开发者提供关于如何使用StockTVAPI获取特定股票或指数的K线数据（即OHLCV数据，包括开盘价、最高价、最低价、收盘价以及成交量），以及如何通过WebSocket(WS)获取实时市场数据的详细指南。通过本文档，您将了解到如何构造请求URL，解析返回的数据，以及一些实用的应用场景示例。K线接口说明请求方法GET请求URLhttps://api.stocktv.top/stock
Java开发者必看！零成本集成DeepSeek-R1打造AI办公神器，源码级实战教程让你效率翻倍！ Leaton Lee java 人工智能开发语言
目录开篇互动一、为什么是DeepSeek-R1？它凭什么碾压传统AI工具？二、手把手部署DeepSeek-R1本地环境（附避坑指南）步骤1：Docker一键部署步骤2：下载模型步骤3：验证部署三、Java整合DeepSeek-R1：从理论到实战1.添加HTTP客户端依赖（以SpringBoot为例）2.封装AI工具类（核心代码解析）3.实战场景1：自动生成周报（附Prompt技巧）四、高阶玩法：A
创建在线工具来测量 PDF图纸程序员
在线处理PDF文件时，能够直接在浏览器中测量尺寸和内容可以显著提高工作效率。本指南将引导您完成使用ComPDFKit的WebSDK构建在线PDF测量工具的简单过程。先决条件首先，您需要访问我们的“WebSDK指南”页面来检查您是否满足这些要求：Node.js的最新稳定版本。与npm兼容的包管理器。应用许可证密钥如何获取30天免费许可证ComPDFKit为每个人提供30天免费许可证密钥，以测试他们的
飞书自定义机器人消息接入指南师小师飞书机器人
操作流程第一步邀请自定义机器人入群：进入你的目标群组，打开会话设置，找到群机器人，并点击添加机器人，选择自定义机器人加入群聊。为机器人输入一个合适的名字和描述，也可以为机器人设置一个合适的头像，然后点击下一步。第二部：配置webhook获取该机器人的webhook地址，格式如下：https://open.feishu.cn/open-apis/bot/v2/hook/xxxxxxxxxxxxxxx
linux下安装卸载永中office步骤,永中集成Office For Linux安装图文指南及简介 weixin_39625975
永中集成OfficeForLinux安装图文指南及简介永中集成Office在一套标准的用户界面下集成了文字处理、电子表格和简报制作三大应用，提供自选图形、艺术字、剪贴画、图表和科教编辑器等附加功能；基于创新的数据对象储藏库专利技术，有效解决了Office各应用之间的数据集成问题，构成了一套独具特色的集成办公软件。永中集成Office用户界面和使用方式与常见Office相似，易学易用；能够双向精确兼
SAP-ABAP：SAP外网接口调用技术全景指南爱喝水的鱼丶 VIP详情查看专栏 SAP业务学习捷径 SAP-ABAP开发基础详解 SAP ABAP ERP 开发运维运维 HTTP 接口调用
SAP外网接口调用技术全景指南1.核心调用方式对比矩阵方法类型协议支持适用场景开发复杂度维护成本典型应用案例HTTPClientREST/HTTP通用API集成★★☆低调用第三方支付接口SOAPProxySOAP/WSDL标准化Web服务★★★中银行系统对接ODataClientODataSAP生态集成★★☆低Fiori应用数据扩展PI/PO中间件多协议转换企业级复杂集成★★★★高跨系统业务流程编
SAP-ABAP：SAP采购模块（MM-PUR）学习指南爱喝水的鱼丶 VIP详情查看专栏 SAP业务学习捷径 SAP-ABAP开发基础详解 ABAP SAP ERP 运维 SAP采购业务学习
Ⅰ.模块全景图采购管理需求计划供应商协同采购执行财务集成采购申请/MRP供应商评估/合同订单/收货/发票应付账款Ⅱ.核心配置矩阵2.1组织结构配置对象事务码配置关系业务影响示例值采购组织OX01分配公司代码跨法人采购1000-US工厂OX18链接采购组织库存管理2000-CH采购组OME9指定采购专家责任划分PG01-IT采购2.2单据类型配置单据类型配置路径关键字段审批策略应用场景标准采购订单M
Seaborn 数据可视化指南：核心功能与实战技巧奋斗者1号信息可视化
Seaborn数据可视化指南：核心功能与实战技巧一、Seaborn核心功能1.高级统计图表接口自动统计计算：内置聚合、分布拟合、误差线计算等功能，无需手动处理数据。importseabornassnssns.histplot(data=df,x="age",hue="gender",kde=True)#自动分箱并拟合分布2.美观的默认主题提供darkgrid、whitegrid、dark、whit
HoRain云--无需修改BIOS！Linux系统迁移根目录到新磁盘终极指南 HoRain 云小助手 linux 运维服务器
HoRain云小助手：个人主页⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。目录⛳️推荐一、原理简析二、操作步骤（以Ubuntu为例）1.准备工作2.临时挂载新磁盘3.修改GRUB配置4.更新引导配置5.验证配置（重要！）三、故障排查（附解决方案）四、永久生效设置五、注意事项一、原理简析通过GRUB
AUTOSAR与arxml的文档解析 dont__cry c语言 autosar
如下是文档脑图一、文档概述该文档是AUTOSAR经典平台的应用接口用户指南，主要解释**AlTable（应用接口表）**的结构、方法论及相关技术细节，帮助开发者理解如何通过标准化接口实现软件组件的互操作性。关键内容目的：定义并发布稳定、广泛接受的汽车电子系统应用接口，支持跨厂商软件组件的通信。结构：包含元模型表示、兼容性管理、生命周期状态、视图概念及XML生成规则等。二、核心概念与示例1.AUTO
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class