yanglr2010

用PHP构建自定义搜索引擎:

用PHP构建自定义搜索引擎

使用 Sphinx 索引内容、快速查找文本并提供有用的搜索结果

Martin Streicher ( [email protected]), 主编, Linux Magazine

Martin Streicher 目前担任 Linux Magazine 的主编。Martin 毕业于普渡大学并获得计算机科学硕士学位，从 1986 年起他一直从事类 UNIX 系统的编程工作，他使用的编程语言包括 Pascal、 C、Perl、Java 以及近期的 Ruby 语言。

简介： 虽然 Google 及其系列产品几乎无所不能，但是 Web 形式的强大搜索引擎并不能很好地适用于每个站点。如果站点内容已被高度专业化或已明确分类，那就需要使用 Sphinx 和 PHP 来创建一个优化的本地搜索系统。

发布日期： 2007 年 9 月 10 日
级别： 中级
访问情况： 14028 次浏览
评论：

static.content.url=http://www.ibm.com/developerworks/js/artrating/

SITE_ID=10

Zone=Open source

ArticleID=254365

ArticleTitle=用 PHP 构建自定义搜索引擎

publish-date=09102007

[email protected]

在 Internet 时代，人们希望信息能够像快餐一样被打包起来：能够快速无障碍使用，并且分为很小的单位（或者是以字节大小为单位？）。实际上，为了满足急躁而又渴求信息的用户的需求，甚至最普通的 Web 站点现在都要求具有快速浏览样式的各种菜单：

RSS 是比萨快递员，会把新鲜出炉的比萨送上门。
网络日志是当地的中餐馆，为您献上喜爱的风味菜肴。
论坛是家常便饭（或者可能更恰当地说，“动物屋” 中抢夺食物的场景）。
而搜索就像在当地的餐厅吃自助晚餐一样：不断将想吃的食物填满盘子就行，只要您的食道 —— 还有您的椅子 —— 撑得住。

幸运的是，PHP 开发人员可以找到各种 RSS、blog 和论坛软件来创建或者改进站点。而且，虽然 Google 和其他搜索站点几乎无所不能并且执行过滤通信，但是搜索引擎并不一定会良好地适应各个站点。

例如，如果 Web 站点提供成百上千的全新和翻新的保时捷汽车零件，Google 可能通过诸如 “Carrera parts” 之类的广义搜索找到您的站点，但是对于更具体的 “used 1991 Porsche 911 Targa headlight bezel” 查询，它可能不会得到精确结果。

如果站点内容高度专业化，或者访问者期望搜索功能与现实工作流类似，那么最好在 Web 的全局搜索引擎基础上增加一个为您的站点量身定做的本地搜索系统（有关专业化搜索的更多实例，请参阅 “A needle in a billion haystacks”）。

通过本文了解如何向 PHP 站点中添加一个快速、高效、开源和免费的搜索引擎。本文没有开发可见的 Web 站点。相反，重点讨论交付有效搜索结果所需的组件：数据库、索引、搜索引擎和 PHP 应用程序编程接口 (API)。

访问优秀的 sphinx

要为站点提供自定义搜索功能，您必须有数据源和搜索该数据源的功能。对于 Web 应用程序，数据源通常是一个关系数据库，其中内置了一些搜索功能（Equality 是一个简单的搜索运算符，与 SQL 运算符 LIKE 一样）。但是，一些搜索可能比数据库可以执行的搜索更加具体，或者搜索可能过于复杂，而导致固有的 SQL JOIN 反应迟钝。

海底捞针

许多站点提供特定于某一个行业、职业或者娱乐的内容，例如医药、法律、音乐和汽车维修。深入研究这些内容可能要求使用特殊工具或者培训，或者仅需要使用一个索引来生成相关的实用结果。

下面是一些需要定制搜索系统的常见搜索场景：

查找 Joe Hockey 所撰写的关于斯坦利杯 (Stanley Cup) 的所有文章。
查找 HP LaserJet 3015 All-in-One 打印机的最新驱动程序。
查找 Dinosaur Jr. 参与大卫深夜脱口秀节目的电视片段。

要加速搜索，您可以重新安排表，并由此简化底层查询（表和 SQL 查询优化高度依赖于模式和引擎。可通过在线搜索查找有关数据库性能的各种文章和书籍）。此外，您可以添加一个专门化的搜索引擎。应用哪种形式的搜索引擎还依赖于数据的形式（和数量）和预算。有许多选择可用：您可以将一个 Google 工具连接到您的网络中，购买 Endeca 或其他大型商业搜索产品，或者尝试 Lucene。但是在很多情况下，使用商业产品都有点小题大做，或者浪费运营预算，并且 Lucene 在 2007 年 7 月编写时并未提供 PHP API。

作为一个备选方案，考虑一下 Sphinx，它是一种开源和免费的搜索引擎，可以非常快速地搜索文本。例如，在一个几乎有 300,000 行及五个索引列（每列包含大约 15 个单词）的活动数据库中，Sphinx 可以在 1/100 秒内得到 “这些单词中任何一个单词” 的搜索结果（在运行 Debian Linux? Sarge 的 2-GHz AMD Opteron 处理器、1 GB RAM 的计算机上）。

Sphinx 提供了大量功能，包括：

它可以为能够表示为字符串的所有数据建立索引。
它可以以各种方式为相同数据建立索引。对于多个索引，每个索引都针对特定目的而定制，您可以选择最适当的索引来优化搜索结果。
它可以把属性与每条索引数据关联起来。然后您可以使用一个或多个属性来进一步过滤搜索结果。
它支持词法，因此搜索单词 “cats” 还会找到词根 “cat”。
您可以在许多计算机中分发 Sphinx 索引，从而提供故障恢复功能。
它可以创建任意长度的单词前缀索引和可变长度的中缀子字符串的索引。例如，一个零件号可以是 10 个字符宽。前缀索引将匹配位于字符串开头处的所有可能的子字符串。中缀索引将匹配在字符串内任意位置的子字符串。
您可以在 MySQL V5 内将其作为存储引擎运行，降低使用其他守护程序的需求（通常被视为另一个故障点）。

您可以在 Sphinx 源代码附带的 README 文件中或通过在线资料找到完整的功能列表。Sphinx Web 站点还列出了已经部署了 Sphinx 的若干个项目。

Sphinx 是用 C++ 编写、用 GNU 编译器构建、支持 64 位支持平台，并在 Linux、UNIX?、Microsoft? Windows? 和 Mac OS X 上运行。构建 Sphinx 十分简单：下载并解压缩代码，然后运行 ./configure && make && make install 命令。

默认情况下，Sphinx 实用程序将被安装到 /usr/local/bin/ 中，并且所有 Sphinx 组件的配置文件都位于 /usr/local/etc/sphinx.conf 中。

Sphinx 有三个组件：索引生成器、搜索引擎和命令行 search 实用程序：

索引生成器被称为索引器。它将查询数据库，为结果的每行中的每列建立索引，并且将每个索引条目绑定到行的主键上。
搜索引擎是名为 searchd 的守护程序。该守护程序将接收搜索词和其他参数，快速遍历一个或多个索引，并返回结果。如果找到匹配，searchd 将返回一个主键数组。对于这些键，应用程序可以针对相关数据库运行查询来查找包含匹配的完整记录。Searchd 将在端口 3312 上通过套接字连接与应用程序进行通信。
便捷的 search 实用程序使您可以从命令行构造搜索而无需编写代码。如果 searchd 返回匹配，则 search 将查询数据库并显示匹配集中的行。search 实用程序对于调试 Sphinx 配置和执行临时搜索十分有用。

此外，Sphinx 的作者 Andrew Aksyonoff 和其他贡献者为 PHP、Perl、C/C++ 和其他编程语言提供了 API。

回页首

搜索车身零件

假定 Body-Parts.com 出售车身零件 —— 挡泥板、铬、缓冲器等 —— 用于珍贵且值得收藏的汽车。正如在现实世界中，Body Parts 站点的访问者很可能按制造商（比如保时捷或制造同类零件的第三方制造商）、零件号、产地、车型、年份、条件（二手、全新、翻新）以及描述或者这些属性的某种组合来搜索零件。

要构建 Body Parts 搜索功能，让我们使用 MySQL V5.0 作为数据存储并使用 Sphinx search 守护程序来提供快速而精确的文本搜索。MySQL V5.0 是一个功能强大的数据库，但是它的增强型全文本搜索功能并不特别丰富。实际上，它仅限于 MyISAM 表 —— 不支持外键的一种表格式，因此使用有限。

清单 1 至清单 4 显示了与此示例相关的 Body Parts 模式的部分代码。您将分别看到 Model（清单 1）、Assembly（清单 2）、Inventory（清单 3）和 Schematic（清单 4）表。

Model 表

清单 1 中所示的 Model 表十分简单：label 列将列举车型的名称（“Corvette”）；description 使用客户友好方式进行描述（“两门跑车；第一年引入”）；而 begin_production 和 end_production 分别表示开始生产和结束生产该车型的年份。由于前述列中的值并不惟一，因此使用一个独立 ID 表示每四个这样的元素（label、description、begin_production、end_production），并且是其他表中的外键。

清单 1. 车身零件 Model 表

                  CREATE TABLE Model (    id int(10) unsigned NOT NULL auto_increment,    label varchar(7) NOT NULL,    description varchar(256) NOT NULL,    begin_production int(4) NOT NULL,    end_production int(4) NOT NULL,    PRIMARY KEY (id)  ) ENGINE=InnoDB;

下面是 Model 表的一些样例数据：

INSERT INTO Model     (`id`, `label`, `description`, `begin_production`, `end_production`)   VALUES     (1,'X Sedan','Four-door performance sedan',1998,1999),    (3,'X Sedan','Four door performance sedan, 1st model year',1995,1997),    (4,'J Convertible','Two-door roadster, metal retracting roof',2002,2005),    (5,'J Convertible','Two-door roadster',2000,2001),    (7,'W Wagon','Four-door, all-wheel drive sport station wagon',2007,0);

Assembly 表

assembly 是一个子系统，例如汽车上安装的传动装置或所有玻璃。车主使用部件图及相关零件列表来查找备件。清单 2 中所示的 Assembly 表也十分简单：它将把一个惟一 ID 与部件标签和描述关联起来。

清单 2. Assembly 表

                  CREATE TABLE Assembly (    id int(10) unsigned NOT NULL auto_increment,    label varchar(7) NOT NULL,    description varchar(128) NOT NULL,    PRIMARY KEY (id)  ) ENGINE=InnoDB;

继续示例，下面是 Assembly 表的一些样例数据：

INSERT INTO Assembly     (`id`, `label`, `description`)   VALUES     (1,'5-00','Seats'),    (2,'4-00','Electrical'),    (3,'3-00','Glasses'),    (4,'2-00','Frame'),    (5,'1-00','Engine'),    (7,'101-00','Accessories');

Inventory 表

Inventory 表是汽车零件的典范列表。零件 —— 例如螺钉或灯泡 —— 可能用于每辆汽车和多个部件中，但是零件只在 Inventory 表中显示一次。Inventory 表中的每行包含：

使用了惟一的 32 位整数 serialno 标识行。
字母数字零件号（此零件号惟一并且可以用作主键。但是，由于它可以包含字母数字字符，因此它不适于与 Sphinx 结合使用，Sphinx 要求索引的每条记录都有一个惟一的 32 位整型键）。
文本描述。
价格。

Inventory 表的规范如清单 3 中所示：

清单 3. Inventory 表

                  CREATE TABLE Inventory (    id int(10) unsigned NOT NULL auto_increment,    partno varchar(32) NOT NULL,    description varchar(256) NOT NULL,    price float unsigned NOT NULL default '0',    PRIMARY KEY (id),    UNIQUE KEY partno USING BTREE (partno)  ) ENGINE=InnoDB;

零件的（部分）列表可能如下面所示：

INSERT INTO `Inventory`     (`id`, `partno`, `description`, `price`)   VALUES     (1,'WIN408','Portal window',423),    (2,'ACC711','Jack kit',110),    (3,'ACC43','Rear-view mirror',55),    (4,'ACC5409','Cigarette lighter',20),    (5,'WIN958','Windshield, front',500),    (6,'765432','Bolt',0.1),    (7,'ENG001','Entire engine',10000),    (8,'ENG088','Cylinder head',55),    (9,'ENG976','Large cylinder head',65);

Schematic 表

Schematic 表将把零件与部件和车型版本绑定在一起。因此，将使用 Schematic 表来查找组装 1979 J Class 敞篷车引擎的所有零件。Schematic 表中的每行都有一个惟一 ID，一个引用 Inventory 表行的外键，一个标识部件的外键，以及用于引用 Model 表中特定型号和版本的另一个键。各行如清单 4 所示：

清单 4. Schematic 表

                  CREATE TABLE Schematic (    id int(10) unsigned NOT NULL auto_increment,    partno_id int(10) unsigned NOT NULL,    assembly_id int(10) unsigned NOT NULL,    model_id int(10) unsigned NOT NULL,    PRIMARY KEY (id),    KEY partno_index USING BTREE (partno_id),    KEY assembly_index USING BTREE (assembly_id),    KEY model_index USING BTREE (model_id),    FOREIGN KEY (partno_id) REFERENCES Inventory(id),    FOREIGN KEY (assembly_id) REFERENCES Assembly(id),    FOREIGN KEY (model_id) REFERENCES Model(id)  ) ENGINE=InnoDB;

为了强化表的意图，下面是 Schematic 中的一张小型行列表：

INSERT INTO `Schematic`     (`id`, `partno_id`, `assembly_id`, `model_id`)   VALUES     (1,6,5,1),    (2,8,5,1),    (3,1,3,1),    (4,5,3,1),    (5,8,5,7),    (6,6,5,7),    (7,4,7,3),    (8,9,5,3);

搜索表

定义了这些表后，就可以轻松地响应很多搜索：

显示特定型号的所有版本
列出装配特殊型号和版本所需的所有部件
显示构成特定型号和版本的特殊部件的所有零件

但是很多搜索代价较大：

查找所有模型和版本中出现零件号开头为 “WIN” 的所有零件
查找描述中有 “lacquer” 或 “paint” 的那些零件
查找描述中有 “black leather” 的所有零件
查找描述中有 “paint” 的所有 2002 J 系列零件

这些搜索中的每个搜索都要求使用长篇的 JOIN 子句或代价高昂的 LIKE 子句，尤其是在 Inventory 表和 Schematic 表十分大时更是如此。而且，复杂的文本搜索完全超出了 MySQL 的能力。要搜索大量文本数据，请考虑构建和使用 Sphinx 索引。

回页首

集成 Sphinx 软件

要应用 Sphinx 来解决问题，您必须定义一个或多个数据源以及一个或多个索引。

source 将标识数据库来建立索引，提供验证信息，并且定义查询用以构造每行。数据源可以随意地标识一列或多列作为过滤器，Sphinx 将之称为组。您将使用组来过滤结果。例如，单词描述可能得到 900 个匹配。如果只对特定型号的汽车匹配感兴趣，则可以进一步使用型号组进行过滤。

index 将要求获得数据源（即一组数据行）并定义应当如何为已从数据源中提取出来的数据编目。

您将在 sphinx.conf 文件中定义数据源和索引。Body Parts 的数据源是 MySQL 数据库。清单 5 显示了名为 catalog 的数据源的部分定义 —— 指定连接的数据库以及如何建立连接（主机、套接字、用户和密码）的代码片段。

清单 5. 用于访问 MySQL 数据库的设置

                  source catalog   {      type                            = mysql            sql_host                        = localhost      sql_user                        = reaper      sql_pass                        = s3cr3t      sql_db                          = body_parts      sql_sock                        =  /var/run/mysqld/mysqld.sock      sql_port                        = 3306

接下来，创建一个查询以生成要被索引的行。通常，将创建 SELECT 子句，可能需要把许多表 JOIN 在一起才能得到行。但这里存在一个问题：搜索型号和年份必须使用 Assembly 表，但是零件号和零件描述只能在 Inventory 表中找到。为此，Sphinx 必须能够把搜索结果与 32 位整型主键绑定在一起。

要获得右侧表单中的数据，需要创建一个视图 —— MySQL V5 中的新结构，它将把来自其他表的列整合到单独的合成虚拟表中。使用视图，各类搜索所需的所有数据都在一个位置，但是活动数据实际上存在于其他表中。清单 6 显示了定义 Catalog 视图的 SQL。

清单 6. Catalog 视图将把数据整合到虚拟表中

                  CREATE OR REPLACE VIEW Catalog AS  SELECT    Inventory.id,    Inventory.partno,    Inventory.description,    Assembly.id AS assembly,    Model.id AS model  FROM    Assembly, Inventory, Model, Schematic  WHERE    Schematic.partno_id=Inventory.id     AND Schematic.model_id=Model.id     AND Schematic.assembly_id=Assembly.id;

如果用前面所示的表和数据创建名为 body_parts 的数据库，则 Catalog 视图应当类似以下内容：

mysql> use body_parts;  Database changed  mysql> select * from Catalog;  +----+---------+---------------------+----------+-------+  | id | partno  | description         | assembly | model |  +----+---------+---------------------+----------+-------+  |  6 | 765432  | Bolt                |        5 |     1 |   |  8 | ENG088  | Cylinder head       |        5 |     1 |   |  1 | WIN408  | Portal window       |        3 |     1 |   |  5 | WIN958  | Windshield, front   |        3 |     1 |   |  4 | ACC5409 | Cigarette lighter   |        7 |     3 |   |  9 | ENG976  | Large cylinder head |        5 |     3 |   |  8 | ENG088  | Cylinder head       |        5 |     7 |   |  6 | 765432  | Bolt                |        5 |     7 |   +----+---------+---------------------+----------+-------+  8 rows in set (0.00 sec)

在视图中，字段 id 将指回 Inventory 表中的零件条目。partno 和 description 列是要搜索的主要文本，而 assembly 和 model 列用作进一步过滤结果的组。视图就绪后，构造数据源查询就是小事一桩。清单 7 显示了 catalog 数据源定义的其余部分。

清单 7. 查询创建待索引的行

                      # indexer query      # document_id MUST be the very first field      # document_id MUST be positive (non-zero, non-negative)      # document_id MUST fit into 32 bits      # document_id MUST be unique      sql_query                       = \              SELECT \                      id, partno, description, \                      assembly, model \              FROM \                      Catalog;            sql_group_column                = assembly      sql_group_column                = model            # document info query      # ONLY used by search utility to display document information      # MUST be able to fetch document info by its id, therefore      # MUST contain '$id' macro       #      sql_query_info          = SELECT * FROM Inventory WHERE id=$id  }

sql_query 必须包括后续查找需要使用的主键，并且它必须包括需要索引和用作组的所有字段。两个 sql_group_column 条目将声明 Assembly 和 Model 可用于过滤结果。并且 search 实用程序将使用 sql_query_info 来查找匹配记录。在查询中，$id 被替换为 searchd 返回的每个主键。

最后一个配置步骤是构建索引。清单 8 显示了数据源 catalog 的索引。

清单 8. 描述 catalog 数据源的一个可能的索引

                  index catalog  {      source                  = catalog      path                    = /var/data/sphinx/catalog      morphology              = stem_en        min_word_len            = 3      min_prefix_len          = 0      min_infix_len           = 3  }

第 1 行将指向 sphinx.conf 文件中的指定数据源。第 2 行将定义存储索引数据的位置；按照约定，Sphinx 索引将被存储到 /var/data/sphinx 中。第 3 行将允许索引使用英文词法。并且第 5 行至第 7 行将告诉索引器只索引含有三个字符或更多字符的那些单词，并且为每个这样的字符的子字符串创建中缀索引（为了便于引用，清单 9 显示了 Body Parts 的完整示例 sphinx.conf 文件）。

清单 9. Body Parts 的示例 sphinx.conf

                  source catalog  {      type                            = mysql            sql_host                        = localhost      sql_user                        = reaper      sql_pass                        = s3cr3t      sql_db                          = body_parts      sql_sock                        =  /var/run/mysqld/mysqld.sock      sql_port                        = 3306                          # indexer query      # document_id MUST be the very first field      # document_id MUST be positive (non-zero, non-negative)      # document_id MUST fit into 32 bits      # document_id MUST be unique        sql_query                       = \              SELECT \                      id, partno, description, \                      assembly, model \              FROM \                      Catalog;        sql_group_column                = assembly      sql_group_column                = model        # document info query      # ONLY used by search utility to display document information      # MUST be able to fetch document info by its id, therefore      # MUST contain '$id' macro       #        sql_query_info          = SELECT * FROM Inventory WHERE id=$id  }    index catalog  {      source                  = catalog      path                    = /var/data/sphinx/catalog      morphology              = stem_en        min_word_len            = 3      min_prefix_len          = 0      min_infix_len           = 3  }    searchd  {   port    = 3312   log     = /var/log/searchd/searchd.log   query_log   = /var/log/searchd/query.log   pid_file   = /var/log/searchd/searchd.pid  }

底部的 searchd 部分将配置 searchd 守护程序本身。该部分中的条目不言自明。query.log 尤为有用：它将在运行时显示每次搜索并显示结果，例如搜索的文档数和匹配总数。

回页首

构建和测试索引

您现在已经准备好为 Body Parts 应用程序构建索引。为此，需要执行以下步骤：

键入 $ sudo mkdir -p /var/data/sphinx 创建目录结构 /var/data/sphinx

假定 MySQL 正在运行，使用如下所示的代码运行索引器来创建索引。

清单 10. 创建索引

                          $ sudo /usr/local/bin/indexer --config /usr/local/etc/sphinx.conf --all  Sphinx 0.9.7  Copyright (c) 2001-2007, Andrew Aksyonoff    using config file '/usr/local/etc/sphinx.conf'...  indexing index 'catalog'...  collected 8 docs, 0.0 MB  sorted 0.0 Mhits, 82.8% done  total 8 docs, 149 bytes  total 0.010 sec, 14900.00 bytes/sec, 800.00 docs/sec

注： -all 参数将重构 sphinx.conf 中列出的所有索引。如果不需要重构所有索引，您可以使用其他参数只对部分索引进行重构。

您现在可以使用如下所示的代码用 search 实用程序测试索引（不必运行 searchd 即可使用 search）。

清单 11. 用 search 测试索引

                          $ /usr/local/bin/search --config /usr/local/etc/sphinx.conf ENG  Sphinx 0.9.7  Copyright (c) 2001-2007, Andrew Aksyonoff    index 'catalog': query 'ENG ': returned 2 matches of 2 total in 0.000 sec    displaying matches:  1. document=8, weight=1, assembly=5, model=7          id=8          partno=ENG088          description=Cylinder head          price=55  2. document=9, weight=1, assembly=5, model=3          id=9          partno=ENG976          description=Large cylinder head          price=65    words:  1. 'eng': 2 documents, 2 hits    $ /usr/local/bin/search --config /usr/local/etc/sphinx.conf wind   Sphinx 0.9.7  Copyright (c) 2001-2007, Andrew Aksyonoff    index 'catalog': query 'wind ': returned 2 matches of 2 total in 0.000 sec    displaying matches:  1. document=1, weight=1, assembly=3, model=1          id=1          partno=WIN408          description=Portal window          price=423  2. document=5, weight=1, assembly=3, model=1          id=5          partno=WIN958          description=Windshield, front          price=500    words:  1. 'wind': 2 documents, 2 hits    $ /usr/local/bin/search \  --config /usr/local/etc/sphinx.conf --filter  model 3 ENG  Sphinx 0.9.7  Copyright (c) 2001-2007, Andrew Aksyonoff    index 'catalog': query 'ENG ': returned 1 matches of 1 total in 0.000 sec    displaying matches:  1. document=9, weight=1, assembly=5, model=3          id=9          partno=ENG976          description=Large cylinder head          price=65    words:  1. 'eng': 2 documents, 2 hits

第一条命令 /usr/local/bin/search --config /usr/local/etc/sphinx.conf ENG 在零件号中找到了两个含有 ENG 的结果。第二条命令 /usr/local/bin/search --config /usr/local/etc/sphinx.conf wind 在两个零件描述中找到了子字符串 wind。而第三条命令把结果限定为 model 为 3 的条目。

回页首

编写代码

最后，您可以编写 PHP 代码来调用 Sphinx 搜索引擎。Sphinx PHP API 非常小并且易于掌握。清单 12 是一个小型 PHP 应用程序，用于调用 searchd 以得到使用上面所示的最后一条命令得到的相同结果（“在属于型号 3 的名称中找到含有 ‘cylinder’ 的所有零件”）。

清单 12. 从 PHP 调用 Sphinx 搜索引擎

                  <?php    include('sphinx-0.9.7/api/sphinxapi.php');      $cl = new SphinxClient();    $cl->SetServer( "localhost", 3312 );    $cl->SetMatchMode( SPH_MATCH_ANY  );    $cl->SetFilter( 'model', array( 3 ) );      $result = $cl->Query( 'cylinder', 'catalog' );      if ( $result === false ) {        echo "Query failed: " . $cl->GetLastError() . ".\n";    }    else {        if ( $cl->GetLastWarning() ) {            echo "WARNING: " . $cl->GetLastWarning() . "
";        }          if ( ! empty($result["matches"]) ) {            foreach ( $result["matches"] as $doc => $docinfo ) {                  echo "$doc\n";            }                        print_r( $result );        }    }      exit;  ?>

要测试代码，需要为 Sphinx 创建 log 目录，启动 searchd，然后运行 PHP 应用程序，如下所示：

清单 13. PHP 应用程序

                  $ sudo mkdir -p /var/log/searchd  $ sudo /usr/local/bin/searchd --config /usr/local/etc/sphinx.conf  $ php search.php   9  Array  (      [fields] => Array          (              [0] => partno              [1] => description          )        [attrs] => Array          (              [assembly] => 1              [model] => 1          )        [matches] => Array          (              [9] => Array                  (                      [weight] => 1                      [attrs] => Array                          (                              [assembly] => 5                              [model] => 3                          )                    )            )        [total] => 1      [total_found] => 1      [time] => 0.000      [words] => Array          (              [cylind] => Array                  (                      [docs] => 2                      [hits] => 2                  )            )  )

输出为 9：匹配的单行的正确主键。如果 Sphinx 找到匹配，相关数组 $result 将包含名为 results 的元素。浏览 print_r() 的输出以查看返回的其他内容。

注意事项：total_found 是在索引中找到的匹配总数，而 found 是返回的结果数。这两者可能不同，因为您可以更改每次返回多少个匹配结果以及要返回哪批匹配结果，哪个结果利于对冗长的结果列表分页。请查看 API 调用 SetLimits()。一个分页示例是用 $cl->SetLimits( ( $page - 1 ) * SPAN, SPAN ) 调用搜索引擎返回第一批、第二批、第三批（依此类推）SPAN 匹配结果，这取决于显示哪个页面。

回页首

结束语

Sphinx 还有更多的功能可以利用。我在这里仅仅介绍了最浅显的一部分，但是您现在有一个可以工作的现实示例作为基石来扩展您的技能。

仔细研读随发行版附带的样例 Sphinx 配置文件 /usr/local/etc/sphinx.conf.dist。该文件中的注释将说明每个 Sphinx 参数可以实现的功能；展示如何创建分布式冗余配置；并说明如何继承基本设置以避免源代码及索引中的重复。Sphinx README 文件还是十分丰富的信息源，包括如何将 Sphinx 直接嵌入 MySQL V5 —— 不需要使用守护程序。

下一篇文章中，将探寻比 echo() 和 print_r() 更好的解决方案来调试 PHP 代码。

参考资料

学习

您可以参阅本文在 developerWorks 全球站点上的英文原文。
Sphinx 是一个专门用于快速搜索文本的免费的开源搜索引擎。
查看 Endeca 或另一个大型商业搜索产品，或者尝试 Lucene。
PHP.net 是 PHP 开发者的重要资源。
查看 “PHP 推荐读物列表”。
浏览 developerWorks 上的全部 PHP 文章和PHP 教程。
查看 IBM developerWorks 的 PHP 项目资源以扩展 PHP 技巧。
收听针对软件开发人员的有趣访谈和讨论，一定要访问 developerWorks podcast。
要将数据库与 PHP 结合使用？查看 Zend Core for IBM，它是一个无缝的、可以立即使用、易于安装、支持 IBM DB2 V9 的 PHP 开发和生产环境。
随时关注 developerWorks 的技术事件和网络广播。
查阅最近将在全球举办的面向 IBM 开放源码开发人员的研讨会、交易展览、网络广播和其他活动。
访问 developerWorks 开放源码专区，获得丰富的 how-to 信息、工具和项目更新，帮助您用开放源码技术进行开发，并与 IBM 产品结合使用。
查看免费的 developerWorks On demand demo，观看并了解 IBM 及开源技术和产品功能。

获得产品和技术

正在寻找要与 PHP 应用程序结合使用的数据库？下载 IBM DB2 Express-C 9，它是一个免费版本的 DB2 Express V9 数据服务器。
使用 IBM 试用软件改进您的下一个开发项目，这些软件可以通过下载或从 DVD 中获得。
下载 IBM 产品评估版，并开始使用 DB2?、Lotus?、Rational?、Tivoli? 和 WebSphere? 的应用程序开发工具和中间件产品。

讨论

参与 developerWorks blog 并加入 developerWorks 社区。
加入 developerWorks PHP Forum: Developing PHP applications with IBM Information Management products (DB2, IDS)。

关于作者

相关链接: https://www.ibm.com/developerworks/cn/opensource/os-php-sphinxsearch/

http://www.mzone.cc/article/344.html

http://www.mzone.cc/article/334.html

利用Yahoo! Search API开发自已的搜索引擎-php版: http://www.phpfans.net/article/php/q1171770261_14625.html

你可能感兴趣的:(用PHP构建自定义搜索引擎:)

面试官：Vue中的过滤器了解吗？过滤器的应用场景有哪些？动感超人，过滤器 filter vue epoll tapestry
一、是什么过滤器（filter）是输送介质管道上不可缺少的一种装置大白话，就是把一些不必要的东西过滤掉过滤器实质不改变原始数据，只是对数据进行加工处理后返回过滤后的数据再进行调用处理，我们也可以理解其为一个纯函数Vue允许你自定义过滤器，可被用于一些常见的文本格式化ps:Vue3中已废弃filter二、如何用vue中的过滤器可以用在两个地方：双花括号插值和v-bind表达式，过滤器应该被添加在Ja
常见的深度学习优化器青灯剑客算法 python 人工智能机器学习自然语言处理深度学习
一直用优化器解决问题，但是没有对它进行一个系统的总结。。不对，系统的总结进行过，只是时过境迁，早已忘却。一、照进我脑海的几个家伙一开始学习的当然是SGD，只是学着学着就忘记了。后来呢，接触到网上介绍的几种常用的优化器，看着原理挺给力，可是记了好几次都记不住。直到遇到《百面机器学习》，它从最基本的原理出发，给了我一点灵感。（1）几种常用的优化器，详情见这里链接34（2）二、以为自己遇见了大海老师说，
Vue3开发 vue-router的使用 CV菜鸟# 前端开发 vue.js javascript 前端
1、vue-router简介官方介绍：VueRouter是Vue.js(opensnewwindow)官方的路由管理器。它和Vue.js的核心深度集成，让构建单页面应用变得易如反掌。包含的功能有：嵌套的路由/视图表模块化的、基于组件的路由配置路由参数、查询、通配符基于Vue.js过渡系统的视图过渡效果细粒度的导航控制带有自动激活的CSSclass的链接HTML5历史模式或hash模式，在IE9中自
vue面试题阡陌路人前端面试题 vue
一、mvc与mvvm的区别俩者都为开发架构，，后端用的比较多的是mvc，前端则是mvvm，移动端俩者都有。MVC是包括view视图层、controller控制层、model数据层。各部分之间的通信都是单向的。适合大型项目。MVVM包括view视图层、model数据层、viewmodel层。各部分通信都是双向的。适合小型项目。二、vue的事件修饰符.stop阻止冒泡，由内到外.prevent阻止默认
【工厂老板必看】智能切割算法帮您省 30% 原材料！附真实案例——一维下料问题算法、cad c#二次开发山水CAD筑梦人 CAD C#二次开发算法
一、行业痛点：原材料浪费有多严重？现象：传统人工排料导致大量边角料，例如：某钢材厂每月因切割不合理损失15万元木材加工厂平均浪费率高达25%核心问题：无法兼顾切割数量与材料利用率人工计算耗时且容易出错二、解决方案：贪心算法和遗传算法切割优化系统技术原理（通俗解释）：用贪心算法和遗传算法通过编程，自动生成最优切割方案，比人工排料效率高100倍以上！核心优势：省材料：原材料总根数减少20%-40%降成
贪心算法——c# 山水CAD筑梦人 C#学习笔记贪心算法算法
贪心算法通俗解释贪心算法是一种"每一步都选择当前最优解"的算法策略。它不关心全局是否最优，而是通过局部最优的累积来逼近最终解。优点是简单高效，缺点是可能无法得到全局最优解。一句话秒懂自动售货机找零钱：用最少数量的硬币凑出指定金额。比如找零198美分，它会优先用25美分的大硬币，不够再用小的，直到凑够金额。背景故事想象你在加拿大超市当收银员（CAD场景）：顾客买了东西你需要快速找出零钱198分收银台
TDE透明加密：免改造实现SQLServer数据库安全存储安当加密 sqlserver 数据库
引言：数据安全已成企业生命线在数字经济时代，SQLServer作为全球企业级数据库市场的核心引擎，承载着金融交易记录、医疗档案、智能制造数据等核心资产。然而，勒索软件攻击、内部泄密、备份泄露等威胁频发，仅2024年全球因数据库安全漏洞造成的损失已超320亿美元。传统防火墙与权限管理难以应对存储介质窃取、高权限滥用等风险，而安当TDE透明加密组件通过创新技术，为SQLServer数据库构建了从存储层
智能车辆控制技术：MPC与轨迹规划实战项目柚木i
本文还有配套的精品资源，点击获取简介：本压缩包集合了车辆转向控制与轨迹规划的MATLAB代码，包含模型预测控制（MPC）策略、MPT工具箱应用、车辆动力学模型构建、轨迹规划实现、mp-QP算法应用及MATLAB编程实践。旨在通过源码分析，提供智能车辆控制技术的深入学习与研究平台，涉及横向和纵向运动控制、系统模型的定义、控制策略的制定及仿真流程。1.模型预测控制（MPC）基础与应用模型预测控制（MP
基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别普和司
importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,trainDataSet,trainTargetSet,testDataSet):withopen(filename1,'r')ascsvfile1:lines1=csv.reader(csvfile1)dataSet=list(lines1
理解“机票和航班的多对多关系” 背太阳的牧羊人数据库 python sql
机票和航班的多对多关系：一张机票可以包含多个航班（比如你买了一张从北京到纽约的机票，中间需要在伦敦转机，那么这张机票实际对应两个航班：北京→伦敦和伦敦→纽约）。一个航班上可以有多个机票（比如北京→伦敦这趟航班上有200个乘客，每个乘客都有一张机票）。这就形成了一个多对多的关系：✅一张机票可以绑定多个航班（联程票）✅一个航班上可以有很多机票（多个乘客）用数值举例详细说明假设有以下航班：航班ID航班号
鸿蒙NEXT开发【基于HMRouter路由框架的页面开发场景解决方案】应用框架开发沙人防火历飞雨开发日常 harmonyos 鸿蒙鸿蒙系统架构路由前端框架 ui
HMRouter介绍HMRouter是HarmonyOS上页面跳转的场景解决方案，主要解决应用内原生页面间相互跳转的问题。本文主要以实际开发中的各项场景为例，介绍HMRouter路由框架的使用。HMRouter路由框架提供了下列功能特性：使用自定义注解实现路由跳转。支持HAR/HSP。支持路由拦截、路由生命周期。简化自定义动画配置：配置全局动画，单独指定某个页面的切换动画。支持不同的页面类型：单例
2Android中的AIDL是什么以及如何使用它 Java资深爱好者 android python git
一、Android中的AIDL概述AIDL（AndroidInterfaceDefinitionLanguage）是Android系统中用于定义和实现跨进程通信（IPC）接口的语言。它允许一个进程向另一个进程发送请求并获取响应，是Android中实现进程间通信的一种重要机制。AIDL文件定义了客户端和服务端之间的通信接口，这些接口在构建应用时会被AndroidSDK工具自动生成对应的Java接口文
python和pytorch关系_PyTorch：Python优先的深度学习框架 weixin_39877182
最近，Torch7团队开源了PyTorch。据该项目官网介绍，PyTorch是一个Python优先的深度学习框架，能够在强大的GPU加速基础上实现张量和动态神经网络。PyTorch是一个Python软件包，其提供了两种高层面的功能：使用强大的GPU加速的Tensor计算（类似numpy）构建于基于tape的autograd系统的深度神经网络如有需要，你也可以复用你最喜欢的Python软件包（如nu
分布式架构的 CAP 定理、BASE 理论及其应用教程宋发元分布式架构
分布式架构的CAP定理、BASE理论及其应用教程在构建分布式系统时，数据一致性、系统可用性和网络分区容忍性是三个核心关注点。CAP定理和BASE理论为我们提供了指导原则，帮助在系统设计中进行合理权衡。本文将深入解析CAP定理和BASE理论，并结合实际应用案例，帮助你掌握在分布式架构中的应用策略。1.CAP定理：分布式系统的权衡法则1.1CAP定理概述CAP定理由EricBrewer提出，指出在一个
SpringBoot 快速入门（保姆级详细教程）「已注销」 SpringBoot spring boot spring java
作者：大三的土狗专栏：SpringBoot入门到精通快速导航前言1、SpringBoot简介2、优势3、快速入门1、新建工程2、勾选SpringWeb3、创建Controller4、启动服务器4、Spring和SpringBoot对比5、在官网构建工程6、问题总结前言SpringBoot时Spring家族中的一个全新框架，用来简化spring程序的创建和开发过程。SpringBoot化繁为简，使开
. HTML 中的注释和特殊字符花林似霰f html 前端
在HTML页面中，一些特殊的符号很难或者不方便直接使用，此时我们就可以使用下面的字符来替代。最常使用为>空格记住这三个，其它随用随查原始字符entity原始字符entity""&&''> ¡¡¢¢££¤¤¥¥¦¦§§¨¨©©ªª«&l
单元测试方法及其运用一休哥助手软考系统架构师单元测试
引言随着软件规模和复杂度的不断提升，开发人员面临着如何保证软件质量与稳定性的挑战。单元测试作为软件测试中不可或缺的一环，能够在早期发现代码中的问题，从而提高软件的可靠性。本文将结合我参与的一个软件项目，详细介绍单元测试中的静态测试与动态测试方法，以及如何确定白盒测试的覆盖标准和组织实施回归测试。1.项目背景及个人角色在我参与的一个在线教育平台开发项目中，团队的目标是构建一个高度可扩展的课程管理和学
2024架构设计师论文题目数字化信息化智能化解决方案 2024架构
论文1大数据lamda架构1、简要说明你参开发的软件项目,吸你所承担的主要作2、lamada体系架构将数据流分为批处理层(对应的英文、加速层文、服务层。简要叙这三个层次的用途和特点3、详细阐述你参与开发的软件项目如何基于lamada体系架构进行大数据处理的架构论文2模型驱动架构设计方法及其用1、简要说明你参与分析和研发的软件项目,吸你所承担的要工作2、简要阐述采用模型驱动架构思想进行软件开发的全过
用Python实现字符串反转程序媛了了 python java 前端
字符串反转代码：#第一种：最简单的切片方法defpythonit():n=input("请输入一段文本：")a=n[::-1]print(a)pythonit()#第二种：列表循环法，利用sort()函数defpython():n=input("请输入一段文本：")list=[]foriinn:list.append(i)list.sort(reverse=True)print("".join(l
OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file, 小李飞刀李寻欢 Notebook huggingface bert 分类大模型
场景：训练bert-base-chinese下游任务：分类。在一个服务器可以用，但GPU只有一个卡，只能换一个服务器，换个服务器又要重装环境，但后者下载模型有问题，手动用git-lfs下载后指定位置报错：Traceback(mostrecentcalllast):/examples/pytorch/text-classification/run_glue.py",line622,inmain()/
自写控制台清除内容函数clrscr() z1095582370 c语言
编程小白，最近学了双缓冲，倒腾了好几天，终于是学会了。这里想要给大家分享的是控制台清除内容的函数clrscr()在网上找了好久，有的说这个函数是TC特有的（虽然不知道TC是啥），还有些说是在conio.h头文件里但VS2019绝对是没有的，所以只能只能写这里可能有人会说用system(“cls”)就好，clrscr()很复杂，但我最近几天被折磨的BUG就是因为这个system(“cls”)导致的，
DeepSeek、Grok、ChatGPT4.5和Gemini四大AI模型深度解析：谁才是你的最佳助手 lifire_H 人工智能 chatgpt DeepSeek Grok
在AI技术爆发的今天，DeepSeek、Grok、ChatGPT4.5和Gemini这四大主流模型各显神通。本文大白话帮你理清它们的优缺点，看完就知道该选谁干活了！一、四大金刚的看家本领1.DeepSeek：省钱小能手这个国产AI最擅长精打细算，训练成本只要557万美元（其他家动不动上亿），就像用奥拓的钱造出了奥迪。它在金融、医疗等专业领域特别灵光，处理中文合同比老外AI强得多。不过看图能力还停留
鸿蒙开发：自定义一个搜索模版
前言代码案例基于Api13。在之前的文章中，我们简单分析了弹性布局Flex，并使用Flex实现了一个简单的流式布局，今天这篇文章，我们就结合搜索框，完成一个常见的搜索页面，具体的效果如下图所示：这样的一个模版，可以简单的分为，三个部分，分别是上边的搜索框，中间的历史搜索和下边的热门搜索，搜索框，我们直接可以使用系统的组件Search，历史搜索，由于是内容不一的搜索的内容，这里使用弹性布局Flex，
Zookeeper性能优化与调优技巧精讲 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Zookeeper性能优化与调优技巧精讲1.背景介绍1.1什么是Zookeeper?ApacheZooKeeper是一个开源的分布式协调服务,为分布式应用程序提供高可用性和强一致性的协调服务。它主要用于解决分布式环境中的数据管理问题,如统一命名服务、配置管理、分布式锁、集群管理等。ZooKeeper的设计目标是构建一个简单且高效的核心,以确保最大程度的可靠性和可扩展性。1.2Zookeeper的应
从零开始：基于LLM大模型构建智能应用程序的完整指南 AI天才研究院 ChatGPT 人工智能
目录从零开始：基于LLM大模型构建智能应用程序的完整指南什么是LLM大模型如何利用LLM大模型构建智能应用程序1.收集和准备数据2.构建LLM大模型3.集成和部署4.监测和维护使用特定于私有领域的数据增强LLM检索增强生成(RAG)数据预处理、分块和检索技术零射击与少量射击提示和指导LLM大模型使用LLM进行推荐和聚类任务改善组织内的搜索体验考虑以上所有解锁的利基应用程序参考最近，围绕大型语言模型
HarmonyOS NEXT 实战系列09-生命周期 harmonyos-next
生命周期编辑页面生命周期，即被@Entry装饰的组件生命周期，提供以下生命周期接口：onPageShow：页面每次显示时触发一次，包括路由过程、应用进入前台等场景。onPageHide：页面每次隐藏时触发一次，包括路由过程、应用进入后台等场景。onBackPress：当用户点击返回按钮时触发。aboutToAppear：组件即将出现时回调该接口，具体时机为在创建自定义组件的新实例后，在执行其bui
中信银行太原分行开展3.15金融知识进社区志愿活动 lsrsyx 金融
为扎实开展“我为群众办实事”实践活动，深入推进金融知识进社区工作，中信银行太原分行在第62个学雷锋纪念日到来之际，以“315消费者权益保护日”为契机，联合小店街道汾东南路社区温情开展了一场集爱心慰问、贴心服务与金融知识普及于一体的志愿服务活动，用实际行动传递温暖，提升老年群体金融素养。活动伊始，太原分行的志愿者们带着精心准备的慰问品，走进老年人的家中，主动帮忙打扫卫生，擦拭家具、清扫地面、整理杂物
使用Jest和React Testing Library测试React组件邹澜鹤Gardener
使用Jest和ReactTestingLibrary测试React组件去发现同类优质开源项目:https://gitcode.com/项目介绍这个开源项目是TestingJavaScript.com课程的一部分，专注于教你怎么用最智能、最高效的方式去测试任何JavaScript应用，特别是针对React组件的测试。它提供了一系列示例代码，涵盖了从基础的React渲染到复杂的Redux连接组件以及自
Python个人学习笔记（14）：函数（匿名函数、内置函数（下）、三元表达式） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
九、匿名函数lambda表达式语法规则：变量=lambda参数1,参数2,…:返回值例：用lambda简化下述操作deffunc(a,b):returna+bret=func(1,2)print(ret)代码：fn=lambdaa,b:a+bprint(fn)print(fn(12,13))结果：at0x000001E751EAAF20>25可以帮我们一句话创建函数可以与某些内置函数一起用十、内置
Windows控制台函数：控制台输出函数WriteConsoleA（）闪电麦坤95 Windows API 控制台函数 windows c++开发语言 c语言
目录什么是WriteConsoleA？函数签名参数详解返回值一个最简单的例子跟ReadConsoleA对比再试一个有趣的例子为什么传地址给lpNumberOfCharsWritten？注意事项什么是WriteConsoleA？WriteConsoleA是一个WindowsAPI函数，用来把文字写到控制台屏幕上。就像你在C++用std::cout输出东西，但它是直接跟Windows的控制台打交道。把
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象