码农老张Zy

【迅搜10】索引管理（三）同义词及其它属性方法

索引管理（三）同义词及其它属性方法

学习完索引操作最核心的增、删、改操作之后，我们再来学习它的其它一些功能。其中，比较有意思的是一个同义词操作的功能，我们先来看看这个功能的操作。

同义词操作

同义词，不用多解释了吧。小学一二年级，我们就会在语文课上学习到同义词的概念，不过在上学阶段，通常是同级同义词的练习，比如说“早上”、“早晨”、“清晨”。但是在日常，同义词的形式就复杂许多，比如说之前流行的 “PUA” ，还有更新潮的 “CPU” ，它们其实又都是单词 “洗脑”、名词“精神控制”的意思。

现在，我们期望在搜索 “PUA” 时，顺带着其它三种词，也就是与 “CPU”、“洗脑”、“精神控制” 有关的内容都可以被搜索到。这就是同义词搜索的概念。在这个例子中，“PUA” 是我们搜索用的原词，也可以叫做标准词，因为我们的主查询语句或者单词就是它。而另外三个词就是“同义词”。同样的，“长沙”=“星城”，“湖大”=“湖南大学”，“湖南”=“湘”，类似的这类都是同义词搜索的典型词汇。

在大部分的搜索引擎中，目前都是通过预先设置好的同义词库来进行搜索查询的。词库内每条记录由“标准词（原词）”和“同义词”组成，它们都必须是独立的词汇，也就是最小的索引单位，不可以是多个词组成的短语。这个最小索引单位，就是我们之前一直强调的分词后的单个词项，比如“卡车”，但不能是“大卡车”（会拆成“大”和“卡车”）或“卡”。而对于英文来说，独立词汇就是一个单词，我们后面也会看到英文词汇的效果。另外 XS 中的同义词和 Xapian 中的不同，XS 会进行智能匹配和转换，我们只需要关注通用词库就好了。

这个通用词库就是 SCWS 默认自带的那个词库，后面在学习分词相关的内容时，我们还会再讲。现在，我们先来看看怎么操作同义词库。其实只有几个方法，非常简单。不过需要注意的是，同义词针对的是一个索引项目，不同的索引项目的同义词不能通用。

$xs->index->add(new XSDocument([
  'id'=>uniqid(),
  'title'=>'PHP是最好的Web编程语言',
  'content'=>'你敢信？',
]));
$xs->index->add(new XSDocument([
  'id'=>uniqid(),
  'title'=>'PHP是最强的Web编程语言',
  'content'=>'你敢信？',
]));
$xs->index->add(new XSDocument([
  'id'=>uniqid(),
  'title'=>'PHP是最棒的Web编程语言',
  'content'=>'你敢信？',
]));


$xs->index->addSynonym("最好","最强");
$xs->index->addSynonym("最好","最棒");

$xs->index->addSynonym("最棒","最强");

首先，添加了三条数据，然后，我们使用 addSynonym() 添加同义词，其中，第一个参数是原词，第二个参数是同义词。上面三段添加的结果就是，“最好”=“最强”和“最棒”，而“最棒”=“最强”。词库添加也是异步执行的过程，所以我们要等一会之后再测试。

print_r($xs->search->setAutoSynonyms()->search('最好'));
// 三条数据

print_r($xs->search->search('最棒'));
// 两条数据

print_r($xs->search->search('最强'));
// 只有最后一条

很明显，搜索关键词“最好”的时候，三条数据都出来了，因为它的同义词“最强”和“最棒”都会同时搜索，后面我们会看到具体的搜索语句的效果。搜索“最棒”时会同时也搜索到“最强”的那条数据。而“最强”因为没有设置同义词，所以搜索这个词只有那一条数据。

在这段搜索代码中，第一行代码我们使用了一个 setAutoSynonyms() 方法。这个方法的意思是打开同义词搜索功能。而后面两条不需要再使用这个方法了。其实，setAutoSynonyms() 是直接向服务端发送一个使用同义词搜索的命令的，所以在当前这个服务端连接未中断的情况下，后续的查询是不需要再添加这个方法的。当然，所有的查询都带上这个方法也没什么问题。

接下来，我们要分析一下查询语句，看看为什么会查到同义词相关的数据。具体的搜索方法我们到后面学习搜索部分的时候会详细的说明，现在大家只需要知道怎么用就好了。

print_r($xs->search->setQuery('最好')->getQuery());
// Query((最好@1 SYNONYM 最强@78 SYNONYM 最棒@79))

setQuery() 方法是 XSSearch 对象设置查询条件的方法，而 getQuery() 方法则是返回分词查询语句。这就有点像在使用 TP 之类的框架时，通过 getLastSql() 之类的方法返回最后的查询语句一样的效果。通过这个返回的内容，我们可以看到查询单词 “最好” 的后面跟着 SYNONYM 最强和 SYNONYM 最棒。SYNONYM 表示的就是同义词的意思，剩下的就不用多解释了吧。SYNONYM 是自动通过同义词库获得对应词项的同义词，然后以类似于 OR 的形式进行实际的查询。也就是说，查询包含 “最好” 或者（OR）“最强” 或者 “最棒” 任意一个单词存在的文档。关于这里的条件分析及布尔查询问题，更具体的内容我们在后面学习搜索相关知识的时候再详细说明，不过只要有一点 MySQL 基础，相信你也知道同义词这一块是怎么查询的了吧。

XSSearch 对象的 setAutoSynonyms() 还有一个布尔类型的参数，如果是设置为 false ，就表示在查询时关闭同义词查询功能。

$xs->search->setAutoSynonyms(false);
print_r($xs->search->search('最好')); // 恢复成一条了

print_r($xs->search->setQuery('最好')->getQuery());
// Query(最好@1)

除了 setAutoSynonyms() 之外，XSSearch 对象还有一个 getAllSynonyms() 方法，用于返回同义词库中所有的数据。

print_r($xs->search->getAllSynonyms());
// Array
// (
//     [最好] => Array
//         (
//             [0] => 最强
//             [1] => 最棒
//         )

//     [最棒] => Array
//         (
//             [0] => 最强
//         )

// )


print_r($xs->search->getAllSynonyms(0,0,true));
// Array
// (
//     [最好] => Array
//         (
//             [0] => 最强
//             [1] => 最棒
//         )

//     [最棒] => Array
//         (
//             [0] => 最强
//         )

// )

这个方法有三个参数，前两个参数是分页用的，第一个是 limit ，默认 100 条，第二个是偏移从 0 开始，这两个不多解释了。第三个参数是一个布尔值，用于指定是否显示词根词。这个东西对中文没效果的，下一小节我们看英文的同义词效果时，会看到它的效果。

好了，最后还剩一个删除同义词，没什么多说的了。

$xs->index->delSynonym('最好', '最强');

// 等一会再试
print_r($xs->search->getAllSynonyms(0,0,true));
// Array
// (
//     [最好] => Array
//         (
//             [0] => 最棒
//         )

//     [最棒] => Array
//         (
//             [0] => 最强
//         )

// )
print_r($xs->search->setAutoSynonyms()->search('最好'));
// 只能查到两条了

大家自己试试效果吧。注意，同义词相关的方法都是和增、删、改索引数据一样走异步的。同时，它们也可以走缓冲区的，就是可以进入 openBuffer() 中走批量操作。

同义词相关的操作中有一些是 XSSearch 中的，因此在后面学习搜索相关的内容时，关于同义词部分的内容就不会再重复讲解了。

索引工具操作同义词及英文词根效果

除了在代码中操作同义词之外，PHP SDK 中提供的 Indexer.php 索引工具也可以方便地操作索引。直接使用 --add-synonym 就可以添加同义词，使用 --del-synonym 可以删除同义词。

> php vendor/hightman/xunsearch/util/Indexer.php ./config/5-zyarticle-test1.ini --add-synonym=好看:漂亮,好看:美丽,好看:靓仔,懵圈:懵逼,懵圈:傻了
报告：开始添加同义词记录 5 条...
刷新索引提交 ...

参数格式还是比较好懂的吧，原词:同义词，然后使用逗号进行分隔。接着，使用 Quest.php 查询工具的 --list-synonyms 就可以查看当前索引项目下的所有同义词库。

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini --list-synonyms
报告：开始添加同义词记录 5 条....ini --list-synonyms   
   原词                             同义词
--------------------------------------------------------
   1. 好看                          漂亮, 美丽, 靓仔
   2. 懵圈                          傻了, 懵逼
   3. 最好                          最强, 最棒
   4. 最棒                          最强

接下来再试试删除的效果，前面加同义词的时候大意了，“好看”和“靓仔”的关系貌似不是很合适，另外整个懵圈都不想要了。

> php vendor/hightman/xunsearch/util/Indexer.php ./config/5-zyarticle-test1.ini --del-synonym=懵圈,好看:靓仔
报告：开始删除同义词记录 2 条...
刷新索引提交 ...

嗯，这下就没什么问题了。

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini --list-synonyms
   原词                             同义词
--------------------------------------------------------
   1. 好看                          漂亮, 美丽
   2. 最好                          最强, 最棒
   3. 最棒                          最强

小伙伴们在自己测试的时候应该会发现，使用 SDK 工具添加或者删除同义词是马上生效的，这个其实是通过刷新服务端缓冲区来实现的，后面我们也会学到。

接下来，我们测试一下英文同义词。

> php vendor/hightman/xunsearch/util/Indexer.php ./config/5-zyarticle-test1.ini --add-synonym=find:search 
报告：开始添加同义词记录 1 条...
刷新索引提交 ...
> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini --synonym "finding"
--------------------
解析后的 QUERY 语句：Query((Zfind@1 SYNONYM Zsearch@67))
--------------------

这回在查看的时候，我们给 --list-synonyms 加上一个等于 stemmed 的值，然后结果会多出来一些内容。

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini --list-synonyms=stemmed
   原词                             同义词
--------------------------------------------------------
   1. Zfind                         Zsearch
   2. Zwww                          Zweb
   3. find                          search
   4. www                           web
   5. 好看                          漂亮, 美丽
   6. 最好                          最强, 最棒
   7. 最棒                          最强
   8. 网络                          web

怎么有了一个 Z 开头的 find ？其实呀，这就是我们前面说过的那个词根词的显示效果。词根词的作用就是在英文中，会有时态、比较级这些语法，比如搜索 “finding” ，默认英文分词和进行词法分析时，会转换成词根 “find” 。同理，对于同义词来说，也会直接将对应同义词的词根加上，搜索 “finding” 时，同时搜索的是 “find” 和 “search” 这两个词根。

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini "finding" --synonym
--------------------
解析后的 QUERY 语句：Query((Zfind@1 SYNONYM Zsearch@67))
--------------------

这下明白词根的含义了吧，同时我们也顺便说明了，在英文搜索时，XS 已经帮我们处理好了英文的词根问题。

默认同义词

除了我们添加的同义词库以外，XS 还有一些默认的同义词库，比如搜索下面这个词，它的同义词是两个拆开的词。

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini "项目管理"
--------------------
解析后的 QUERY 语句：Query((项目管理@1 SYNONYM (项目@78 AND 管理@79)))

注意，“项目管理” 是 SCWS 中的一个词项，不是短语，不会再次分词的，它的默认同义词是同时包含 “项目” 和 “管理” 的，注意中间的 “AND” 。这个 “AND” 表示的就是同时包含 “项目” 和 “管理” 这两个词的内容，等同于 “项目管理” ，一样可以被搜索到。如果是短语使用同义词搜索，也会有特殊的效果，比如：

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini "印度人爱吃咖喱" --synonym
--------------------
解析后的 QUERY 语句：Query(((印度人@1 SYNONYM (印度@78 AND 度人@79)) AND 爱吃@2 AND 咖喱@3))

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini "印度人爱吃咖喱"
--------------------
解析后的 QUERY 语句：Query(((印度人@1 SYNONYM (印度@78 AND 度人@79)) AND 爱吃@2 AND 咖喱@3))
--------------------

看出效果了吧，即使我们不加 --synonym ，在 XS 进行智能词法分析的时候，也会对一些特殊词或者短语词进行同义词拆分。那么，我们可以自己定义这样带 “AND” 效果的同义词吗？可以，但必须还是针对词项，不能是短语。

> php vendor/hightman/xunsearch/util/Indexer.php ./config/5-zyarticle-test1.ini --add-synonym=牛顿:"物理 名人 先驱 运动 伟大 "

> php vendor/hightman/xunsearch/util/Quest.php --show-query ./config/5-zyarticle-test1.ini "牛顿" --synonym
--------------------
解析后的 QUERY 语句：Query((牛顿@1 SYNONYM (物理@78 AND 名人@78 AND 先驱@78 AND 运动@78 AND 伟大@78)))
--------------------

其它属性方法

关于索引对象 XSIndex 剩余部分的内容就不多了，我们就快速的看一下。继承自 XSServer 的部分我们就不多说了，之前已经详细的学习过了。只学它自己拥有的一些属性和方法。

公共属性

首先是它的 public 属性，在 XSIndex 对象中，只有两个公共属性。

var_dump($xs->index->customDict); // string(0) ""
var_dump($xs->index->scwsMulti); // int(3)

customDict 属性是自定义字典，它有对应的 setCustomDict() 和 getCustomDict() 方法，因此这个属性就是可读写的。

scwsMulti 属性表示当前索引库的 SCWS 复合分词等级，默认是 3 ，无特殊情况的话不用改它。

这两个属性都是和分词相关的，后面在详细学习分词相关的内容时再进行详细的说明，这里大家先看一下就好。

addExdata() 批量提交数据

addExdata() ，是一个公共方法，但平常我们用不上。它用于批量提交索引命令封包数据，把多个命令封包内容连续保存为文件或变量，然后一次性提交以减少网络开销提升性能。它是 openBuffer() 和 closeBuffer() 这两个批量提交命令的基础函数。

具体来说整个流程是：openBuffer() 的参数会设置一个 _bufSize 变量，当增、删、改操作看到 _bufSize 变量大于 0 时，就会调用 appendBuffer() 方法，在这个方法中，将操作命令，也就是序列化（字符串化）之后的 XSCommand 对象放到 _buf 变量中。同时，它还会判断 _buf 长度是否大于 _bufSize 设定的长度。如果超过了，就直接提交了，否则，继续向 _buf 中添加内容。

如果我们调用了 closeBuffer() ，或者 _buf 变量长度超过了 _bufSize ，那么，就会执行 addExdata() 进行提交了。实际上就是去执行 execCommand() 提交整个 _buf 变量里的所有命令内容。

这下，是不是对整个批量提交的过程更清晰了？这个方法我们就不演示了，自己在外面拼接组合 XSCommand 对象没什么必要，大家可以自己看下源码哦。

addServer() 增加同步索引服务器

这个方法是用于为当前索引项目增加服务器信息的，就是我们在讲索引配置时说过的，可以通过配置文件直接配置多台索引服务器，然后在添加数据的时候，会同时向这些索引服务器写入数据。而这个 addServer() 方法就是可以动态地添加。具体的用法我就不演示了，它就是需要一个配置参数，格式是 “服务器:端口号” 。

索引服务器信息添加后会保存在 XSIndex 类的静态变量 $_adds 中。所有的操作在最后调用 XSIndex 的 execCommand() 时，都会遍历这个静态变量，从而向每一个索引服务器都发送相同的指令数据。这样就实现了同步向所有的索引服务进行写操作的功能。

有移除的方法吗？抱歉，真没有。说实话，大部分情况下，还是直接使用配置文件的配置会好一些。仅有一些特殊情况下，可能需要从代码层面进行动态地添加，比如说临时的加备份服务器之类的。

flashIndex() 强制刷新服务端索引

前面我们就看到过了，SDK 提供的 Indexer.php 工具添加同义词时，它会提示一个“刷新索引提交”，然后我们马上就可以查到新添加的同义词内容。而我们自己在 PHP 代码中的操作则是异步的要等一会才能生效。其实呀，SDK 工具就是通过强制刷新服务端索引的方式来让索引快速生效的。我们可以尝试先正常添加一条数据，然后使用 SDK 工具查看一下服务端索引的运行信息，使用 Indexer.php 工具的 --info 参数。

> php vendor/hightman/xunsearch/util/Indexer.php ./config/5-zyarticle-test1.ini --info
---------- SERVER INFO BEGIN ----------
{
  id:"indexd", uptime:108237, num_burst:1, max_burst:1,
  num_accept:47, aps:0.0, num_task:720759, tps:6.7,
  sock:7, name:"zyarticle", home:"data/zyarticle", rcv_size:8,
  flag:0x0000, version:"1.4.17"
}
DBS: [db] -> [NULL]
CMDS:
  -> {NULL}
---------- SERVER INFO END ----------
数据库名：db[0x0000]
队列数据：1条
导入进程：无

在这其中，最重要的是看到后面的队列数据有 1 条，表示我们提交的数据在服务端也是进入到了一个队列缓冲区中等待消费的，消费之后才能在前台搜索到。还有一种情况，就是缓冲区满了，也会直接写入，另外就是在一定时间内，没有新数据过来，也会开始消费。最后，就是通过我们的手动刷新，直接消费。那么我们就来试一下手动刷新，使用 flushIndex() 方法。

$id = uniqid();
 $xs->index->add(new XSDocument([
 'id'=>$id,
 'title'=>'JavaScript才是最牛X的',
 'content'=>'服不服？',
 ]));
 $xs->index->flushIndex();

马上使用 SDK 的 Quest.php 进行搜索，现在一下就出现数据了。同时查看服务端索引状态，队列数据也是 0 条了。

> php vendor/hightman/xunsearch/util/Indexer.php ./config/5-zyarticle-test1.ini --info
……………………
队列数据：0条
……………………

强制刷新索引很好呀，为啥不每次都直接刷新了，这样我们不就可以实时查到数据了嘛。这个呀，还是性能的取舍问题。XS 使用异步的缓冲队列，目的应该也是尽量减少大量数据写入时的磁盘性能问题。先入队，再消费，通过内存队列的方式来异步实现数据的落盘，避免落盘时间长导致长时间的 Socket 占用。我猜的哈，真实情况是不是这样希望有大佬能去看一下 XS 服务端的源码然后再回来好好跟我们这帮小菜鸡讲讲哦。

flushLogging() 强制刷新服务端搜索日志

搜索日志又是什么鬼？这个东西和我们后面在搜索技巧中要学习到的热门推荐、相关搜索、拼音搜索、纠错建议等功能有关的。在这里我们先看下在索引这边它有什么功能，其它具体的内容我们后面再细说。

先看一下目录的相关搜索词库。

> php vendor/hightman/xunsearch/util/Logger.php ./config/5-zyarticle-test1.ini "最强"
序 相关搜索词(最强)                          次数      
--------------------------------------------------
 1. 最强                                     5

就是我们上面测试过的最强，搜了好几次，然后我们再搜索两次最强，查看次数还是 5 ，接着就使用下面的函数刷新一下。

var_dump($xs->index->flushLogging()); // true

现在结果变成了 7 。这下明白啥意思了吧，也就是刷新一下对应的搜索日志库。

> php vendor/hightman/xunsearch/util/Logger.php ./config/5-zyarticle-test1.ini "最强"
序 相关搜索词(最强)                          次数      
--------------------------------------------------
 1. 最强                                     7

好了，点到为止，这个搜索日志库是我们下一大章节的内容了。现在先别急，后面学到的时候，能想起来刷新搜索日志库是在索引对象这边的这个 flushLogging() 方法就好啦。

总结

说是没什么东西了，结果随便一写又是一大长篇的内容。不过到此为止，咱们对于索引管理对象，也就是 XSIndex 对象（类）的学习也就结束了。接下来要进入到的，就是另一块大的章节，搜索技巧的学习。

测试代码：

https://github.com/zhangyue0503/dev-blog/blob/master/xunsearch/source/10.php

参考文档：

http://www.xunsearch.com/doc/php/api/XSIndex

http://www.xunsearch.com/doc/php/guide/special.synonym

你可能感兴趣的:(python,算法,机器学习,前端,开发语言)

Halcon 初步了解科学的发展-只不过是读大自然写的代码图形编程 c#视觉处理 Halcon
1.Halcon概述Halcon是德国MVTec公司开发的一套完善的机器视觉算法包，也是一款功能强大的视觉处理软件，为工业自动化领域提供了全面的解决方案。它拥有应用广泛的机器视觉集成开发环境，提供了一套丰富的图像处理和机器视觉算法，可以在各种工业应用中进行图像分析、目标检测、测量、定位、识别等任务。Halcon的核心功能包括图像处理、特征提取与匹配、3D视觉、深度学习、条码识别、OCR识别以及视觉
Python高效移除列表中符合条件的元素：5种方法详解 Ven% python python 算法开发语言
文章目录1.列表推导式（推荐首选）2.filter()函数（函数式编程）3.倒序删除法（原地修改）4.while循环（正向删除）5.切片赋值（原地高效修改）方法对比与选择指南注意事项总结在Python开发中，经常需要对列表进行过滤操作，移除不符合条件的元素。本文将全面介绍5种常用方法，并分析各自的适用场景和性能特点。1.列表推导式（推荐首选）最简洁高效的方式，特别适合中小型列表numbers=[1
由浅入深：Python异步函数调用的艺术 - 从脚本到API架构设计 Ven% python python 网络开发语言
文章目录引言：异步编程的新范式一、基础篇：事件循环中的直接调用1.1理解异步执行模型1.2简单调用示例1.3关键注意事项二、进阶篇：API接口中的异步调用2.1为什么需要API封装？2.2FastAPI实现示例2.3调用对比分析三、架构篇：分层设计的最佳实践3.1问题：紧耦合的陷阱3.2解决方案：三层架构设计3.2.1核心业务层(core/retrieval.py)3.2.2API接口层(api/
前端 React.js 项目的性能优化的成功案例分析前端视界前端艺匠馆前端 react.js 性能优化 ai
前端React.js项目的性能优化的成功案例分析关键词：React.js性能优化、代码拆分与懒加载、虚拟列表与长列表优化、Webpack深度调优、Fiber架构实践、SSR与SSG落地、React.memo与useCallback最佳实践摘要：本文通过三个真实企业级React项目的性能优化案例，系统解析从性能瓶颈诊断到优化策略落地的完整流程。结合React核心原理（如Fiber架构、虚拟DOMdi
边缘计算与 CDN 融合技术实践教程快快网络-三七云计算优化边缘计算人工智能
目录前言一、核心技术原理与架构设计1.1边缘计算与CDN协同架构1.2智能调度算法二、数据同步与一致性实现2.1边缘节点数据缓存机制2.2一致性哈希算法应用三、典型应用场景实践3.1实时视频直播优化3.2物联网数据处理四、部署与运维要点4.1容器化部署4.2监控与告警五、未来技术演进方向总结前言在互联网流量爆发式增长、低延迟应用场景不断涌现的背景下，边缘计算与CDN的融合已成为提升网络性能的核心技
基于MATLAB代码DWA算法的移动车路径规划 985计算机硕士路径规划 matlab 算法 android
基于MATLAB代码DWA算法的移动车路径规划，可实现动态避障和静态避障文章目录DWA（DynamicWindowApproach）是一种常用于移动机器人路径规划的局部路径规划算法。它通过在速度空间中采样，结合机器人的运动学约束和环境信息，选择最优的速度组合来实现避障和目标点导航。以下是一个基于DWA算法的MATLAB代码示例，用于实现移动车的路径规划：%DWA(DynamicWindowAppr
Python中字符串isalpha()函数详解
在Python中，isalpha()是字符串（string）类型的内置方法，用于检查字符串中的所有字符是否都是字母字符（alphabeticcharacter）。以下是详细说明：一、基本功能返回值：布尔值（True或False）判断规则：如果字符串中所有字符都是字母（包括Unicode字母，如中文、日文等），且至少有一个字符→返回True如果字符串中包含任何非字母字符（如数字、空格、标点、特殊符号
python内置哪些装饰器_Python内置装饰器 weixin_39968820 python内置哪些装饰器
1、staticmethod()a）描述原文：staticmethod(function)->methodConvertafunctiontobeastaticmethod.Astaticmethoddoesnotreceiveanimplicitfirstargument.Todeclareastaticmethod,usethisidiom:classC:@staticmethoddeff(a
【手写前端面试题01】防抖和节流全栈前端老曹 javascript 前端 javascript 学习防抖节流
《手写防抖和节流：从“打工人”到“时间管理大师”》一、本质理解（别被术语吓到）防抖（debounce）是什么？玩游戏看60秒广告只需要完整看一次就行了，退出去一次重新60秒，别一直退✅核心思想：在事件被触发后，等待一段时间，如果这段时间内没有再次触发，才执行。节流（throttle）又是什么？闪现CD：不管多急，都要等冷却好才能再次使用✅核心思想：多次触发→只按固定频率执行，在一定时间内只允许执行
python爬虫爬百度云盘的资源 oaa608868 百度云爬虫 python
最近百度云盘不知道为啥不提供资源检索，正好最近看了一下python，正好来练练手，写歌爬虫爬一下百度云盘的资源。分析了一下百度云盘的网友源码和js文件，里面有大量ajax的东西，利用json传输数据，前端显示。话说，这样数据爬去就方便多了，也不要用scrapy啥的，直接解析json数据就好。分析js文件提炼了下面三个链接：URL_SHARE='http://yun.baidu.com/pclo
Python通过字符串调用函数_python 面向对象根据字符串调动对应函数(1) m0_61418142 python 数据库 linux
textprocess(file,language)但是textprocess(file=‘data.txt’,language=‘english’)language(text)TypeError:‘str’objectisnotcallable百度谷歌一番，我查到以下几种方式####1-字典最简单，易上手的方式，使用字典配对。defchinese(text):print(‘jieba分词’)de
python-内置装饰器大风起于云兮测试开发学习 python
类方法classMethodsdemo:param_a=0#定义类方法必须要加classmethod装饰器@classmethoddefclass_method_demo(cls):"""这是一个类方法，类方法的第一个参数必须为cls，以区别实例方法的self参数:return:"""print('这是一个类方法',cls.param_a)if__name__=='__main__':Method
【python第三方库】Hydra库在AI项目中使用简介
文章目录一、前言1.omegaconf与Hydra库的关系2.Hydra优势二、实际用法展示1.项目结构2.配置文件3.Python代码4.运行示例4.1默认配置运行4.2从命令行覆盖配置4.3多运行模式5.超参数优化5.1安装Optuna插件5.2修改config.yaml5.3运行超参数优化一、前言Hydra是一个开源Python框架，可简化研究和其他复杂应用程序的开发。关键特性是能够通过组合
大学专业科普 | 计算机应用、视觉与算法鸭鸭鸭进京赶烤计算机应用
一、专业概述计算机应用专业是一门实践性很强的学科，专注于将计算机技术转化为实际应用，服务于各个行业和领域，为社会的数字化转型提供人才支撑。二、课程设置专业基础课程：包括计算机组成原理、操作系统、数据结构、计算机网络等，为学生构建坚实的理论基础。专业核心课程：聚焦于程序设计语言（如C、C++、Java、Python等）、数据库原理与应用、软件工程、Web前端开发等，使学生具备开发各类软件系统的能力。
字符串篇(python)—如何统计字符串中连续的重复字符个数_python随机给出字符串,统计连续且相同个数 2401_84141337 程序员 python 开发语言
"""递归实现一个求字符串中连续出现相同字符的最大值例如字符串"aaabbcc"最大值为a3解题思路遍历字符串的时候定义两个变量curMaxLen记录当前遍历字符重复的连续字符个数maxLen遍历到目前为止找到最长的连续重复字符的个数"""defgetMaxDupChar(s,startIndex,curMaxLen,maxLen):ifstartIndex==len(s)-1:returnmax
为了方便学习icss项目上的css技巧，我用next.js写了一个网站前端next.js
icss-website一、项目简介与定位icss-website是一个基于Next.js14（AppRouter架构）开发的现代化CSS技巧展示平台，致力于为前端开发者、设计师和技术爱好者提供一个高效、优雅、易用的CSS奇技淫巧学习与交流空间。项目以GitHub上的iCSS仓库为内容源，通过API动态获取、分类、展示和高亮CSS相关的文章与代码示例，支持多主题、多语言、响应式布局和丰富的交互体验
【Python】Hydra 用法详解行码棋 #Python python 开发语言
Hydra官方文档Hydra（Python配置管理工具）1.引言在机器学习、深度学习和软件开发中，管理复杂的配置是一个常见的挑战。Hydra是一个强大的Python库，允许开发者轻松地管理和组织配置文件，支持动态参数覆盖、多层次配置和可组合配置等特性。2.安装HydraHydra可以通过pip直接安装：pipinstallhydra-core安装完成后，你可以使用hydra进行配置管理。3.基础用
探索 Vue.js 组件的最新特性 vue.js
引言：Vue.js作为一款流行的前端框架，始终在不断发展和演进，为开发者带来新的特性和功能，以提升开发效率和用户体验。Vue.js组件是构建Vue应用的基础，其最新特性为开发者提供了更强大的工具和更灵活的开发方式。本文将深入探讨Vue.js组件的一些最新特性，包括组合式API、Teleport、Suspense等，帮助开发者更好地掌握和运用这些特性，从而构建出更加高效、复杂的前端应用。组合式API
Python 时间处理实战：4 个 datetime 模块的高效应用场景李智 - 重庆 Python 精讲精练 -从入门到实战 python 案例学习编程技巧经验分享经典范例
Python时间处理实战：4个datetime模块的高效应用场景Python的datetime模块是标准库中用于处理日期和时间的核心模块。它提供了多种类和工具，方便开发者操作日期、时间、时间间隔以及时区信息。以下是其主要功能及组件：一、基础速递1.主要类及用途1.1datetime.date功能：处理日期（年、月、日）。示例：fromdatetimeimportdatetoday=date.tod
Python实战案例，requests模块，Python实现获取动态图表小雁子学Python Python技术分享 python 实战案例 requests模块动态图表
前言利用Python实现获取动态图表，废话不多说~让我们愉快地开始吧~开发工具Python版本：3.6.4相关模块：re模块；requests模块；urllib模块；pandas模块；以及一些Python自带的模块。环境搭建安装Python并添加到环境变量，pip安装需要的相关模块即可。看一下B站2019年「数据可视化」版块的情况，第一个视频超2百万的播放量，4万+的弹幕百度指数获取百度指数，首先
onnx模型部署 python_深度学习模型转换与部署那些事(含ONNX格式详细分析) weixin_39759270 onnx模型部署 python
背景深度学习模型在训练完成之后，部署并应用在生产环境的这一步至关重要，毕竟训练出来的模型不能只接受一些公开数据集和榜单的检验，还需要在真正的业务场景下创造价值，不能只是为了PR而躺在实验机器上在现有条件下，一般涉及到模型的部署就要涉及到模型的转换，而转换的过程也是随着对应平台的不同而不同，一般工程师接触到的平台分为GPU云平台、手机和其他嵌入式设备对于GPU云平台来说，在上面部署本应该是最轻松的事
【算法】动态规划斐波那契类型： 740. 删除并获得点数
740.删除并获得点数中等题目给你一个整数数组nums，你可以对它进行一些操作。每次操作中，选择任意一个nums[i]，删除它并获得nums[i]的点数。之后，你必须删除所有等于nums[i]-1和nums[i]+1的元素。开始你拥有0个点数。返回你能通过这些操作获得的最大点数。示例1：输入：nums=[3,4,2]输出：6解释：删除4获得4个点数，因此3也被删除。之后，删除2获得2个点数。总共获
【算法】动态规划斐波那契类型： 198. 打家劫舍等风来不如迎风去算法/数据结构算法 leetcode 动态规划
198.打家劫舍中等你是一个专业的小偷，计划偷窃沿街的房屋。每间房内都藏有一定的现金，影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统，如果两间相邻的房屋在同一晚上被小偷闯入，系统会自动报警。给定一个代表每个房屋存放金额的非负整数数组，计算你不触动警报装置的情况下，一夜之内能够偷窃到的最高金额。示例1：输入：[1,2,3,1]输出：4解释：偷窃1号房屋(金额=1)，然后偷窃3号房屋(金
Python - 爬虫；Scrapy框架之插件Extensions（四） MinggeQingchun Python Python 爬虫 Scrapy extensions
阅读本文前先参考https://blog.csdn.net/MinggeQingchun/article/details/145904572在Scrapy中，扩展（Extensions）是一种插件，允许你添加额外的功能到你的爬虫项目中。这些扩展可以在项目的不同阶段执行，比如启动、关闭、处理请求、处理响应等。Extensions官网文档：Extensions—Scrapy2.12.0document
用户实体行为分析与数据异常访问联防方案 KKKlucifer 时序数据库
一、用户实体行为分析（UEBA）技术概述1.1定义与概念用户实体行为分析（UEBA）是一种高级网络安全方法，它利用机器学习和行为分析技术，对用户、设备、应用程序等实体在网络环境中的行为进行深入分析，以检测出异常行为和潜在的安全威胁。UEBA的核心在于通过建立行为基线，识别出偏离正常行为模式的活动，从而发现那些传统安全工具难以检测到的高级、隐藏和内部威胁。1.2工作原理UEBA系统通过收集来自多个数
python中的高级变量V hbwhmama python学习 python
定义一个元组(常规)info_tuple=("Tom",18,1.85)print(type(info_tuple))#查看info_tuple的类型print(info_tuple)#输出元祖中的所有元素('Tom',18,1.85)print(info_tuple[0])#指定索引直输出指定数据Tom定义一个空元组info_tuple_01=()print(type(info_tuple_01
Python应用指南：利用高德地图API获取公交+地铁可达圈（二）图说交通高德API系列 python 开发语言信息可视化 shp 高德地图api
副标题：利用Python自动化调用高德API并批量处理可达圈在上一篇文章中，我们详细探讨了如何利用高德地图API获取单一位置的公交可达圈数据。通过构建请求URL、发送HTTP请求、解析返回的JSON数据，并对其中的坐标进行从GCJ-02（高德火星坐标系）到WGS84（通用地理坐标系）的转换，最终将结果整理为CSV格式输出，实现了对单个出发点在指定时间范围内可到达区域的精确描绘。这一过程不仅帮助我们
题解：二叉树的中序遍历（94.二叉树的中序遍历）微白.. 算法数据结构 leetcode
题目描述给定一个二叉树的根节点root，返回它的中序遍历。解题思路二叉树的中序遍历是一种常见的树遍历方法。它按照访问左子树——根节点——右子树的顺序进行。本文将介绍三种实现二叉树中序遍历的方法：递归、迭代和Morris遍历，并详细分析每种方法的复杂度。方法一：递归思路与算法递归是最直观的中序遍历实现方式。中序遍历的特点是先遍历左子树，然后访问根节点，最后遍历右子树。因此，可以通过递归函数来实现这一
java opencv 数字识别算法_[机器学习]基于OpenCV实现最简单的数字识别后期小雨 java opencv 数字识别算法
本文将基于OpenCV实现简单的数字识别。这里以游戏AngryBirds为例，通过以下几个主要步骤对其中右上角的分数部分进行自动识别。1.学习分类器根据训练样本，选取模型训练产生数字分类器。这里的样本可以是通用的数字样本库(如NIST等)，也可以是针对应用场景而制作的专门训练样本。前者优在泛化性，后者强在准确率，当然常用做法是将这两者结合，即在通用数字库基础上做修改。另外这里由于模式并不复杂，计算
【CSS-14-基础样式表Base.css】如何编写高质量的Base.css：前端样式重置与基础规范指南 AllenBright #CSS 前端 css
在前端开发中，Base.css（也称为重置样式表或基础样式表）是整个项目样式的基石。它负责消除浏览器默认样式的差异，建立统一的样式基准，为后续开发提供一致的起点。一个精心设计的Base.css能够显著提高开发效率，减少浏览器兼容性问题，并保持项目样式的一致性。1.Base.css的核心作用样式重置（Reset）：消除不同浏览器之间的默认样式差异基础规范（BaseRules）：定义项目通用的基础样式
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出