bingcool空间

sphinx搭建亿级搜索

最近在做一些模糊搜索，大家知道MySQL单表如果超过100万条记录，查询就会变慢，如果用like语句做模糊搜索，那么索引就完全用不上，这样一来一次搜索就要遍历全表，没个1秒是出不来结果的，多的时候十几秒也是正常的。如果是MyISAM引擎，写表的时候是表级锁，立刻就跪了。一台小型机做100个并发，每个并发建立一个数据库长连接，机器负载很快就上去了。之前还做过一些挣扎，在MySQL前端顶个Memcached，灰度1小时建立缓存再全上，但很快就跪了，穿透Memcached的请求会拖死MySQL。MySQL的like还无法支持乱序、分词搜索（搜“城市中国”的时候，“中国城市”无法被匹配出来），当然MyISAM引擎支持全文检索，MySQL也有REGEXP这样的正则匹配支持，不过效果都很不理想。
Sphinx是个开源的搜索引擎，功能的强大和设计的合理性真是让人赞不绝口。现在我把它应用在一个每天亿级的搜索页上，4核8G内存的小型机，单表百万级记录，99%以上的搜索都在5ms内出结果。

为什么选择Sphinx？
（1）高速建立索引：建索引速度达到单核10-15mb/s;
（2）高速查询：100万记录（约1.2GB数据）下，单核每秒支持约200次搜索;
（3）高扩展性：已知最大索引簇支持对30亿条记录建立索引，每天单个连接5千万次搜索;
（4）强大附属功能：支持分布式搜索，中文分词引擎，c/java/python/php等多语言支持，支持MySQL，也可以自建索引（xml pipe mechanism）支持KV等其他存储。

Sphinx如何工作？
sphinx有两个重要的工具，indexer和searchd。
indexer是通过指定数据源（数据库信息、索引字段等）来创建索引文件
searchd是个后台进程，使用indexer生成的索引文件做查询，prefork模型，支持多点长连接
（1）与存储分离

这里建议至少有3台机器，MySQL主机只做insert，数据同步流水到MySQL备机，然后把Sphinx部署在第三台机上，indexer连接MySQL备机，生成索引文件给本机的searchd做查询。本文将就这种工作模式做详细分析，因为它独立于存储模型，具有很高的灵活性。
（2）MySQL特化
这种工作模式需要在编译MySQL的时候把Sphinx作为一个插件编译进去，为要索引的MySQL表建立对应的Sphinx索引表（采用Sphinx数据引擎），详见http://blog.s135.com/post/360/ 。

怎样开始使用Sphinx？
（1）到http://sphinxsearch.com/downloads/release/ 官方网站上下载最新的安装包，./Configure && make && make install 安装好，mmseg可以更好的支持中文分词，不过也有些毛病，一般Sphinx自带的中文分词足够用了
（2）填写配置文件sphinx.conf
这里举个简单的例子，假如你有个MySQL表，用来存用户信息，建表如下：
CREATE TABLE account (ID INT AUTO_INCREMENT, type INT, name VARCHAR(128), nickname VARCHAR(128), PRIMARY KEY(ID));
假如搜索的实时性要求不高，对新增的数据，可以容忍5分钟内的延迟，而且表新增记录的速度比较慢，表又比较大，那么增量索引会非常有用。一个可行的方法是，每天深夜全表扫描重新构建主索引，构建完主索引，之后插入的记录就放倒增量索引里面去，增量索引每5分钟构建一次，以主索引构建时表中最大ID为基准。这样一来就需要有一个表记录主索引构建时扫描到的最大ID。
CREATE TABLE sph_counter (counter_id INT, max_doc_id INT);

注意，Sphinx要求每个表都有个ID标识，其实建表的时候建个自增ID字段是个良好的习惯，有时候一开始你觉得不需要这个字段，最后要用到的时候才后悔没建。
接下来，我们要做个功能，用户昵称搜索，也就是搜索nickname字段，那么可以这么配置数据源：

source nickname_src
{
    type = mysql
    sql_host = 111.111.111.111
    sql_user = berryxie
    sql_pass = hello
    sql_db   = project
    sql_port = 3306
    sql_sock = /tmp/mysql.sock #your mysql socket file location
    sql_query_pre = set names utf8 #this section will be executed before sql_query
    sql_query_pre = REPLACE INTO sph_counter SELECT 1, MAX(id) FROM account
    sql_query = SELECT ID, type, nickname FROM account where ID = $id
    sql_query_info   = SELECT * FROM account WHERE ID=$id
    sql_attr_bigint = type
}

在配置里，MySQL表有两种类型的字段，一种是sphinx要索引的字段（这里是nickname），一种是属性字段（这里是type，属性字段可以用来order by、group by、条件筛选等，暂时不能是字符串，我在c++里面没办法用int属性，只好用bigint）。ID、索引字段和属性字段都必须出现在sql_query的select fields里面。

source delta_nickname_src : nickname_src
{
    sql_query_pre = set names utf8
    sql_query = SELECT ID, type, nickname FROM account where ID = $id \
                                WHERE ID > ( SELECT max_doc_id FROM sph_counter WHERE counter_id = 1 )
}

这个是增量索引的数据源配置，注意delta_nickname_src继承于nickname_src，这就意味着子类拥有父类的所有属性，所以这里子类需要配置sql_query_pre来覆盖父类的属性，不然父类的两个sql_query_pre在子类构建增量索引时都会执行，这样第二次构建增量索引时，第一次构架的增量索引就会丢数据了。

接下来是index的索引配置

index nickname
{
  source      = nickname_src 
  path      = /home/berryxie/data/sphinx/main_nickname

  docinfo      = extern
  mlock      = 0
  morphology    = none

  charset_type    = utf-8
    
    charset_table = U+FF10..U+FF19->0..9, 0..9, U+FF41..U+FF5A->a..z, U+FF21..U+FF3A->a..z,\
    A..Z->a..z, a..z, U+0149, U+017F, U+0138, U+00DF, U+00FF, U+00C0..U+00D6->U+00E0..U+00F6,\
    U+00E0..U+00F6, U+00D8..U+00DE->U+00F8..U+00FE, U+00F8..U+00FE, U+0100->U+0101, U+0101,\
    U+0102->U+0103, U+0103, U+0104->U+0105, U+0105, U+0106->U+0107, U+0107, U+0108->U+0109,\
    U+0109, U+010A->U+010B, U+010B, U+010C->U+010D, U+010D, U+010E->U+010F, U+010F,\
    U+0110->U+0111, U+0111, U+0112->U+0113, U+0113, U+0114->U+0115, U+0115, \
    U+0116->U+0117,U+0117, U+0118->U+0119, U+0119, U+011A->U+011B, U+011B, U+011C->U+011D,\
    U+011D,U+011E->U+011F, U+011F, U+0130->U+0131, U+0131, U+0132->U+0133, U+0133, \
    U+0134->U+0135,U+0135, U+0136->U+0137, U+0137, U+0139->U+013A, U+013A, U+013B->U+013C, \
    U+013C,U+013D->U+013E, U+013E, U+013F->U+0140, U+0140, U+0141->U+0142, U+0142, \
    U+0143->U+0144,U+0144, U+0145->U+0146, U+0146, U+0147->U+0148, U+0148, U+014A->U+014B, \
    U+014B,U+014C->U+014D, U+014D, U+014E->U+014F, U+014F, U+0150->U+0151, U+0151, \
    U+0152->U+0153,U+0153, U+0154->U+0155, U+0155, U+0156->U+0157, U+0157, U+0158->U+0159,\
    U+0159,U+015A->U+015B, U+015B, U+015C->U+015D, U+015D, U+015E->U+015F, U+015F, \
    U+0160->U+0161,U+0161, U+0162->U+0163, U+0163, U+0164->U+0165, U+0165, U+0166->U+0167, \
    U+0167,U+0168->U+0169, U+0169, U+016A->U+016B, U+016B, U+016C->U+016D, U+016D, \
    U+016E->U+016F,U+016F, U+0170->U+0171, U+0171, U+0172->U+0173, U+0173, U+0174->U+0175,\
    U+0175,U+0176->U+0177, U+0177, U+0178->U+00FF, U+00FF, U+0179->U+017A, U+017A, \
    U+017B->U+017C,U+017C, U+017D->U+017E, U+017E, U+0410..U+042F->U+0430..U+044F, \
    U+0430..U+044F,U+05D0..U+05EA, U+0531..U+0556->U+0561..U+0586, U+0561..U+0587, \
    U+0621..U+063A, U+01B9,U+01BF, U+0640..U+064A, U+0660..U+0669, U+066E, U+066F, \
    U+0671..U+06D3, U+06F0..U+06FF,U+0904..U+0939, U+0958..U+095F, U+0960..U+0963, \
    U+0966..U+096F, U+097B..U+097F,U+0985..U+09B9, U+09CE, U+09DC..U+09E3, U+09E6..U+09EF, \
    U+0A05..U+0A39, U+0A59..U+0A5E,U+0A66..U+0A6F, U+0A85..U+0AB9, U+0AE0..U+0AE3, \
    U+0AE6..U+0AEF, U+0B05..U+0B39,U+0B5C..U+0B61, U+0B66..U+0B6F, U+0B71, U+0B85..U+0BB9, \
    U+0BE6..U+0BF2, U+0C05..U+0C39,U+0C66..U+0C6F, U+0C85..U+0CB9, U+0CDE..U+0CE3, \
    U+0CE6..U+0CEF, U+0D05..U+0D39, U+0D60,U+0D61, U+0D66..U+0D6F, U+0D85..U+0DC6, \
    U+1900..U+1938, U+1946..U+194F, U+A800..U+A805,U+A807..U+A822, U+0386->U+03B1, \
    U+03AC->U+03B1, U+0388->U+03B5, U+03AD->U+03B5,U+0389->U+03B7, U+03AE->U+03B7, \
    U+038A->U+03B9, U+0390->U+03B9, U+03AA->U+03B9,U+03AF->U+03B9, U+03CA->U+03B9, \
    U+038C->U+03BF, U+03CC->U+03BF, U+038E->U+03C5,U+03AB->U+03C5, U+03B0->U+03C5, \
    U+03CB->U+03C5, U+03CD->U+03C5, U+038F->U+03C9,U+03CE->U+03C9, U+03C2->U+03C3, \
    U+0391..U+03A1->U+03B1..U+03C1,U+03A3..U+03A9->U+03C3..U+03C9, U+03B1..U+03C1, \
    U+03C3..U+03C9, U+0E01..U+0E2E,U+0E30..U+0E3A, U+0E40..U+0E45, U+0E47, U+0E50..U+0E59, \
    U+A000..U+A48F, U+4E00..U+9FBF,U+3400..U+4DBF, U+20000..U+2A6DF, U+F900..U+FAFF, \
    U+2F800..U+2FA1F, U+2E80..U+2EFF,U+2F00..U+2FDF, U+3100..U+312F, U+31A0..U+31BF, \
    U+3040..U+309F, U+30A0..U+30FF,U+31F0..U+31FF, U+AC00..U+D7AF, U+1100..U+11FF, \
    U+3130..U+318F, U+A000..U+A48F,U+A490..U+A4CF
    
    min_prefix_len = 0
    min_infix_len = 1
    ngram_len = 1
    preopen = 1
}

这里有几个字段需要说明一下:
docinfo: sql_attr的放置方式。有none, extern和inline三种值。none是没有sql_attr时候设置的，sphinx会搞定。inline表示index把sql_attr和表ID一起放在.spd文件里面，而extern方式是把sql_attr放到.spa文件里面，和ID分离。默认用extern，这样这些sql_attr和id文件都会被加载到内存，性能比较好。
mlock: searchd为了提高性能，会提前把.spa和.spi索引文件加载进内存，如果有一段时间没搜索请求，那么这两个文件在内存中就不会被访问到，操作系统会把它置换回硬盘。mlock=1时就不会被置换啦，不过需要root级启动权限。
morphology：可以将多种语言的各种词态变成原型再搜索，比如”dogs”会被转成”dog”，默认为空。
charset_type：编码，写错了很多东西搜不出来的哦~
charset_table：合法字符表，不可识别字符会被当成分隔符来处理。
min_prefix_len：最短索引前缀，默认为0，若设置会生成大量冗余索引记录。例如：设置为3，”apple”会被切成app、appl、apple三个词，这样搜索app的时候也会命中，有需要再用吧。
ngram_len：0或1.中日韩文不像英语一样，每个次都有空格分隔，对于“我是中国人”，分词器不知道怎么分隔。当值为1时，前面的句子会被分隔成“我是中国人”。
preopen：默认为0，为1时searchd会在启动时就把索引加载到内存，而不是等到有请求时才加载。

index还可以配置处理html、停用此表等，这里用不到，具体看官方文档。

接下来是indexer，配置很简单，IO限制非必要不配，只配内存。索引器配置：

indexer
{
  mem_limit      = 256M
}

mem_limit：内存大小，最大2047M,看你的数据量有多大，机器有多好。

最后是searchd的配置：

searchd
{
  listen             = 127.0.0.1:12325
  log      = /home/berryxie/log/error/searchd.log
  query_log    = /home/berryxie/log/error/query.log
  read_timeout    = 5
  client_timeout    = 300
  max_children    = 200
  pid_file    = /tmp/searchd.pid
  max_matches    = 2000
  seamless_rotate    = 1
  preopen_indexes    = 1
  unlink_old    = 1
  mva_updates_pool  = 10M
  max_packet_size    = 8M
  #crash_log_path    = /tmp/crash
  max_filters    = 256
  max_filter_values  = 4096
  workers                 = prefork
  prefork_rotation_throttle = 50
}

这里只介绍最重要的几个配置：
client_timeout：使用长连接时，默认300秒没收到请求，将断开连接
max_children：默认为0，无限制，配置最大fork出的并发搜索量。
max_matches：API默认会设置为1000，这个时候如果数据库里面有1w条命中的记录，只会返回最先搜索到的1000条，看业务需要，也可以设置得很大。
seamless_rotate：更新索引策略。默认为1时，会先生成好新的index文件，Load进内存，重命名新旧索引文件名，searchd切到新索引文件搜索，这样实现了无缝切换索引。
read_buffer：每个查询都有两个buffer，一个是存储记录的，一个是命中的记录的，默认为256k。
read_unhinted：必须比read_buffer小，默认32k。
workers：有none/prefork/fork/threads四种值，默认为fork。Windows可以用None来串行处理请求。fork则会创建子进程来处理请求，请求量大时系统消耗会比较明显，threads则会创建个线程来处理请求。推荐prefork，先创建一定量的进程来处理请求，性能最优。
prefork_rotation_throttle：prefork模型下切换索引时会重启所有进程，如果有200个子进程，瞬间的重启需要消耗大量的CPU和网络连接。让这200个进程以50ms的间隔重启是个比较明智的选择。

最后，配置好sphinx.conf，就是crontab程序来更新主索引和增量索引啦：
更新增量索引update.sh
#!/bin/sh
/home/berryxie/sbin/indexer –config /home/berryxie/etc/sphinx.conf –rotate delta_nickname >> /home/berryxie/log/error/indexer.log
更新主索引indexer.sh
#!/bin/sh
/home/berryxie/sbin/indexer –config /home/berryxie/etc/sphinx.conf –all –rotate >> /home/berryxie/log/error/indexer.log

大功告成，可以用search工具试试，search工具只读indexer生成的文件和连接mysql。需要测试searchd，则要用php/c++ client连上去啦~

reStructuredText 全面教程：从基础语法到实践应用
reStructuredText全面教程：从基础语法到实践应用reStructuredText（简称reST或RST）是一种轻量级标记语言，主要用于Python技术文档的编写，也是Sphinx文档生成器的默认输入格式。本教程将系统介绍reST的语法规则、核心功能以及实际应用场景。1.reStructuredText简介reStructuredText是PythonDocutils项目的一部分，设计
sphinx，一个神奇的 Python 库！ Elivis Hu python sphinx python 全文检索
大家好，今天为大家分享一个神奇的Python库-sphinx。Github地址：https://github.com/sphinx-doc/sphinx/在软件开发和项目管理中，文档是不可或缺的一部分。好的文档可以帮助开发人员理解代码、API、工具或项目，并提供清晰的指导。Python中有许多文档生成工具，其中Sphinx是最流行和强大的之一。Sphinx可以生成各种格式的文档，包括HTML、PD
Python 项目文档编写全攻略：从入门到自动化维护侦探已死488 python 学习笔记
引言在软件开发领域，完善的文档可提升40%的团队协作效率（来源：IEEE2022年开发者调查报告^^1^^）。本文将深入探讨Python项目文档的最佳实践，涵盖文档生成工具、注释规范、自动化维护等关键环节。一、Python文档工具链选择1.1Sphinx文档生成器#安装Sphinx#pipinstallsphinx#初始化文档项目sphinx-quickstartdocs1.2自动生成API文档d
php mysql关键技术_中高级PHP开发者应该掌握哪些技术？何宗徽 php mysql关键技术
1.Linux能够流畅的使用Shell脚本来完成很多自动化的工作；awk/sed/perl也操作的不错，能够完成很多文本处理和数据统计等工作；基本能够安装大部分非特殊的Linux程序(包括各种库、包、第三方依赖等等，比如MongoDB/Redis/Sphinx/Luncene/SVN之类的)；了解基本的Linux服务，知道如何查看Linux的性能指标数据，知道基本的Linux下面的问题跟踪等2.N
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
再见，Elasticsearch ！码农code之路 elasticsearch 大数据搜索引擎全文检索
新一代搜索引擎，是ES的15倍，号称干翻ES！ManticoreSearch是一个使用C++开发的高性能搜索引擎，创建于2017年，其前身是SphinxSearch。ManticoreSearch充分利用了Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保持开源。这一切使ManticoreSearch成为一个现代，快速，轻量级和功能齐全的数据库，具有出色的全文搜索功能。Ma
Unreal Engine 4 语音识别插件：Sphinx-UE4 林泽炯
UnrealEngine4语音识别插件：Sphinx-UE4sphinx-ue4AspeechrecognitionpluginforUnrealEngine4.ThisisessentiallyaportofPocketsphinx,tobeusedwithinanUnrealEngineproject.项目地址:https://gitcode.com/gh_mirrors/sp/sphinx-
Sphinx-UE4 语音识别插件使用教程嵇子高Quintessa
Sphinx-UE4语音识别插件使用教程sphinx-ue4AspeechrecognitionpluginforUnrealEngine4.ThisisessentiallyaportofPocketsphinx,tobeusedwithinanUnrealEngineproject.项目地址:https://gitcode.com/gh_mirrors/sp/sphinx-ue4项目介绍Sph
Sphinx-UE4 项目使用教程牧爱颖Kelvin
Sphinx-UE4项目使用教程sphinx-ue4AspeechrecognitionpluginforUnrealEngine4.ThisisessentiallyaportofPocketsphinx,tobeusedwithinanUnrealEngineproject.项目地址:https://gitcode.com/gh_mirrors/sp/sphinx-ue41.项目的目录结构及介
【UE插件】Sphinx关键词语音识别我的巨剑能轻松搅动潮汐 UE插件 ue5
视频教程：UnrealEngine-SpeechRecognition-FreePluginhttps://www.youtube.com/watch?v=KBcXNnSdWog&t=622s官方教程：Sphinx:SpeechRecognitionPlugin|UnrealEngineCommunityWikihttps://unrealcommunity.wiki/speech-recogni
Java实现音频转文本（语音识别） Tech Synapse java 音视频语音识别
在Java中实现音频转文本（也称为语音识别或ASR）通常涉及使用专门的语音识别服务，如GoogleCloudSpeech-to-Text、IBMWatsonSpeechtoText、AmazonTranscribe、MicrosoftAzureSpeechServices，或者一些开源库如CMUSphinx。由于直接使用开源库或云服务的API进行完整演示可能涉及复杂的设置和依赖管理，这里将提供一个
通过手机控制家用电器的一个程序的设计（一） zhumin726 智能家居智能家居
一、概述设计一款安卓平台上的家庭智能控制软件，通过语音识别指令控制家用电器。该软件结合离线语音识别技术、红外线和WIFI通讯技术，实现对家电的智能控制，如开关机、调温度、调频道等操作。二、主要功能模块离线语音识别模块功能：识别用户的语音指令。技术：使用离线语音识别API，如PocketSphinx或Kaldi。操作流程：用户说出指令→语音数据被传输到离线语音识别引擎→引擎返回文本指令。命令解析模块
sphinx-apidoc longgb246
[toc]一、使用sphinx-apidoc[OPTIONS]-o[EXCLUDE_PATTERN,…]sphinx-apidoc是一个自动生成Sphinx源的工具，使用该autodoc扩展。MODULE_PATH：是python的源码的文件目录。OUTPUT_PATH：是包含conf.py和*.rst的source目录。注意在python源码的py文件中，应该使用if__name__=='__m
万字详解PHP+Sphinx中文亿级数据全文检索实战（实测亿级数据0.1秒搜索耗时）小松聊PHP进阶 MySQL PHP 全文检索 php sphinx mysql sql 数据库服务器
Sphinx查询性能非常厉害，亿级数据下输入关键字，大部分能在0.01~0.1秒，少部分再5秒之内查出数据。Sphinx官方文档：http://sphinxsearch.com/docs/sphinx3.html极简概括：由C++编写的高性能全文搜索引擎的开源组件，C/S架构，跨平台（支持Linux、Windows、MacOS），支持分布式部署，并可直接适配MySQL。解决问题：因为MySQL的l
ElasticSearch VS. Solr VS. Sphinx：最好的开源搜索引擎比较 chenxiyy3773 大数据人工智能数据库
译者按：本文是来自一家乌克兰技术公司的文章。该文章译者认为着重在应用上，而非单纯的性能对比。给自己的平台选择一个合适的搜索引擎比任何一个吹嘘技术强大的好。虽然最近一两年ES发展飞速，但sphinx的简单易用性还是赢得很多机构公司的青睐，比如优酷土豆都是用sphinx。所以使用之前，务必先了解自己的业务诉求，再选择合适的搜索引擎，而非一昧跟风。翻译若有误请指正，谢谢查看！编译自：ELASTICSEA
阿里P8架构师谈：开源搜索引擎Lucene、Solr、Sphinx等优劣势比较 liuhuiteng 中间件中间件
开源搜索引擎分类1.Lucene系搜索引擎，java开发,包括：LuceneSolrElasticsearchKatta、Compass等都是基于Lucene封装。你可以想象Lucene系有多强大。2.Sphinx搜素引擎，c++开发,简单高性能。以下重点介绍最常用的开源搜素引擎：Lucene、Solr、Elasticsearch、Sphinx的特点和优劣势选型比较。Lucene1.Lucene简
python 机器人工具箱——robotics-toolbox-python FL17171314 python 开发语言
这个工具箱为Python带来了机器人特定的功能，并利用Python的可移植性、普遍性和支持性的优势，以及线性代数（numpy、scipy）、图形（matplotlib、three.js、WebGL）的开源生态系统的能力，交互式开发（jupyter、jupyterlab、mybinder.org）和文档（sphinx）。python-mpipinstall--usernumpyscipymatplo
python-自动化篇-运维-语音识别 fo安方 #python-自动化篇-运维运维 python 自动化
文章目录理论文本转换为语音使用pyttsx使用SAPI使用SpeechLib语音转换为文本代码和效果01使用pyttsx实现文本_语音02使用SAPI实现文本_语音03使用SpeechLib实现文本_语音04使用PocketSphinx实现语音转换文本理论语音识别技术，也被称为自动语音识别，目标是以电脑自动将人类的语音内容转换为相应的文字和文字转换为语音。文本转换为语音使用pyttsx使用名为py
Sphinx的原理详解和使用 m0_68949064 PHP sphinx 全文检索搜索引擎
一、Sphinx介绍1.1简介Sphinx是由俄罗斯人AndrewAksyonoff开发的一个全文检索引擎。意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL数据库数据源的支持，也支持从标准输入读取特定格式的XML数据。通过修改源代码，用户可以自行增加新的数据源（例如：其他类型的DBM
ROS2手册的离线编译安装 ArslanRobot ROS2开发实例 ROS 机器人
ROS开发中经常要查询相关API，把文档下载到本地离线使用方便快捷，极大提高开发效率下载ROS2文档gitclonehttps://github.com/ros2/ros2_documentation.gitcdros2_documentation安装sphinxpipinstallSphinx配置sphinxsphinx-quickstart按提示进行配置编译makehtml期间如果提示exce
API文档生成(sphinx) Along20210921 sphinx 全文检索搜索引擎
1.安装pipinstallSphinx2.使用2.1文档手册Sphinx1.3.1中文手册(推荐查看)教程https://fengxc.me/基于python注释使用sphinx自动化生成API文档.html2.2创建工程新建一个文件夹sphinx_test,并创建两个子文件夹code,doc。目录结构如下：进去到doc目录，打开powershell,执行下边命令创建工程sphinx-quick
智能语音技术栈 chenkaifang 不归类
识别原理——硬件数据采集——软件数据处理目前主流的开源平台包括CMUSphinx、HTK、Kaldi、Julius、iATROS、CNTK、TensorFlow等，CMUSphinx是离线的语音识别工具，支持DSP等低功耗的离线应用场景。由于深度学习对于语音识别WER的下降具有明显的作用，所以Kaldi、CNTK、TensorFlow等支持深度学习的工具目前比较流行，Kaldi的优势就是集成了很多
ai智能语音机器人如何基于本地语音识别，搭建一款智能聊天机器人？ VO_794632978 WX-794632978 语音机器人人工智能机器人语音识别腾讯云阿里云
基于本地语音识别技术，搭建智能聊天机器人是一种广泛使用的人工智能应用。它可以为用户提供语音聊天、语音指令和语音控制等服务，提高用户的体验和方便性。以下是基于本地语音识别的智能聊天机器人搭建过程。确定使用的技术在搭建智能聊天机器人之前，需要确定将使用的技术和平台。通常情况下，语音识别技术可以使用开源框架，如CMUSphinx、Kaldi、DeepSpeech等。它们都提供了丰富的文档和示例代码，用于
sphinx在c#.net平台下使用（一） weixin_30432179 c#数据库 php
Sphinx是由俄罗斯人AndrewAksyonoff开发的一个可以结合MySQL,PostgreSQL全文检索引擎。意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。是做站内全文搜索的一把利器。sphinx已经出现很多年，并不是一个新鲜技术，但如今仍被广泛使用者。但由于IT技术的不断创新，在圈子中又出现了几款用于全文检索的新技术，如lucene就是一款与之媲美的工具，但相对而言，它
使用sphinx生成API文档火之木叶啊
使用sphinx生成API文档1、安装sphinxpipinstallSphinx2、初始化文档：在项目根目录下运行(或者进入doc目录下执行sphinx-quickstart)sphinx-quickstartdoc#api文档放在此目录下根据提示一步步来，我只处理下以下几项，其它的都是默认回车>Separatesourceandbuilddirectories(y/n)[n]:y>Projec
使用 gitee+sphinx+readthedocs 搭建个人博客明月与玄武开源项目 gitee sphinx 个人博客搭建
给大家安利如何快速搭建个人博客网站！前言这是我本地运行的一个使用sphinx构建的博客服务，这些文章，都是用markdown写的。一直有个想法，就是把自己写的这些文件，搞成一个博客网站，放到网上，但是，一想，要搞个域名、一个服务器，这样长期运营维护，成本有些高。再一个，个人技术博客，独立地址，百度中抓取率可能也不高，结果就是花了大成本，结果自嗨，别人搜索、访问不到，所以，一直没有行动。最近，发现用
实现Django的全文检索功能（一）：选择Whoosh全文检索引擎 stonefisher Django Python
Django没有内置全文检索功能，这方面的资料也很少。有搜到两篇,一篇是使用在django应用上使用sphinx全文搜索还有一篇是使用Whoosh的，看这里其中whoosh是原生唯一的python写的全文搜索引擎，虽然有说whoosh性能比不上sphinx,xapian等。不过whoosh本身很小，安装后才2.61M，非常容易集成到django/python里面，而我们的需求又不大一般小站完全够用
自身文档管理规范 __pop_ 杂七杂八总览文档管理
之前在这里叙述了用sphinx生成静态网站，并利用静态网络托管服务readthedocs现在我们有了新的需求，想知道这些东西到底是什么。过程过程A：markdown/rst->htmlmkdocssphinx相关：pandoc(不能生成整个网站的html文件，而是生成单个md/rst对应的html文件)应用场合：例如sphinx支持markdown不力，可以将md格式转为rst格式gitbook(
居然能取代 Elasticsearch？ qintian0225 elasticsearch big data 大数据
ManticoreSearch不知道是否有人了解或者使用过？它是一个使用C++开发的高性能搜索引擎，创建于2017年，其前身是SphinxSearch。ManticoreSearch充分利用了Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保持开源。这一切使ManticoreSearch成为一个现代，快速，轻量级和功能齐全的数据库，具有出色的全文搜索功能。在GitHub上M
Linux Mint编译安装Qemu进行固件仿真攻城狮老李物联网安全物联网 iot
文章目录前言1.准备Qemu源码包2.编译安装2.1首次尝试编译2.2安装python3-venv2.3安装sphinx2.4安装sphinx-rtd-theme2.4安装ninja2.6安装编译器3.重新编译并安装4.进行固件仿真4.1准备固件4.2Binwalk解析文件4.3看一下文件结构4.4安装sasquatch4.5重新解析文件4.6确定指令集4.7开启qemu虚拟环境。4.8为Qemu
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

sphinx搭建亿级搜索

sphinx搭建亿级搜索

你可能感兴趣的:(sphinx)