阿锋2016

sphinx 笔记

一、安装
sphinx在此处下载：
http://sphinxsearch.com/downloads/release/
本次我下的是2.2.4版本

自持中文分词的包叫做coreseek，其实就是带了中文分词插件的sphinx，在此处下载：
http://www.coreseek.cn/稳定版3.2.14内带的的sphinx还是 0.9.9 release版本的；


下面先来讲sphinx的安装和配置：

http://sphinxsearch.com/files/sphinx-2.1.3-release.tar.gz(建议安装这个，把包下载下来)

http://sphinxsearch.com/fies/sphinx-2.2.6-release.tar.gz

tar xzvf sphinx-2.2.4-release.tar.gz
cd sphinx-2.2.4-release
./configure --prefix=/usr/local/sphinx/   --with-mysql  --enable-id64 #如果是64位的才加这个选项
make
make install

这样就装好了，现在来配置
cp /usr/local/sphinx/etc/sphinx-min.conf.dist /usr/local/sphinx/etc/test.conf
vim /usr/local/sphinx/etc/test.conf

/*=========================以下是配置文件说明===============================
1.   sphinx配置文件结构介绍
Sphinx的配置文件结构如下：
Source 源名称1{     
#添加数据源，这里会设置一些连接数据库的参数比如数据库的IP、用户名、密码等
#设置sql_query、设置sql_query_pre、设置sql_query_range等后面会结合例子做详细介绍 ……
}
Index 索引名称1{
     Source=源名称1
#设置全文索引     ……
}
Indexer{
#设置Indexer程序配置选项，如内存限制等……
}
Searchd{  
#设置Searchd守护进程本身的一些参数……
}
Source和Index都可以配置多个。
 
2.   spinx配置案例详细解释
接下来就来针对一个配置案例来做详细的配置介绍：
#定义一个数据源source search_main
{
           #定义数据库类型
   type                 = mysql#定义数据库的IP或者计算机名
   sql_host             = localhost
           #定义连接数据库的帐号
   sql_user             = root
           #定义链接数据库的密码
   sql_pass             = test123
           #定义数据库名称
   sql_db               = test
           #定义连接数据库后取数据之前执行的SQL语句
   sql_query_pre        = SET NAMESutf8
   sql_query_pre        = SET SESSIONquery_cache_type=OFF
           #创建一个sph_counter用于增量索引
   sql_query_pre        = CREATETABLE IF NOT EXISTS sph_counter \
                                      ( counter_id INTEGER PRIMARY KEY NOTNULL,max_doc_id INTEGER NOT NULL)
           #取数据之前将表的最大id记录到sph_counter表中
   sql_query_pre        = REPLACEINTO sph_counter SELECT 1, MAX(searchid) FROM v9_search
           #定义取数据的SQL，第一列ID列必须为唯一的正整数值
    sql_query            = SELECTsearchid,typeid,id,adddate,data FROM v9_search where \
                                      searchid<(SELECT max_doc_id FROM sph_counter WHERE counter_id=1 ) \
                                        andsearchid>=$start AND searchid<=$end#sql_attr_uint和sql_attr_timestamp用于定义用于api过滤或者排序，写多行制定多列
   sql_attr_uint        = typeid
   sql_attr_uint        = id
   sql_attr_timestamp   = adddate
           #分区查询设置
   sql_query_range      = SELECTMIN(searchid),MAX(searchid) FROM v9_search
           #分区查询的步长
   sql_range_step       = 1000
           #设置分区查询的时间间隔
   sql_ranged_throttle  = 0
           #用于CLI的调试
   sql_query_info       = SELECT *FROM v9_search WHERE searchid=$id
}
#定义一个增量的源
source search_main_delta : search_main
{
   sql_query_pre       = set namesutf8
           #增量源只查询上次主索引生成后新增加的数据
#如果新增加的searchid比主索引建立时的searchid还小那么会漏掉
   sql_query           = SELECTsearchid,typeid,id,adddate,data FROM v9_search where  \
                                  searchid>(SELECT max_doc_id FROM sph_counter WHERE counter_id=1 ) \
                                   andsearchid>=$start AND searchid<=$end
   sql_query_range     = SELECTMIN(searchid),MAX(searchid) FROM v9_search where \
                                       searchid>(SELECT max_doc_id FROM sph_counter WHERE counter_id=1 )
}
 
#定义一个index_search_main索引index index_search_main
{
           #设置索引的源
   source            = search_main
           #设置生成的索引存放路径
   path         =/usr/local/coreseek/var/data/index_search_main
           #定义文档信息的存储模式，extern表示文档信息和文档id分开存储
   docinfo           = extern
           #设置已缓存数据的内存锁定，为0表示不锁定
   mlock             = 0
           #设置词形处理器列表，设置为none表示不使用任何词形处理器
   morphology        = none
           #定义最小索引词的长度
   min_word_len      = 1
           #设置字符集编码类型，我这里采用的utf8编码和数据库的一致
   charset_type      = zh_cn.utf-8
           #指定分词读取词典文件的位置
   charset_dictpath  =/usr/local/mmseg3/etc
           #不被搜索的词文件里表。
   stopwords       =/usr/local/coreseek/var/data/stopwords.txt
           #定义是否从输入全文数据中取出HTML标记
   html_strip       = 0
}
#定义增量索引
index index_search_main_delta : index_search_main
{
   source   = search_main_delta
   path    =/usr/local/coreseek/var/data/index_search_main_delta
}
 
#定义indexer配置选项indexer
{
           #定义生成索引过程使用索引的限制
   mem_limit        = 512M
}
 
#定义searchd守护进程的相关选项searchd
{
           #定义监听的IP和端口#listen            = 127.0.0.1#listen            =172.16.88.100:3312
    listen            = 3312
    listen            = /var/run/searchd.sock
           #定义log的位置log                =/usr/local/coreseek/var/log/searchd.log#定义查询log的位置
   query_log          =/usr/local/coreseek/var/log/query.log#定义网络客户端请求的读超时时间
   read_timeout       = 5
           #定义子进程的最大数量
   max_children       = 300
           #设置searchd进程pid文件名
   pid_file           =/usr/local/coreseek/var/log/searchd.pid
           #定义守护进程在内存中为每个索引所保持并返回给客户端的匹配数目的最大值
   max_matches        = 100000
           #启用无缝seamless轮转，防止searchd轮转在需要预取大量数据的索引时停止响应#也就是说在任何时刻查询都可用，或者使用旧索引，或者使用新索引
   seamless_rotate    = 1
           #配置在启动时强制重新打开所有索引文件
   preopen_indexes    = 1
           #设置索引轮转成功以后删除以.old为扩展名的索引拷贝
   unlink_old         = 1
           # MVA更新池大小，这个参数不太明白
   mva_updates_pool   = 1M
           #最大允许的包大小
   max_packet_size    = 32M
           #最大允许的过滤器数
   max_filters        = 256
           #每个过滤器最大允许的值的个数
   max_filter_values  = 4096
}
=======================================配置文件说明完毕==============================*/

二、创建索引

 这样配置就完成了，接下来要生成索引和开启守护进程： 
/usr/local/sphinx/bin/indexer -c /usr/local/sphinx/etc/test.conf --all //（不一定需要写路径，不填写自动加载默认路径）
/usr/local/sphinx/bin/searchd -c /usr/local/sphinx/etc/test.conf

如果重建索引时守护进程正在运行，会报错，需要运行下面的指令，会重建索引并且重开守护进程
/usr/local/sphinx/bin/indexer -c /usr/local/sphinx/etc/test.conf --all --rotate


三、配置扩展
现在进行php和sphinx的交互：
到http://pecl.php.net/package/sphinx下载php的sphinx模块，放到php中引用起来，方法不在此赘述
vim test.php

(1)全PHP加载Sphinx模块

wget http://pecl.php.net/get/sphinx-1.1.0.tgz
tar zxf sphinx-1.1.0.tgz
cd /www/soft/sphinx-1.1.0
/usr/local/webserver/php/bin/phpize
./configure --with-php-config=/usr/local/webserver/php/bin/php-config

提示出错:
checking for libsphinxclient headers in default path... not found
configure: error: Cannot find libsphinxclient headers
找了下libsphinxclient，在/www/soft/csft-3.2.13/api/libsphinxclient，之前安装的是coreseek3.2.13版

cd libsphinxclient/
./configure
make && make install
安装完libsphinxclient，继续安装sphinx扩展

cd /www/soft/sphinx-1.1.0
/usr/local/php/bin/phpize
./configure --with-php-config=/usr/local/php/bin/php-config
make && make install
cd /usr/local/php/lib/php/extensions/no-debug-non-zts-20060613/

看到sphinx.so
vi /usr/local/webserver/php/etc/php.ini
加入extension = sphinx.so

/usr/local/apache2/bin/apachectl restart

测试Sphinx模块,http://192.168.10.1/phpinfo.php

(2)、使用API类连接Sphinx程序

需要到coreseek解压包中找到sphinxapi.php文件，放到程序目录下

cp /lamp/coreseek-3.2.14/csft-3.2.14/api/sphinxapi.php /usr/local/apache2/htdocs/

include 'sphinxapi.php';

//加载Sphinx API



四、php调用
$sphinx = new SphinxClient;
//sphinx的主机名和端口$sphinx->SetServer ( '192.168.1.168', 9412 );
$sphinx->SetConnectTimeout ( 1 );
//设置返回结果集为php数组格式$sphinx->SetArrayResult ( true );
//匹配结果的偏移量，参数的意义依次为：起始位置，返回结果条数，最大匹配条数$sphinx->SetLimits(0, 20, 1000);
//最大搜索时间$sphinx->SetMaxQueryTime(10);
//索引源是配置文件中的 index 类，如果有多个索引源可使用,号隔开：'email,diary' 或者使用'*'号代表全部索引源$index = 'message1';
//搜索关键字$result = $sphinx->Query ( '你要搜索的非中文/中文字串', "*" );
if (!$result){
    print_r($sphinx->getLastError());
}
print_r($result);

sphinx调用模式：

大家都知道sphinx自带的一些匹配模式。主要有
setMatchMode:
SPH_MATCH_ALL匹配所有查询词（默认模式）
SPH_MATCH_ANY匹配查询词中的任意一个
SPH_MATCH_PHRASE将整个查询看作一个词组，要求按顺序完整匹配
SPH_MATCH_BOOLEAN将查询看作一个布尔表达式
SPH_MATCH_EXTENDED将查询看作一个Sphinx内部查询语言的表达式
SPH_MATCH_FULLSCAN使用完全扫描，忽略查询词汇
SPH_MATCH_EXTENDED2类似 SPH_MATCH_EXTENDED ，并支持评分和权重.



开通服务器9312端口：

lsof -i:9312这是查看某端口号开了没有

//注意：当重建索引时，需要重启searchd监听端口，否则返回 bool(false)


杀死进程：
pkill -9 searchd

重启进程：
./searchd

五、安装中文版coreseek

现在来讲coreseek的安装配置：
把包下载下来，我下载的地址是http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz
安装过程可以参考官网文档http://www.coreseek.cn/products-install/install_on_bsd_linux/我直接复制过来，照着打命令就可以了
##前提：需提前安装操作系统基础开发库及mysql依赖库以支持mysql数据源和xml数据源
##安装mmseg
$ cd mmseg-3.2.14
$ ./bootstrap    #输出的warning信息可以忽略，如果出现error则需要解决
$ ./configure --prefix=/usr/local/mmseg3
$ make && make install
$ cd ..

##安装coreseek
$ cd csft-3.2.14 或者 cd csft-4.0.1 或者 cd csft-4.1
$ sh buildconf.sh    #输出的warning信息可以忽略，如果出现error则需要解决
$ ./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql##如果提示mysql问题，可以查看MySQL数据源安装说明
$ make && make install
$ cd ..
这样就算装好了
接下来同样是配置，和sphinx有些不一样
同样是参考官网文档http://www.coreseek.cn/products-install/coreseek_mmseg/
#以下部分为中文分词核心配置#stopwords        = /path/to/stowords.txt的位置
    charset_dictpath        = /usr/local/mmseg3/etc/
    charset_type        = zh_cn.utf-8
    #charset_table                    = .................... #需将原有的该配置注释掉
    ngram_len                    = 0
#以上部分为中文分词核心配置
关键在于：
#必须设置，表示词典文件的目录，该目录下必须有uni.lib词典文件存在
charset_dictpath=/usr/local/mmseg3/etc/
#必须设置，表示启用中文分词功能；否则中文分词功能无效，使用sphinx的其他处理模式
charset_type=zh_cn.utf-8
#必须设置，表示取消原有的一元字符切分模式，不使其对中文分词产生干扰
ngram_len=0
#charset_table的配置需要注释掉！
#charset_table=......搜索测试：
/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/test.conf 你要搜索的非中文/中文字串
结果应该是类似：
displaying matches:
1. document=4, weight=5, uid=3046690
        id=4
        bid=3046730-4e842acdcf8be
        uid=3046690
        content=??????????
        valid=y
        createtime=1317286728

words:
1. '没有': 683 documents, 700 hits
2. '听': 124 documents, 134 hits
3. '过': 722 documents, 741 hits
4. '，': 9797 documents, 11936 hits
5. '过来': 47 documents, 47 hits
6. '一下': 404 documents, 404 hits


coreseek和php的交互
总的来说和sphinx的交互几乎是一样的
用的是pecl的sphinx模块的话，可能$result会返回false，使用getLastError()方法会返回
client version is higher than daemon version
这样的错误
可以禁用pecl的sphinx模块，转而使用coreseek包中提供的sphinxapi.php


ls /usr/local/coreseek/api/*.php
sphinxapi.php
test2.php
test_coreseek.php
test.php
test*.php都是demo，可以作为参考
自己写个test.php
vim test.php


include './sphinxapi.php';
//require_once "sphinxapi.php";也可，放在哪里都可以，在程序根目录也可，能调用即可
$sphinx->SetServer ( '192.168.1.168', 9512 );
$sphinx->SetArrayResult ( true );
$index = 'message1';
$result = $sphinx->Query ( '搜索关键字', "*" );
if (!$result){
    print_r($sphinx->getLastError());
}
print_r($result);
其他的和sphinx一样

结束！

=============================

其他：

//sphinx搜索
//使用setLimits函数改变默认显示20条结果
$sphinx = new SphinxClient();
$sphinx->SetServer('localhost', 9312);
$sphinx->SetMatchMode(SPH_MATCH_ANY);
$sphinx->setLimits (0,1000);
$result = $sphinx->query($word,'*');

//高亮显示的配置参数的数组
$opts = array(
    "before_match"          => "<span class=/"highlight/">",
    "after_match"           => "</span>",
    "chunk_separator"       => "...",
    "limit"                 => 60,//摘要最多包含的符号（码点）数。整数，默认为 256
    "around"                => 25,//每个关键词块左右选取的词的数目。整数，默认为 5.
    "single_passage"        => true,//是否仅抽取最佳的一个段落。
    "exact_phrase"          => false//是否仅高亮精确匹配的整个查询词组，而不是单独的关键词。布尔值，默认为假。
);

三、匹配模式

匹配模式:SetMatchMode（设置匹配模式）

原型：function SetMatchMode ( $mode )

SPH_MATCH_ALL 匹配所有查询词（默认模式）.

SPH_MATCH_ANY 匹配查询词中的任意一个.

SPH_MATCH_PHRASE 将整个查询看作一个词组，要求按顺序完整匹配.

SPH_MATCH_BOOLEAN 将查询看作一个布尔表达式.

SPH_MATCH_EXTENDED 将查询看作一个 Sphinx 内部查询语言的表达式.

SPH_MATCH_FULLSCAN 使用完全扫描，忽略查询词汇.

SPH_MATCH_EXTENDED2 类似 SPH_MATCH_EXTENDED ，并支持评分和权重

调用代码：

PHP代码实例:
Vi index.php
<html>
<head>
    <meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
<body>
    <h1>简单PHP搜索测试</h1>
    <form action="find.php" method=post>
        请输入搜索关键字:<input type="text" name="word"><br>
        <input type="submit" name="submit"><br>
    </form>
</body>
</html>
Vi find.php
<html>
<head>
    <meta http-equiv="content-type" content="text/html; charset=utf-8">
    <title>Find</title>
</head>
<body>
    <h1 id='top'>查询输出页面</h1>
    <?php
        $keyword=$_POST['word'];    
        $sphinx=new SphinxClient();
        $sphinx->SetServer("localhost",9312);
        $sphinx->SetMatchMode(SPH_MATCH_ANY);
        //$sphinx->setLimits(0,0);$result=$sphinx->query("$keyword","*");
        //echo "<pre>";
        //print_r($result);
        //echo "</pre>";$ids=join(",",array_keys($result['matches']));
        mysql_connect("localhost","root","123");
        mysql_select_db("test");
        $sql="select * from post where id in({$ids})";
        mysql_query("set names utf8");
        $rst=mysql_query($sql);
        $opts=array(
            "before_match"=>"<button style='font-weight:bold;color:#f00'>",
            "after_match"=>"</button>"
        );
        while($row=mysql_fetch_assoc($rst)){
            $rst2=$sphinx->buildExcerpts($row,"main",$keyword,$opts);
            echo "第{$rst2[0]}篇贴子<br>";
            echo "标题: {$rst2[1]}<br>";
            echo "内容: {$rst2[2]}<br>";
            echo "<hr>";
        }
    ?>
<body>
<html>

【ATU 随笔记】整车网路系统架构之探讨 ( 一 ) WPG大大通 NXP产线大大通笔记经验分享 CAN 汽车车载系统
一、前言在现今的车辆设计中，通讯架构扮演着至关重要的角色，以确保车内各个电子控制单元（ElectronicControlUnit,ECU）能够快速且可靠地交换资讯。车用通讯协议的选择多样且具备不同的应用特性，其中包括CAN（ControllerAreaNetwork）、LIN（LocalInterconnectNetwork）、Ethernet和FlexRay等。每一种通讯协议皆有其特定的应用范畴
【Docker项目实战】使用Docker安装Blossom 笔记应用江湖有缘 Docker部署项目实战合集 docker 笔记容器
【Docker项目实战】使用Docker安装Blossom笔记应用一、Blossom介绍1.1Blossom简介1.2主要特点1.3使用场景二、本次实践规划2.1本地环境规划2.2本次实践介绍三、本地环境检查3.1检查Docker服务状态3.2检查Docker版本3.3检查dockercompose版本四、下载Blossom镜像五、部署Blossom应用5.1创建部署目录5.2编辑部署文件5.3创
Docker 镜像操作笔记 π大星星️ docker eureka spring cloud
一、简介Docker镜像是容器运行的基础，它包含了容器运行所需的文件系统、应用程序及其依赖。镜像是不可变的，每次修改都会生成一个新的镜像。以下是对Docker镜像操作的详细介绍，包括常用的命令及其参数解释。二、镜像操作（一）拉取镜像1.基本命令dockerpull:2.参数解释dockerpull：从远程仓库拉取镜像。：镜像的名称，例如nginx、ubuntu。：镜像的版本或变体，例如latest
[笔记.AI]如何判断模型是否通过剪枝、量化、蒸馏生成？俊哥V 由AI辅助创作 AI 笔记人工智能
以下摘自与DeepSeek-R1在线联网版的对话一、基础判断维度技术类型核心特征验证方法剪枝模型参数减少、结构稀疏化1.检查模型参数量是否显著小于同类标准模型12.分析权重矩阵稀疏性（如非零参数占比50%）3蒸馏模型结构轻量但性能接近大模型、输出分布平滑1.对比师生模型结构差异52.分析输出概率分布的熵值（蒸馏模型熵值更高）2二、具体技术验证方法1.剪枝模型验证结构分析使用model.summar
基于旭日派的Ros系统小车的再开发——使用python脚本Astra调用深度相机（学习笔记） Z._ Yang python 嵌入式硬件个人开发 python
1、Ros系统的简要介绍：ROS是你的机器人的操作系统。它运行在各种不同类型的计算机上的标准Linux系统之上，如树莓派或其他的一些单片机、以及笔记本电脑或台式电脑。ROS中可执行的程序的基本单位是：节点（node）节点之间通过消息机制进行通信，这就组成了：算图（abac）节点之间通过收发消息进行通信，消息的收发机制分为：话题（topic）、服务（service）和动作（action）1.ROS提
设计模式--类图、实例代码 HarryTusta java 设计模式
前言本文是参照尚硅谷、黑马程序员以及cyc2018记录的个人学习笔记，仅供记录，不确保严谨性，部分实例代码是根据自己的理解抽象了代码，若不理解，更多具象实例可以参考其他网上实例资料，欢迎讨论学习。设计模式在软件工程中，设计模式是对软件设计中普遍存在（反复出现）的各种问题所提出的解决方案。设计模式的目的设计模式是为了让程序具有更好的代码重用性：即相同功能的代码不用多次编写可读性：即变成规范性，便于其
25/2/16 ＜算法笔记＞ DirectPose 青椒大仙KI11 视觉计算机视觉
DirectPose是一种直接从图像中预测物体的6DoF（位姿：6DegreesofFreedom）姿态的方法，包括平移和平面旋转。它在目标检测、机器人视觉、增强现实（AR）和自动驾驶等领域中具有广泛应用。相比于传统的位姿估计方法，DirectPose试图简化复杂的处理流程，采用端到端的方式直接从图像中输出位姿参数。1.DirectPose是什么？DirectPose是一种端到端的神经网络方法，旨
网络运维学习笔记 009网工初级（HCIA-Datacom与CCNA-EI）STP生成树协议与VRRP虚拟路由冗余协议技术小齐网络运维学习
文章目录STP(SpanningTreeProtocol，生成树协议)思科：华为：实验思科华为VRRP（VirtualRouterRedundancyProtocol，虚拟路由冗余协议）思科华为STP(SpanningTreeProtocol，生成树协议)提高可靠性（使用冗余链路）的同时避免环路产生的问题（广播风暴，MAC地址表震荡）。STP模式有三种：MSTP（默认，而且常用）、RSTP、STP
数据结构学习笔记(3)：栈别等天上俯瞰数据结构
前言栈的逻辑结构其实也是线性表，只不过它的插入和删除操作受限，如下图所示:栈只有一端能够插入和删除，这端叫做栈顶；而不同操作的一端就称为栈顶。所以，后面进入栈的元素能够被优先删除，这种特性被称为后进先出(LastInFirstOut，LIFO)。顺序栈顺序栈，顾名思义，就是用顺序存储实现的栈，它使用一连串连续的存储单元来存储栈元素，同时加入一个指针，表明现在栈的元素个数。2.1顺序栈的定义顺序栈的
25/2/18 ＜算法笔记＞ ByteTrack 青椒大仙KI11 笔记
ByteTrack（发表在2021年）是一种高效且精确的**多目标跟踪（Multi-ObjectTracking,MOT）**算法。它属于目标跟踪领域中基于检测的类别（trackingbydetection），核心思想是利用目标检测器的高置信度和低置信度检测结果，通过简单的后处理策略实现高效和准确的目标跟踪。多目标跟踪(MOT)的主要目的是对视频或帧序列中的多个对象进行检测和跟踪。在MOT方法中通
容器方式安装 nexus3 并作为yum私服 chenxizhan1995 总结记录 linux containers
nexus3笔记new,2022-10-19,chenxizhan1995@163.com目标虚拟机上docker形式搭建nexus服务，用作yum私服和containerimage私服，为k8s集群提供基础了解nexus数据存储目录，把数据存储到单独的磁盘上，可以迁移资料阅读NexusRepositoryManagerNexusRepositoryOSSvs.ProFeaturesReposit
【STM32进阶笔记】FATFS文件系统（上）二土电子 STM32进阶笔记 stm32 笔记嵌入式硬件 FAT 文件系统
本专栏争取每周三更新直到更新完成，期待大家的订阅关注，欢迎互相学习交流。本文需要一些SD卡的前置知识，后续文章会介绍，这里先介绍一下FATFS文件系统。关于FATFS的文章分为上下两篇，上篇主要介绍什么是FAT文件系统以及FATFS的移植，下篇主要介绍FATFS的一些API函数。目录一、FATFS文件系统简介1.1FATFS引入1.2FATFS特点二、FATFS文件系统移植2.1FATFS
基于Rust开发git-cryptx与Obsidian实现加密多机同步的写作方案
「知识管理的尽头，是安全与效率的平衡」——你的每一份笔记都值得被加密保护痛点直击：为什么需要加密同步？Obsidian的好用程度不必多说（个人心目中最佳），然而官方同步服务年费高达48~96美元，且对隐私敏感用户而言，将笔记明文存储在第三方平台存在风险。使用ObsidianGit插件同步方案虽然免费，但安全性存在两大硬伤：隐私泄露：配置文件、日记、账号密码等敏感内容以明文形式存储Github、Gi
《Operating System Concepts》阅读笔记：p41-p49 操作系统
《OperatingSystemConcepts》学习第8天，p41-p49总结，总计9页。一、技术总结1.peer-to-peer(P2P)(1)定义P2PisAmodeofdistributedcomputinginwhichallnodesactasbothclientsofothernodesandserverstoothernodes.(2)示例Napster、Gnutella、Skyp
《Operating System Concepts》阅读笔记：p34-p40 操作系统
《OperatingSystemConcepts》学习第7天，p34-p40总结，总计7页。一、技术总结1.virtualization(虚拟化)(1)定义Atechnologyforabstractingthehardwareofasinglecomputerintoseveraldifferentexecutionenvironments,therebycreatingtheillusiont
《Operating System Concepts》阅读笔记：p26-p33 操作系统
《OperatingSystemConcepts》学习第6天，p26-p33总结，总计8页。一、技术总结timer(1)为什么设置timerWemustensurethattheoperatingsystemmaintainscontrolovertheCPU.Wecannotallowauserprogramtogetstuckinaninfinitelooportofailtocallsyst
《Operating System Concepts》阅读笔记：p50-p61 操作系统
《OperatingSystemConcepts》学习第9天，p50-p61总结，总计12页。一、技术总结1.systemcall(1)定义Theprimaryinterfacebetweenprocessesandtheoperatingsystem,providingameanstoinvokeservicesmadeavailablebytheoperatingsystem.二、英语总结(生
《Cell》期刊作者提交指南 TigerZ 生信宝库科研技能程序人生
❝写在前面在投稿论文前，阅读目标期刊的政策要求是非常必要的。本文为《Cell》期刊提供给作者的提交指南，包含了提交论文的相关信息和政策要求。本着自己学习、分享他人的态度，分享学习笔记，希望能对大家有所帮助。目录1期刊介绍（Aboutthejournal）2编辑评估时间表（Editorialevaluationtimeline）3CellPress期刊之间的关系（Relationshipbetwee
《计算机组成及汇编语言原理》阅读笔记：p1-p8 编程
《计算机组成及汇编语言原理》学习第1天，p1-p8总结，总计8页。一、技术总结1.Intel8088microprocessor(微处理器)，1979-1988。2.MS-DOSMicrosoftDiskOperatingSystem的缩写，是一个操作系统(operatingsystem)。3.Moore'sLaw&Moore'ssecondlaw(1)Moore'slawThenumberoft
C语言结构体学习笔记 BUG 劝退师 c语言 c语言学习笔记
C语言结构体学习笔记目录结构体基本概念结构体变量定义结构体初始化结构体数组结构体指针共用体枚举类型typedef自定义类型总结结构体基本概念1.什么是结构体？结构体：一种用户自定义的数据类型，用于将多个不同类型的变量组合成一个整体。用途：表示复杂数据（如学生信息：学号、姓名、成绩等）。2.结构体定义struct结构体名{数据类型成员1;数据类型成员2;//可以嵌套结构体struct子结构体名子成员
TT无人机零散笔记 xzal12 TT无人机无人机笔记
TT扩展板上传模式：sdk：软件开发工具包。一键安装驱动：扩展模块使用Mind+编程是通过USB串口，因此在首次使用Mind+连接扩展模块时需要一键安装驱动。恢复设备初始设置：由于扩展模块可编程，如果扩展模块中存在程序则会导致实时模式的控制无法生效，因此在使用实时模式前需要将扩展模块恢复默认固件。serial.begin(9600)#初始化串口通信，设置数据传输速率(波特率)为9600。波特率：表
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理 dorabighead javascript 开发语言 ecmascript
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理大家好！我是小哆啦，欢迎回到《JavaScript高级程序设计》的读书笔记大本营！在这章中，我们要聊的是两个让人头疼又迷人的话题——变量、作用域与内存管理。有些人一提到这些，就会感到一阵头晕目眩，恍若置身一场JavaScript版的迷宫大冒险！但今天，小哆啦会带你们轻松过关，深入了解这些概念，并且保持足够的幽默感，让你既能笑着学
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
Mysql学习笔记-Mysql基础进阶少年无为 Mysql Mysql 数据库多表查询数据库备份 Mysql查询
#知识点1.DQL:查询语句1.排序查询2.聚合函数3.分组查询4.分页查询2.约束3.多表之间的关系4.范式5.数据库的备份和还原#DQL:查询语句1.排序查询*语法：orderby子句*orderby排序字段1排序方式1，排序字段2排序方式2...*排序方式：*ASC：升序，默认的。*DESC：降序。*注意：*如果有多个排序条件，则当前边的条件值一样时，才会判断第二条件。2.聚合函数：将一列数
嵌入式学习DAY28 --- 线程、同步和互斥问题、如何实现同步和互斥？楼台的春风嵌入式学习多线程 c语言嵌入式 linux ubuntu
嵌入式入门学习笔记，遇到的问题以及心得体会！DAY28概述：一、线程二、同步和互斥问题三、如何实现同步四、如何实现互斥笔记：一、线程1、什么是线程：（1）线程是轻量级的进程（2）线程存在于进程内，不能独立存在（3）线程参与CPU调度，进程是系统资源分配最小单位，线程是系统调度的最小单位（4）在单核CPU中，多线程并发属于伪并发，但是不牵扯虚拟地址空间的切换，所以开销比进程间切换要小很多（5）在多核
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
Java 运行时常量池笔记（详细版小猫猫猫◍˃ᵕ˂◍ java 笔记 python
Java运行时常量池笔记（详细版）Java的运行时常量池（RuntimeConstantPool）是JVM方法区的一部分，用于存储编译期生成的字面量和符号引用。它是Java类文件常量池的运行时表示，具有动态性和共享性。运行时常量池的核心概念1.什么是运行时常量池？运行时常量池是JVM方法区的一部分，存储类文件中常量池的内容。它包含：字面量：如字符串、整数、浮点数等。符号引用：如类名、方法名、字段名
侯捷 C++ 课程学习笔记：C++ 面向对象开发的艺术孤寂大仙v c++c++学习笔记
在侯捷老师的C++系列课程中，《C++面向对象开发》这门课程让我对面向对象编程有了更深入的理解。面向对象编程（OOP）是现代软件开发中最重要的编程范式之一，而C++作为支持OOP的语言，提供了强大的工具和特性。侯捷老师通过系统的讲解和实战案例，帮助我掌握了如何在C++中高效地使用面向对象技术。以下是我对这门课程的学习笔记和心得体会。一、课程核心内容：C++面向对象开发的关键特性![侯捷老师的课程详
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
使用 Docker 基本命令创建并发布带有新功能的镜像到阿里云 2021级计算机网络技术2班梁嘉敏 docker 阿里云容器
1.关于Docker镜像1.基础假定您在开发一个网上商城，您使用的是一台笔记本电脑而且您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。此外，您的企业还拥有标准化的测试和生产环境，且具有自身的配置和一系列支持文件。您希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销。请问？您要如何确保应用能够在这些环境中运行和
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

sphinx 笔记

你可能感兴趣的:(sphinx 笔记)