yuyulovespicy

boost搜索引擎 (保姆级制作,包看包会)

0.观前提醒:

1.项目背景介绍

2.搜索引擎宏观原理

3.搜索引擎技术栈与项目环境

4.正排索引 && 倒排索引 - 搜索引擎基本原理

4.1正排索引

4.2文档分词

4.3倒排索引

5.编写数据去标签与数据清理的模块 Parser

5.1获取相关boost资源

5.2去标签化思路构建

5.3去标签化代码实现

5.3.1网页文件去标签化代码的基本框架:

5.3.2网页文件解析接口的分别实现

#1.GetFiles接口的实现:

#2.ParserHtmls接口的实现:

#3.SaveHtmlInfo接口的实现:

6.编写建立索引的模块 Index

6.1建立索引的基本代码框架

6.2建立正排索引

6.2.1正排索引代码基本结构

6.2.2切分字符串-boost库split函数使用

6.3建立倒排索引

6.3.1倒排索引的思路结构

6.3.2倒排索引的代码编写

6.3.3分词工具cppjieba

6.4将索引类设计成为单例模式

6.4.1 限制构造

6.4.2 单例接口

7.编写搜索引擎模块Searcher

7.1搜索引擎Searcher.hpp基本结构

7.2对Search接口的实现

7.3对jsoncpp库的引入与使用

7.4实现获取内容摘要接口

8.编写搜索服务端http_server.cc

8.1测试版search_server.cc

8.2网络版http_server.cc

8.2.1升级gcc

8.2.2引入cpp-httplib库

8.2.3使用cpp-httplib库

8.3编写搜索服务端http_server.cc

9.前端部分代码实现

9.1前端基础说明

9.2编写前端代码工具选择及其安装

9.3 Html网页结构书写

9.3.1搜索引擎网页基本结构设计

9.3.2HTML网页代码基本实现

9.4 CSS网页样式设置

9.4.1对网页进行总体样式设置

9.4.2对标题进行样式设置

9.4.3对搜索内容进行样式设置

9.5 Js前后端交互

9.5.1网页Search()搜索函数初测试

9.5.2引入JQuery库

9.5.3网页Search()搜索函数书写

10.小细节完善

10.1摘要完善

10.2去重完善

11.添加日志与部署到Linux中

11.1建立日志库/接口

11.2进行日志部署

11.2.1在index.hpp中进行日志部署

11.2.2在searcher.hpp中进行日志部署

11.2.3在http_server.cc中进行日志部署

11.2.4日志打印测试

11.3后台部署服务

11.3.1介绍nohup指令

11.3.2使用nohup指令进行服务,日志部署

12.结项总结

源码资源文件:boost_search_engine : A simple but useful search engine of boost warehouse. You can see all the codes and other resouces. (gitee.com)https://gitee.com/onlookerzy123456qwq/boost_search_engine

0.观前提醒:

(1)本文所有代码资源都已经上传至Gitee码云,强烈建议源码与Xmind思维导图食用此文。

(2)本文是保姆级项目展示,耐心看一定能看懂,且你对搜索引擎技术的理解将比别人高一个层次。

1.项目背景介绍

(1) 在如今的信息时代下,检索信息成为几乎人人的"必需品",在此大背景下,出现了诸如百度,360,搜狗等大型的搜索引擎,我们可以通过做一个微型的搜索引擎达到"管中窥豹"的效果,明晰搜索引擎的运行原理。

图片1 搜索引擎网页的基本构成

(2) boost作为C++的准标准库,在C++代码编写中使用频率很高,但是在官方的网站中,却没有站内搜索,并不便于用户的快速查找。

所以我们的项目boost搜索引擎,就是用来提供对boost官方库中资源的搜索服务的。

2.搜索引擎宏观原理

(1)通过爬虫程序在全网中抓取相关的html网页信息,存至server服务器端的磁盘当中。

(2)对这些html文件,进行去标签化与数据清理,即只保留网页文件中的主要信息(title,content,url)。

(3)对去标签化清理后的数据,建立索引,方便我们进行后续的检索查找。

(4)客户端在浏览器中发起http请求,服务端在索引中检索到相关的html网页主要信息。

(5)拼接多个网页的(title+content+url)信息,构建出一个新html网页,返回给用户。

PS:爬虫程序,涉及法律,技术等因素限制,所以我们暂时只爬取一个boost库官方网站,且通过正规

渠道下载boost库的相关文件。

3.搜索引擎技术栈与项目环境

技术栈:

后端:C/C++,C++11,STL,boost准标准库,Jsoncpp,cppjieba,cpp-httplib

前端:HTML5,CSS,JS,jQuery,Ajax

项目环境:

Centos7云服务器,vim/gcc(g++)/Makefile,VS2022/Vscode

4.正排索引 && 倒排索引 - 搜索引擎基本原理

文档一: 郑成功打败了荷兰殖民者。

文档二: 郑成功收复了台湾。

4.1正排索引

正排索引:就是从文档ID中找到文档内容(或文档内的关键字)

文档ID	文档内容
1	郑成功打败了荷兰殖民者。
2	郑成功收复了台湾。

4.2文档分词

对目标文档进行分词(目的: 方便建立倒排索引与查找)

文档1: [郑成功打败了荷兰殖民者。] : 郑成功/打败/荷兰/殖民者/荷兰殖民者

文档2: [郑成功从荷兰手中收复了台湾。] : 郑成功/荷兰/台湾/收复台湾

PS:停止词如 "了" , "从" , "吗" , "the" , "a" 等,在我们分词的时候不纳入考虑范围。

4.3倒排索引

倒排索引:根据文档内容进行分词 , 整理不重复的各个关键字 , 对应联系到文档ID的方案

关键字(具有唯一性)	文档ID,weight(权重)
郑成功	文档1,文档2
打败	文档1
荷兰	文档1,文档2
殖民者	文档1
荷兰殖民者	文档1
收复	文档2
台湾	文档2
收复台湾	文档2

总之,大致过程就是先使用倒排索引,通过关键字找到文档ID。

再使用正排索引,通过文档ID找到文档内容。

用户输入 : 郑成功 -> 倒排索引中查找 -> 提取出文档ID{1,2} -> 根据正排索引

-> 找到文档内容 -> title+content+url 文档结果进行摘要 -> 构建响应结果

PS:后续我们倒排索引找到文档ID后, 在网页中,需要按照权重对不同文档进行先后的排序显示,所以我们在倒排索引这里需要增加权重weight信息项。

5.编写数据去标签与数据清理的模块 Parser

5.1获取相关boost资源

(1)进入官网 https://www.boost.org 进行相应资源下载(我们以boost1.8为例)

(2)下载后载入云服务器中

PS:这里需要使用lrzsz进行云服务的文件上传 , 如果没有安装可以执行 sudo yum install lrzsz 指令进行安装。

PS:我们获取的基本资源是boost_1_80_0/doc/html/* 这个文件夹里面的内容

主要是因为云服务器配置并不允许我拷贝来那么多资源,配置好的小伙伴可以

cp boost_1_80_0/doc/*

整站搜索NO... 部分站资源搜索YES!

5.2去标签化思路构建

我们随便打开一个.html原生文件,观察其内容

我们的目的是提取出一个网页文件的 title + content + url, 得到每一个网页的去标签化内容 ,。

所以就需要过滤掉<...>等并不需要的标签内容 ,

最终将每个网页文件的主体三件套 title + content + url 进行保存。

总思路:

就是把每个文档内容都进行解析去标签化后,写入raw_html文件夹中的同一个文件当中。

PS: 在保存网页数据的时候,我们使用 '\3'作为分隔符

这是因为在ASCII表中 , 控制字符是不可显示字符 , 即无法打印。

在我们获取的文档内容(即data/input中的html网页文件)中,里面基本上都是可打印字符,基本上不会有不可显示的控制字符。

如此以来也就不会污染我们的文档内容啦。

5.3去标签化代码实现

我们创建parser.cc文件进行去标签化工作

5.3.1网页文件去标签化代码的基本框架:

5.3.2网页文件解析接口的分别实现

#1.GetFiles接口的实现:

要实现GetFIles接口,就是要在/data/input/文件夹下 , 提取每个html网页文件的路径名称。

这时候就需要借助boost库中的接口来完成这一任务。

#1.1 认识使用boost库接口

这里做一个区分,我们做站内搜索的版本是1.80 , 我们写代码要使用的boost库是1.53版本。

在云服务器中对boost库进行安装: (sudo yum install -y boost-devel)

在boost官方中可以找到相应接口的使用手册: (如下是进入方法)

#1.2 编写GetFiles接口

下面开始我们的编写GetFiles接口的代码部分: (不要忘记#include哦)

现在我们Getfiles已经把data/input/目录下的所有.html文件名路径,读取到了file_list中,

下一步就是根据所有的文件名路径,打开每一个.html文件,读取+解析文件(数据清洗,去标签化)

只提取出每个文件的title content url,再将一个个提取内容保存到result中。

#2.ParserHtmls接口的实现:

任务就是实现这四个函数,从而实现对每一个.html文件的读取解析提取。

ParserHtmls函数基本结构:

#2.1ReadFile接口:

#2.2Parsertitle接口:

#2.3Parsercontent接口:

#2.4Parserurl接口:

#3.SaveHtmlInfo接口的实现:

PS:

('\3'作为控制字符,不可显示性质的内容,用其分隔可不污染原文档主体内容)

一个文档,即一个html的三件套(title+content+url),内部采用\3分隔。 <不采用\n分隔>

文档与文档之间采用\n分隔。 <不再采用\3分隔>

主要是因为后续我们对/data/raw_html/raw.txt的读取时,

使用getline一次读取文件一行\n , 读取单个文档的效率就提高了!

综上,我们就有了去标签化的各个网页文件的主体内容(title+content+url)了(如下图)。

完成以上的解析去标签化工作,就可以给建立索引提供基本的数据源了。

6.编写建立索引的模块 Index

我们构建索引,实际上就是构建存储+搜索的数据结构,来加快我们对于关键字->文档ID->文档内容的搜索过程。根据第四部分所述"正排索引 && 倒排索引 - 搜索引擎基本原理",我们需要构建正排索引以及倒排索引。

6.1建立索引的基本代码框架

存储倒排索引与正排索引的基本信息单位

使用vector作为构建正排索引的容器 : 则vector的下标就是天然的文档ID

使用unordered_map作为构建倒排索引的容器 : 通过关键字key_word , 从而快速查找到倒排文档信息拉链。

对索引Index对象,我们有三个核心接口,分别是在正派索引的查找,在倒排索引的查找,构建索引(包括构建正排和倒排索引结构)。

对于索引查找接口的实现:

对于构建索引代码结构的实现:

则接下来的重点就是如何对每一个文档的基本信息,分别构建正排索引以及倒排索引了。

先建立正排索引。

6.2建立正排索引

6.2.1正排索引代码基本结构

6.2.2切分字符串-boost库split函数使用

在util.hpp中,我们首先需要引头文件#include

举例使用 : 一个例子带你了解boost::split分词使用

编写util.hpp的切分字符串函数

6.3建立倒排索引

6.3.1倒排索引的思路结构

我们对于每一个获取到的文档信息title+content+url,建立倒排索引。

#1.首先我们对一个文档的title+content进行分词(借助于jieba分词工具,这点我们最后谈)

#2.我们对分词后得到的多个词段,进行词频统计,得到每一个词段的在标题/内容的出现次数

#3.就可以根据<词key_word,频次word_cnt>map表,填充单个倒排词段信息,插入到倒排索引

PS:一个文档中的一个key_word关键词的权重weight信息的计算:

就是根据这个文档中该关键词在标题title 内容content中出现的次数,

再自定义相关性计算出该关键词key_word的分量weight,再填充词段信息weight。

一个简单例子理清上述思路:

#1.分词

title: 计算机专业

content: 计算机专业是硬件与软件的结合

title: 计算机 / 专业 / 计算机专业

content: 计算机 / 专业 / 计算机专业 / 硬件 / 软件 / 结合

存储在vector title_word , content_word

#2.词频统计

struct word_cnt{

title_cnt;

content_cnt;

}//对于一个词段的在标题和内容中出现频数统计

unordered_map wordcnt_map;

for word : title_word{

word_cnt[word].title_cnt++;

//计算机(1) / 专业(1) / 计算机专业(1)

}

for word : content_word{

word_cnt[word].content_cnt++;

//计算机(1) / 专业(1) / 计算机专业(1) / 硬件(1) / 软件(1) / 结合(1)

}

则可以知道每一个出现的词段,以及其在标题/内容中出现的次数。

#3.自定义相关性_填充字段_插入倒排索引

for word : wordcnt_map{

// key_word->vector 一个关键字对应多个文档的信息

InvertedInfo word_info;

word_info._key_word = word.first;

word_info._doc_id = Doc._doc_id

word_info._weight = 10*word.second.title_cnt + 1*word.second.content_cnt

//根据word_cnt频数自定义

_InvertedIndex[word.first].push_back(word_info);

}

6.3.2倒排索引的代码编写

由于对cppjieba工具的说明使用部分较长,我们放在倒排索引代码编写部分之后进行说明。

PS细节说明: 我们在搜索的时候实际上是不需要区分大小写的,所以需要我们在进行关键词统计的时候,我们统一将获取的分词进行小写化,即把我们倒排索引中查找的关键词(即倒排表的左侧改为全小写),我们随后在索引中搜索时再统一将输入的搜索词按小写检索。

所以我们对代码做如下改动。

6.3.3分词工具cppjieba

#1.Jieba库的安装和使用

我们进入GitHub来获取cppjieba分词工具资源(链接如下)

GitHub - yanyiwu/cppjieba: "结巴"中文分词的C++版本

我们看一下cppjieba工具包的具体构造

解决jiaba库的链接使用问题

其中我们需要连接使用的是如下三个:

cppjieba/include (需要建立对/include目录下文件的链接)

cppjiba/dict (需要建立对/dict目录下文件的链接,从而获取jieba分词时的字典根据)

cppjibea/deps/limonp (这是cppjiaba库的坑,需要将此目录拷贝到cppjieba/include/cppjieba)

下面我们举例测试使用cppjieba工具,可以带我们了解cppjiba库的基本使用

PS:我们使用jieba库中的demo.cpp进行测试,当然我们也要首先解决jiba库的链接问题。

解决jieba库的链接问题

(链接问题实际上是要解决在一个.cpp源文件中要找到库的链接路径)

(我们软连接ln -s 库路径 , 实际上就是在为源文件.cpp寻找到库路径提供便利)

下面我们对修改源文件demo.cpp的对库的链接获取路径

这里我们发现了一个问题 : 我们直接下载的cppjieba/deps/limonp实际上是空文件夹,

(不信自己下载完去看真的哭了) 这就需要我们重新专门下载limonp文件夹。

git clone https://github.com/yanyiwu/limonp.git

得到limonp文件夹按照如下操作就可以了

#2.引入Jieba库到项目

我们先将完整的,更新limonp的jieba库 , 拷贝到专门的资源仓库文件夹中。

建立对jieba库的软连接

根据demo.cpp的对字符串的分词示例,设计util.hpp中Jieba分词接口

#3.工具集util.hpp中对于Jieba分词接口的实现

友情提示:不要忘记在util.hpp中#include"cppjieba/Jieba.hpp"

到此我们建立索引的部分就结束了

索引就是一个存储+查找的数据结构(这里其实就是填充两张表嘛)

然而,我们再思考一下索引类,我们需要建立多个索引对象吗?

一来,我们其实在boost搜索引擎项目当中,事实上不需要建立多个Index索引对象,只需要建立一个索引对象就可以完成查找工作了(即我们不需要建立多对正排倒排表,只要有一对能检索查找即可)。

二来,我们建立一个索引对象的成本事实上是极高的,因为我们需要将所有的网页信息分词,统计,填充,插入,效率上会受极大损失。

因此我们将其设计为单例模式。

6.4将索引类设计成为单例模式

6.4.1 限制构造

6.4.2 单例接口

友情提示:记得#include 和类外初始化静态成员

7.编写搜索引擎模块Searcher

编写Seacher搜索引擎,实际上就是对index索引类的一个再封装的过程,进而在接下来对搜索服务端时更加方便的使用检索查找接口。

7.1搜索引擎Searcher.hpp基本结构

7.2对Search接口的实现

友情提示: 下载json库后, #include

7.3对jsoncpp库的引入与使用

jsoncpp库的引入 sudo yum install -y jsoncpp-devel

对jsoncpp库的使用测试

7.4实现获取内容摘要接口

前情提要:我们根据搜索内容query分词,到倒排查找到的文档内容进行返回,然而我们返回的,即用户搜索完出来的信息,应该是文档内容的摘要部分,所以我们只需要找到包含搜索关键字的内容摘要即可。 content ---> Desc(content,key_word)

$获取内容摘要接口注意点:

(1)我们的建立的索引Index,其中的倒排表实际上是统一按照小写词段进行查找的,也就是说,我们倒排索引表的左侧是小写的词。

我们搜索到的倒排拉链里面的文档ID信息里面存储的也是小写化的搜索关键词_key_word。

(2)而索引Index.其中的正排表中,文档id对应的文档内容,doc_info里面的_content内容,却是不区分大小写的。

->所以我们不能直接用小写化的_key_word在_content中find搜索,大小写不匹配,这是不可能找到包含该关键词的语句的。

我们应该在content中寻找key_word时,在检查对比时,统一小写化对比。

这里我们使用C++ 中的search接口解决。

8.编写搜索服务端http_server.cc

8.1测试版search_server.cc

编写测试版http_server.cc

改写编译规则Makefile

测试运行,我们发现了如下报错

可以看出是对于ns_index::InvertedInfo类的比较出现比较问题。

我们STL中的set底层是一棵红黑树,在插入的时候需要来回比较结点,而我们InvertedInfo类作为自定义类无法比较,所以需要我们添加比较规则,即给set传入比较仿函数类。

给set添加比较仿函数之后,我们再次运行测试,可以发现运行成功!

8.2网络版http_server.cc

我们要编写网络版本的boost搜索引擎服务端,就要使用网络传输的原始接口,不过在C++中,

可以直接引入cpp-httplib库,减少我们编写网络传输部分代码的成本。

然而,要链接,编译,使用cpp-httplib库,我们需要使用更新版本的gcc。

我们云服务器中自带的gcc版本较低,是不能编译通过cpp-httplib库的。

所以在引入cpp-httplib库之前我们需要先升级gcc。

8.2.1升级gcc

我们更新gcc需要用到三条指令 + 一个配置 (需要用scl来启动gcc 后续的配置是方便使用)

$1.安装scl

sudo yum install -y centos-release-scl

$2.安装新版本gcc

sudo yum install -y devtoolset-7

$3.启动scl更新gcc

scl enable devtoolset-7 bash

#4.(选做)配置自启动更新gcc

vim ~/.bash_profile

>在该文件的末尾放上语句scl enable devtoolset-7 bash即可

我们启动scl更新gcc,实际上只有当前次会话有效而已,即下一次重新启动之后仍然需要启动scl更新gcc。所以才有了我们的第四步配置bash_profile ,可以使每次启动的时候,都会自动执行更新gcc的指令:enable devtoolset-7 bash 。就不用劳烦大家每次都启动更新一下gcc啦~

执行$1 $2 $3 三步之后,就可以使用gcc的升级版本了

执行#4 配置自启动更新gcc

8.2.2引入cpp-httplib库

我们在gitee网站上搜索该资源

将下载好的库文件上传入云服务器中 (依托lrzsz工具 , 没有可以sudo yum install -y lrzsz)

我们就有了对cpp-httplib库资源的链接

PS:这里注意,我们cpp-httplib的实现是运用到了原生线程库的,所以我们在编译的时候,需要链接线程库-lpthread

8.2.3使用cpp-httplib库

友情提示: #include "cpp-httplib/httplib.h"

使用测试:

8.3编写搜索服务端http_server.cc

PS：设置服务端的web根目录wwwroot/index.html,web根目录就是直接访问该IP: Port端口时默认显示的网页。web根目录这里我们在后续实现前端的网页HTML时再进行演示。

http_server代码结构:

http_server搜索端测试：

9.前端部分代码实现

9.1前端基础说明

我们boost搜索引擎的主要代码（后端）已经完成，我们接下来简单介绍一下前端。

了解前端三大件：html , css , javascript（js）

html：是网页的骨骼 --- 负责网页结构

css: 网页的皮肉 --- 负责网页的美观

js：网页的灵魂 --- 负责动态效果，以及前后端交互

前端学习网站推荐：http://www.w3school.com.cn

9.2编写前端代码工具选择及其安装

我们使用Vscode连接云服务器进行前端代码的编写，下面我们安装Vscode并进行连接。

#1.进入Vscode官方网站进行下载。

Visual Studio Code - Code Editing. RedefinedVisual Studio Code is a code editor redefined and optimized for building and debugging modern web and cloud applications. Visual Studio Code is free and available on your favorite platform - Linux, macOS, and Windows.https://code.visualstudio.com/

#2.下载相关插件

示例：

【1】安装好Remote - SSH之后，按F1打开输入对话框。

【2】输入remote-ssh

【3】ssh [email protected]

之后就会点击下图示主机进行连接主机，再打开文件夹即可找到自己的工作目录。

9.3 Html网页结构书写

9.3.1搜索引擎网页基本结构设计

9.3.2HTML网页代码基本实现

进入wwwroot/index.html进行代码书写

下面我们先介绍一下快捷键：

！+ Tab ：会自动设计出html网页代码基本结构

h1 + Tab ：会自动设计出h1标签

我们按照9.3.1搜索引擎根目录网页基本结构设计，设计如下的HTML文件。

代码展示：

web根目录：wwwroot/index.hmtl 网页测试：

9.4 CSS网页样式设置

对网页进行样式设置 (给骨骼加上皮肉)

设置样式的本质: 找到想设置的标签, 设置它的属性。

1. 选择特定的标签: 类选择器, 标签选择器, 符合选择器

9.4.1对网页进行总体样式设置

web根目录：wwwroot/index.hmtl 网页测试：

9.4.2对标题进行样式设置

web根目录：wwwroot/index.hmtl 网页测试：

9.4.3对搜索内容进行样式设置

web根目录：wwwroot/index.hmtl 网页测试：

9.5 Js前后端交互

9.5.1网页Search()搜索函数初测试

点击搜索一下按钮,我们可以进行搜索功能。

即我们需要添加点击按钮button时,会发生搜索Search()事件,执行Search()函数

初测试代码结构:

初测试结果:

9.5.2引入JQuery库

我们使用JQuery库 (就像C++语言之于C++标准库的关系)

来进行前后端交互,Js代码部分的书写。

下面利用JQuery进行前后端交互搜索服务模块的编写。

9.5.3网页Search()搜索函数书写

#1.获取搜索原生结果data

#2.根据搜索结果,建立搜索结果网页。

搜索功能测试:

10.小细节完善

现在我们的代码已经基本成型了, 下面我们对小地方进行修改。

10.1摘要完善

在我们的搜索结果展示上, 增加摘要内容,将摘要内容后面加 ... , 提示摘要部分。

修改代码:

10.2去重完善

前情提要:之前在写searcher.hpp时,我们对搜索词query进行jieba分词后,由于分出的是多个词段,所以在进行倒排索引之后,我们会查到重复的文档信息,我们当时是用set去重,这样的确可以起到去重的目的,但是事实上不能体现权重这一属性。

举个例子: 一个query搜索关键词,我们将其分词成4个词段,这四个词段都能倒排搜索到同一个文档信息,那这个文档信息的优先级事实上应该是高的,我们之前无脑对搜索到的文档信息进行去重是不合理的。我们应该根据去重的数量,对有重复的文档信息word_info进行权重_weight

的增加。

下面用之前的代码进行伪代码的修改:

看上图代码,而当我们使用set进行修改时,并不能达到我们的预期(因为set的key并不可以修改),所以我们改用map容器,即可完成去重以及权重叠加两个工作。

测试结果:

可见搜索结果发生了变化,且更加贴合我们的搜索结果预期。

11.添加日志与部署到Linux中

打日志,说人话就是在服务端打印提示信息: 哪个文件中的哪一行,执行发生了什么。

11.1建立日志库/接口

语法提示 : #LEVEL #后面的宏: 对之不进行宏替换,而是自动将其作为一个字符串

举个例子: LOG(WARNING,"这里有xxx警告") ->

在预处理阶段处理成: log( "WARNING" , "这里有xxx警告" , "调用log的文件名" , "调用行数")

最后打印出来的信息: [WARNING][这里有xxx警告][searcher.hpp][50]

11.2进行日志部署

11.2.1在index.hpp中进行日志部署

在index.hpp中进行日志即提示信息的部署:

友情提示: #include "log.hpp"

11.2.2在searcher.hpp中进行日志部署

11.2.3在http_server.cc中进行日志部署

11.2.4日志打印测试

11.3后台部署服务

11.3.1介绍nohup指令

nohup的执行:

nohup指令: 将服务进程以守护进程的方式执行 , 使关闭XShell之后仍可以访问该服务。

例如 nohup ./http_server

如果让程序在后台执行, 可以在末尾加上 & , 程序就会隐身 , 不会显示在终端。

例如 nohup ./http_server &

nohup形成的文件:

执行完上述的nohup指令之后,将会形成一个nohup.out存储日志信息文件,可以cat查看该文件

11.3.2使用nohup指令进行服务,日志部署

实现基本的自动服务+更新日志的部署

使用nohup指令后,我们的http_server就可以一直在后台执行了,即使我们关闭了XShell!!!

而且日志信息也会自动同步更新到nohup.out中。 (如下验证)

事实上,我们也可以存一个专门的日志文件夹,进行日志信息的存储。

而这之前我们要删除上一条对于日志服务的部署。

这个较为简单:

ps axj | head -1 && ps axj | grep http_server //找到相应服务的PID。

kill -9 SERVER_PID //对该服务发送信号,结束服务。

再实现自动服务+更新日志的部署

总之,我们就完成了自动服务+自动更新日志的部署!!!

12.结项总结

至此,我们就完成了boost搜索引擎项目,我们可以随时访问该服务网址,进行在boost准标准库相应接口的站内搜索。

这里我们再总结一下该项目的可扩展点

1.我们受限于云服务器配置,没有做boost库的整站搜索,而只是做了1.8.0版本下的doc/html/*下的文件搜索。

2.我们在搜索引擎中,对于权重的设置先后显示顺序,我们其实可以叠加一些算法,比如可以设置竞价排名,热点统计,额外增加某些文档的权重。

3.我们可以利用数据库,设置用户登录注册,引入对MySQL的使用。

PS:欢迎大家及时指正此项目的不足,有任何问题可以随时联系我。

欢迎大家的支持!!!

你可能感兴趣的:(搜索引擎,c++,c语言,http,数据结构)

Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析一起搞IT吧数码相机算法数据结构人工智能 android 图像处理计算机视觉
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析目录一、libcvface_api.so数据结构详细注释解析一、libcvface_api.so数据结构详细注释解析///@brief人脸信息结构体typedefstructcv_face_t{cv_r
C++系列（十）：面向对象编程终极指南！从封装到多态，彻底掌握类与对象的核心奥秘傅里叶的耶 C++语言系列（教程 +实战）c++类和对象
引言面向对象编程（OOP）是现代软件开发的核心范式，C++通过封装、继承和多态三大特性提供了强大的面向对象能力。这些特性使代码更易维护、扩展和复用，是构建复杂系统的基石。本章将深入探讨C++类和对象的方方面面，从基础封装到高级多态应用，帮助您掌握面向对象编程的精髓。最后，如果大家喜欢我的创作风格，请大家多多关注up主，你们的支持就是我创作最大的动力！如果各位观众老爷觉得我哪些地方需要改进，请一定在
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
Spring框架中的Component与Bean注解
SpringBoot中的@Bean与@Component![](https://pic4.zhimg.com/v2-f957e9ec5412c87a66ccb021410eaae9_14...)Spring的@Component和@Bean注解的关键区别在于：@Bean注解可用于暴露您自己编写的JavaBeans，而@Component注解可用于暴露源代码由他人维护的JavaBeans。Sprin
C++ 工厂模式与抽象工厂：创建对象的灵活设计海派程序猿 c++java jvm
C++工厂模式与抽象工厂：让对象“流水线”更优雅想象一下，你是一家玩具工厂的老板，主要生产两种玩具：小汽车和积木。最初，你的生产流程很简单，需要什么就直接用new创建什么：//生产小汽车Car*myCar=newCar();//生产积木Block*myBlock=newBlock();简单粗暴，效率很高，就像直接从仓库里抓取零件组装一样。但问题也随之而来：耦合度高：生产代码直接依赖于具体的Car和
【视频观看系统】- 技术与架构选型
✅项目技术选型方案一、整体架构风格项目层级技术选型说明架构风格微服务架构（SpringCloud）独立部署、易扩展、易维护服务通信HTTP（RestTemplate或Feign）+RocketMQ同步调用+异步事件注册中心Nacos服务注册、发现、配置中心配置中心Nacos配置管理多服务统一配置API网关SpringCloudGateway路由转发、权限验证、限流服务监控SpringBootAdm
Readr 项目安装与配置指南芮奕滢Kirby
Readr项目安装与配置指南readr项目地址:https://gitcode.com/gh_mirrors/rea/readr1.项目基础介绍readr是一个R语言的开源项目，由HadleyWickham创建和维护。该项目的主要目的是提供一种快速且友好的方式来读取分隔文件（如CSV和TSV）中的矩形数据。readr能够解析多种数据类型，并在解析过程中提供详细的错误报告，以便用户能够快速识别和解决
C++树状数组详解浩瀚星辰2024 java 算法数据结构
C++树状数组深度解析第1章引言：为什么需要树状数组1.1动态序列处理的挑战在现代计算机科学中，我们经常需要处理动态变化的序列数据，这类数据具有以下特点：实时更新：数据点会随时间不断变化频繁查询：需要快速获取特定区间的统计信息大规模数据：通常涉及数百万甚至数十亿个数据点考虑一个实时股票分析系统：需要监控数千只股票的价格变化，并实时计算：某只股票在特定时间段内的平均价格多只股票之间的价格相关性价格波
自动化测试 | UI Automator 进阶指南 aihuanshang9340
UIAutomator相关介绍：跨应用的用户界面自动化测试包含在AndroidXTest(https://developer.android.com/training/testing)中支持的Android系统：>=Android4.3(APIlevel18)基于instrumentation，依赖于AndroidJUnitRunner测试运行器设置UIAutomator(SetupUIAutom
ubuntu miktex安装教程傅小凤- ubuntu linux ubuntu linux 运维 miktex
ubuntumiktex安装教程安装miktex之前必须先安装texlive，否则会无法安装miktex。sudoapt-getinstalltexlive-fullcjk-latexlatex-cjk-chinese然后就按照miktex官网的安装教程一步一步执行就可以了：https://miktex.org/download
板凳-------Mysql cookbook学习（十一--------4)
唐宇迪机器学习实战课程笔记https://blog.csdn.net/weixin_54338498/article/details/128818007?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ECtr-1-12881
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
Pandas 学习（数学建模篇）停走的风数学建模 pandas 学习
今天学习数学建模2023年C篇（228）优秀论文2023高教社杯全国大学生数学建模竞赛C题论文展示（C228）-2023C题论文-中国大学生在线一.pd.DataFramepd.DataFrame()是pandas库中用于创建二维表格数据结构（DataFrame）的核心函数。它的作用是将各种格式的数据（如字典、列表、Series等）转换为带有行索引和列标签的表格形式，便于数据处理和分析.impor
Centos系统及国产麒麟系统设置自己写的go服务的开机启动项完整教程二当家的素材网运维 centos linux 运维
1、创建服务文件在/etc/systemd/system/下新建服务配置文件（需sudo权限），例如：sudonano/etc/systemd/system/mygo.service如下图，创建的mygo.service2、创建内容如下：Description=ThegoHTTPandreverseproxyserverAfter=network.targetremote-fs.targetnss
linux 定时任务小小小欣
crontab-e0*/1***/usr/bin/curlhttp://manage.baicmotorsales.com/Lists/clueData每一小时访问一次这个方法servicecrondrestart重启任务crontab-l查看定时任务tail-f/var/log/cron查看任务日志
如何解决小程序发布之后不能访问任何请求的问题？嘉琪001 小程序 apache php
（1）域名白名单设置不正确：小程序需要在微信公众平台后台请求域名添加到request合法域名白名单中，否则无法发送请求，确保所有域名添加到白名单中服务器SSL/HTTPS配置问题：小程序要求必须使用HTTPS协议进行网络请求，如果服务器没有配置好SSL证书，就无法访问，跨域问题:在服务器配置好CORS的跨域策略接口权限限制：如果请求是像某个特定的接口发送，确保你在小程序后台设置了相应接口权限有些接
最实用的selenium使用指南
selenium使用一环境搭建下载seleniumpipinstallselenium下载浏览器驱动（以Edge为例）在设置中找到当前Edge版本号，在[MicrosoftEdgeWebDriver-MicrosoftEdgeDeveloper](https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/)中下载对应版
服务间远程调用 tomorrow.hello 架构网络服务器运维
1.协议分层模型通信协议通常按照分层模型进行设计，常见的分层模型包括OSI七层模型和TCP/IP四层模型。OSI七层模型包括应用层、表示层、会话层、传输层、网络层、数据链路层和物理层；而TCP/IP四层模型则包括应用层、传输层、网络层和网络接口层‌。每个层次都有其特定的功能和职责，确保数据的完整传输和错误处理。2.传输协议传输协议主要包括TCP、UDP、HTTP、HTTPS、FTP、SMTP、SS
Leetcode 393. UTF-8 编码验证 C++ Want!
Leetcode393.UTF-8编码验证题目UTF-8中的一个字符可能的长度为1到4字节，遵循以下的规则：对于1字节的字符，字节的第一位设为0，后面7位为这个符号的unicode码。对于n字节的字符(n>1)，第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。这是UTF-8编码的工作方式：Char.number
brew java 切换_Java jdk11 在Mac上的安装和配置以及JDK多个版本之间切换 weixin_39570838 brew java 切换
1、JDK11安装1)下载JDK11wgethttps://download.java.net/java/GA/jdk11/13/GPL/openjdk-11.0.1_osx-x64_bin.tar.gz2)解压安装包(系统中默认安装位置：/Library/Java/JavaVirtualMachines/)sudotar-zxfopenjdk-11.0.1_osx-x64_bin.tar.gz-
python中的pydantic是什么？ John Song Python python 前端开发语言 pydantic
Pydantic是Python中一个用于数据验证和设置管理的库，主要通过Python类型注解（TypeHints）来定义数据结构，并自动验证输入数据的合法性。它广泛应用于API开发（如FastAPI）、配置管理、数据序列化等场景。核心功能数据验证自动检查输入数据是否符合类型和约束条件（如字符串长度、数字范围等）。类型转换将原始数据（如JSON、字典）转换为Python类型（如datetime、En
LeetCode 393. UTF-8 编码验证 Sasakihaise_ LeetCode leetcode 模拟
题目链接：力扣https://leetcode-cn.com/problems/utf-8-validation/【模拟】先转为二进制，直接用Integer.toString(int,2)即可，然后不足八位的前面补0；接下来遍历，如果以‘0’开头直接不用管，如果以‘1’开头，则遍历这个字符串记录1的个数，如果是1或者>4则直接false，否则将t--（除去自身），然后继续遍历剩下的字符串，每当出现
sublime LSP clangd c++提示配置 docker真的爽爆了 c++开发语言 sublime text
sublimeLSPclangdc++提示配置sublimetextLSPclangsc++配置网上99%教程没有提到header如何用c++的标准而不是c的，当然我也搜的脑子冒烟了。功夫不负有心人，最终在github社区找到了将-xc++-header添加到项目根目录下的complie_flags.txt
LeetCode 刷题：数据结构与算法的实战经验分享
LeetCode刷题：数据结构与算法的实战经验分享关键词：LeetCode、数据结构、算法、刷题经验、实战摘要：本文将围绕LeetCode刷题展开，深入探讨数据结构与算法在实际刷题过程中的应用。通过分享实战经验，帮助读者更好地理解和掌握数据结构与算法知识，提升解题能力。文章将从背景介绍入手，阐述刷题的目的和意义，接着详细解释核心概念，分析它们之间的关系，然后介绍核心算法原理和具体操作步骤，结合数学
python汇率_用Python抓取汇率
抓取的是中行的数据:网址代码#-*-coding:utf-8-*-importreimporturllib.requesturl='http://www.boc.cn/sourcedb/whpj/index.html'#网址req=urllib.request.Request(url)response=urllib.request.urlopen(req)the_page=response.rea
数据结构实验解析(C++版)——实验一复杂度分析拯救三金数据结构 c++算法
目录一、实验例题例题1例题2二、实验原理与背景知识1、实验原理2、背景知识三、解题思路与算法1、解题思路2、算法四、代码实现例题1代码例题2代码五、实验结果分析与总结1、实验结果分析2、该实验与数据结构的联系一、实验例题例题1时间空间限制时间限制：1SEC空间限制：128MB问题描述分析以下代码：for(i=1;iusingnamespacestd;intmain(){longlongn;//输入
爬虫小结 Crescent_P python小项目 python 数据分析
python爬虫小组作业上周布置了python的小组作业,每一组要求爬取老师指定的信息,本组抽到的题目如下:从中国银行网址：http://www.boc.cn/sourcedb/whpj/获取主要外汇（美元、欧元、英镑、加拿大元、澳大利亚元、日元、韩元、新台币、澳门元和港币）的牌价信息，计算出它们的每天平均价。要求把今年5月份每天平均价格保存到Excel文件中，每种外汇的数据保存在一个工作表中，并
【数据结构】复杂度分析
目录一、算法1.基本概念2.描述方法3.算法效率二、算法的时间复杂度三、算法的空间复杂度一、算法1.基本概念通俗的讲，算法是解决问题的方法，比如在现实生活中一道菜谱，一个安装轮椅的操作指南等。严格的说，算法是对特定问题求解步骤的一种描述，是指令的有限序列。算法具有的基本特性有：（1）有穷性。一个算法必须总是在执行有穷步之后结束，且每一步都在有求时间内完成。（2）确定性。算法中的每一条指令必须有确切
C语言指针进阶完全指南：从多级指针到函数指针的深度探索给老吕螺丝 #C语言 c语言开发语言
掌握指针基础后，你将开启C语言真正的力量之门。本文通过实战代码示例和内存布局图解，带你系统攻克指针进阶技术。一、指针核心回顾与进阶重点核心概念：指针本质：存储内存地址的变量间接访问：通过地址操作数据指针大小：64位系统固定8字节（与类型无关）进阶重点：多级指针：处理复杂间接关系动态内存管理：精准控制内存生命周期函数指针：实现代码抽象与回调复杂结构：构建链表等动态数据结构二、多级指针：指针的指针内存
Go - 项目收藏
1、谷歌官方维护了一个基于go语言的开源项目列表：https://github.com/golang/go/wiki/Projects2、[知乎网]有哪些值得学习的Go语言开源项目？3、[知乎用户：hackstoic]看过awesome-go项目，汇总了很多go开源项目。但是awesome-go收集了太全了，而且每个项目没有描述。因此我自己根据go语言中文社区提供的资料，还有互联网企业架构设计中的
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1