_ 菜 -∞

C++项目：基于boost在线文档实现的搜索引擎（二）

索引模块
索引模块的描述
正排索引与倒排索引的建立
- 正排索引
- 倒排索引
jieba分词，正排查找，倒排查找
- jieba分词
- 索引查找
索引的测试

上一篇：C++项目：基于boost在线文档实现的搜索引擎（一）
下一篇：C++项目：基于boost在线文档实现的搜索引擎（三）
github: https://github.com/duchenlong/boost-search-engine

通过之前的预处理的过程，我们将boost在线文档都进行了分解，得到了每一个html在线文档分词后的结果（title，url，content）

之后我们就需要将正文进行拆分，为正文的每一个关键字建立一个索引，方便我们之后的搜索过程，这里可以使用C++STL中的哈希表，也就是unordered_map

这里我们需要完成 倒排索引的建立，倒排索引与正排索引进行搜索文本的查找

索引模块

对于索引模块，也就是我们需要构建倒排索引

也就是需要提取关键字对指定文本进行分词，这一过程叫做倒排索引。他的核心就是根据一个词，映射到这个词所属的文档中（哈希表）

正排索引：根据文档id，得到文档的内容
倒排索引：根据文档的内容，得到文档的id

为了对每一个倒排索引与正排索引的关键字进行描述，我们给他们各自封装一个结构体：

	/*
     *  正排索引的存储结构体
     *  根据文档 id 定位到文档的内容 
     *  防止文档过多，直接使用64位的 int 来存储
    */
    struct frontIdx{
        int64_t _docId;
        string  _title;
        string  _url;
        string  _content;
    };
    
    /*
     *  倒排索引存储的结构体
     *  根据文本的关键字 定位到 所属的文档Id
     *  为了后面根据权值排序，再加一个关键字的权值
    */
    struct backwardIdx{
        int64_t _docId;
        int     _weight;
        string  _word;
    };

索引模块的描述

我们的索引模块会有两次使用的地方：

第一次就是我们启动服务器的时候，自动对指定目录下的所有 html文档进行分词，建立索引
第二次就是我们进行查找的时候，这时进行分词的就是我们的搜索内容，并对这个内容进行分词，正排索引与倒排索引。

这其中会有一些公共的代码块，所以我们可以对索引的地方进行封装，构建一个类Index来进行这一模块的描述：

 	class Index{
        public:
            Index();
            //查找正排索引
            const frontIdx* GetFrontIdx(const int64_t doc_id);
            //查倒排索引
            const vector<backwardIdx>* GetBackwardIdx(const string& key);
            // 建立倒排索引 与 正排索引
            bool Build(const string& input_path);
            // jieba分词 对语句进行分词
            void CutWord(const string& input,vector<string>* output);
        private:
            //根据一行 预处理 解析的文件，得到一个正排索引的节点
            frontIdx* BuildForward(const string& line);
            //根据正排索引节点，构造倒排索引节点
            void BuildInverted(const frontIdx& doc_info);
        private:
            //正排索引
            vector<frontIdx> forward_index;
            //倒排索引  哈希表
            unordered_map<string,vector<backwardIdx> > inverted_index;
            // jieba分词
            cppjieba::Jieba jieba;
    };

正排索引与倒排索引的建立

首先，我们在建立索引的时候，所传的参数是预处理中存储文档进行解析后数据的文件的路径，这个路径中，一行即是一组数据，他的排列为 title\3url\3content\n。

所以在建立索引之前，我们需要进入这个文件中，然后一行一行的将所有html文档中的数据都读取了

在得到一个文档解析的数据后，我们需要得到单独的 title，url，content。因为他们中间被我们用特殊的符号\3分割开，我们可以使用split函数进行分割，而C++的STL中并没有实现这个函数，就借助与Boost中的split函数来实现一些。

boost::split(type, select_list, boost::is_any_of(","), boost::token_compress_on);

type类型是std::vectorstd::string，用于存放切割之后的字符串
select_list：传入的字符串，可以为空。
boost::is_any_of(",")：设定切割符为,(逗号)
boost::token_compress_on：将连续多个分隔符当一个，默认没有打开，当用的时候一般是要打开的。
boost:: token_compress_off：不会压缩分割结果，连续的分隔符时会返回 ""字符串

因为可能存在有些html文档中没有标题的情况，所有我们采用boost:: token_compress_off风格来分割字符串，遇到没有标题或者正文时，会直接返回""空字符串。并且，split函数进行封装时，因为这是一个公共的代码，所以我们防止公共代码出，common文件下

因为涉及到对文档进行编号的问题，所以应该建立正排索引（得到文档id），再根据正排索引的数据建立倒排索引。

    // 建立索引
    bool Index::Build(const string& input_path){
        //  按行读取 存放预处理中解析出来的数据的文件 
        cout<<input_path<<" build index begin "<<endl;
        std::ifstream file(input_path.c_str());
        if(file.is_open() == false){
            cout<<input_path<< " file open error " <<endl;
            return false;
        }

        string line;
        int idx = 0;
        static string progess("|/-\\");

        while(std::getline(file,line)){
            //  针对当前行数据，进行正排索引
            frontIdx* doc_info = BuildForward(line);
            if(doc_info == nullptr){
                cout<< " forward build error "<<endl;
                continue;
            }

            //根据正排索引的节点，构建倒排索引
            BuildInverted(*doc_info);

            // 打印部分构建结果 防止过多cout影响时间复杂度
            if(doc_info->_docId % 100 == 0){
                //cout<< doc_info->_docId << " sucessed "<
                //进度条
                cout<<"\r"<<progess[idx % 4]<< doc_info->_docId << " sucessed " <<std::flush;
                idx++;
            }
        }
        cout<<"index build sucessed "<<endl;
        file.close();
        return true;
    }

进度条显示结果

正排索引

//根据一行 预处理 解析的文件，得到一个正排索引的节点
frontIdx* BuildForward(const string& line);

正排索引的参数就是一个文档需要处理的一行数据，所以需要先进行分词，获取单独的 title，url，content，然后再操作

因为正排索引建立的时机就是服务器启动的同时，然后根据所有文档操作一下。所以一开始的文档id完全凭我们自己的取值，那何不简单一点，就不用哈希表了（因为哈希表存在冲突的问题），我们可以用一个vector数组，那么数组的下标即为文档id的时候，我们可以真正做到O(1)的查找复杂度

这样，我们文档Id的一开始的取值就是0，每次新增的文档Id即为当前数组的大小

    //根据一行 预处理 解析的文件，得到一个正排索引的节点,并插入到正排数组中
    frontIdx* Index::BuildForward(const string& line){
        // 对一行数据进行拆分 \3 为分割点，依次为 title url content
        vector<string> nums;
        common::Util::Split(line,"\3",&nums);
        if(nums.size() != 3){
            cout<<" file num error "<< nums.size()<<endl;
            return nullptr;
        }
        frontIdx doc_info;
        doc_info._docId     = forward_index.size();
        doc_info._title     = nums[0];
        doc_info._url       = nums[1];
        doc_info._content   = nums[2];
        forward_index.push_back(std::move(doc_info)); 

        return &forward_index.back();
    }

我们在正排索引中添加文档正文的时候，因为这里的文档正文可能非常多，并且这个变量也是一个临时变量，出了这个函数就被析构了，我们何不利用一些C++中的move与右值引用呢？把这个临时变量变成一个右值，直接使用vector中的右值拷贝，省事又省时。

那么作为返回值，我们需要返回这个新的文档的节点，这个时候不能直接返回&doc_info，因为我们已经通过move操作将doc_info变成nullptr了，再说这也是一个临时变量，不能作为地址去返回。

倒排索引

//根据正排索引节点，构造倒排索引节点
void BuildInverted(const frontIdx& doc_info);

这里我们需要做的就是分别对title和content进行关键字拆分（jieba分词），然后再分别统计分词后的关键字作为title和content出现的次数

    struct backwardIdx{
        int64_t _docId;
        int     _weight;
        string  _word;
    };

这时候，文档的id和关键字_word我们就知道了，还需要我们定义一个计算权值的公式来，因为title的长度一般都远远少于content的长度，所以让title中关键字的出现次数的比重大一点

 _weight = 10 * _titleCnt + _contentCnt;（不存在特殊性，完全自定义）

    //根据正排索引节点，构造倒排索引节点
    void Index::BuildInverted(const frontIdx& doc_info){
        //统计关键字作为 标题 和正文的出现次数
        struct WordCnt {
            int _titleCnt;
            int _contentCnt;
            WordCnt()
                :_titleCnt(0),_contentCnt(0)
                {} 
        };

        unordered_map<string,WordCnt> wordMap;

        //针对标题进行分词
        vector<string> titleWord;
        CutWord(doc_info._title,&titleWord);
        for(string word : titleWord){
            //全部转为小写
            boost::to_lower(word);
            wordMap[word]._titleCnt++;
        }

        //针对正文进行分词
        vector<string> contentWord;
        CutWord(doc_info._content,&contentWord);
        for(string word : contentWord){
            boost::to_lower(word);
            wordMap[word]._contentCnt++;
        }

        //统计结果，插入到倒排索引中
        for(const auto& word_pair : wordMap){
            backwardIdx backIdx;
            backIdx._docId  = doc_info._docId;

            //自定义 权值 = 10 * titleCnt + contentCnt
            backIdx._weight = 10 * word_pair.second._titleCnt + word_pair.second._contentCnt;
            backIdx._word   = word_pair.first;

            vector<backwardIdx>& back_vector = inverted_index[word_pair.first];
            back_vector.push_back(std::move(backIdx));
        }
    }

同理，在添加到倒排索引的数组中的时候，又是一个临时变量，那为了减少不必要的拷贝，我们还是使用move进行右值拷贝

jieba分词，正排查找，倒排查找

jieba分词

    //jieba分词词典的路径
    const char* const DICT_PATH = "../jieba_dict/jieba.dict.utf8";
    const char* const HMM_PATH = "../jieba_dict/hmm_model.utf8";
    const char* const USER_DICT_PATH = "../jieba_dict/user.dict.utf8";
    const char* const IDF_PATH = "../jieba_dict/idf.utf8";
    const char* const STOP_WORD_PATH = "../jieba_dict/stop_words.utf8";

    Index::Index()
        :jieba(DICT_PATH, HMM_PATH, USER_DICT_PATH, IDF_PATH, STOP_WORD_PATH)
    {
        forward_index.clear();
        inverted_index.clear();
    }

jieba分词的使用，就是看了github上下载之后，大佬们写的测试程序，然后修改一下，做一个接口就可以了

    // jieba分词 对语句进行分词
    void Index::CutWord(const string& input,vector<string>* output){
        jieba.CutForSearch(input,*output);

索引查找

没有什么特殊的，没有找到就返回nullptr，找到了就返回找到数据的指针

   //查找正排索引
    const frontIdx* Index::GetFrontIdx(const int64_t doc_id){
        if(doc_id < 0 || doc_id >= forward_index.size()){
            return nullptr;
        }
        return &forward_index[doc_id];
    }

    //查倒排索引
    const vector<backwardIdx>* Index::GetBackwardIdx(const string& key){
        auto it = inverted_index.find(key);
        if(it == inverted_index.end()){
            return nullptr;
        }

        return &(it->second);
    }

索引的测试

#include "searcher.hpp"
#include 

int main() {
    searcher::Index index;
    bool ret = index.Build("../data/tmp/raw_input.txt");
    if (!ret) {
        std::cout << "file error, create index error " << std::endl;
        return 1;
    }

    // 索引构建成功, 就调用索引中的相关函数. (查正排+查倒排)
    auto* inverted_list = index.GetBackwardIdx("filesystem");
    for (const auto& weight : *inverted_list) {
        std::cout << "doc_id:" << weight._docId << "weight:" << weight._weight << std::endl;
        auto* doc_info = index.GetFrontIdx(weight._docId);
        std::cout << "title:" << doc_info->_title << std::endl;
        std::cout << "url:" << doc_info->_url << std::endl;
        std::cout << "content:" << doc_info->_content << std::endl;
        std::cout << "================================================================" << std::endl;
    }
    return 0;
}

所搜索的关键字出现了三次，都是在正文中出现，权值为3

Android Compose 线性布局（Row、Column）源码深度剖析(十) &有梦想的咸鱼& Androiod Compose原理 Android开发大全 android
AndroidCompose线性布局（Row、Column）源码深度剖析一、引言在Android应用开发的领域中，UI布局是构建用户界面的核心工作之一。良好的布局设计不仅能提升用户体验，还能使应用在不同设备上保持一致的视觉效果。随着Android开发技术的不断演进，JetpackCompose作为新一代的声明式UI框架应运而生。它以简洁的代码、高效的性能和强大的可维护性，逐渐成为开发者的首选。线性
plt.text matplotlib 斜体加粗粗体 ‘style‘:‘italic‘, ‘weight‘:‘bold‘ mohana48833985 python python
plt.text(0,0,'aaa',color='#c20635',horizontalalignment='center',verticalalignment='top',fontdict={'style':'italic','weight':'bold'})
网页版 123 分身数字人源码搭建，OEM贴牌 18538162800=余音视频矩阵
在数字化时代的浪潮下，数字人技术蓬勃发展，网页版123分身数字人源码搭建为众多开发者和企业提供了实现个性化数字人应用的可能。本文将深入探讨其技术开发过程，从底层架构到关键技术实现，全方位解析如何构建一个功能强大的网页版数字人系统。技术架构设计前端展示层HTML5与CSS3：构建数字人的可视化界面，实现流畅的动画效果和交互元素。利用CSS3的过渡、动画属性，为数字人的动作、表情变化提供细腻的视觉呈现
SQL Server数据库表删除分区 MartinYangHJ SQL Server 数据库
在SQLServer中删除分区并将表恢复到非分区状态，需按以下步骤操作：一、合并所有分区1.检查现有分区结构首先确认表的分区方案和分区函数：--查看分区方案SELECT*FROMsys.partition_schemes;--查看分区函数SELECT*FROMsys.partition_functions;2.合并所有分区将所有分区合并为一个，使数据集中在单个分区中：--假设分区函数名为`pf_D
六种方法教你将Python源代码打包成exe xuefeng_210 python 开发语言 linux
将Python源代码打包成可执行文件（exe）是一种常见的需求，它可以使我们的程序在没有安装Python解释器的环境中运行。在本文中，我们将介绍六种常用的方法来实现这个目标，并详细说明每种方法的使用过程。cx_Freezecx_Freeze是一个用于将Python脚本打包成可执行文件的工具。它可以将Python代码和依赖的库文件一起打包，并生成一个独立的可执行文件。使用cx_Freeze的步骤如下
Python Excel操作新玩法：从零到高手掌握openpyxl xuefeng_210 python 自动化 java
openpyxl是Python中一个强大的第三方库，用于操作Excel文件，它可以读取、写入和修改Excel文件，并且支持Excel文件中的样式、图表等元素。openpyxl使得在Python中处理Excel文件变得非常简单和高效。本文将从入门到精通地介绍openpyxl的使用方法，带你掌握在Python中处理Excel文件的技巧。目录安装和导入创建和保存Excel文件读取Excel文件写入Exc
CentOS7下安装python3.8 讓丄帝愛伱 Linux 编程语言
查看系统版本#查看系统版本cat/etc/centos-release>CentOSLinuxrelease7.2.1511(Core)uname-a>Linuxlocalhost.localdomain3.10.0-327.el7.x86_64#1SMPThuNov1922:10:57UTC2015x86_64x86_64x86_64GNU/Linux#查看python版本python-V>Py
Ubuntu18.04切换python3.8版本波波维琦 python linux ubuntu
安装python3.8sudoaptinstallpython3.8赋予python优先级sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python3.82切换python默认版本sudoupdate-alternatives--configpython选择python3.8的编号，回车赋予python3优先级sudou
【数据库】MySQL数据类型decimal详解以及对于float和double两种类型精度问题的探索明璐花生牛奶数据库 mysql 数据库经验分享
引言或许很多同学都很好奇为什么在数据库里要引入decimal这一种数据类型来表示小数？使用float和double这两种数据类型来表示小数为什么不可以？那是因为float和double这两种类型可能会出现精度问题如果本文出现了错误，还请路过的大佬在评论区指出，您的批评是我前进的动力！谢谢！decimal数据类型参考文献：https://cloud.tencent.com/developer/art
从零搭建Pytorch模型教程（七）单机多卡和多机多卡训练 AI大模型探索者 pytorch 人工智能 python transformer 深度学习 ai 机器学习
前言本文主要介绍单机多卡训练和多机多卡训练的实现方法和一些注意事项。其中单机多卡训练介绍两种实现方式，一种是DP方式，一种是DDP方式。多机多卡训练主要介绍两种实现方式，一种是通过horovod库，一种是DDP方式。单机单卡训练前面我们已经介绍了一个完整的训练流程，但这里由于要介绍单机多卡和多机多卡训练的代码，为了能更好地理解它们之间的区别，这里先放一个单机单卡也就是一般情况下的代码流程。impo
在R中读入h5ad文件，并转换为seurat对象拜托啦！狮子 r语言前端 javascript
太可恶了要么就报错要么就卡住！！！！/(ㄒoㄒ)/~~library(Seurat)library(SeuratDisk)pbmc10kmono=paste0(path,'/pbmc10k/use_data/rna_mono.h5ad')1.Round1##方法1：通过h5Seurat中转#library(SeuratDisk)#Convert(pbmc10kmono,dest="h5seurat
IPv6网络的可操作安全考虑——RFC9099解析（四）黑带架构湿 IPv6安全网络安全安全
2.6记录和监控为了在发生安全事件或检测到异常行为的情况下进行取证（forensic）研究，网络运营商应记录多个信息片段。在某些情况下，这需要通过网络管理站对设备进行频繁的轮询。日志包括但不限于：在可用时，使用网络的所有应用程序（包括用户空间和内核空间）的日志(例如，网络运营商管理的web服务器；IPFIX数据【RFC7011】；SNMPMIBs或来自RESTCONF/NETCONF的YANG数据
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
【半导体】：半导体制造工厂的数字化、智能化的新时代不爱原创的Yoga 制造
半导体制造的背景：半导体产业是现代电子技术的基础，其发展深刻影响了人们的生活、通信、信息技术等各个领域。半导体材料具有介于导体和绝缘体之间的导电特性，因而被称为“半导体”。半导体制造是将这些半导体材料制成芯片，用于制造集成电路（IC）的过程。半导体产业的发展源于二十世纪中叶，随着晶体管的发明和集成电路的诞生，半导体技术逐渐成为电子工业的核心。从最早的晶体管到今天的微处理器和存储芯片，半导体制造在信
Python连接StarRocks全流程实践: SQL文件调用与Pandas混合优化 ToreanonyTang python sql pandas 数据库开发语言
文章目录一环境准备与连接方法1.安装核心依赖库2.连接字符串配置3.多模式连接验证二SQL文件调用与动态执行1.外部SQL文件结构设计2.Python动态加载执行三Pandas混合使用技巧1.查询结果直接转DataFrame2.批量数据写入优化四深度性能优化策略1.StarRocks服务端优化2.Python客户端优化3.混合计算策略五完整业务场景示例1:用户转化漏斗业务场景实现代码公用表表达式(
【Pandas】pandas Series plot.bar liuweidong0802 Pandas Series pandas 信息可视化
Pandas2.2SeriesPlotting方法描述Series.plot([kind,ax,figsize,…])用于绘制Series对象的数据可视化图表Series.plot.area([x,y,stacked])用于绘制堆叠面积图（StackedAreaPlot）Series.plot.bar([x,y])用于绘制垂直条形图（VerticalBarPlot）pandas.Series.pl
GPU计算的历史与CUDA编程入门己见明 GPU计算 CUDA C 数据并行性 CUDA程序结构向量加法内核
GPU计算的历史与CUDA编程入门背景简介GPU计算的历史可以追溯到早期的并行计算研究，如今已发展成为计算机科学中的一个重要分支。本文将探讨GPU计算的发展史，重点分析《ComputerGraphics:PrinciplesandPractice》等关键文献，以及CUDAC编程模型的引入及其对现代软件开发的影响。历史回顾回顾历史，GPU计算的发展始于1986年Hillis与Steele在《Comm
稳定运行的以Microsoft Azure Cosmos DB数据库为数据源和目标的ETL性能变差时提高性能方法和步骤 weixin_30777913 microsoft azure 数据仓库 etl 性能优化
在以MicrosoftAzureCosmosDB数据库为数据源和目标的ETL(提取、转换、加载)过程中，性能变差时，可能有多种原因。提高以MicrosoftAzureCosmosDB为数据源和目标的ETL性能，通常涉及数据库配置、查询优化、并发执行、数据传输优化和使用CosmosDB特性等多个方面。通过以下方法和步骤，可以显著改善ETL性能：增加RU设置、优化分区策略；优化查询、使用批量操作；提高
DJANGO 中间件的白名单配置换个网名有点难 django python
在处理白名单内的多个Apps的URL链接时，可以采用以下几种方法来简化白名单的配置：1.使用reverse动态获取URL如果你在urls.py中为每个App的URL定义了名称（name参数），可以使用reverse函数动态获取这些URL，而不是硬编码路径。这样可以避免手动维护大量的路径字符串。Python复制fromdjango.urlsimportreverseclassLoginRequire
MySQL Connector / Python weixin_30369087
MySQLConnector/Python允许Python程序使用符合Python数据库API规范v2.0（PEP249）的API访问MySQL数据库。MySQLConnector/Python包括对以下内容的支持：几乎所有MySQLServer提供的功能都包括MySQLServer版本5.7。Connector/Python8.0也支持XDevAPI。有关使用XDevAPI的MySQLConne
机器学习中的贝叶斯网络：如何构建高效的风险预测模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
入门 Canvas：Web 绘图的强大工具 Hopebearer_ 前端 es6 javascript canva可画
文章目录入门Canvas：Web绘图的强大工具一、Canvas简介二、Canvas的基本用法（一）绘制基本图形（二）绘制文本三、Canvas的应用场景（一）数据可视化（二）游戏开发（三）图像编辑四、Canvas的动画效果五、Canvas的优势与局限性（一）优势（二）局限性六、总结入门Canvas：Web绘图的强大工具在Web开发的广阔天地中，为了满足用户对丰富、交互性强的体验的不断追求，前端技术持
【机会约束、鲁棒优化】机会约束和鲁棒优化研究优化【ccDCOPF】研究（Matlab代码实现）科研_G.E.M. matlab 概率论开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述机会约束、鲁棒优化与ccDCOPF研究综述1.机会约束规划（ChanceConstrainedProgramming,CCP）在电力系统中的应用2.鲁棒优化（RobustOptimization,RO）在电力系统中的应用3.机会约束与鲁棒优化的协同方法
MATLAB程序代编液压系统电机非线性滑膜伺服模糊控制simulink仿真 matlabgoodboy matlab 开发语言
在MATLAB中设计和仿真一个液压系统电机的非线性滑模伺服模糊控制系统，可以通过Simulink来实现。以下是一个大致的步骤指南，帮助你完成这个任务。由于这是一个复杂的系统，我们需要逐步分解问题并构建模型。1.系统描述假设我们有一个液压系统，其电机通过某种方式（例如泵）控制液压缸。目标是设计一个控制器，使得液压缸的位置或速度能够跟踪期望的轨迹。我们将使用滑模控制（SlidingModeContro
Linux常见命令周雨濛 linux
1.查看IP地址1.ipa2.ifconfig2.切换用户1.su-lHOSTNAME---同时切换当前路径2.suHOSTNAME---只切换用户不切换路径3.su---直接切换到管理员3.远程连接XShell界面1.sshIP地址ssh192.168.1.12.sshHOSTNAME@主机[email protected]新建会话4.查看当前终端设备文件名tty1、/
进制转换（R转十）（1290. 二进制转换十进制、1292. 十六进制转十进制、1291. 八进制转十进制、1405. 小丽找潜在的素数）是帅帅的少年东方博宜OJ题库解析算法 c++数据结构
题单地址：题单中心-东方博宜OJ这里以二进制转十进制为例（按位加权求和法）1290.二进制转换十进制问题描述请将一个25位以内的2进制正整数转换为1010进制！输入一个25位以内的二进制正整数。输出该数对应的十进制。样例输入111111111111111111111111输出16777215解析：按位加权(2^n)求和法。#includeusingnamespacestd;intmain(){st
kafka 的 message 包括哪些信息 weixin-80213251 javaweb java kafka hadoop
一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成header部分由一个字节的magic(文件格式)和四个字节的CRC32(用于判断body消息体是否正常)构成。当magic的值为1的时候，会在magic和crc32之间多一个字节的数据：attributes(保存一些相关属性，比如是否压缩、压缩格式等等)；如果magic的值为0，那么不存在attributes
java笔试题以及答案详解 weixin-80213251 javaweb 类 java class jdk
一、单项选择题1．Java是从（）语言改进重新设计。A．AdaB．C++C．PasacalD．BASIC答案：B2．下列语句哪一个正确（）A．Java程序经编译后会产生machinecodeB．Java程序经编译后会产生bytecodeC．Java程序经编译后会产生DLLD．以上都不正确答案：B3．下列说法正确的选项有（）A．class中的constructor不可省略B．constructor必
Linux系统中安装各种常用中间件 Vic2334 运维 linux 中间件运维
Linux安装docker安装docker定制软件源yuminstall-yyum-utilsdevice-mapper-persistent-datalvm2yum-config-manager--add-repohttp://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo安装最新版dockeryumlistdocker-ce--
红宝书第十一讲：超易懂版「ES6类与继承」零基础教程：用现实例子+图解实现 kovlistudio 前端 es6 javascript 开发语言前端学习
红宝书第十一讲：超易懂版「ES6类与继承」零基础教程：用现实例子+图解实现资料取自《JavaScript高级程序设计（第5版）》。查看总目录：红宝书学习大纲一、ES6类的核心语法：把事物抽象成“模板”想象你要设计一款「动物养成游戏」，需要创建多种动物对象。ES6的class就是一个代码模板：//基础类（Animal是模板，有名称和吃东西方法）classAnimal{constructor(name
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

C++项目：基于boost在线文档实现的搜索引擎（二）