冰果滴

search_engine：搜索引擎实现

一.项目背景及原理

1.背景

2.原理

二.技术栈及项目环境

1.技术栈

2.项目环境

3.环境准备

三.模块划分

四. 遇到的问题及其解决方法

1.搜索结果出现重复文档的问题

2.实现httplib功能的问题

五. 项目特点

1.文档记录

2.竞价排名

3.去掉暂停词

4.模拟实现httplib库

六. 最终版代码

前言: 这里实现一个基于boost官方文档的搜索引擎。，但是不只可以用来搜索boost, 修改引入的内容, 就可以变成其它的搜索引擎, 比如可以用来搜索cpp官网文档内容等.

一.项目背景及原理

1.背景

搜索引擎很多互联网大厂都做过，但是他们做的是由很多人共同完成的大型项目，是一个人没法完成的，不过，可以通过实现一个"小"的搜索引擎，来揣测出这些大型搜索引擎是如何做的。

这个搜索引擎项目就是在一个网站内搜索，搜索的数据更垂直，数据量更小，实现相对比较简单。

不过呢，虽然实现的是boost搜索引擎，但是只要修改所引入的文档内容，以及相应的就可以变成其它的搜索引擎，例如JAVA搜索引擎、STL搜索引擎等。

实现的内容：

我们用百度搜索引擎搜索Boost，可以看到网页的title、网页内容的摘要描述、即将跳转的网站url。

搜索引擎项目要实现的内容就是这三大块。

2.原理

① 爬虫程序抓取网页信息：搜索引擎会使用爬虫程序在全网中抓取相关的HTML网页信息，并将其存储在服务器端的磁盘中(这里采用离线下载的方式获取网页信息)。

② 数据预处理：对抓取到的HTML文件进行去标签化和数据清理，即只保留网页文件中的主要信息（标题、正文、URL等）。

③ 建立索引：对预处理后的数据建立索引，以便快速检索。这里的索引包括正排索引和倒排索引。正排索引是根据文档ID查找文档内容，而倒排索引是根据文档内容查找文档ID(建立倒排索引要根据文档内容进行分词, 整理成不重复的多个关键字，再对应到相应的文档ID)。

④ 搜索查询：用户在浏览器中发起HTTP请求，服务端根据请求中的关键字在索引中查找相关文档，并将结果返回给客户端。

二.技术栈及项目环境

1.技术栈

后端：C/C++(C++11), STL, 准标准库Boost, jsoncpp, cppjieba, cpp-httplib

前端：html, css, js, jQuery, Ajax

2.项目环境

CentOS 7, vim, g++, Makefile, VSCode

3.环境准备

boost官方文档: Boost C++ Libraries

下载文档: Index of main/release/1.82.0/source (jfrog.io)

boost库安装: sudo yum install -y boost-devel

cppjieba: GitHub - yanyiwu/cppjieba: "结巴"中文分词的C++版本

注: 安装后, 要将deps下的limonp拷贝一份放到include/cppjieba内

这个安装后可能存在deps下的limonp内无数据, 就要再安装一下limonp: GitHub - yanyiwu/limonp at a269e34dc4948d5a9209e21a7887b52daa0d3e78

安装后把limonp/include下的limonp拷贝到刚才安装的cppjieba的include/cppjieba中

安装方式:
cppjieba: git clone GitHub - yanyiwu/cppjieba: "结巴"中文分词的C++版本

limonp: git clone GitHub - yanyiwu/limonp: C++ headers(hpp) library with Python style.

使用cppjieba需要使用较新版本的gcc、g++, 可以自行搜索升级方式

jsoncpp安装: sudo yum install -y jsoncpp-devel

cpp-httplib: cpp-httplib: cpp-httplib - Gitee.com

cpp-httplib安装: git clone cpp-httplib: cpp-httplib

三.模块划分

四. 遇到的问题及其解决方法

1.搜索结果出现重复文档的问题

在搜索模块 searcher 中, 如果根据关键字的各个词检索查找时, 直接创建一个存储倒排拉链的vector数组, 并且在获得当前关键字的倒排拉链后直接插入到这个vector中, 那么就可能出现一个问题: 搜索结果出现重复文档的问题.

原因: 搜索关键字被jiaba分词后的几个词对应在同一个文档((即同一个doc_id))出现, 导致倒排拉链中存在重复情况. 进而出现了多个一样的搜索结果.

存在这种问题的搜索模块实现如下：

#pragma once

#include 
#include 
#include "index.hpp"
#include "util.hpp"
#include "log.hpp"


namespace ns_searcher
{
    class Searcher
    {
    private:
        ns_index::Index *index; // 供系统进行查找的索引
    public:
        Searcher() {}
        ~Searcher() {}
    public:
        // 初始化搜索引擎
        void InitSearcher(const std::string &input)
        {
            // 1. 获取index对象
            index = ns_index::Index::GetInstance();
            LogMessage(DEBUG, "获取index单例成功...");
            // 2. 根据index对象建立索引
            index->BuildIndex(input);
            LogMessage(DEBUG, "建立正排和倒排索引成功...");
        }

        // 根据用户的搜索关键词, 查找结果, 并返回给用户搜索结果
        // query: 用户的搜索关键词, json_string: 返回给用户浏览器的搜索结果
        void Search(const std::string &query, std::string *json_string)
        {
            // 1. 分词: 对query按照searcher的要求进行分词
            std::vector words;
            ns_util::JiebaUtil::CutString(query, &words);

            // 2. 检索触发: 根据分词的各个"词进行index索引查找(建立index是忽略大小写的，所以搜索的关键字也要忽略)", 
            ns_index::InvertedList inverted_list_all;

            for(std::string word : words)
            {
                // 将分的词变成小写
                boost::to_lower(word);

                // 根据倒排索引哈希表中的关键字word获得倒排拉链
                ns_index::InvertedList *inverted_list = index->GetInvertedList(word);
                if(nullptr == inverted_list) continue;

                inverted_list_all.insert(inverted_list_all.end(), inverted_list->begin(), inverted_list->end());     
            }

            // 3. 合并排序: 汇总查找结果, 按照相关性权重(weight)降序排序
            std::sort(inverted_list_all.begin(), inverted_list_all.end(), \
                    [](const ns_index::InvertedElem &e1, const ns_index::InvertedElem &e2){ 
                    return e1.weight > e2.weight;
                    });

            // 4. 构建json: 根据查找出来的结果, 构建json字符串
            // 创建Json对象root, 用于保存所有的文档信息
            Json::Value root;
            for(auto &item : inverted_list_all)
            {
                // 根据doc_id获取正排索引的文档信息
                ns_index::DocInfo *doc = index->GetForwardIndex(item.doc_id);
                if(nullptr == doc) continue;

                // 创建Json对象elem, 添加标题, 摘要, url信息
                Json::Value elem;
                elem["title"] = doc->title;
                // content是文档的去标签的结果, 但是不是想要的, 想要的是其中一部分, 即摘要
                // 通过GetDesc函数获得关键字前后的内容(摘要)
                elem["desc"] = GetDesc(doc->content, item.words[0]); 
                elem["url"] = doc->url;

                // 将elem添加到结果root中
                root.append(elem);
            }   

            Json::FastWriter writer;
            *json_string = writer.write(root);
        }
    };
}

那么如何解决?

首先需要重新创建一个结构体InvertedElemPrint, 不能再使用之前的index的倒排索引的结构体, 而这个结构体中将原来的string类型的word, 变成了vector类型, 这样这一个结构体如果遇到多个词对应在同一个文档(同一个doc_id)的情况下, 就可以把这多个词都插入到vector数组中.

接下来可以创建一个token_map哈希表, 用于doc_id与InvertedElemPrint建立映射关系, 目的是为了根据doc_id去重. 遍历根据doc_id获得到的倒排拉链, 然后创建或获得doc_id在哈希表中所映射的InvertedElemPrint, 然后将InvertedElem内的关键字word放入InvertedElemPrint的vector数组中. 这样即使有doc_id相同的关键字也都会放入同一个vector中, 完成去重的效果.

最后创建一个存储InvertedElemPrint的vector数组, 并把完成去重后的每一个不重复的doc_id倒排索引放入其中. 用于后面进行合并排序, 汇总查找结果, 并按照相关性权重(weight)降序排序.

解决问题后的搜索模块实现如下:

// 为了解决搜索结果出现重复文档的问题(搜索关键字被jiaba分词后的几个词对应在同一个文档(即同一个doc_id)出现, 导致倒排拉链中存在重复情况)
struct InvertedElemPrint
{
    uint64_t doc_id;                  // 文档ID
    int weight;                       // 文档权重
    // 可能多个词对应同一个ID, 所以采用数组的结构, 将搜索结果合并
    std::vector words;   // 存储倒排拉链节点

    InvertedElemPrint() : doc_id(0), weight(0) {}
};

class Searcher
{
private:
    ns_index::Index *index; // 供系统进行查找的索引
public:
    Searcher() {}
    ~Searcher() {}
public:
    // 初始化搜索引擎
    void InitSearcher(const std::string &input)
    {
        // 1. 获取index对象
        index = ns_index::Index::GetInstance();
        LogMessage(DEBUG, "获取index单例成功...");
        // 2. 根据index对象建立索引
        index->BuildIndex(input);
        LogMessage(DEBUG, "建立正排和倒排索引成功...");
    }

    // 根据用户的搜索关键词, 查找结果, 并返回给用户搜索结果
    // query: 用户的搜索关键词, json_string: 返回给用户浏览器的搜索结果
    void Search(const std::string &query, std::string *json_string)
    {
        // 1. 分词: 对query按照searcher的要求进行分词
        std::vector words;
        ns_util::JiebaUtil::CutString(query, &words);

        // 2. 检索触发: 根据分词的各个"词进行index索引查找(建立index是忽略大小写的，所以搜索的关键字也要忽略)", 
        
        // 存放全部文档的倒排索引, 用于后面根据权重排序
        std::vector inverted_list_all;
        // doc_id与InvertedElemPrint建立映射关系, 目的是为了根据doc_id去重
        std::unordered_map tokens_map;

        for(std::string word : words)
        {
            // 将分的词变成小写
            boost::to_lower(word);

            // 根据倒排索引哈希表中的关键字word获得倒排拉链
            ns_index::InvertedList *inverted_list = index->GetInvertedList(word);
            if(nullptr == inverted_list) continue;    
        
            // 遍历倒排拉链, 把重复的doc_id合并
            for(const auto &elem : *inverted_list)
            {
                // 采用引用的方式获得哈希表为doc_id映射的倒排拉链
                auto &item = tokens_map[elem.doc_id]; // 如果没有就创建, 如果有就获得
                // 这个item一定是doc_id相同的
                item.doc_id = elem.doc_id;
                // 如果存在相同的doc_id, 权值相加
                item.weight += elem.weight;
                // 将InvertedElem内的关键字word放入InvertedElemPrint的vector数组中
                // 这样即使有doc_id相同的关键字也都会放入同一个vector中, 完成去重的效果
                item.words.push_back(elem.word);
            }
        }

        // 完成去重后, 把每一个不重复的doc_id倒排索引放入记录全部文档倒排索引的数组中
        for(const auto &item : tokens_map)
        {
            inverted_list_all.push_back(std::move(item.second));
        }
        // 3. 合并排序: 汇总查找结果, 按照相关性权重(weight)降序排序
        std::sort(inverted_list_all.begin(), inverted_list_all.end(), \
                [](const InvertedElemPrint &e1, const InvertedElemPrint &e2){ 
                return e1.weight > e2.weight;
                });

        // 4. 构建Json: 根据查找出来的结果, 构建Json字符串
        // 创建Json对象root, 用于保存所有的文档信息
        Json::Value root;
        for(auto &item : inverted_list_all)
        {
            // 根据doc_id获取正排索引的文档信息
            ns_index::DocInfo *doc = index->GetForwardIndex(item.doc_id);
            if(nullptr == doc) continue;

            // 创建Json对象elem, 添加标题, 摘要, url信息
            Json::Value elem;
            elem["title"] = doc->title;
            // content是文档的去标签的结果, 但是不是想要的, 想要的是其中一部分, 即摘要
            // 通过GetDesc函数获得关键字前后的内容(摘要)
            elem["desc"] = GetDesc(doc->content, item.words[0]); 
            elem["url"] = doc->url;

            // 将elem添加到结果root中
            root.append(elem);
        }   

        // FastWriter用于转换为字符串时采用快速的方法
        Json::FastWriter writer;
        // 调用write方法, 将Json对象root快速的转换为字符串
        *json_string = writer.write(root);
    }

    // 获取摘要
    std::string GetDesc(const std::string &html_content, const std::string &word)
    {
        // 找到关键字word在html content中的首次出现, 然后往前找100字节(如果没有50个, 就从begin开始), 往后找100字节(如果没有100个, 就到end结束)
        // 截取这部分内容
        const int prev_step = 100;
        const int next_step = 100;
        // 1. 找到首次出现关键字的位置
        auto iter = std::search(html_content.begin(), html_content.end(), word.begin(), word.end(), [](int x, int y){
            return (std::tolower(x) == std::tolower(y));
        });
        // 没有找到, 报错
        if(iter == html_content.end())
        {
            LogMessage(WARNING, "not exists word");
            return "None1";
        }
        // 获得关键字位置与内容开头的距离
        int pos = std::distance(html_content.begin(), iter);

        // 2. 获取start, end 
        int start = 0;
        int end = html_content.size() - 1;
        // 如果之前有大于100个字节, 就更新开始位置
        if(pos > start + prev_step) start = pos - prev_step;
        // 如果之后有大于100个字节, 就更新结束位置
        if(pos + next_step < end) end = pos + next_step;

        // 3. 截取子串
        // 开头比结尾大, 报错
        if(start >= end)
        {
            LogMessage(WARNING, "start >= end");
            return "None2";
        }
        // 截取start和end内的子串, 作为摘要
        std::string desc = html_content.substr(start, end - start);
        desc += "...";
        // 返回摘要
        return desc;
    }
};

2.实现httplib功能的问题

实现httplib的过程中遇到的问题可以说很多，究其原因是对TCP、HTTP、多路转接的理解不够深刻，同时使用经验较少，导致出现了很多的低级错误(包括请求与响应不符合http协议格式的低级错误)。

解决的方式也很简单，反复查看相关文档，多次理解相关协议与方案，编写代码并反复进行调试与修改。

五. 项目特点

1.文档记录

文档的作用是为了显示出当前项目的运行情况，是否正常运行，同时也作为一种调试的手段，是很有作用的。

这里通过实现一个单例类，这个类将标准输出和标准错误的内容重定向到日志文件中，除了该类，又实现了一个日志函数，使用可变参数列表，用来接收不同的日志内容。调用上，只需要在项目执行前，调用类内的enable函数，然后在需要日志的位置，调用LogMessage函数，添加需要的日志即可。

实现：

#pragma once

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

#define DEBUG 0
#define INFO 1
#define WARNING 2
#define FATAL 3

const char *log_level[] = {"DEBUG", "INFO", "WARINING", "FATAL"};

#define LOGFILE "http_server.log"

// 下面的Log类和logMessage是两种处理日志的方式

// 管理日志文件, 将日志信息重定向到日志文件中
// 日志类(设置为单例模式)
class Log
{
private:
    // 设置为单例模式
    Log() : logFd(-1) {}
    Log(const Log&) = delete;
    void operator=(const Log&) = delete;

    static Log *instance;
    static std::mutex mtx;
public:
    static Log *GetInstance()
    {
        if(nullptr == instance)
        {
            mtx.lock();
            if(nullptr == instance)
            {
                instance = new Log();
            }
            mtx.unlock();
        }

        return instance;
    }

    void enable()
    {
        // 修改文件掩码为0, 防止系统默认掩码影响打开文件的权限
        umask(0);
        // 打开文件
        logFd = open(LOGFILE, O_WRONLY | O_CREAT | O_TRUNC, 0666);
        // 如果logFd为-1, 说明打开文件错误
        assert(logFd != -1);
        // 将标准输出和标准错误的内容重定向到日志文件中
        dup2(logFd, 1);
        dup2(logFd, 2);
    }

    ~Log()
    {
        if (logFd != -1)
        {
            // 将日志文件中所有修改过的数据刷新到磁盘上
            fsync(logFd);
            // 关闭日志文件
            close(logFd);
        }
    }
private:
    int logFd;
};
Log* Log::instance = nullptr;
std::mutex Log::mtx;

// 将日志信息直接输出到标准输出或标准错误中
void LogMessage(int level, const char *format, ...)
{
    assert(level >= DEBUG);
    assert(level <= FATAL);

    char *name = getenv("USER");

    char logInfo[1024];
    // 定义ap变量, 用于存储可变参数列表
    va_list ap;
    // 初始化ap变量, 使其指向可变参数列表中的第一个参数
    va_start(ap, format);
    // 格式化日志信息, 使用给定的格式字符串和可变参数列表中的参数来生成格式化后的字符串, 并将其存储在logInfo中
    vsnprintf(logInfo, sizeof(logInfo) - 1, format, ap);
    // 清理ap变量, 避免内存泄漏等问题
    va_end(ap);

    // 如果日志级别为FATAL, 使用标准错误; 否则, 使用标准输出
    // 输出信息包括日志级别, 时间戳, 用户名, 日志信息, 日志信息所在源文件, 日志信息所在行号
    FILE *out = (level == FATAL) ? stderr : stdout;
    fprintf(out, "%s | %u | %s | %s\n",
            log_level[level],
            (unsigned int)time(nullptr),
            name == nullptr ? "unknow" : name,
            logInfo);

    fflush(out);        // 将C缓冲区中的数据刷新到OS中
    fsync(fileno(out)); // 将OS中的数据刷新到磁盘中
}

2.竞价排名

（1）竞价排名定义

竞价排名是一种按效果付费的网络推广方式, 通过购买相关关键词, 然后给予出价获得竞价排名, 展现给目标用户, 从而获取用户点击.

很多浏览器都存在竞价排名, 因此这里我也实现一个简单的竞价排名.

（2）实现方法

首先创建一个文档, 把参与竞价排名的网址url以及出价用 | 分割放入advertise.txt文档中, 每个网址之间用 \n 分隔.

然后在index中创建advertise_rec哈希表, 用于记录竞价信息. 通过AddAdvertise函数从advertise.txt文档中读取信息并插入到advertise_rec哈希表中. 再实现一个直接返回advertise_rec的函数, 用于将advertise_rec哈希表给到searcher中.

最后在searcher中先通过index的AddAdvertise函数获取竞价信息, 再获取advertise_rec哈希表, 然后当遍历倒排拉链, 把重复的doc_id合并实现后, 再一次遍历, 判断该关键字对应的文档是否参与竞价排名, 如果参与, 就修改其权重, 并且在title后面加上[广告]标识.

（3）实现

advertise.txt:

https://www.boost.org/doc/libs/1_82_0/doc/html/boost_dll/f_a_q_.html|2000\n
https://www.boost.org/doc/libs/1_82_0/doc/html/interprocess/acknowledgements_notes.html|4000\acknowledgements_notes\n
https://www.boost.org/doc/libs/1_82_0/doc/html/quickbook/change_log.html|3000\n

index:

std::unordered_map advertise_rec; // 记录竞价信息

// 返回竞价信息哈希表
std::unordered_map GetAdvertise_rec()
{
    return advertise_rec;
}

// 添加竞价排名信息
bool AddAdvertise()
{
    const std::string Ad = "data/Ad/advertise.txt";

    // 将广告信息读取到advertise中
    std::string advertise;
    // 以输入模式(只读)打开file_path
    std::ifstream in(Ad, std::ios::in);
    // 文件没有打开成功
    if(!in.is_open())
    {
        LogMessage(WARNING, "open file %s error", Ad.c_str());
        return false;
    }

    // line用于读取in输入文件流的一行文本
    std::string line;
    while(std::getline(in, line))
    {
        // 提取url
        std::string url = line.substr(0, line.find('|'));
        // 提取出价
        int price = atoi(line.substr(line.find('|') + strlen("\3")).c_str());
        // 插入advertise数组中
        advertise_rec[url] = price;
    }

    return true;
}

searcher:

// 初始化搜索引擎
void InitSearcher(const std::string &input)
{
    // 1. 获取index对象
    index = ns_index::Index::GetInstance();
    LogMessage(DEBUG, "获取index单例成功...");
    // 2. 根据index对象建立索引
    index->BuildIndex(input);
    LogMessage(DEBUG, "建立正排和倒排索引成功...");
    // 3. 获取竞价信息
    index->AddAdvertise();
    LogMessage(DEBUG, "获取竞价信息成功...");
}

// 获取竞价排名信息
std::unordered_map advertise_rec = index->GetAdvertise_rec();
// 再次遍历, 判断是否参与竞价排名, 并对其进行修改
for(const auto &elem : *inverted_list)
{
    auto &item = tokens_map[elem.doc_id];
    // 获得文档
    ns_index::DocInfo *doc = index->GetForwardIndex(item.doc_id);
    // 根据url查找该文档是否参与了竞价排名, 并根据出价修改所占权重, 进而修改其排序
    // 同时在其标题后写上 [广告] 标识
    for(auto &ad_pair : advertise_rec)
    {
        if(ad_pair.first == doc->url)
        {
            // 对应参与竞价排名的文档的标题加上[广告]
            doc->title += "[广告]";
            // 根据原权重以及竞价更改权重
            item.weight = item.weight * (ad_pair.second / 10);
        }
    }
}

（4）测试结果

3.去掉暂停词

我们平常在搜索时，无论我们是否写了 "了", "的", "吗" 类似这样的字，搜索出来的结果是没有变化的，因为这些词在搜索中是没有什么作用的，我们想搜的内容是不会因为这些词而发生变化。而去掉这些暂停词之后，会使得搜索变得更快。这里我也实现了该功能。

通过在util中实现一个JiebaUtil单例类，在进行Jieba分词的过程中，通过将这些词与暂停词文档进行对比，如果是暂停词，就将该词去掉。

实现：

// 定义jieba所需的文件路径
const char* const DICT_PATH = "./dict/jieba.dict.utf8";       // 中文单词及其词频信息
const char* const HMM_PATH = "./dict/hmm_model.utf8";         // 用于对未登录词进行分词
const char* const USER_DICT_PATH = "./dict/user.dict.utf8";   // 用户自定义词典文件路径
const char* const IDF_PATH = "./dict/idf.utf8";               // 逆文档频率文件路径
const char* const STOP_WORD_PATH = "./dict/stop_words.utf8";  // 暂停词(停用词)文件路径

// 设置为单例模式
class JiebaUtil
{
private:
    //static cppjieba::Jieba jieba;
    cppjieba::Jieba jieba;
    std::unordered_map stop_words;
private:
    JiebaUtil(): jieba(DICT_PATH, HMM_PATH, USER_DICT_PATH, IDF_PATH, STOP_WORD_PATH)
    {}
    JiebaUtil(const JiebaUtil&) = delete;
    JiebaUtil &operator=(const JiebaUtil&) = delete;

    static JiebaUtil *instance;
public:
    // 获得唯一实例
    static JiebaUtil* get_instance()
    {
        static std::mutex mtx;
        if(nullptr == instance)
        {
            mtx.lock();
            if(nullptr == instance)
            {
                instance = new JiebaUtil();
                instance->InitJiebaUtil();
            }
            mtx.unlock();
        }

        return instance;
    }

    // 初始化(用于去掉暂停词)
    void InitJiebaUtil()
    {
        // 读取暂停词文件
        std::ifstream in(STOP_WORD_PATH);
        if(!in.is_open())
        {
            LogMessage(FATAL, "load stop words file error");
            return;
        }
        std::string line;
        while(std::getline(in, line))
        {
            // 将暂停词插入到哈希表中
            stop_words.insert({line, true});
        }
        in.close();
    }

    void CutStringHelper(const std::string &src, std::vector *out)
    {
        // 用Jieba分词
        jieba.CutForSearch(src, *out);
        // 去掉暂停词
        for(auto iter = out->begin(); iter != out->end(); )
        {
            auto it = stop_words.find(*iter);
            if(it != stop_words.end())
            {
                // 说明string是暂停词, 需要去掉
                iter = out->erase(iter);
            }
            else
            {
                ++iter;
            }
        }
    }

    void CutS(const std::string &src, std::vector *out)
    {
        jieba.CutForSearch(src, *out);
    }
    
public:
    // 用Jieba分割单词并, 去掉暂停词
    static void CutStringRemove(const std::string &src, std::vector *out)
    {
        ns_util::JiebaUtil::get_instance()->CutStringHelper(src, out);
    }
    
    // 只用Jieba分割单词, 不去掉暂停词
    static void CutString(const std::string &src, std::vector *out)
    {
        ns_util::JiebaUtil::get_instance()->CutS(src, out);
    }
};

JiebaUtil *JiebaUtil::instance = nullptr;

4.模拟实现httplib库

如果使用httplib库，那么http_server这一模块可以很轻松的完成，只需要调用其中的函数即可，但是这个httplib库在实际的公司项目中基本上是不会使用这个httplib库的，因为这个库是存在一些缺点的，可能会出现一些问题。

因此，这里我自己实现该项目所需用到的相关httplib中的接口，包括TCP和http的实现。

其中TCP是按照多路转接的方案进行实现的，用到了epoll。

具体代码可以查看最终版代码。

六. 最终版代码

gitee仓库：基于某个网站的站内搜索引擎

你可能感兴趣的:(search_engine,搜索引擎)

Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
网站推广爬虫 Bearjumpingcandy 爬虫
网站推广爬虫是一种用于升网站曝光度和推广效果的工具。它通过自动化地访问和收集网站信息，从而实现对目标网站的广告、关键词、排名等数据进行分析和优化。以下是网站推广爬虫的一些介绍：数据收集：网站推广爬虫可以自动访问目标网站，并收集相关的数据，如网站流量、关键词排名、竞争对手信息等。这些数据可以帮助网站推广人员了解网站的现状和竞争环境，从而制定相应的推广策略。关键词优化：通过分析搜索引擎的关键词排名情况
SpringBoot整合ES搜索引擎实现网站热搜词及热度计算码踏云端 springboot Elasticsearch spring boot elasticsearch 后端热搜词热度计算 java
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
2019.1.6 root_restart
1.新版研学行程公众号推送及页面改动，以后继续尝试无logo版行程单方便转发，附带一篇研学政策解读2.百家号，头条号，搜狐号注册认证及审核，后续每天会在上面更新以往研学活动，增加搜索引擎中山大研学和雨滴教育的关联3.与鹿老师探讨研究方便代理的新宣传模式
只有一个诚字最重要（3.22）胡同学的读书笔记
1人们会认为谷歌是搜索引擎。而事实上，谷歌是第一个以机器为主导的搜索引擎，这个分类在谷歌之前是不存在的，而你必须要认识到谷歌的这个秘密才能判断它与其他公司的不同之处。2如果我目前在一个公司，当大家不知道未来的路怎么走，过去的路也已经彻底放弃了，我会先把事实摆在所有人面前，然后让大家讨论，在争论的过程中产生一个纲领性的共识，让每个部门在大的纲领下去寻求一种变化，不再以增长和竞争为纲，而是转移到产品和
写出渗透测试信息收集详细流程卿酌南烛_b805
一、扫描域名漏洞：域名漏洞扫描工具有AWVS、APPSCAN、Netspark、WebInspect、Nmap、Nessus、天镜、明鉴、WVSS、RSAS等。二、子域名探测：1、dns域传送漏洞2、搜索引擎查找（通过Google、bing、搜索c段）3、通过ssl证书查询网站：https://myssl.com/ssl.html和https://www.chinassl.net/ssltools
【ShuQiHere】快速排序（Quick Sort）：揭开高效排序算法的神秘面纱 ShuQiHere 排序算法算法数据结构
【ShuQiHere】引言在计算机科学中，排序算法是我们日常编程不可或缺的一部分。无论是处理大量数据、优化搜索引擎，还是进行系统性能提升，排序算法都起到了至关重要的作用。在所有的排序算法中，快速排序（QuickSort）凭借其高效性和灵活的分治策略成为最受欢迎的排序算法之一。在这篇博客中，我们将深入探讨快速排序的原理、性能分析以及如何通过优化策略进一步提升其效率。1.什么是快速排序？（QuickS
海量数据查找最大K个值：数据结构与算法的选择星辰@Sea 数据结构 Java 数据结构
在处理大数据集时，经常需要找到数据集中最大的K个元素，这样的需求在很多领域都有广泛应用，例如推荐系统中寻找评分最高的K个商品、数据分析中找出最重要的K个特征、搜索引擎中找到排名前K的结果等等。面对海量数据，传统的排序方法可能不再适用，因为它们通常具有较高的时间复杂度。因此，选择合适的数据结构和算法对于提高效率至关重要。本文将详细介绍如何在海量数据集中查找最大的K个值，探讨不同的数据结构与算法选择，
全面解析MeiliSearch及其Go语言实现寻找09之夏 Meilisearch golang 开发语言后端 Meilisearch
前言随着互联网的发展和数字化进程的加速，无论是企业还是个人用户，都需要面对海量的信息。在这个背景下，搜索技术的重要性日益凸显。MeiliSearch是一款开源搜索引擎，它的出现为开发者提供了一个高效、灵活的选择。本文将从多个角度探讨MeiliSearch的特性、使用方法及其实现原理，并通过Go语言示例展示如何构建一个高性能的搜索系统。一、MeiliSearch特性MeiliSearch之所以受到欢
面对信息茧房，我们如何破局？听风便是雨_
当我们进入了互联网时代，信息的交互变得无比地便捷，当你需要什么样的信息，只需要在搜索引擎上输入，便可立马查询到你想要的结果，而且现在随着抖音、微博之类的应用APP的出现，我们本应从这些APP中获得更加丰富的知识或者信息，来开阔我们的眼界。但是事实上，我们仿佛没有获得预期的效果，更甚至于陷入更大的怪圈当中——缺乏耐心，不能容忍与自己想法不一样的他人建议，失去了与外界良好沟通的能力以及开拓自己的眼界的
80%的人都知道的——内容营销老泊
我们已经知道内容营销是依靠内容来进行营销，一起看一下内容营销的工作流吧。选题创作投放主要内容营销的选题类型-常青树：用户长时间关心的，比如房价，教育-热点：用户短时间关心的，比如八卦，实事二八原则常青树话题等等选题来源：访谈法：寻找目标用户尽可能一对一进行访谈，用户反馈的问题都可以成为你的选题来源数据法：利用搜索引擎获取内容选题。利用爬虫工具看看人们都比较关心哪些话题来作为选题基于时事的选题数据工
50.复盘变现之路 506小棉袄
1.昨天下载了头条，用搜索引擎找到了如何写文章。注册了一下。这一切其实都好简单，但是自己就是拖着没有做，而且还心安理得。现在在管理别人，于是用自己做到了才能教别人去做到来要求自己发现也不难。2.日更被我捡了起来。后面没有特殊情况，我会一直更下去。放弃一件事很容易，坚持自己喜欢的事也不会太难。3.今天完成了50关的最后一关，接下来就要挑战100关。想看看自己的极限在哪里。具体做法：1.每天早起一小时
NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
Django：Python高级Web框架详解及参数设置零度° python python django 前端
Django是一个高级的PythonWeb框架，它鼓励快速开发和简洁实用的设计。Django遵循MVC设计模式，提供了一套完整的解决方案，用于构建复杂的、数据库驱动的网站。Django的主要特点自动管理数据库：通过ORM（对象关系映射）自动管理数据库。自动生成站点地图：支持搜索引擎优化（SEO）。用户身份认证：内置用户认证系统。中间件支持：强大的中间件支持，可以处理请求和响应。跨站请求伪造（CSR
ES(Elasticsearch)常用的函数遨游在知识的海洋里无法自拔 java
Elasticsearch（简称ES）是一个开源的搜索引擎，广泛用于全文搜索、分析和数据可视化。以下是一些常用的Elasticsearch函数和操作：索引操作创建索引PUT/index_name删除索引DELETE/index_name查看索引GET/index_name文档操作插入文档POST/index_name/_doc/{"field":"value"}获取文档GET/index_name
HTML 图片一壶浊酒.. 前端开发 html 前端
在HTML中，我们可以使用img标签来显示一张图片。对于img标签，我们只需要掌握它的三个属性：src、alt和title。alt属性用于描述图片，这个描述文字是给搜索引擎看的，并且当图片无法显示时，页面会显示alt中的文字。title属性也用于描述图片，不过这个描述文字是给用户看的，并且当鼠标指针移到图片上时，会显示title中的文字。colspan属性body{background-color
生信学习Day-1 GJJDr
1.如何学习2.怎样解决学习中遇到的问题？a.第一步:搜索：首选-谷歌，其次-必应，大神级的搜索引擎：虫部落快搜。专业教程-搜狗微信、搜狗知乎、、githubb.第二步：如果你的问题不知该如何搜索，可在微信群中与小组成员讨论c.第三步：正确的提问3.如何搭建高效的学习平台a.效率软件:（1）浏览器-chrome浏览器简洁高效无广告，可以添加插件，比如”沙拉查词”（自行搜索），可以即时翻译。（2）电
优质素材的六个搜索技巧老李大李和小李
一是要有耐心哦耐心不但是搜索的技巧而且是前提的、必要的。没有耐心进行搜索就不会有大量的好的输入。二是多关键词这个就像我们在搜索引擎中使用的方法，输入关键词反复搜索就会发现好多有用的而且是我们未知的知识。三是多渠道我们要利用各种搜索引擎和各种方式包括读书、和人聊天的方法来搜集资料。四是多维度至少要从三方面着手～文字、图片、视频。五是精准搜索有了前面做的功课，我们要对主题和材料进行凝炼～取其精华去除无
什么是黑链？什么是黑帽？什么是明链？倔强的小蚁云Zt 网络数据库 tcp/ip 运维
什么是黑链？什么是黑帽？什么是明链？黑链有哪几种表示方式！怎样预防黑链？首先我们说下黑链定义:黑链是SEO黑帽手法中相当普遍的一种手段，笼统地说，它就是指一些人用非正常的手段获取的其它网站的反向链接，最常见的黑链就是通过各种网站程序漏洞获取搜索引擎权重或者PR较高的网站的WEBSHELL，进而在被黑网站上链接自己的网站。黑链的写法黑链文本黑链标签被放在一个隐藏的div中。用户在浏览器中是无法看到的
精准剖析白帽SEO和黑帽SEO的区别 heimaoxuexi 黑帽seo 黑帽 seo 黑帽seo技术
我们都知道，SEO就是搜索引擎优化，是对网站进行内部及外部的不断调整优化，改进网站在搜索引擎中的关键词自然排名，获得更多流量。而SEO又分为白帽SEO和黑帽SEO，SEO中的黑帽SEO技术http://www.heimaolianmeng.com。根据做网站的实战经验，分享一下自己对于白帽SEO和黑帽SEO的见解。一、白帽SEO1、符合用户体验原理就是指我们网站上做的任何内容、任何图片以及任何网站
【程序员必读】如何利用AI高效编程，从容准时下班！ z千鑫 AI领域人工智能 Agent AI工具 AI助手工作流 AI编程 ai
前言：在编程的旅途中，程序员们常常面临各种挑战，尤其是在编写代码时，难题层出不穷。尽管传统搜索引擎提供了海量信息，但往往让我们在无尽的例子和复杂分析中迷失，难以找到真正适合自己的解决方案。正因如此，越来越多的程序员开始借助AI的力量，轻松应对这些难题，让工作变得更高效，从而实现准时下班的目标。问题：那么如何利用AI编写代码呢？一、明确问题的核心在使用AI生成代码之前，首先要明确你所遇到的问题是什么
万字详解PHP+Sphinx中文亿级数据全文检索实战（实测亿级数据0.1秒搜索耗时）小松聊PHP进阶 MySQL PHP 全文检索 php sphinx mysql sql 数据库服务器
Sphinx查询性能非常厉害，亿级数据下输入关键字，大部分能在0.01~0.1秒，少部分再5秒之内查出数据。Sphinx官方文档：http://sphinxsearch.com/docs/sphinx3.html极简概括：由C++编写的高性能全文搜索引擎的开源组件，C/S架构，跨平台（支持Linux、Windows、MacOS），支持分布式部署，并可直接适配MySQL。解决问题：因为MySQL的l
弹性搜索引擎Elasticsearch：本地部署与远程访问指南猴哥是肖鸿人工智能技术指导专升本 jenkins 运维
在大数据时代，数据搜索和分析成为企业核心竞争力的关键因素。弹性搜索引擎Elasticsearch作为一种分布式、可扩展的搜索和分析引擎，受到广泛欢迎。本文将介绍Elasticsearch的本地部署与远程访问，帮助读者更好地利用这一强大的工具。一、本地部署环境准备在开始部署Elasticsearch之前，需要准备以下环境：操作系统：Elasticsearch支持多种操作系统，如Linux、Windo
程序员如何平衡日常编码工作与提升式学习？--编程之路：平衡与成长的艺术青云交教学 java学习学习高效编码习惯与时间管理技巧提升式学习的策略职业发展与个人成长的和谐共生编程教会你如何思考--比尔盖茨 Java学习方法时间管理
目录引言：正文：方向一：高效编码习惯与时间管理技巧方向二：提升式学习的策略方向三：职业发展与个人成长的和谐共生结束语：引言：在当今科技飞速发展的时代，编程已成为一项至关重要的技能。正如比尔·盖茨所说：“编程教会你如何思考。”对于程序员来说，如何在繁忙的日常编码工作中不断提升自己，实现职业发展与个人成长的双赢，是一个极具挑战性的问题。例如，谷歌的搜索引擎算法就是一个经典的编程案例，它通过高效的算法和
2023-03-15 困的晕_5c43
1.简述引擎有哪些类型，各类搜索引擎的工作原理是什么。.（1）全文索引型（2）目录索引型（3）元数据索引型（4）垂直索引型（5）互动式索引型搜索引擎的原理可以分为：数据收集、建立索引数据库、索引数据库中搜索和排序。2.新媒体内容搜集工具有哪些？尝试使用这些工具搜集一些当前热点话题第一个：爆文素材采集工具做新媒体运营，每天都需要去搜集大量的爆文视频等素材，这里给大家推荐一个自媒体爆文素材采集工具--
云计算技术与应用 - 了解认识云计算 ZuckD 云计算运维
云计算的背景互联网自1960年开始兴起，主要用于军方、大型企业等之间的纯文字电子邮件或新闻集群组服务。直到1990年才开始进入普通家庭，随着web网站与电子商务的发展，网络已经成为了目前人们离不开的生活必需品之一。云计算这个概念首次在2006年8月的搜索引擎会议上提出，成为了互联网的第三次革命。近几年来，云计算也正在成为信息技术产业发展的战略重点，全球的信息技术企业都在纷纷向云计算转型。我们举例来
LlamaIndex 使用 RouterOutputAgentWorkflow hawk2014bj llamaIndex LLM agent
LlamaIndex中提供了一个RouterOutputAgentWorkflow功能，可以集成多个QueryTool，根据用户的输入判断使用那个QueryEngine，在做查询的时候，可以从不同的数据源进行查询，例如确定的数据从数据库查询，如果是语义查询可以从向量数据库进行查询。本文将实现两个搜索引擎，根据不同Query使用不同QueryEngine。安装MySQL依赖pipinstallmys
五类学习技巧之搜索技巧│《学习力》笔记06 翟树纯
在当今信息爆炸的时代，搜索引擎就相当于我们的外接大脑，为了充分发挥搜索引擎的威力，就要提高自己的搜索能力。我们平时用的最多的就是通用搜索引擎，以百度为例，不仅可以用来搜索文字，还可以进行学术搜索、图片搜索、视频搜索、地图搜索。术业有专攻，除了百度之类的通用搜索引擎，还有其他的专业搜索引擎，如网站历史查询、高清图库、学术网站、商业数据库等。01搜索两大原则1．换位思考从搜索引擎的角度思考，用关键词检
NLP面试题（9月4日笔记）好好学习Py 自然语言处理自然语言处理笔记人工智能
常见的分词方法分词是将连续的子序列按照一定的规则进行重新组合形成词序列的过程，是NLP领域内最基础的内容。常见的分词方法有jieba分词，jieba分词支持多种分词模模式：精确模式，全模式，搜索引擎模式。1）精确模式：将句子最精确的进行切分，适合文本分析，在日常工作中最为常用；2）全模式：将句子中所有可以成词的词语都扫描出来，速度非常快，但不能消除歧义。3）搜索引擎模式：在精确模式的基础上，对长词
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D