期待与你的对决～

Boost搜索引擎

一·功能和框架

二·技术栈与项目环境

三·具体代码结构

编辑四·项目背景

五·项目宏观原理

六·数据去标签模块

七·建立索引模块

建立正排索引

建立倒排索引

倒排原理解析

八·建立搜索模块

将index设置为单例模式

九·网络模块

十·前端模块

一·功能和框架

功能：实现boost文档站内搜索。通过输入关键字，将与关键字有关的网页按文档权值大小，罗列出来。前端显示包括，标题，摘要，网址~

框架：

二·技术栈与项目环境

技术栈：

c/c++、c++11、STL、准标准库boost、Jsoncpp、cppjieba、cpp-httplib

项目环境：

Linux CentOS 7云服务器、vim/gcc(g++)/Makefile、vscode

三·具体代码结构

四·项目背景

项目与日常搜索搜索网站不同，如百度，360，搜狗。此搜索引擎只支持boost库1.78版本站内搜索

boost库：

我们平时在网上搜索的内容都以三个内容返回给我们；标题，摘要，网页url

我们在数据清理阶段只需要对boost/html下的文件标题，摘要，url进行处理即可

五·项目宏观原理

六·数据去标签模块

我们下载到linux中的boost1.78文档中有好多东西是我们不需要的

以上和划线的都是不需要的我们将这一些去掉并将这些文档内容按每个文档:

文档1：标题\3摘要\3/url\n

文档2：标题\3摘要\3/url\n

...

以此这样排列好放在一个特定目录下方便我们进行检索

在进行原始文件的处理时用到了boost库开发的工具就掠过吧~

去标签代码：parser.cc

//判断文件是否为html后缀文件，是的话就放在一个集合进行统一处理
bool EnumFile(const std::string &src_path, std::vector *files_list);
//解析文件将文件标题，目录，URl按照我们上面说的方式整理放在一个集合。
bool ParseHtml(const std::vector &files_list, std::vector *results);
//将处理好的html文件(已经处理好的去标签，数据清洗完的。统一放在output文件里。每个文件按\n分割)
bool SaveHtml(const std::vector &results, const std::string &output);

int main()
{
  std::vector files_list;
  //第一步: 递归式的把每个html文件名带路径，保存到files_list中，方便后期进行一个一个的文件进行读取
  if (!EnumFile(src_path, &files_list))
  {
    std::cerr << "enum file name error!" << std::endl;
    return 1;
  }
  // 第二步: 按照files_list读取每个文件的内容，并进行解析
  std::vector results;
  if (!ParseHtml(files_list, &results))
  {
    std::cerr << "parse html error" << std::endl;
    return 2;
  }

  // //第三步: 把解析完毕的各个文件内容，写入到output,按照\3作为每个文档的分割符
  if (!SaveHtml(results, output))
  {
    std::cerr << "sava html error" << std::endl;
    return 3;
  }

  return 0;
}

bool EnumFile(const std::string &src_path, std::vector *files_list)
{
  namespace fs = boost::filesystem;
  fs::path root_path(src_path);

  //判断路径是否存在，不存在，就没有必要再往后走了
  if (!fs::exists(root_path))
  {
    std::cerr << src_path << " not exists" << std::endl;
    return false;
  }

  //定义一个空的迭代器，用来进行判断递归结束
  fs::recursive_directory_iterator end;
  for (fs::recursive_directory_iterator iter(root_path); iter != end; iter++)
  {
    //判断文件是否是普通文件，html都是普通文件
    if (!fs::is_regular_file(*iter))
    {
      continue;
    }
    if (iter->path().extension() != ".html")
    { //判断文件路径名的后缀是否符合要求
      continue;
    }
    std::cout << "debug: " << iter->path().string() << std::endl;
    //当前的路径一定是一个合法的，以.html结束的普通网页文件
    files_list->push_back(iter->path().string()); //将所有带路径的html保存在files_list,方便后续进行文本分析
  }

  return true;
}

static bool ParseTitle(const std::string &file, std::string *title)
{
  std::size_t begin = file.find("");
  if (begin == std::string::npos)
  {
    return false;
  }
  std::size_t end = file.find("");
  if (end == std::string::npos)
  {
    return false;
  }

  begin += std::string("").size();

  if (begin > end)
  {
    return false;
  }
  *title = file.substr(begin, end - begin);
  return true;
}

static bool ParseContent(const std::string &file, std::string *content)
{
  //去标签,基于一个简易的状态机
  enum status
  {
    LABLE,
    CONTENT
  };

  enum status s = LABLE;
  for (char c : file)
  {
    switch (s)
    {
    case LABLE:
      if (c == '>')
        s = CONTENT;
      break;
    case CONTENT:
      if (c == '<')
        s = LABLE;
      else
      {
        //我们不想保留原始文件中的\n,因为我们想用\n作为html解析之后文本的分隔符
        if (c == '\n')
          c = ' ';
        content->push_back(c);
      }
      break;
    default:
      break;
    }
  }

  return true;
}

static bool ParseUrl(const std::string &file_path, std::string *url)
{
  std::string url_head = "https://www.boost.org/doc/libs/1_78_0/doc/html";
  std::string url_tail = file_path.substr(src_path.size());

  *url = url_head + url_tail;
  return true;
}

// // for debug
static void ShowDoc(const DocInfo_t &doc)
{
  std::cout << "title: " << doc.title << std::endl;
  std::cout << "content: " << doc.content << std::endl;
  std::cout << "url: " << doc.url << std::endl;
}

bool ParseHtml(const std::vector<std::string> &files_list, std::vector<DocInfo_t> *results)
{
  for (const std::string &file : files_list)
  {
    // 1. 读取文件，Read();
    std::string result;
    if (!ns_util::FileUtil::ReadFile(file, &result))
    {
      continue;
    }
    DocInfo_t doc;
    // 2. 解析指定的文件，提取title
    if (!ParseTitle(result, &doc.title))
    {
      continue;
    }
    // 3. 解析指定的文件，提取content,就是去标签
    if (!ParseContent(result, &doc.content))
    {
      continue;
    }
    // 4. 解析指定的文件路径，构建url
    if (!ParseUrl(file, &doc.url))
    {
      continue;
    }

    // done,一定是完成了解析任务，当前文档的相关结果都保存在了doc里面
    results->push_back(std::move(doc)); // bug:todo;细节，本质会发生拷贝，效率可能会比较低

    // for debug
    //  ShowDoc(doc);
    //   break;
  }
  return true;
}

bool SaveHtml(const std::vector<DocInfo_t> &results, const std::string &output)
{
#define SEP '\3'
  //按照二进制方式进行写入
  std::ofstream out(output, std::ios::out | std::ios::binary);
  if (!out.is_open())
  {
    std::cerr << "open " << output << " failed!" << std::endl;
    return false;
  }

  //就可以进行文件内容的写入了
  for (auto &item : results)
  {
    std::string out_string;
    out_string = item.title;
    out_string += SEP;
    out_string += item.content;
    out_string += SEP;
    out_string += item.url;
    out_string += '\n';

    out.write(out_string.c_str(), out_string.size());
  }

  out.close();

  return true;
}
</code></pre> 
  </blockquote> 
  <h2 id="%E4%B8%83%C2%B7%E5%BB%BA%E7%AB%8B%E7%B4%A2%E5%BC%95%E6%A8%A1%E5%9D%97">七·建立索引模块</h2> 
  <blockquote> 
   <pre><code class="language-cpp">#pragma once
#include <iostream>
#include <string>
#include <vector>
#include <unordered_map>
namespace ns_index{
struct DocInfo{
std::string title; //文档的标题
std::string content; //文档对应的去标签之后的内容
std::string url; //官网文档url
uint64_t doc_id; //文档的ID，暂时先不做过多理解
};
struct InvertedElem{
uint64_t doc_id;
std::string word;
int weight;
};
//倒排拉链
typedef std::vector<InvertedElem> InvertedList;
class Index{
private:
//正排索引的数据结构用数组，数组的下标天然是文档的ID
std::vector<DocInfo> forward_index; //正排索引
//倒排索引一定是一个关键字和一组(个)InvertedElem对应[关键字和倒排拉链的映射关系]
std::unordered_map<std::string, InvertedList> inverted_index;
public:
Index(){}
~Index(){}
public:
//根据doc_id找到找到文档内容
DocInfo *GetForwardIndex(uint64_t doc_id)
{
return nullptr;
}
//根据关键字string，获得倒排拉链
InvertedList *GetInvertedList(const std::string &word)
{
return nullptr;
}
//根据去标签，格式化之后的文档，构建正排和倒排索引
//data/raw_html/raw.txt
bool BuildIndex(const std::string &input) //parse处理完毕的数据交给我
{
return true;
}
};
}</code></pre> 
  </blockquote> 
  <h3 id="%E5%BB%BA%E7%AB%8B%E6%AD%A3%E6%8E%92%E7%B4%A2%E5%BC%95">建立正排索引</h3> 
  <blockquote> 
   <p>我们怎么理解正派索引？</p> 
   <p>用户输入了搜索关键字。我们怎么去文档查找这个关键字？</p> 
   <p>将文档一一按编号穿起来放到一个数组里面。每个文件都标记自己是第几个文件</p> 
   <p>输入：<strong>我在郑州上学</strong></p> 
   <p>输入：<strong>我是一名学生</strong></p> 
   <table border="1" style="width:500px;"> 
    <tbody> 
     <tr> 
      <td>文档ID</td> 
      <td>关键字</td> 
     </tr> 
     <tr> 
      <td>1</td> 
      <td>我在郑州上学</td> 
     </tr> 
     <tr> 
      <td>2</td> 
      <td>我是一名学生</td> 
     </tr> 
    </tbody> 
   </table> 
   <p>我们之前将处理好的文档内容，都放在了一个结构体里面将这些结构体放在一个集合，那么它们的ID就是它们自己的下标</p> 
   <p><a href="http://img.e-com-net.com/image/info8/05c7cc9a19e6441cad95a67c3cfcdcad.jpg" target="_blank"><img alt="Boost搜索引擎_第8张图片" height="178" src="http://img.e-com-net.com/image/info8/05c7cc9a19e6441cad95a67c3cfcdcad.jpg" width="650" style="border:1px solid black;"></a></p> 
   <p><strong> 正排索引代码：</strong></p> 
   <pre><code class="language-cpp">DocInfo *BuildForwardIndex(const std::string &line)
        {
            // 1.解析line，字符串切分
            // line->3 string,title,content,url;
            const std::string sep = "\3";
            std::vector<std::string> results; //行内分割符
            ns_util::StringUtil::Split(line, &results, sep);
            // ns_util::StringUtil::CutString(line,&results,sep);
            if (results.size() != 3)
            {
                return nullptr;
            }
            // 2.字符串进行填充到Docinfo
            DocInfo doc;
            doc.title = results[0]; // title
            doc.content = results[1];
            doc.url = results[2];
            doc.doc_id = forward_index.size(); //先进行保存id，再插入，对应的id就是当前doc再vector中的下标！
            // 3.插入到正派索引的vector
            forward_index.push_back(std::move(doc));
            return &forward_index.back();
        }</code></pre> 
  </blockquote> 
  <h3 id="%C2%A0%E5%BB%BA%E7%AB%8B%E5%80%92%E6%8E%92%E7%B4%A2%E5%BC%95"> 建立倒排索引</h3> 
  <blockquote> 
   <p>什么是倒排索引呢？</p> 
   <p>可以先阐述一下正排索引的效率高么？</p> 
   <p>很明显单单使用正派索引完成搜索任务显然是不可行的</p> 
   <p>每次都通过文档ID一一去看这个文档里面有咩有出现关键字无疑大费周折</p> 
   <p>要是你搜索的内容在好几个文档中都出现过呢？</p> 
   <p>我们可以通过关键字查询这几个关键字都在哪几个文档中出现过。</p> 
   <p>(这里我们要对输入的关键字进行切分。使用的是split函数)</p> 
   <p>文档1:我在郑州上大学。我/在/郑州/上/大学</p> 
   <p>文档2:我是一名大学生。我/是/一名/大学/生</p> 
   <table border="1" style="width:500px;"> 
    <tbody> 
     <tr> 
      <td>关键字</td> 
      <td>文档ID</td> 
     </tr> 
     <tr> 
      <td>我</td> 
      <td>1   2</td> 
     </tr> 
     <tr> 
      <td>在</td> 
      <td>1</td> 
     </tr> 
     <tr> 
      <td>郑州</td> 
      <td>1</td> 
     </tr> 
     <tr> 
      <td>一名</td> 
      <td>2</td> 
     </tr> 
     <tr> 
      <td>大学</td> 
      <td>1    2</td> 
     </tr> 
    </tbody> 
   </table> 
   <p>搜索过程：输入-》大学-》倒排索引查找，找到文档ID-》根据正排索引-》找到文档内容-》</p> 
   <p>title+content+url-》构建响应结果。</p> 
   <h4 id="%E5%80%92%E6%8E%92%E5%8E%9F%E7%90%86%E8%A7%A3%E6%9E%90">倒排原理解析</h4> 
   <p>通过关键字去找文档的ID是大致意义上的理解，怎么实现这么一个功能呢？</p> 
   <p>找的文档应该都有一些什么属性呢？</p> 
   <p>用一个结构体来表示文档的id。weight(权值)。关键字</p> 
   <p>通过关键字对拟文档属性进行修改。主要是权值统一建立一个集合将它们放进去我们称之为倒排拉链。</p> 
   <p>一个关键字可能对应多个倒排拉链</p> 
   <pre><code class="language-cpp">//倒排原理
    struct InvertedElem
    {
        int doc_id;
        std::string word;
        int weight;
    };
    //倒排拉链
    typedef std::vector<InvertedElem> InvertedList;</code></pre> 
   <p><a href="http://img.e-com-net.com/image/info8/529fc6ea20474a4abb562179b6a903cb.jpg" target="_blank"><img alt="Boost搜索引擎_第9张图片" height="278" src="http://img.e-com-net.com/image/info8/529fc6ea20474a4abb562179b6a903cb.jpg" width="650" style="border:1px solid black;"></a></p> 
   <p> 这里建立倒排索引的时候需要对文档的标题啊，摘要等进行分词。这样让我们在建立倒排索引更精确这里使用的是jieba分词工具。放在util里面。</p> 
   <p>倒排查找模块</p> 
   <pre><code class="language-cpp"> bool BulidInvertedIndex(const DocInfo &doc)
        {
            // DocInfo{title, content, url, doc_id}
            // word -> 倒排拉链
            struct word_cnt
            {
                int title_cnt;
                int content_cnt;

                word_cnt() : title_cnt(0), content_cnt(0) {}
            };
            std::unordered_map<std::string, word_cnt> word_map; //用来暂存词频的映射表

            //对标题进行分词
            std::vector<std::string> title_words;
            ns_util::JiebaUtil::CutString(doc.title, &title_words);

            
            for(auto &s:title_words)
            {
                boost::to_lower(s);
                word_map[s].title_cnt++;
            }
            
            // if(doc.doc_id == 1572){
            //     for(auto &s : title_words){
            //         std::cout << "title: " << s << std::endl;
            //     }
            // }


            //对文档内容进行分词
            std::vector<std::string> content_words;
            ns_util::JiebaUtil::CutString(doc.content, &content_words);


            //对内容进行词频统计
            for (auto &s : content_words)
            {
                boost::to_lower(s);
                word_map[s].content_cnt++;
            }

#define X 10
#define Y 1
            // Hello,hello,HELLO
            for (auto &word_pair : word_map)
            {
                InvertedElem item;
                item.doc_id = doc.doc_id;
                item.word = word_pair.first;
                item.weight = X * word_pair.second.title_cnt + Y* word_pair.second.content_cnt; //相关性
                InvertedList &inverted_list = inverted_index[word_pair.first];
                inverted_list.push_back(std::move(item));
            }

            return true;
        }</code></pre> 
  </blockquote> 
  <h2 id="%C2%A0%E5%85%AB%C2%B7%E5%BB%BA%E7%AB%8B%E6%90%9C%E7%B4%A2%E6%A8%A1%E5%9D%97"> 八·建立搜索模块</h2> 
  <blockquote> 
   <p> </p> 
   <pre><code class="language-cpp">#pragma once
#include"index.hpp"

namespace ns_searcher
{
    class Searcher
    {
    private:
        ns_index::Index *index;//系统查找的索引

    public:
        Searcher(){}
        ~Searcher(){}

        //初始化
        void InitSearcher(std::string &input)
        {
            //1.获取/创建index对象
            //2.根据index对象建立索引
        }

        //提供搜索服务
        //query:搜索关键字；json_string:搜索结果
        void Search(const std::string &query,std::string *json_string)
        {
            //1.query分词
            //2.根据分“词”进行index查找
            //3.根据查找结果，根据权重进行降序排序
            //4.构建json_string
        }
    };
}</code></pre> 
   <h3 id="%E5%B0%86index%E8%AE%BE%E7%BD%AE%E4%B8%BA%E5%8D%95%E4%BE%8B%E6%A8%A1%E5%BC%8F">将index设置为单例模式</h3> 
   <pre><code class="language-cpp">  private:
    Index() {}
    Index(const Index &) = delete;
    Index &operator=(const Index &) = delete;

    static Index *instance;
    static std::mutex mtx;

  public:
    ~Index() {}

    static Index *GetInstance()
    {
      if (nullptr == instance)
      {
        mtx.lock();
        if (nullptr == instance)
          instance = new Index();
      }
      mtx.unlock();
      return instance;
    }
</code></pre> 
   <p>由于单例模式存在线程安全问题，我们对其进行加锁</p> 
   <p>用户输入的搜索内容我们也需要对其进行分词。然后去倒排索引中查找。这里使用jesoncpp对其进行序列化，再反序列化</p> 
   <p>jsoncpp</p> 
   <pre><code class="language-cpp">#include <iostream>
#include <string>
#include <vector>
#include <jsoncpp/json/json.h>

int main()
{
  Json::Value root;
  Json::Value item1;
  item1["key1"]="Value1";
  item1["key2"]="Value2";

  Json::Value item2;
  item2["key1"]="Value1";
  item2["key2"]="Value2";

  root.append(item1);
  root.append(item2);

  Json::StyledWriter writer;
  std::string s = writer.write(root);

  std::cout<<s<<std::endl;
  return 0;
}</code></pre> 
   <p>Search模块：</p> 
   <pre><code class="language-cpp">void Search(const std::string&query,std::string *json_string)
        {
            //1.[分词]：对我们的query进行按照searcher的要求进行分词
            std::vector<std::string>words;
            ns_util::JiebaUtil::CutString(query,&words);
            //2.[触发]:根据分词的各个词，进行index查找
            ns_index::InvertedList inverted_list_all;
            for(std::string word:words)
            {
                boost::to_lower(word);
                ns_index::InvertedList*inverted_list=index->GetInvertedList(word);
                if(nullptr==inverted_list)
                {
                    continue;
                }
                inverted_list_all.insert(inverted_list_all.end(),inverted_list->begin(),inverted_list->end());
            }
            //3.[合并排序]；汇总查找结果，按照相关性（weight）降序排列
            std::sort(inverted_list_all.begin(),inverted_list_all.end(),[](const ns_index::InvertedElem &e1,const ns_index::InvertedElem &e2)
            {
                return e1.weight>e2.weight;
            });   
            //4.[构建]：根据查出来的结果，构建json串。
            Json::Value root;
            for(auto&item:inverted_list_all)
            {
                ns_index::DocInfo*doc=index->GetForwardIndex(item.doc_id);
                if(nullptr==doc)
                {
                    continue;
                }
                Json::Value elem;
                elem["title"]=doc->title;
                elem["desc"]=GetDesc(doc->content,item.word);
                elem["url"]=doc->url;
                elem["id"]=(int)item.doc_id;
                elem["weight"]=item.weight;
                root.append(elem);
            }
            Json::StyledWriter writer;
            *json_string=writer.write(root);
        }</code></pre> 
   <p>我们在建立好搜索模块之后而且已经触发了文档内容，这时候的文档摘要是需要进行处理的。不然不美观</p> 
   <pre><code class="language-cpp"> std::string GetDesc(const std::string&html_content,const std::string&word)
        {
            //找到word在html中的位置，返回摘要为关键字往前50个，往后100个，如果没有就从begin到end;
            const int prev_step=50;
            const int next_step=100;

            auto iter=std::search(html_content.begin(),html_content.end(),word.begin(),word.end(),[](int x,int y){
                return (std::tolower(x)==std::tolower(y));
            });
            int pos=std::distance(html_content.begin(),iter);
            int start=0;
            int end=html_content.size()-1;
            //如果之前有50+个字符，就更新开始位置
            if(pos-prev_step>start)
            {
                start=pos-prev_step;
            }
            if(pos+next_step<end)
            {
                end=pos+next_step;
            }
            //3截取字符串return
           std::string desc=html_content.substr(start,end-start);
           desc+="...";
           return desc;
        }</code></pre> 
  </blockquote> 
  <h2 id="%E4%B9%9D%C2%B7%E7%BD%91%E7%BB%9C%E6%A8%A1%E5%9D%97">九·网络模块</h2> 
  <blockquote> 
   <p>这里网络模块我们使用了cpp-httplib这样就不要再手动写一个http协议</p> 
   <p>安装cpp-httplib</p> 
   <pre><code class="language-cpp">cpp-httplib安装路径：
https://gitee.com/zhangkt1995/cpp-httplib?_from=gitee_search</code></pre> 
   <pre><code class="language-cpp">#include"search.hpp"
#include"cpp-httplib/httplib.h"
const std::string input="./data/rm_html/raw.txt";
const std::string root_path="./wwwroot";
int main()
{
    ns_searcher::Searcher search;
    search.InitSearcher(input);

    httplib::Server svr;
    svr.set_base_dir(root_path.c_str());
    // svr.Get("/hi",[](const httplib::Request &req,httplib::Response& rsp){
    //     rsp.set_content("hello,world!","text/plain: charset=utf-8");
    // });
    svr.Get("/s",[&search](const httplib::Request &req,httplib::Response &rsp){
       if(!req.has_param("word"))
       {
        rsp.set_content("必须要有搜索关键字！","text/plain: charset=utf-8");
        return ;
       }
       std::string word=req.get_param_value("word");
       std::cout<<"用户正在搜索: "<<word<<std::endl;
       std::string json_string;
       search.Search(word,&json_string);
       rsp.set_content(json_string,"application/json"); 
    });
    svr.listen("0.0.0.0",8081);
    return 0;
}
</code></pre> 
   <p></p> 
  </blockquote> 
  <h2 id="%E5%8D%81%C2%B7%E5%89%8D%E7%AB%AF%E6%A8%A1%E5%9D%97">十·前端模块</h2> 
  <blockquote> 
   <p>前端模块就不解释</p> 
   <pre><code class="language-cpp"><!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <script src="http://code.jquery.com/jquery-2.1.1.min.js"></script>

    <title>boost 搜索引擎

网络爬虫：技术原理、应用场景与合法使用全攻略程序小武 python爬虫入门爬虫网络
爬虫是什么？网络爬虫（WebScraping或WebCrawling）是一种通过自动化方式从网站上抓取公开数据的程序。它通过模拟用户在浏览器中浏览网页的过程，访问网页、提取信息，并将数据保存到本地系统中。爬虫技术广泛应用于搜索引擎、数据收集、市场分析、信息聚合等多个领域。爬虫能做什么？数据收集爬虫可以高效地从互联网上的大量网站收集信息。比如，抓取新闻网站上的文章内容、商品电商平台的价格与库存数据、
mac OS上docker安装zookeeper
拉取镜像：$dockerpullzookeeper:3.5.73.5.7:Pullingfromlibrary/zookeeper3.5.7:Pullingfromlibrary/zookeeper3.5.7:Pullingfromlibrary/zookeepernomatchingmanifestforlinux/arm64/v8inthemanifestlistentries报错：由于时M3
Linux 定时器应用示例
1.运行结果2.程序#include#include#includeintcount=0;structitimervalt;voidtimer_handler(intsig){printf("timer_handler:signal=%d,count=%d\n",sig,++count);if(count>=8){printf("canceltimer\n");t.it_value.tv_sec=
2018-04-08 viper44
科技就是将复杂的事情简单化，所以智能手机的出现显著降低了我们学习的难度，只要善于使用搜索引擎，几乎能够获得所有的知识，而我们利用这些工具的姿势，会反过来决定我们未来的走向，所以一定不能做伸手党，能查到东西尽量自己去搜索，网上有很多现成的成功，我们要善于搜索，把节约的时间拿去干别的事生活中会面临很多突发状况，要如何才能从容面对呢，培养急智的最简单的方法就是列举出所有可能出现的问题，并对它们制定一些相
【无标题】 Aczone28 单片机嵌入式硬件
学习记录：初识Linux操作系统与基本命令今天我正式开始学习Linux操作系统，并对Ubuntu有了初步的了解。Ubuntu是基于GNU工程发布的Linux发行版之一，具有开源、自由、安全和高效的特点，是目前主流的Linux系统之一，广泛应用于服务器、开发环境以及日常桌面使用。在实践中，我接触并掌握了一些常用的Linux命令，包括但不限于以下几个方面：文件和目录操作：-ls：查看当前目录下的文件和
LocalSend：比 AirDrop 更自由！这款神器让文件传输不再受限开源项目精选 https
LocalSend是一款免费、开源的跨平台文件传输工具，支持Windows、macOS、Linux、Android和iOS等主流操作系统。它通过HTTPS实现端到端加密传输，无需互联网或外部服务器，即可在局域网内高速、安全地传输文件和文本。其核心优势在于打破平台壁垒，提供高效安全的本地文件共享方案，让您的多设备互联互通变得前所未有的简单。Stars数64,423Forks数3,437主要特点跨平台
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
tcpdump交叉编译 weixin_45673259 tcpdump 测试工具网络
1.下载路径官网：https://www.tcpdump.org/2.编译解压：tar-xflibpcap-1.10.4.tar.xztar-xftcpdump-4.99.4.tar.xz编译libpcap./configure--host=mips-v720s229-linux--target=mips-v720s229-linuxCC=/opt/A1/mips-gcc720-uclibc229
【Linux内核模块】Linux内核模块程序结构 byte轻骑兵 #嵌入式Linux驱动开发实战 linux 运维服务器
如果你已经写过第一个"HelloWorld"内核模块，可能会好奇：为什么那个几行代码的程序能被内核识别？那些module_init、MODULE_LICENSE到底是什么意思？今天咱们就来扒一扒内核模块的程序结构，搞清楚一个合格的内核模块到底由哪些部分组成，每个部分又承担着什么角色。目录一、内核模块的"骨架"：最简化结构解析二、头文件：内核模块的"说明书"2.1最常用的三个头文件2.2按需添加的其
LVM逻辑卷扩容
目录1.逻辑卷的简介2.逻辑卷的概念3.相关命令4.建立逻辑卷1.逻辑卷的简介1.LVM是逻辑卷管理(LogicalVolumeManager)的简称,它是Linux环境下对磁盘分区进行管理的一种机制,LVM是建立在硬盘和分区之上的一个逻辑层,来提高磁盘分区管理的灵活性。2.LVM最大的特点就是可以对磁盘进行动态管理。使用了LVM管理分区,动态的调整分区的大小,标准分区是做不到的。2.逻辑卷的概念
Rocky Linux 8.5/CentOS 8 安装Wine chen_teacher linux 运维服务器
RockyLinux8.5/CentOS8安装Wine首先配置EPEL镜像配置方法安装Wine首先配置EPEL镜像EPEL(ExtraPackagesforEnterpriseLinux),是由FedoraSpecialInterestGroup维护的EnterpriseLinux（RHEL、CentOS）中经常用到的包。下载地址：https://mirrors.aliyun.com/epel/相
系统迁移从CentOS7.9到Rocky8.9
我有两台阿里云上的服务器是CentOS7.9，由于CentOS7已经停止支持，后续使用的话会有安全漏洞，所以需要尽快迁移，个人使用的话目前兼容性好的还是RockyLinux8，很多脚本改改就能用了。一、盘点系统和迁移应用查看当前系统发行版版本cat/etc/os-release盘点迁移清单服务器应用部署方式docker镜像来源v1wordpressdockerdockerhubv1zdirdock
【Linux内核模块】Linux内核模块简介 byte轻骑兵 #嵌入式Linux驱动开发实战 linux arm开发运维
你是否好奇过，为什么Linux系统可以在不重启的情况下支持新硬件？为什么修改一个驱动程序不需要重新编译整个内核？这一切都离不开Linux的"模块化魔法"——内核模块（KernelModule）。作为Linux内核最灵活的特性之一，内核模块让开发者可以动态扩展内核功能，今天就来揭开这个神秘组件的面纱。目录一、什么是内核模块？1.1先打个比方：给内核装"插件"1.2技术定义：动态加载的内核代码段1.3
Linux中LVM逻辑卷扩容
在Linux系统中对根目录所在的LVM逻辑卷进行扩容，需要依次完成物理卷扩容➔卷组扩容➔逻辑卷扩容➔文件系统扩容四个步骤。以下是详细操作流程：一、确认当前磁盘和LVM状态#1.查看磁盘空间使用情况df-h/#2.查看块设备及LVM层级关系lsblk#3.查看LVM详细信息（物理卷PV、卷组VG、逻辑卷LV）pvdisplayvgdisplaylvdisplay二、扩容物理卷（PV）场景1：已有未分
在 Windows 上安装 Docker Desktop 不老刘人工智能 windows docker 容器
还是简单说一下，如何在Windows上安装DockerDesktop，具体步骤如下：系统要求Windows10/1164-bit（专业版、企业版或教育版，版本21H2或更高）启用WSL2（WindowsSubsystemforLinux2）或Hyper-V至少4GB内存BIOS中启用虚拟化（VT-x/AMD-V）安装步骤1.下载DockerDesktop访问Docker官网下载页面。下载Docke
【Linux】进程间通信-管道通信实验会的全对٩(ˊᗜˋ*)و Linux linux 经验分享
要求：利用有名管道编写简单的聊天程序，聊天双方在线才能说话，一方说话后需另一方应答才能继续说话，即一来一往的聊天模式，如果输入quit则退出聊天程序。代码实现：进程A#include#include#include#include#include#include#defineFIFO_A"/tmp/chat_fifo_a"//进程A写消息，进程B读消息#defineFIFO_B"/tmp/chat
Python uWSGI 安装配置 AI老李 python python 开发语言
关键要点uWSGI安装和配置适合PythonWSGI应用，资源丰富，适合初学者和中级用户。推荐菜鸟教程和官方文档，涵盖Linux和Windows环境。配置需注意操作系统差异和框架（如Django、Flask）需求。安装步骤uWSGI安装通常通过pip或源码编译完成。以下是基本步骤：Linux：安装依赖（如build-essentialpython-dev），然后用pipinstalluwsgi或编
上位机知识篇---Linux中的文件挂载 Atticus-Orion 上位机操作篇 linux 运维网络文件挂载
文章目录前言1.挂载的基本概念文件系统挂载点设备文件2.挂载的命令挂载文件系统示例卸载文件系统示例3.挂载的常用选项示例4.自动挂载（/etc/fstab文件）示例使用UUID挂载5.挂载网络文件系统（NFS）挂载NFS示例6.挂载ISO文件挂载ISO文件示例7.查看已挂载的文件系统8.挂载的注意事项9.挂载的常见问题挂载失败卸载失败10.总结前言在Linux系统中，文件挂载是指将一个文件系统（如
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
如何在 Linux 上安装 RTX 5090 / 5080 /5070 Ti / 5070 驱动程序 — 详细指南知识大胖 NVIDIA GPU和大语言模型开发教程 linux 运维服务器
简介为了获得最佳性能，您需要在Linux上运行5090/5080/5070Ti/5070或其他50系列GPU（或Windows上的WSL）。这篇文章将包含有关如何操作的详细指南。主线内核和驱动程序怪癖之旅Nvidia50系列GPU拥有最新的Nvidia技术。但是，新硬件需要一些新软件或更新，这需要一些耐心。如果您在这里，您可能会遇到Ubuntu默认设置的障碍。不要害怕！我最近自己摸索了这个迷宫，结
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
STM32 CubMax 6.1.1 版本安装包姜奇惟Sparkling
STM32CubMax6.1.1版本安装包【下载地址】STM32CubMax6.1.1版本安装包本仓库提供STM32CubeMX6.1.1版本的安装包，支持Linux、macOS和Windows64位系统。STM32CubeMX是STMicroelectronics推出的一款图形化配置工具，能够自动生成适用于STM32微控制器的初始化代码，极大地简化了开发流程。用户只需根据操作系统选择相应的安装包
在 Linux（openEuler 24.03 LTS-SP1）上安装 Kubernetes + KubeSphere 的防火墙放行全攻略
目录在Linux（openEuler24.03LTS-SP1）上安装Kubernetes+KubeSphere的防火墙放行全攻略一、为什么要先搞定防火墙？二、目标环境三、需放行的端口和协议列表四、核心工具说明1.修正后的exec.sh脚本（支持管道/重定向）2.批量放行脚本：open_firewall.sh五、使用示例1.批量放行端口2.查看当前防火墙规则3.仅开放单一端口（临时需求）4.检查特定
解决Linux绑定失败地址已使用(端口被占用)的问题誰能久伴不乏 linux 服务器网络
文章目录解决`bindfailed:Addressalreadyinuse`问题一、问题原因1.**端口已经被其他程序占用**2.**端口处于`TIME_WAIT`状态**3.**未正确关闭套接字**二、如何排查和解决问题1.**确认端口是否被占用**2.**查找并杀掉占用端口的进程**3.**等待端口释放（`TIME_WAIT`状态）**4.**强制重用端口**（仅限开发环境）5.**使用其他端
linux/ubuntu启动引导过程详细分析奇妙之二进制 #linux ubuntu postgresql
文章目录**一、固件初始化阶段（BIOS/UEFI）****1.BIOS（基本输入输出系统）模式****2.UEFI（统一可扩展固件接口）模式****二、引导加载程序阶段（GRUB2）****1.GRUB2的加载过程****2.GRUB配置解析****3.内核参数传递****三、内核加载与初始化****1.内核解压缩与启动****2.initramfs（初始内存文件系统）加载****3.根文件系统
深入理解 Linux 中的 stat 函数与文件属性操作
在Linux系统编程中，获取和操作文件属性是一项基础且重要的任务。stat函数作为获取文件状态信息的核心接口，为我们提供了丰富的文件元数据。本文将详细解析stat函数的用法、结构体成员含义，以及与文件时间戳、权限相关的实用操作。一、stat函数：文件信息的"万能查询器"stat函数的原型非常简洁：intstat(constchar*pathname,structstat*statbuf)功能：通过
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

Boost搜索引擎

一·功能和框架

二·技术栈与项目环境

三·具体代码结构

四·项目背景

五·项目宏观原理

六·数据去标签模块

你可能感兴趣的:(linux,搜索引擎)