lilbedwin

open-vcdiff流式编码过程分析（三）

了解了基本原理，看代码就轻松了，把EncodeInternal的完整代码贴上来：

template<bool look_for_target_matches>
void VCDiffEngine::EncodeInternal(const char* target_data,
                                  size_t target_size,
                                  OutputStringInterface* diff,
                                  CodeTableWriterInterface* coder) const {
  if (!hashed_dictionary_) {
    VCD_DFATAL << "Internal error: VCDiffEngine::Encode() "
                  "called before VCDiffEngine::Init()" << VCD_ENDL;
    return;
  }
  if (target_size == 0) {
    return;  // Do nothing for empty target
  }
  // Special case for really small input
  if (target_size < static_cast<size_t>(BlockHash::kBlockSize)) {
    AddUnmatchedRemainder(target_data, target_size, coder);
    FinishEncoding(target_size, diff, coder);
    return;
  }
  RollingHash<BlockHash::kBlockSize> hasher;
  BlockHash* target_hash = NULL;
  if (look_for_target_matches) {
    // Check matches against previously encoded target data
    // in this same target window, as well as against the dictionary
    target_hash = BlockHash::CreateTargetHash(target_data,
                                              target_size,
                                              dictionary_size());
    if (!target_hash) {
      VCD_DFATAL << "Instantiation of target hash failed" << VCD_ENDL;
      return;
    }
  }
  const char* const target_end = target_data + target_size;
  const char* const start_of_last_block = target_end - BlockHash::kBlockSize;
  // Offset of next bytes in string to ADD if NOT copied (i.e., not found in
  // dictionary)
  const char* next_encode = target_data;
  // candidate_pos points to the start of the kBlockSize-byte block that may
  // begin a match with the dictionary or previously encoded target data.
  const char* candidate_pos = target_data;
  uint32_t hash_value = hasher.Hash(candidate_pos);
  while (1) {
    const size_t bytes_encoded =
        EncodeCopyForBestMatch<look_for_target_matches>(
            hash_value,
            candidate_pos,
            next_encode,
            (target_end - next_encode),
            target_hash,
            coder);
    if (bytes_encoded > 0) {
      next_encode += bytes_encoded;  // Advance past COPYed data
      candidate_pos = next_encode;
      if (candidate_pos > start_of_last_block) {
        break;  // Reached end of target data
      }
 // candidate_pos has jumped ahead by bytes_encoded bytes, so UpdateHash
      // can't be used to calculate the hash value at its new position.
      hash_value = hasher.Hash(candidate_pos);
      if (look_for_target_matches) {
        // Update the target hash for the ADDed and COPYed data
        target_hash->AddAllBlocksThroughIndex(
            static_cast<int>(next_encode - target_data));
      }
    } else {
      // No match, or match is too small to be worth a COPY instruction.
      // Move to the next position in the target data.
      if ((candidate_pos + 1) > start_of_last_block) {
        break;  // Reached end of target data
      }
      if (look_for_target_matches) {
        target_hash->AddOneIndexHash(
            static_cast<int>(candidate_pos - target_data),
            hash_value);
      }
      hash_value = hasher.UpdateHash(hash_value,
                                     candidate_pos[0],
                                     candidate_pos[BlockHash::kBlockSize]);
      ++candidate_pos;
    }
  }
  AddUnmatchedRemainder(next_encode, target_end - next_encode, coder);
  FinishEncoding(target_size, diff, coder);
  delete target_hash;
}

开头的几行，前文分析过了，从33行开始，是block匹配的逻辑。首先初始化几个变量：next_encode是为被编码的数据起点；candidate_pos是当前窗口的起点，之前介绍过，第一个16byte如果匹配不到block，窗口就会移动；target_end是本次函数调用传递进来的数据的重点，如果窗口的右端到了终点，本次编码就该结束了。

下面是一个循环，EncodeCopyForBestMatch函数，即之前介绍的，基于当前窗口的16个byte，找到一个匹配的block，然后尽量匹配其上下文，直到找到一个匹配最长的block，然后进行COPY编码，COPY前面可能会有一个ADD。EncodeCopyForBestMatch的返回值，是找到的最佳match数据的长度。

if (bytes_encoded>0)，这个分支，表示找到的match数据，并且成功进行了编码。这里的逻辑，就是next_encode，candidate_pos分别后移，后移的值即是math数据的长度，然后检查是否已经处理完毕了，如果没完，计算新窗口的哈希。下面的if(look_for_target_matchs)，表示如果需要在target数据自身里寻找match数据，那么已经编码的数据，也应该建立分段哈希，这个分段哈希称为target_hash_。

else分支，表示没有找到match（或者找到的match太短，不值得一次COPY编码）。这里的逻辑，candidate_pos_后移1，重新计算hash。然后如果需要自身匹配，加入target_hash，这里有点迷惑性，其实并不是每移动一个byte就需要增加一个block，看AddOneIndexHash的代码就清楚了，注意下面注释部分以及if判断：

  // This function will be called to add blocks incrementally to the target hash
  // as the encoding position advances through the target data.  It will be
  // called for every kBlockSize-byte block in the target data, regardless
  // of whether the block is aligned evenly on a block boundary.  The
  // BlockHash will only store hash entries for the evenly-aligned blocks.
  //
  void AddOneIndexHash(int index, uint32_t hash_value) {
    if (index == NextIndexToAdd()) {
      AddBlock(hash_value);
    }
  }

循环结束后，需要对最后残留的不够一block的数据，通过函数AddUnmatchedRemainder直接编码为VCDiff的ADD，然后FinishEncoding写缓冲区。

然后再看一下之循环开头的EncodeCopyForBestMatch函数，代码：

template<bool look_for_target_matches>
inline size_t VCDiffEngine::EncodeCopyForBestMatch(
    uint32_t hash_value,
    const char* target_candidate_start,
    const char* unencoded_target_start,
    size_t unencoded_target_size,
    const BlockHash* target_hash,
    CodeTableWriterInterface* coder) const {
  // When FindBestMatch() comes up with a match for a candidate block,
  // it will populate best_match with the size, source offset,
  // and target offset of the match.
  BlockHash::Match best_match;

  // First look for a match in the dictionary.
  hashed_dictionary_->FindBestMatch(hash_value,
                                    target_candidate_start,
                                    unencoded_target_start,
                                    unencoded_target_size,
                                    &best_match);
  // If target matching is enabled, then see if there is a better match
  // within the target data that has been encoded so far.
  if (look_for_target_matches) {
    target_hash->FindBestMatch(hash_value,
                               target_candidate_start,
                               unencoded_target_start,
                               unencoded_target_size,
                               &best_match);
  }
  if (!ShouldGenerateCopyInstructionForMatchOfSize(best_match.size())) {
    return 0;
  }
  if (best_match.target_offset() > 0) {
    // Create an ADD instruction to encode all target bytes
    // from the end of the last COPY match, if any, up to
    // the beginning of this COPY match.
    coder->Add(unencoded_target_start, best_match.target_offset());
  }
  coder->Copy(best_match.source_offset(), best_match.size());
  return best_match.target_offset()  // ADD size
       + best_match.size();          // + COPY size
}

这个函数本身没有太多信息量，首先调用FindBestMatch，找到最佳的match数据，然后就是ADD，COPY。重头戏都交给FindBestMatch了，我们来看一下这个函数的代码：

void BlockHash::FindBestMatch(uint32_t hash_value,
                              const char* target_candidate_start,
                              const char* target_start,
                              size_t target_size,
                              Match* best_match) const {
  int match_counter = 0;
  for (int block_number = FirstMatchingBlockInline(hash_value,
                                                   target_candidate_start);
       (block_number >= 0) && !TooManyMatches(&match_counter);
       block_number = NextMatchingBlock(block_number, target_candidate_start)) {
    int source_match_offset = block_number * kBlockSize;
    const int source_match_end = source_match_offset + kBlockSize;

    int target_match_offset =
        static_cast<int>(target_candidate_start - target_start);
    const int target_match_end = target_match_offset + kBlockSize;

    size_t match_size = kBlockSize;
    {
      // Extend match start towards beginning of unencoded data
      const int limit_bytes_to_left = std::min(source_match_offset,
                                               target_match_offset);
      const int matching_bytes_to_left =
          MatchingBytesToLeft(source_data_ + source_match_offset,
                              target_start + target_match_offset,
                              limit_bytes_to_left);
      source_match_offset -= matching_bytes_to_left;
      target_match_offset -= matching_bytes_to_left;
      match_size += matching_bytes_to_left;
    }
    {
      // Extend match end towards end of unencoded data
      const size_t source_bytes_to_right = source_size_ - source_match_end;
      const size_t target_bytes_to_right = target_size - target_match_end;
      const size_t limit_bytes_to_right = std::min(source_bytes_to_right,
                                                   target_bytes_to_right);
      match_size +=
          MatchingBytesToRight(source_data_ + source_match_end,
                               target_start + target_match_end,
                               static_cast<int>(limit_bytes_to_right));
    }
    // Update in/out parameter if the best match found was better
    // than any match already stored in *best_match.
    best_match->ReplaceIfBetterMatch(match_size,
                                     source_match_offset + starting_offset_,
                                     target_match_offset);
  }
}

未完，见下篇

Nginx gzip压缩、expires缓存时间 Sunrise清风 Nginx linux
原理:浏览器---请求---->声明可以接受gzip压缩或deflate压缩或compress或sdch压缩从http协议的角度看--请求头声明acceopt-encoding:gzipdeflatesdch(是指压缩算法,其中sdch是google倡导的一种压缩方式,目前支持的服务器尚不多)服务器-->回应---把内容用gzip方式压缩---->发给浏览器浏览80字节,而且压缩也是耗费CPU资源
Python解析html的几种操作方式？？？？？ python
解析html是爬虫后的重要的一个处理数据的环节。一下记录解析html的几种方式。先介绍基础的辅助函数，主要用于获取html并输入解析后的结束#把传递解析函数，便于下面的修改defget_html(url,paraser=bs4_paraser):headers={'Accept':'*/*','Accept-Encoding':'gzip,deflate,sdch','Accept-Languag
Request Headers 里面的 Accept 属性 monica888888 jsp 浏览器 http web服务器 servlet Request Headers 里面的
文章来源：https://tools.ietf.org/html/rfc7231#section-1.1例子：Accept:text/html,application/xhtm+xml,application/xml;q=0.9,image/webp,*/*;q=0.8Accept-Encoding:gzip,deflate,sdch,brAccept-Language:zh-CN,zh;q=0.
从python爬虫引发出的gzip,deflate,sdch,br压缩算法分析 asiwuy9180
今天在使用python爬虫时遇到一个奇怪的问题,使用的是自带的urllib库，在解析网页时获取到的为b'\x1f\x8b\x08\x00\x00\x00\x00...等十六进制数字，尝试使用chardet来检查编码格式时发现encoding为None,因为以前一直用的是requests库，所以没有仔细注意过这个问题，经过详细搜索后分析如下（下面代码是修改后加入gzip的）：转载注明http://w
用requests爬虫拒绝301/302页面的重定向而拿到Location(重定向页面URL)的方法 Mao_code python爬虫笔记
defyunsite():'url'headers={'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','Accept-Encoding':'gzip,deflate,sdch,br','Accept-Language':'zh-CN,zh;q=0.8','Connection
05_nginx之gzip压缩对方不想理你并向你抛出一个异常
gizp压缩官方文档http://nginx.org/en/docs/http/ngx_http_gzip_module.html网页内容的压缩编码与传输速度优化，我们观察news.163.com的头信息请求:Accept-Encoding:gzip,deflate,sdch响应:Content-Encoding:gzipContent-Length:36093再把页面另存下来,观察,约10W字节
如何将一个非ASCII编码的字典格式数据按照中文输入一个文件 Philosopher_
注意json的dump方法中的ensure_ascii参数的值:默认为True,这样输出所有非ASCII编码的时候,就会采用"u\xxxxx"的形式若改为False,则非ASCII编码的字符就会按照原本的字符形式输入importrequestsimportjsonheaders={'Pragma':'no-cache','Accept-Encoding':'gzip,deflate,sdch','
Ajax中的setRequestHeader设置请求头小※兽
Ajax中的setRequestHeader设置请求头1、问题引发点:前不久发现一个问题:前端并没有设置请求头信息里面的Accept-Encoding:gzip...但是在请求头中可以明显的看到Accept-Encoding:gzip,deflate,sdch,并且我尝试修改这个请求头，发现不生效；2、XMLHttpRequest对象提供了一个设置请求头的方法:setRequestHeader，对
对Python3 解析html的几种操作方式小结极客点儿
解析html是爬虫后的重要的一个处理数据的环节。一下记录解析html的几种方式。先介绍基础的辅助函数，主要用于获取html并输入解析后的结束#把传递解析函数，便于下面的修改defget_html(url,paraser=bs4_paraser):headers={'Accept':'*/*','Accept-Encoding':'gzip,deflate,sdch','Accept-Languag
Nginx中gzip配置 Fe_cow丿 Nginx
Nginx中gzip配置：一、作用：减少从服务器下载的文件和请求的资源大小，大幅提高页面加载速度。二、原理：浏览器------请求------->声明可以接收gzip压缩；或者deflate压缩；或compress压缩；或sdch压缩从http协议的角度看----请求头声明:acceopt-encoding:gzipdeflatesdch[是指压缩算法,其中sdch是google倡导的一种压缩方式
ajax中的setRequestHeader设置请求头 hong2511
原文地址为：ajax中的setRequestHeader设置请求头1、问题引发点:前不久发现一个问题:前端并没有设置请求头信息里面的Accept-Encoding:gzip...但是在请求头中可以明显的看到Accept-Encoding:gzip,deflate,sdch,并且我尝试修改这个请求头，发现不生效；2、XMLHttpRequest对象提供了一个设置请求头的方法:setRequestHe
python requests用url爬妹子套图保存在文件夹杀手binsen python爬虫
参考文章：http://cuiqingcai.com/3179.html代码可封装成函数，此仅为学习第一种：importrequestsheaders={'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','Accept-Encoding':'gzip,deflate,sdch'
Http--Header zlcook
Encoding请求：Accept-Encoding响应：Content-Encoding取值：gzip、deflate、sdch作用：对请求体和响应体进行压缩，压缩文本数据能减少带宽并加快显示速度。压缩的时间会远小于传输的时间，所以不用担心压缩。请求头响应头Connection请求：Connection响应：Connection取值范围：Keep-Alive、Close作用：Keep-Alive
使用Brotli提高网站访问速度 icyfire 前端优化前端性能
使用Brotli提高网站访问速度在优化网站打开速度上，我们有很多的方法，而其中一个就是减少诸如Javascript和CSS等资源文件的大小，而减少文件大小的方法除了在代码上下功夫外，最常用的方法就是使用压缩算法对文件进行压缩。目前，网站普遍使用的是gzip压缩算法，当然你可能还知道deflate和sdch算法，但是最近两年新兴了一个新的压缩算法：Brotli，下面我将会对这个算法进行简单的介绍。什
Python的验证码识别，模拟ajax请求，爬取优酷会员（滑稽） Recar Python 爬虫
首先想写一个爬取一个网站的优酷会员分享，但是是要输入验证码。首先，我用谷歌分析其验证码的请求。然后拼接url去访问发现做了限制那么应该是做了检测对请求头。复制刷新验证码图片的请求头。自己构造个请求，并写出图片defgetyzm():headers={'Accept-Encoding':'gzip,deflate,sdch','Accept-Language':'zh-CN,zh;q=0.8','C
Nginx启用GZIP压缩网页传输方法(推荐) kwinH
原理:浏览器―请求―->声明可以接受gzip压缩或deflate压缩或compress或sdch压缩从http协议的角度看�C请求头声明acceopt-encoding:gzipdeflatesdch(是指压缩算法,其中sdch是google倡导的一种压缩方式,目前支持的服务器尚不多)服务器�C>回应―把内容用gzip方式压缩―->发给浏览器浏览80字节,而且压缩也是耗费CPU资源的.比较小的文件
ajax中的setRequestHeader设置请求头暗语321
1、问题引发点:前不久发现一个问题:前端并没有设置请求头信息里面的Accept-Encoding:gzip...但是在请求头中可以明显的看到Accept-Encoding:gzip,deflate,sdch,并且我尝试修改这个请求头，发现不生效；2、XMLHttpRequest对象提供了一个设置请求头的方法:setRequestHeader，对应的jQuery可以再beforeSend回调里面设置
Python每日一练(3):爬取百度贴吧图片 weixin_30399821 python
importrequests,re#先把要访问URL和头部准备好url='http://tieba.baidu.com/p/2166231880'head={'Accept':'*/*','Accept-Encoding':'gzip,deflate,sdch','Accept-Language':'zh-CN,zh;q=0.8','Connection':'keep-alive'}#获取html
HTTP 协议之压缩 rnZuoZuo
注意：请求头中写了Accept-Encoding:gzip,deflate,sdch不代表返回的数据就一定是GZIP压缩的，需要服务器那边处理才可以（测试结论）HTTP压缩是指:Web服务器和浏览器之间压缩传输的”文本内容“的方法。HTTP采用通用的压缩算法，比如gzip来压缩HTML,Javascript,CSS文件。能大大减少网络传输的数据量，提高了用户显示网页的速度。当然，同时会增加一点点服
HTTP压缩算法SDCH socket
程序设计中使用的那些共享方法或者技术前段时间看了个paper是讲述谷歌浏览器使用的压缩方法SDCH，其实原理还是比较简单的。看了论文后就想总结一下程序中使用的一些共享方法或者技术吧。 1.Google最近发明的HTTP压缩算法SDCH 　　SDCH的全称是Shared Dictionary Compression over HTTP的简写。　　SDCH的基于以下的事实：　　
13 nginx gzip压缩提升网站速度 nginx
一：nginx gzip压缩提升网站速度我们观察news.163.com的头信息请求: Accept-Encoding:gzip,deflate,sdch 响应: Content-Encoding:gzip Content-Length:36093 再把页面另存下来,观察,约10W字节,实际传输的36093字节原因-------就在于gzip压缩上. 原理:
动态网站学习笔记（1）学习笔记
1. 为什么给一个URL发送的http请求里会有host这一项 Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Charset:GBK,utf-8;q=0.7,*;q=0.3 Accept-Encoding:gzip,deflate,sdch Accept-Language:zh-
Python 3 之 Chrom 截获的Headers转成dict格式 kinglearnjava
如题，直接复制Chrom截获的Headers如下：Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8 Accept-Encoding:gzip,deflate,sdch Accept-Language:zh-CN,zh;q=0.8 Connection:keep-alive Cookie
扒一扒各大电商网站的m站都用的什么前端技术输入日志标题前端
凡客首页使用Swiper和zepto，没有使用jquery ，静态首页+js交互，资源加载使用 lazyLoad X-AspNet-Version: 4.0.30319 X-AspNetMvc-Version: 3.0 X-Powered-By: ASP.NET Accept-Encoding: gzip, deflate, sdch
程序设计中使用的那些共享方法或者技术程序设计
前段时间看了个paper是讲述谷歌浏览器使用的压缩方法SDCH，其实原理还是比较简单的。看了论文后就想总结一下程序中使用的一些共享方法或者技术吧。 1.Google最近发明的HTTP压缩算法SDCH 　　SDCH的全称是Shared Dictionary Compression over HTTP的简写。　　SDCH的基于以下的事实：　　(1)在HTTP的传输文件之间有大量重复冗余
高性能web网站优化原则4——利用gzip压缩组件 jobar GZip
从HTTP/1.1开始，web客户端在http请求头Accept-Encoding里支持压缩技术 Accept-Encoding:gzip, deflate, sdch 如果服务器看到这个请求，就可以用客户端给定列表里面的压缩方法压缩响应数据，web服务器使用响应头Content-Encoding来通知客户端Conte
nginx gzip压缩提升网站速度 freedomai
观察news.163.com的头信息请求:Accept-Encoding:gzip,deflate,sdch响应:Content-Encoding:gzipContent-Length:36093再把页面另存下来,观察,约10W字节,实际传输的36093字节原因-------就在于gzip压缩上.原理: 浏览器---请求---->声明可以接受gzip压缩或deflate压缩或compress或sd
curl ywc
curl"https://www.google.com/"-H"accept-encoding:gzip,deflate,sdch"-H"accept-language:zh-CN,zh;q=0.8"-H"user-agent:Mozilla/5.0(Linux;Android4.2.1;en-us;Nexus5Build/JOP40D)AppleWebKit/535.19(KHTML,likeG
curl ywc
curl"https://www.google.com/"-H"accept-encoding:gzip,deflate,sdch"-H"accept-language:zh-CN,zh;q=0.8"-H"user-agent:Mozilla/5.0(Linux;Android4.2.1;en-us;Nexus5Build/JOP40D)AppleWebKit/535.19(KHTML,likeG
还以为SDCH是什么高端的东西， cteng 压缩 http sdch
原来不过是在服务器、客户端都存储一份相同的字典，用于压缩网站连续页面中相同的内容（比如header、footer、广告什么的）主要就是为了节省流程加快传输不过这实在没啥意思简直令人厌倦了
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

open-vcdiff流式编码过程分析（三）

你可能感兴趣的:(open-vcdiff,sdch)