hzwfz1989

Memcached哈希性能优化(八)——总结报告

Memcached哈希性能优化报告

一、 Memcached分析

这两个月一直在memcached优化和找工作之间忙着，一边复习一边优化改代码还真是个让人觉得难以忘记的夏天。做这个项目确实收获了很多，不管是对Linux的系统的认识，还是对memcached的认识都比以前更近一步，另外后面由于添加分块hash，替换LRU算法和更改hash算法对源代码进行修改，一不小心就把原来的代码的测试改跪了，用gdb调试的能力也有所提升了。感觉这个项目还是蛮有价值的。

还是得把memcached简单介绍一下，毕竟后面的东西要用一下的来着。

1. 内存管理

首先这个内存指的是slab的内存管理，这个是memcached的一个主要特点，他所有的item的内存空间均是从slab管理的内存分配器中分配的。这个内存管理大致是以下这么几个要点

和一般的内存管理差不过, memcached从操作系统获取到一大块内存后, 便把这大块内存划分为各种大小的chunk块, chunk块大小按照比例逐渐递增，这个可以由用户来指定完成。
每个slabclass含有多个slab，一个slab是一个大小为1M的内存块，这个slab块的会被按照chunk块的大小进行分割进行分配。
从 slab管理器分配item的时候, 首先计算item的大小, 找到大小刚好大于等于某个chunk块size所在的slabclass,然后进行分配。
分配的逻辑很简单，如果有空闲的或是回收回来item的话，则直接分配从这个chunk块，否则尝试申请新的slab的然后进行分配，再要没有就只能返回NULL让LRU去替换了。

这种分配方式的缺点其实是蛮多的，举下面2个例子：

存在内存碎片, 比如说, 将48字节的item存储到一个64字节的 chunk, 就有16字节的内存浪费。
另外，由于slab是唯一的，必须采用slab_lock保证分配的原子性，也就是说如果多线程分配的话，如果cache_lock间冲突假设没有的话，到这个slab去申请内存的话也只能是单一的申请，所以决定了插入的过程的最终瓶颈就是这里了，而这里对内存的管理如果把他也分块的话导致后续的逻辑比较难处理，所以这个其实没有处理。

2. hash和LRU

hash和LRU这个东西memcached采用了最简单的设计方式，hash的实现采用的chain的实现，LRU是基于链表的实现，解构的图大概是下面这个样子的（原谅我的盗图行为图片来自百度百科）。

这个模型很经典，不管是链式hash还是LRU的双向链表的实现，不过存在下面几个问题

链式hash的实现很经典，但是由于是链表保存，数据的局部性很不好，所以内存的访问效率就会有所下降。
LRU的那个双向链表的实现，插入和读取都要调整item在LRU表中的位置，这2个操作明显需要上锁，其实读取本身不需要上锁的，但是要调整LRU的位置，所以没有办法在do_item_link和do_item_unlink中我们都能发现要上锁cache表。
如果采用开放寻址法使用的话，那么hash的查找效率可能就不高了，所以hash的效率还是极为关键的。

3. 线程模型

这个优化做的没关注这里，就这个我就列举以下建立流程。

初始化主线程event_base,和worker线程
建立worker线程的通知管道
注册worker线程管道的libevent事件
初始化每个worker的CQ队列
启动worker线程，主线程监听socket事件，worker线程监听socket的读写事件

如果有链接建立或者是运行的过程见这张图(图片来自http://bachmozart.iteye.com/blog/344172)，具体的代码分析就不列举了，今年这个blog都有的。

二、Memcached的优化内容

1. 分块hash优化

这个是这个样子的主要是为了能够多线程的读取和查找做优化使用，主要思路借鉴了下面这个文章的几个思路。"CPHASH: A Cache-Partitioned Hash Table",主要思路是下面两个

首先把hash表分块，每个分块由不同的线程进行处理，当然可以绑定到固定的核上去，这个有个memc3就是这个绑定的
每个hash块拥有有自己的LRU表和hash的表，分块由自己的LRU和hash表进行处理操作

这样读的效率肯定可以利用多核的优势，处理读的性能肯定可以上去，但是插入的效率是没有办法的，因为原因主要是出在了slab_lock这个上面，因为slab的分配显然不是可以并行的，因为slab的的分配由slab_lock进行处理，而这个由于上锁的原因，多个workerthread对应的只有一个slab分配器，那么可以肯定的说，插入的瓶颈没有办法通过多线程来解决，但是读可以采用多线程来提高读的效率的。所以这里分块hash主要是提升了读的性能。由于采用了分块hash的处理，那么使得有些item的逻辑就不是原来的那个了，具体的代码可以看clockdev那个branch上的的代码，那个分支是采用了clock替换和mulit－hash是这么做的。

2. clock算法优化

目的其实很单纯，牺牲命中率和淘汰次数，提高get的读写性能，尤其是多核的情况下这个Clock置换算法大致描述如下

　　1类(A=0, M=0): 表示该页最近既未被访问，又未被更新，是最佳淘汰页。
　　2类(A=0, M=1)：表示该页最近未被访问，但已被修改，并不是很好的淘汰页。
　　3类(A=1, M=0)：最近已被访问，但未被修改，该页有可能再被访问。
　　4类(A=1, M=1): 最近已被访问且被修改，该页可能再被访问。其执行过程可分成以下三步：
　　(1) 从指针所指示的当前位置开始，扫描循环队列，寻找A=0且M=0的第一类页面，将所遇到的第一个页面作为所选中的淘汰页。在第一次扫描期间不改变访问位A。
　　(2) 如果第一步失败，即查找一周后未遇到第一类页面，则开始第二轮扫描，寻找A=0且M=1的第二类页面，将所遇到的第一个这类页面作为淘汰页。在第二轮扫描期间，将所有扫描过的页面的访问位都置0。
　　(3) 如果第二步也失败，亦即未找到第二类页面，则将指针返回到开始的位置，并将所有的访问位复0。然后重复第一步，如果仍失败，必要时再重复第二步，此时就一定能找到被淘汰的页。

具体的实现的话采用下面的策略实现

只采用了时间进行标记，在update和get的时候记录下最新时间，在替换的时候检验这个时间是不是超期，如果超期则进行替换，如果没有超期就不替换。
为了能够支持循环查找，讲LRU的链表改成了双向的循环链表，同时添加hand指针，指向需要替换的元素，如果超期就替换，如果不超期则进行下一次尝试，如果失败的话，则就将这个元素替换出去
更新的过程中，不将元素放置到head处，只更新访问时间，这样的话就不用断掉链表，这样不用进行item _unlink和item_link的过程

这么做的话，get的性能确实可以上去，但是检查的过程中确实会降低部分的命中虑。

3. hash算法优化

采用了Hopscotch_hashing算法，其思路见这个wikihttp://en.wikipedia.org/wiki/Hopscotch_hashing。

这是一种线性探测hash算法的变形，主要目的是为了提高查询速度。原始的线性探测算法在key较多的情况下探测次数过多，而这个算法的目的其实就是减少探测的次数。

他的步骤主要是这么三个步骤：

首先检测映射到的bucket，看它是不是被占用，如果未被占用那就直接使用
如果已被占用，那么采用线性探测法探测到位置pos
如果pos的位置离bucket的位置大于给定的阈值H，那就调整这个上面的位置，使得这个H－1的bucket上出现空槽，如果没有空槽，resize哈希表然后再次进行尝试。

这个在最新的master上有所采用，不过性能好像不是很好，主要是expand hashtable的过程变得代价很大，而且expand的时机的选择变得更加的不确定，而且expand的过程中必须得上锁，期间几乎不能处理其他的请求，如果不expand bucket的话，可以有比较不错的处理性能的情况，所以这个过程和memc3的cuckoo hashing比较类似，它确实也舍弃了expand hash这个后台处理线程，看来线性探测法在这个expand上确实很难做到最优。

4. tag查询优化

这个主要是借鉴这个文章的“MemC3: Compact and Concurrent MemCache with Dumber Caching and Smarter Hashing”，找到了github上的项目，不过貌似编译完了运行不了，插入key貌似会报错(>_<),不过思路蛮好的

首先，另外采用一个hash函数计算算出一个1字节大小tag，直接保存在 hashtable 的对应item里面。
然后查找的时候，先比较tag是不是一致，如果一致，再去比较 key。

这样避免没必要的指针取地址的操作，而且当key很大时，比较key的代价其实还是蛮高的，而很多时候tag比较首先就会不满足了，因而就没必要再去解析这个key对应的内容了，而且如果key存储在另外的内存块里面很可能造成cache不命中，性能就不好了。这个也是前面hash算法优化的一个问题，尤其是碰撞的key又用链表链接在一起的时候，进而遍历历整个链表，最坏的情况下如果后续链表的节点都在不同的内存，性能那就更差了。

三、优化结果

主要是这么几个结论把，以前的blog上也写过部分的测试结果，现在统一描述以下。测试环境一台4核的pc，内存4G，2台24核工作站作为client使用进行测试。

client均采用48个线程进行读写工作

1. 测试pc单线程工作

这个测试的过程主要是测试上限，由于slab_lock的限制上限其实结果插入大约是每秒10万个操作，读取也在每秒11万操作

[OVERALL], RunTime(ms), 45906.0
[OVERALL], Throughput(ops/sec), 108917.52712063782
[INSERT], Operations, 4999968
[INSERT], AverageLatency(us), 428.84410700228483
[INSERT], MinLatency(us), 123
[INSERT], MaxLatency(us), 59953
[INSERT], 95thPercentileLatency(ms), 0
[INSERT], 99thPercentileLatency(ms), 1
[INSERT], Return=0, 4999968

2. 测试pc 8个线程工作

采用clock＋mulitihash：插入平均是每秒9万操作。

[OVERALL], RunTime(ms), 53169.0
[OVERALL], Throughput(ops/sec), 94039.15815606838[INSERT], Operations, 4999968
[INSERT], AverageLatency(us), 497.43873040787463
[INSERT], MinLatency(us), 120
[INSERT], MaxLatency(us), 156936
[INSERT], 95thPercentileLatency(ms), 0
[INSERT], 99thPercentileLatency(ms), 6
[INSERT], Return=0, 4999968

比较接近上限

采用原始的memcached：插入平均是每秒6万操作，

[OVERALL], RunTime(ms), 77420.0
[OVERALL], Throughput(ops/sec), 64582.381813484884
[INSERT], Operations, 4999968
[INSERT], AverageLatency(us), 722.7500804005145
[INSERT], MinLatency(us), 120
[INSERT], MaxLatency(us), 118476
[INSERT], 95thPercentileLatency(ms), 1
[INSERT], 99thPercentileLatency(ms), 12

采用2个client

采用clock ＋ mulithash： 2个读取是每秒20万操作,基本是单个client的叠加

采用原始的memcached： 2个读取是每秒20万操作，基本是单个client的叠加

而单个client的测试基本读取都是每秒11万操作

这个是clock ＋ multihash

[OVERALL], RunTime(ms), 167550.0
[OVERALL], Throughput(ops/sec), 119367.16204118174
[READ], Operations, 19959611
[READ], AverageLatency(us), 389.58720097300494
[READ], MinLatency(us), 94
[READ], MaxLatency(us), 58364
[READ], 95thPercentileLatency(ms), 0
[READ], 99thPercentileLatency(ms), 3

原始的能稍微差点，但是数量级差不多

[OVERALL], RunTime(ms), 168112.0
[OVERALL], Throughput(ops/sec), 118968.11649376607
[READ], Operations, 19960241
[READ], AverageLatency(us), 390.19616010648366
[READ], MinLatency(us), 97
[READ], MaxLatency(us), 166104
[READ], 95thPercentileLatency(ms), 0
[READ], 99thPercentileLatency(ms), 3

get的过程中中memcahed的所在pc的cpu的利用率均为能达到100%，但是client的cpu都已经是100%了，也就是说get的处理性能没有达到最高，但是在插入的过程中确实cpu的利用率在htop下看达到了100%，而且单个client的增加，处理的总数是会增加的，所以说get处理过程中2个client确实没有达到这个pc的处理的最高值，get的插入确实是没有办法检测出来，从htop的看到的cpu的利用率来说，clock+multihash能稍微高一点点，这个是测试的环境所限，确实无法测出2个实际的差距。但是在单机上有一个趋势就是采用multihash的办法在发端的线程提升的情况下，hash的效果下降不会太大，而原始的会跌落的比较明显。

四、总结

这次的memcached的开源夏令营也算是告一段路了，期间查询了不少资料，看了不少的paper和项目，从之前的bagLRU到后来的memC3，从开始研究乐观锁和多版本并发控制到后来去研究hash算法和lru算法之间的差异，从skiplist的算法优化到后来的结构的修改，中间试过不少办法，也走了一些弯路，但是发现探索的过程还是学到了许多的东西。不过中间的很多过程还是发现了自己很多不足的地方，希望能够能以此为基础，进一步提高自己的能力，另外，发现开源项目真的很不错，希望以后能继续研究和回馈开源项目。

飞桨携手第二届 GitLink 开源夏令营，邀你参与顶尖开源项目！飞桨PaddlePaddle paddlepaddle 开源人工智能
想参与顶尖开源项目开发？想熟悉开源社区参与流程？想获得资深导师指导和丰厚现金奖励？机会来啦！2016年9月，飞桨框架正式开源，其兼备易用性、高效性、灵活性和可扩展性等特点。如今，百度飞桨在中国深度学习平台市场中的综合份额跃居第一，已凝聚535万开发者，基于飞桨创建67万个模型，服务了20万家企事业单位。作为国内领先的开源深度学习平台，飞桨致力于让深度学习技术的创新与应用更简单。在飞桨框架建设中，除
飞桨携手第二届GitLink开源夏令营，邀你参与顶尖开源项目！飞桨PaddlePaddle paddlepaddle 开源人工智能
想参与顶尖开源项目开发？想熟悉开源社区参与流程？想获得资深导师指导和丰厚现金奖励？机会来啦！2016年9月，飞桨框架正式开源，其兼备易用性、高效性、灵活性和可扩展性等特点。如今，百度飞桨在中国深度学习平台市场中的综合份额跃居第一，已凝聚535万开发者，基于飞桨创建67万个模型，服务了20万家企事业单位。作为国内领先的开源深度学习平台，飞桨致力于让深度学习技术的创新与应用更简单。在飞桨框架建设中，除
飞桨携手第二届GitLink开源夏令营，邀你参与顶尖开源项目！ paddle百度人工智能
想参与顶尖开源项目开发？想熟悉开源社区参与流程？想获得资深导师指导和丰厚现金奖励？机会来啦！2016年9月，飞桨框架正式开源，其兼备易用性、高效性、灵活性和可扩展性等特点。如今，百度飞桨在中国深度学习平台市场中的综合份额跃居第一，已凝聚535万开发者，基于飞桨创建67万个模型，服务了20万家企事业单位。作为国内领先的开源深度学习平台，飞桨致力于让深度学习技术的创新与应用更简单。在飞桨框架建设中，除
GLCC 开源编程夏令营开营 — CloudWeGo 精选优质赛题等你来解答！ CloudWeGo 架构 golang
随着开源文化的普及，越来越多的高校开发者参与到了CloudWeGo开源社区的建设中来，也有越来越多的高校Contributors成为了社区发展的中流砥柱。为了更好地帮助高校开发者找到参与项目的方向，更有针对性、更有挑战性地参与到社区项目开发中，字节跳动基础架构团队的CloudWeGo开源项目精选了5个优质赛题，参与2022届Gitlink开源夏令营（GLCC）。01GLCC活动介绍GLCC是在CC
OpenMLDB新手入门开源介绍叶梨子数据库开源人工智能
10月开发者嘉年华，我正在参与「开源博客马拉松挑战」，点击链接1024开发者嘉年华了解活动详情。OpenMLDB项目开源地址：https://github.com/4paradigm/OpenMLDB与OpenMLDB结缘本人与OpenMLDB结缘源自于中科院开源之夏(OSPP)和GitLink开源夏令营，这俩个活动都是难度很高但性价比很高的开源活动，适合有一定程度开源经验的同学参与。其中活动群内
chinese-calender研究日志一（环境搭建与调试） stonxer 开源夏令营 linux ubuntu 日历 qt csdn
暑假打算参与下csdn的开源夏令营活动。提前准备下总是没错的。一直对linux感兴趣，这次就打算从ubuntukylin入手尝试一下。印象中农历日历好象是ubuntukylin挺好的一个软件。于是选择它研究一下。首先在https://code.launchpad.net/chinese-calendar上下载了源代码。用qtcreater打开chinese-calender.pro，qmake时便
chinese-calender研究日志二（indicator-datatime调试） stonxer linux 开源夏令营
暑假打算参与一次CSDN的开源夏令营。看到有好多Linux相关的项目，怎么也得试一下啊。UbuntuKylin提供的项目多和Linux下的应用软件有关，u盘助手，农历日历什么的。应该做出来挺有成就感的。先看了下资料较多的中国日历项目。两个解决方案，方案一是利用ubuntu自带的indicator-datatime入手，加入农历功能。于是果断下载了源码研究下。编译就遇到了问题。configure:e
2014年开源夏令营-android下使用libhackrf pagekpang hackrf 开源夏令营
完成libhackrf.so的编译之后，我们的android程序就可以通过libhackrf.so控制hackrf了。物理连接上，可以通过OTG线连接android设备和hackrf。libhackrf.so是动态库，android应用层需要通过JNI调用动态库，本文已简单FFT做为例子说一下android如何使用hackrf。HackrfTouch这个app，总体的功能是能够显示信号FFT谱线图
2014年开源夏令营-android下编译libusb和libhackrf pagekpang 开源夏令营 hackrf
libhackrf是上层应用程序操作hackrf的入口库，是软件操作硬件的中间件，在android上使用hackrf当然也需要使用libhackrf。操作系统与hackrf之间的通信是通过USB2.0完成的，libhackrf使用了libusb进行USB通信。android并没有自带libusb，所以我们需要自行编译。整体分为两个部分，首先是libusb的编译，然后是libhackrf的编译。li
CSDN开源夏令营基于Compiz的switcher插件设计与实现之熟悉switcher的功能(ccsm) B12040331 开源夏令营
因为要开发switcher插件，我们必须要熟悉switcher插件的功能。一.系统中提供的switcher功能按Alt+Tab组合键，就能看到效果，效果图如下：二.下载ccsm，使用ccsm里面提供的switcher功能下载ccsm方法：在终端输入sudoapt-getinstallcompizconfig-settings-manager，在这里面我们可以进行一些个性化的设置，实现一些特效，比如
CSDN开源夏令营百度数据可视化实践 ECharts（1）浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发百度 csdn Echarts ZRender 数据可视化
总体规划（1）选题：通过了解林峰老师的专题中国主要城市空气质量实况、中国经济十年时空漫游和中国人口流动大潮，涉及了人口、经济和民生等方面的内容，在这里我选择中国高考，作为我的切入点。高考，一个永恒的话题，是一场你我都值得经历的一场无硝烟的战争。有人曾说：每个高考的孩子都背负着几代人的希望，每个高考的背后都有众多关注的眼睛。人生能有几回搏？虽然失去了许多，但终究会收获很多。（2）题目2006-201
CSDN开源夏令营百度数据可视化实践 ECharts（8）浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发百度 ZRender 数据可视化 Echarts javascript
（1）前言首先谢谢林峰老师，继续接着第七篇提到的内容，CSS布局确实很累，感觉不好看了就的调整，总的看起来的高大上嘛，好了废话不再多说。今天主要就先讲解一个页面的内容，对于CSS布局后面讲会详细的介绍给大家。另外我写的搭配时间轴地图扩展被ECharts采用，http://echarts.baidu.com/doc/example/map19.html（2）总体内容专题包含有如下五块：1）大海战全程
CSDN开源夏令营百度数据可视化实践 ECharts（3）浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发
Echarts仪表盘这里主要讲一讲series（仪表盘）的用法，驱动图表生成的数据内容数组，数组中每一项为一个系列的选项及数据功能丰富，可以做出很漂亮的东西来。（1）首先讲一下仪表盘的基本属性其中最常用的属性：center圆心坐标，支持绝对值(px)和百分比,百分比计算min(width,height)*50%,radius半径大小，支持绝对值（px），百分比计算。radius：半径属性，可以调控
CSDN开源夏令营百度数据可视化实践 ECharts 11 （期末总结）浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发
CSDN开源夏令营百度数据可视化实践ECharts11（期末总结）致谢：CSDN开源夏令营马上就要结束了，随着ECharts专题列入百度ECharts官网，任务就算是基本完成了。再次谢谢林峰老师！回想两个月前听到CSDN要举办这个活动，第一感觉是非常棒，所有就积极看了看所有的项目，项目总体质量很棒，涉及的方面也很广，有云与大数据方面的、有前端与移动方面的、嵌入式与智能硬件方面的、其中linux方面
CSDN开源夏令营百度数据可视化实践 ECharts（8）问题分析浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发
ECharts问题描述：问题就是折线图上的点是显示的，有人问能不能一开始不显示，当你点击的时候或者是当鼠标移动到上面的时候，折线上的点才显示？如下图所示：分析：让折线上的点不显示可以让symbol属性为"none"。考虑到当点击的时候让折线上的点显示出来，那么可以再on事件中重新加载option事件。当click到折线关键点时候可以重新加载数据中symbol属性，设置成你想要的形状，并且一定要重新
CSDN开源夏令营百度数据可视化实践 ECharts（6）期中总结浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发
期中总结（1）首先感谢林峰老师的辛勤指导！！通过半个多月的培训，林峰老师讲解了ECharts总体框架和其中各个部分：图类、组件、接口、基础库的具有应用方法和应该把握的细节，并通过实际的例子熟悉和掌握各个控件。只有打牢基础才能正正的为下步的工作做好准备，熟练的属性代码的编程技巧，才能做出更好的专题。（2）第一次任务重点总结：要求：了解ECharts特性中列举的每一项特性，并能找到实例中的例子，并且在
CSDN开源夏令营百度数据可视化实践 ECharts（2）浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发
将ECharts引入项目中的几种详细方法讲解（1）打好基本功首先感谢林峰老师！给我们的悉心指导。我们之所以学习ECharts和Zrender图表组件，为了就是能够将图表应用到我们的实际情况中来，进而让图表的战士能给我们一种更加人性化的方式呈现给用户。所有我们必须熟悉ECharts中相关组件。下面的例子都以line为例。（2）将ECharts引入项目共有三种方式2.1)第一种方式-模块化包引入模块化
CSDN开源夏令营百度数据可视化实践 ECharts（4）浙商大机器学习实验室-凉水煮茶【开源夏令营】ECharts开发
ECharts知识点总结：在应用过程中总会遇到一些难以理解的概念和属性，这里就总结了一下比较难的知识点，方便理解概念，进而更好的掌握ECharts。（1）1.一个完整的option包含什么？可以归纳为几类？下图中颜色已经区分出了三类分别是：公共选项，组件选项，数据选项名称描述{color}backgroundColor全图默认背景，（详见backgroundColor），默认为无，透明{Array
CSDN开源夏令营百度数据可视化实践 ECharts（7）浙商大机器学习实验室-凉水煮茶【开源夏令营】
本周主要内容整体页面布局：基于CSS和javascript的页面布局（1）CSS简介CSS是能够真正做到网页表现与内容分离的一种样式设计语言。相对于传统HTML的表现而言，CSS能够对网页中的对象的位置排版进行像素级的精确控制，支持几乎所有的字体字号样式，拥有对网页对象和模型样式编辑的能力，并能够进行初步交互设计，是目前基于文本展示最优秀的表现设计语言。CSS能够根据不同使用者的理解能力，简化或者
开源夏令营《基于HackRF开发GPS信号仿真模拟器》工作总结（五） cylinder 开源夏令营
这周(08.04-08.10)主要是在学习GNURadio的使用，在GRC中试验了几个例子，用HackRF接收了WBFM信号，并利用octave来分析从GNURadio中获得的数据。这周主要解决的问题1、用HackRF接收WBFM信号利用HackRF接收无线广播FM信号，然后经过滤波器、WBFM接收解调器、重采样模块，最后由声卡进行播放，同时在频谱仪上显示频谱波形。整个流图如图1。其中，采样率设置
开源夏令营之JStorm Trident接口性能优化——开篇 cxz0593 开源夏令营
1碎碎念首先我实在太幸运了，被选中参与这次开源夏令营，看来名字像男生还是有一定好处的，以后生孩子一定要起一个可男可女的名字！然后在调研提案的过程中，才发现自己的导师是个多么牛气冲天的大神，一定要好好做项目，不辜负导师也对得起自己。下面进入正题，若有错误，求批评指正，感激不尽。2前期调研2.1Storm初识Storm：一个开源的处理海量数据的分布式实时计算系统。说到海量数据处理，很多人就会想到Had
我的开源夏令营——让人欢喜让人忧 B12040331 开源夏令营
看到“我的开源夏令营”征文活动已经好长时间了，一直在犹豫要不要参加，毕竟，我没有能成功的完成这次的项目，感觉没有什么脸面来写一篇感悟，纠结了很久，还是决定写下此文，与大家分享一下我这次的经历，希望后来者能从我失败的的经历中得到教训，以免重蹈覆辙。上学期末，浏览CSDN的快讯时，偶然发现这么一条消息，“开源夏令营”活动，看到这个，我很好奇，就点进去看了看，大致的了解了一下情况，感觉还挺有意思的。当时
学习不能急于求成 kohna 日常学习
今天我看到了CSDN的CSDN举办开源夏令营活动5000元奖金激励学生参与开源http://code.csdn.net/news/2820024当时很激动,,觉得我可以去试试...可是想想到自己没有team,自己连编程的门都没有入,无论是C或者是C++,或者是其它是语言,我都没有很好的掌握..我还没有学数据结构和各种算法..现在就去试,,我有什么资格去看呢..基础还没有够扎实..很多概念和定义都是
【开源夏令营第七周】lwip稳定性测试 hduffddybz 开源夏令营
一、lwip稳定性测试将龙芯2F笔记本作为TCPClient，开发板作为TCPServer笔记本构造随机长度（长度在1-1000之间）的随机字符串，TCPServer作为回显服务器利用单线程的阻塞模型，测试了3*24小时一切收发正常，发送420658个字符串，接收420658个字符串，平均来看一个字符串有0.5KB.Client端的测试代码如下：#include#include#include#i
值得赞扬的尝试与进步——CSDN开源夏令营第一印象 csdn
注：写这篇文章时我并未參加CSDN开源夏令营，也不确定是否会參加以及是否能參加上。欣闻CSDN举办了“CSDN开源夏令营”活动。第一感觉是CSDN作为活动的组织者是很值得称赞的。作为參加了Google Summer of Code的人，这里对照下CSDN开源夏令营和Google Summer of Code。纯粹是个人见解，仅供參考。开源组织在了解有这个活动后，第一反应是这不就是中国的
[开源夏令营][四] Docker remote API 之镜像篇 docker
列出镜像列出镜像，有两个可选參数，一个是all，一个是filter，all可选值有，0/False/false，1/True/true，默觉得0；filter是一个包括一个过滤对象的json，形式如‘{"dangling":["true"]}' GET /images/json 我们能够尝试请求一下 curl -s -XGET th
gnome-logs开发记录1--起源--Gnome开发记录亢松川开源项目 gnome gnome-logs
这个暑假一直想去做点项目去锻炼锻炼自己，毕竟自己算是一点开发经验都没有。六月份在csdn上看到了开源夏令营，就凭着自己的兴趣报了两个项目。一个是Ubuntu系统云备份增强服务，另一个是gnome-logs的五个bug修复。由于开发经验欠缺和个人能力的问题，两个项目都没有被选上。第一个项目准备的还算充分，查阅了一些资料，但还是对项目没有去深入地探究。第二个项目就更加没有去深入的研究，草草的写了开题报
我的开源夏令营——美丽的邂逅 sywcxx gnuradio GPS信号模拟器开源夏令营 HackRF
一切都缘起于那次参观。6月18日，我跟随我们学校的同学去参观了csdn总部。在这之前，对于csdn，我只知道有大牛的博客、有很多的程序段。每当编程遇到问题在网上搜索时，找出来的必有在csdn上的内容。那次去总部参观，见识了他们的很多大佬。但给我留下最深刻印象的却是最后介绍高校俱乐部的帅哥程序员。因为他提到了一个有意思的项目：开源夏令营。当时好像还没有完全上线，只是提到了这个活动。但却吸引了我的注意
开源夏令营《基于HackRF开发GPS信号仿真模拟器》终期汇报 sywcxx matlab gnuradio GPS信号模拟器 HackRF
目前的项目进展能够实现的功能有：1、在Matlab中完整运行数据生成部分功能，产生中频数据在Matlab中，依次读取某天的全部卫星星历、确定用户的状态（位置、速度和加速度）、依据时间计算卫星的状态（位置、速度和加速度）、确定卫星的可见性、计算传输时间、计算码相位、载波相位等参数、生成GPSL1C/A所用的NAV电文格式、完成了通道信息的生成。至此，数据生成部分全部实现，并能产生数据供接收机使用。2
开源夏令营之foldcolumn工具及解决方案（七）测试与总结 xhu_eternalcc 开源夏令营测试与总结 foldcolumn csdn开源夏令营
项目地址http://code.csdn.net/os_camp/16/proposals/65安装方法在https://code.csdn.net/xhu_eternalcc/foldcolumn下载源码，里面有tar/foldcolumn-xx.tar.gz，解压这个tar包：(1)首先安装unibreak库，在thirdparty目录下参考thirdparty/libunibrea
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出