中了名为cache-oblivious的毒 -_-

中了名为cache-oblivious的毒 -_-_第1张图片
Paste_Image.png

笨人学到一个高大上的东西,结果就是花费无限的时间还是学不明白。。。
比如我听说了cache-oblivious(CO)这么个概念,然后就吭哧吭哧费了快两星期了还是没搞懂。。。

基本思想就是在不知道缓存块大小(在分析中设为B)的model下,怎么能得到能和知道大小的model(Disk-Access-Model)想媲美的算法和数据结构呢?

一开始发现扫描还是很高效的,即便不知道块的大小,我扫描N个元素的话,就认为即使不知道块的大小也可以只用 N/B 次块读取就能搞定。

后面就开始鬼畜起来了。基本想法就是依靠分形,或者说递归的数据结构。把一个结构打碎,然后把渣渣按一定的顺序排列,然后只要base case的渣渣可以扫描了,整个结构就相当于按顺序排列了。这样就能保证高效了。

思想很简单,算法和结构是真难啊。给跪了。
虽然还没搞明白,先扯扯淡吧。
1,coarsen base case
因为数据结构是递归的,所以存在base case的数据结构,一般默认为一个元素的结构。但是在实际中,递归到一个元素显然是不经济的。可以把递归的结构想象成递归方法算fib,递归到1显然巨慢无比。
一般进行CO分析都默认 MT(B) = O(1),所以coarsen时,可以把这个B想象成离CPU最近的cache(L1或者L2)的缓存块的大小。然后在base-case,造一个大小为B的特殊结构。

2,理论上最优,不一定实际中跑的最快
图拷贝自http://users-cs.au.dk/gerth/emF03/slides/cacheoblivious.pdf
原作者保留一切权利。

中了名为cache-oblivious的毒 -_-_第2张图片
Paste_Image.png

中了名为cache-oblivious的毒 -_-_第3张图片
Paste_Image.png

vEB layout 里,每往下跳一部都是个递归,很费时。
估算一下,不一定对:logN+1/2log(N)+1/4log(N)+... = O(log(N)),好吧,只差一个常数,不过DFS就是Log(N),看来常数不小啊。。。把缓存的优势都搭进去了。
要优化那个递归可以用indirection(memoize base case),这里可以用indirection是因为CO的东西都是递归的嘛,跟分型似的,里面长的都一样。

就扯这么多,毕竟还没学明白呢。。。
丢链接

https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-046j-design-and-analysis-of-algorithms-spring-2015/lecture-videos/lecture-23-cache-oblivious-algorithms-medians-matrices/
(memory hierarchy,def of External memory model,def of cache oblivious model,
why cache-oblivious,scanning,divide & conquer,Median finding,Matrix Multi)

https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-046j-design-and-analysis-of-algorithms-spring-2015/lecture-videos/lecture-24-cache-oblivious-algorithms-searching-sorting/
(introducing c-o searching and sorting,vEB layout,didn't show exactly how to do them,see them in 6.851)

https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-851-advanced-data-structures-spring-2012/lecture-videos/session-7-memory-hierarchy-models/
(recap mem heirarchy,EMM results,introducing CO model
showing how to make CO B-tree with 5 topics
1,order file maintenance as a black box
2,put a static vEB layout full BST upon ordered file
3,how to update
4,update analysis,finding that it need impovment by a lgN factor
5,using indirection to speed up a lgN factor)

https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-851-advanced-data-structures-spring-2012/lecture-videos/session-8-cache-oblivious-structures-i/
https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-851-advanced-data-structures-spring-2012/lecture-videos/session-9-cache-oblivious-structures-ii/
https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-172-performance-engineering-of-software-systems-fall-2010/video-lectures/lecture-8-cache-efficient-algorithms/
http://users-cs.au.dk/gerth/emF03/slides/cacheoblivious.pdf
https://github.com/lwu/veb-tree
https://www.youtube.com/results?search_query=cache+oblivious
http://www.cs.cornell.edu/courses/cs612/2005sp/papers/thesis.pdf
http://tudr.thapar.edu:8080/jspui/bitstream/10266/1667/1/Ritika%28800932017%29.pdf
http://www.itu.dk/people/pagh/papers/cohash.pdf

你可能感兴趣的:(中了名为cache-oblivious的毒 -_-)