论文Optimizing the Throughput of Data-Driven Peer-to-Peer Streaming读书笔记

论文Optimizing the Throughput of Data-Driven Peer-to-Peer Streaming读书笔记

    • 论文链接
    • 看这篇论文想解决的问题
    • 为什么要解决哪个block由哪个结点下载的问题
    • 笔记
    • 疑惑
    • 结论

论文链接

http://ieeexplore.ieee.org/document/4509427

看这篇论文想解决的问题

P2P时,确定某个block由哪个结点下载。
block: 会把视频文件分成一个个小片传输,这个小片就是block
结点: 用户。当大家同时观看同一视频时,可以分享视频数据,这时大家互为结点
P2P: peer to peer,大家看同一视频时,会互相分享视频数据文件,加快下载速度。不会碰你电脑上的其他文件,更不会泄漏隐私声明的,只是分享、也只能分享当前你在看的这个视频的数据!

为什么要解决哪个block由哪个结点下载的问题

  1. 大家播放进度不同,需要优先下离播放点近的视频数据
  2. 大家缓存了的视频时长不同
  3. 大家的网络状况存在差异
  4. 存在某个结点已经缓存了很多数据了,但还是一直向网络状况好的结点请求数据的情况。这里这个结点其实可以向网络状况差的结点请求数据,让网络状况好的结点给其他缓存数据少的结点提供数据
  5. 期望最大化数据分享率,节省运营商带宽成本

笔记

  1. 论文提出,在知道全局位图信息、带宽上限的情况下,可以把问题转化为 min-cost flow problem, 存在最优解。
  2. 但实际情况下,对于一个结点而言,无法知道全局信息。只知道自己相连结点的位图信息、带宽信息,这时用贪婪或LRF都不是最优解。
  3. LRF: Local rarest first, 稀缺优先。优先下最稀缺的block,即在所有相连结点中,对拥有某个block的结点进行计数,数量最小的block优先下,思想是尽量让稀缺的数据更快扩散开来。
  4. 不能知道全局最优,论文提出了HEURISTIC DISTRIBUTED ALGORITHM,这里之后就看不太懂了,之后都是猜测。
  5. 这里提出是,确定了两个结点间最优传输数据量,再用LRF(本来除了稀缺,还要考虑离播放点近不近这个因素,但似乎用实验数据证明了只需要考虑稀缺),就可以接近全局最优。而确定两个结点间最优传输数据量这个问题,取最近若干次速度平均值的若干倍。

疑惑

  1. 为什么能取之前的速度作为 最优传输数据量 呢?论文是这样说的
    This is because the data-driven protocol has the inherent ability to allocate the traffic to each neighbor and make full utilize of all bandwidths from every neighbor.
    data-driven 协议有能力分配出最大化利用带宽的方案。
  2. 什么是data-driven协议? 似乎就是BT协议……
  3. 如果一开始结点A给B提供数据,这是C进来了,A要给C数据,那C怎么能从B那里抢到带宽呢?
  4. 论文似乎没有解答以上问题,只是说data-driven协议能解决以上问题(但真的可以吗?怎么做到的呢?),然后算出每次请求时,某个结点要从相连结点请求多少的数据量,在这个数据量限制下(不是小于,也不是大于,是等于这个数据量),再做LRF,就能接近全局最优。

结论

如果无法解答,为什么data-driven协议能做到最大化带宽? 或者如何做到,那看这篇论文就没有参考价值了。 这是第一次为了工程而去读论文,但似乎不太顺利……

你可能感兴趣的:(计算机网络,读书笔记)