提高分布式环境中程序启动性能的一个方法

假设在linux下,你有一个可执行文件,其依赖于100个动态库,而这100个动态库来自网络中不同的位置,甚至可能来自不同的region,即使网路用的是专用光纤,其网络延迟也不可忽视,那么在启动该可执行文件时发生了什么:

  • 100个rpath
  • 100个动态库

为了加载任意一个动态库,都需要在这100个rpath逐个寻找,假设其实一一对应,那么查找的次数为:1+2+3+...100=5050,在分布式的环境中,这个代价是非常大的(根据网络环境的不同,有的甚至能达到10分钟以上)。

但其实有个蛮简单的方法,可以完全消除这些无谓的查找:

把rpath设为只有一个entry,比如当前目录,然后把这个可执行文件所有的dependency,symblink到当前目录

这个想法简单,实现起来也可以很简单:

#!/bin/bash -e

test $1

for i in `ldd $1 | grep -o '/[^ ]*'`; do ln -fs $i; done
if test $1 != `basename $1`; then cp $1 .; fi
patchelf --set-rpath `pwd` `basename $1`

 

对于Windows,这个方法应该也是试用的,可以起一个runscript,或者叫做bootstrap的bat脚本,在里面设置PATH为当前目录,并就depenency创建link

你可能感兴趣的:(分布式)