Hadoop中Mapper类的setup()函数在什么地方调用

经过跟踪hadoop源码发现,Mapper类的setup()函数在Mapper类的run()函数中被调用。

向hadoop提交job后,hadoop会在MapTask的runNewMapper()或者runOldMapper()函数中使用反馈机制实例化具体的Mapper子类,然后调用这个对象的run()函数,其中setup()函数就在这个函数的开始被调用,因为hadoop会向setup()函数中传递Configuration等一些变量,所以我们可以通过重载setup()函数来获得系统变量实现自己的功能。

/** 
 * Expert users can override this method for more complete control over the 
 * execution of the Mapper. 
 * @param context 
 * @throws IOException 
 */  
public void run(Context context) throws IOException, InterruptedException {  
  setup(context);//只运行一次,可以重载实现自己的功能,比如获得Configuration中的参数  
  while (context.nextKeyValue()) {  
    map(context.getCurrentKey(), context.getCurrentValue(), context);  
  }  
  cleanup(context);  
}  

你可能感兴趣的:(hadoop)