Hadoop中Mapper类的setup()函数在什么地方调用

 

Hadoop中Mapper类的setup()函数在什么地方调用



分类: hadoop

装载自:http://blog.csdn.net/witsmakemen/article/details/8445133

经过跟踪hadoop源码发现,Mapper类的setup()函数在Mapper类的run()函数中被调用。

向hadoop提交job后,hadoop会在MapTask的runNewMapper()或者runOldMapper()函数中使用反馈机制实例化具体的Mapper子类,然后调用这个对象的run()函数,其中setup()函数就在这个函数的开始被调用,因为hadoop会向setup()函数中传递Configuration等一些变量,所以我们可以通过重载setup()函数来获得系统变量实现自己的功能。

[java]  view plain copy
  1. /** 
  2.  * Expert users can override this method for more complete control over the 
  3.  * execution of the Mapper. 
  4.  * @param context 
  5.  * @throws IOException 
  6.  */  
  7. public void run(Context context) throws IOException, InterruptedException {  
  8.   setup(context);//只运行一次,可以重载实现自己的功能,比如获得Configuration中的参数  
  9.   while (context.nextKeyValue()) {  
  10.     map(context.getCurrentKey(), context.getCurrentValue(), context);  
  11.   }  
  12.   cleanup(context);  
  13. }  

你可能感兴趣的:(hadoop,大数据)