Mapr与Mapr-FS工作(一)——块大小

在MAPR-FS文件被分成(类似于Hadoop的)通常,256 MB的默认。65,536个字节的任意倍数是一个有效的块大小,但正确地调整大小是很重要的:

  • 较小的块尺寸导致较大的地图的任务数量,这可能会导致较低的性能由于任务调度开销
  • 较大的块大小需要更多的内存来map任务的输出,它可以崩溃了JVM或添加显著垃圾收集的开销排序
    MAPR可以在以上的有300 MB每秒提供一个单一的数据流,使其能够使用比在股票Hadoop的大数据块。一般情况下,明智的做法是设置64 MB和256 MB之间的块大小。

块大小设置在目录级。文件继承包含它们的目录的块大小设置,因为这样做对哪些块大小尚未明确设定子目录。写的一个Hadoop的应用程序的任何文件,无论是通过文件API或通过NFS,使用由对所在的文件写入的目录设置中指定的块大小。如果更改写入文件后的目录中的块大小设置,该文件将保留旧的块大小设置。进一步的写入到文件将使用文件的现有块大小。

设置块大小

您可以设置块大小的方法有两种给定目录:

  • 改变块大小的属性。dfs_attributes文件在目录的顶层
  • 使用命令hadoop的MFS -setchunksize

例如,如果音量测试是NFS的安装在/ MAPR / my.cluster.com /项目/测试,您可以通过编辑文件中设置块大小为268,435,456字节/ MAPR / my.cluster.com /项目/测试/ 。dfs_attributes和设置CHUNKSIZE = 268435456。为了实现从同样的事情Hadoop的外壳,使用以下命令:

hadoop的MFS-setchunksize  268435456  / MAPR / my.cluster.com /项目/测试

你可能感兴趣的:(Mapr——开发)