zhaogezhuoyuezhao

Hadoop-0.20.0源代码分析(7)http://blog.csdn.net/shirdrn/article/details/4581666

 
    
 
 前面分析了与操作系统有关的Shell命令，它们用于与操作系统进行命令行方式的交互。在Hadoop中，自定义了FileSystem文件系统，这是基于Unix操作系统之上的文件系统，为了方便对FileSystem的管理，通过org.apache.hadoop.fs.FsShell类定义了对Hadoop FileSystem文件系统进行命令行方式管理的命令实现。
 先给出对Hadoop文件系统进行管理的命令实现类的继承层次关系：
 [java] view plaincopy
 ◦org.apache.hadoop.conf.Configured(implements org.apache.hadoop.conf.Configurable)  
      ◦org.apache.hadoop.fs.FsShell(implements org.apache.hadoop.util.Tool)  
           ◦org.apache.hadoop.hdfs.tools.DFSAdmin  
 
 
 由于DFSAdmin类是对HDFS分布式文件系统提供基于命令行的管理功能，这里先不对DFSAdmin进行分析，在后面分析HDFS实现的时候，进行详细分析理解。
 Configured就不用多说了，是Hadoop配置类的高层抽象。
 Tool接口支持命令行方式的处理，如果需要通过命令行方式来执行一定的任务，都可以实现该接口，通过该接口定义的run方法来运行命令行。由于它继承自Configurable 接口，使得实现Tool的接口可以对特定的待执行的任务进行详细配置，满足执行一个命令能够完成任务的要求。下面是接口的定义：
 [java] view plaincopy
 public interface Tool extends Configurable {  
   int run(String [] args) throws Exception;  
 }  
 
 
 在Hadoop中，Tool接口主要是为进行MapReduce并行计算而定义的，这里FsShell类实现了该接口，其实也是使得命令行执行与任务关联起来，通过执行命令行，而执行设置的待完成的任务。
 下面来看FsShell类的具体实现。
 既然，FsShell是与命令行有关的，那么我们就从其中对指定的命令实现的角度来看，分别对每个命令的实现进行阅读分析。在分析每个命令实现过程之前，先看一下该类中printUsage方法的执行，该方法能够打印出全部命令用法的信息，如下所示：
 [java] view plaincopy
 Usage: java FsShell  
            [-ls <path>]  
            [-lsr <path>]  
            [-du <path>]  
            [-dus <path>]  
            [-count[-q] <path>]  
            [-mv <src> <dst>]  
            [-cp <src> <dst>]  
            [-rm <path>]  
            [-rmr <path>]  
            [-expunge]  
            [-put <localsrc> ... <dst>]  
            [-copyFromLocal <localsrc> ... <dst>]  
            [-moveFromLocal <localsrc> ... <dst>]  
            [-get [-ignoreCrc] [-crc] <src> <localdst>]  
            [-getmerge <src> <localdst> [addnl]]  
            [-cat <src>]  
            [-text <src>]  
            [-copyToLocal [-ignoreCrc] [-crc] <src> <localdst>]  
            [-moveToLocal [-crc] <src> <localdst>]  
            [-mkdir <path>]  
            [-setrep [-R] [-w] <rep> <path/file>]  
            [-touchz <path>]  
            [-test -[ezd] <path>]  
            [-stat [format] <path>]  
            [-tail [-f] <file>]  
            [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]  
            [-chown [-R] [OWNER][:[GROUP]] PATH...]  
            [-chgrp [-R] GROUP PATH...]  
            [-help [cmd]]  
   
 Generic options supported are  
 -conf <configuration file>     specify an application configuration file  
 -D <property=value>            use value for given property  
 -fs <local|namenode:port>      specify a namenode  
 -jt <local|jobtracker:port>    specify a job tracker  
 -files <comma separated list of files>    specify comma separated files to be copied to the map reduce cluster  
 -libjars <comma separated list of jars>    specify comma separated jar files to include in the classpath.  
 -archives <comma separated list of archives>    specify comma separated archives to be unarchived on the compute machines.  
   
 The general command line syntax is  
 bin/hadoop command [genericOptions] [commandOptions]  
 
 
 非常清晰明了，FsShell所支持的命令行，及其该命令的可以设置的参数，都在上述列表中显示出来。
 另外，对于每个命令的帮助信息，都可以通过printHelp方法得到，例如，如果想要得到命令“ls”的帮助信息，调用printHelp("ls");即可。如果想要得到全部命令的帮助信息，只要给printHelp随便传入一个非命令字符串，如printHelp("hashyes3532333");，将打印出全部命令帮助信息，下面是一个帮助信息的片段：
 [xhtml] view plaincopy
 hadoop fs is the command to execute fs commands. The full syntax is:   
   
 hadoop fs [-fs <local | file system URI>] [-conf <configuration file>]  
     [-D <propertyproperty=value>] [-ls <path>] [-lsr <path>] [-du <path>]  
     [-dus <path>] [-mv <src> <dst>] [-cp <src> <dst>] [-rm <src>]  
     [-rmr <src>] [-put <localsrc> ... <dst>] [-copyFromLocal <localsrc> ... <dst>]  
     [-moveFromLocal <localsrc> ... <dst>] [-get [-ignoreCrc] [-crc] <src> <localdst>  
     [-getmerge <src> <localdst> [addnl]] [-cat <src>]  
     [-copyToLocal [-ignoreCrc] [-crc] <src> <localdst>] [-moveToLocal <src> <localdst>]  
     [-mkdir <path>] [-report] [-setrep [-R] [-w] <rep> <path/file>]  
     [-touchz <path>] [-test -[ezd] <path>] [-stat [format] <path>]  
     [-tail [-f] <path>] [-text <path>]  
     [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]  
     [-chown [-R] [OWNER][:[GROUP]] PATH...]  
     [-chgrp [-R] GROUP PATH...]  
     [-count[-q] <path>]  
     [-help [cmd]]  
   
 -fs [local | <file system URI>]:  Specify the file system to use.  
         If not specified, the current configuration is used,   
         taken from the following, in increasing precedence:   
             core-default.xml inside the hadoop jar file   
             core-site.xml in $HADOOP_CONF_DIR   
         'local' means use the local file system as your DFS.   
         <file system URI> specifies a particular file system to   
         contact. This argument is optional but if used must appear  
         appear first on the command line.  Exactly one additional  
         argument must be specified.   
 
 
 下面介绍每个命令的实现：
 ls与lsr命令
 执行ls命令，能够列出匹配指定Path下的全部文件，并且不递归列出子目录中文件；lsr能够列出指定Path下的所有文件，并且如果存在子目录，也会递归列出子目录中的文件。实现这两个命令的方法均为ls方法，如下所示：
 [java] view plaincopy
 /** 
  * 列出满足模式srcf的全部文件 
  * @param srcf 文件模式 
  * @param recursive 是否递归列出 
  */  
 private int ls(String srcf, boolean recursive) throws IOException {  
   Path srcPath = new Path(srcf);  
   FileSystem srcFs = srcPath.getFileSystem(this.getConf()); // 通过构造Path类实例，获取它所属的FileSystem文件系统  
   FileStatus[] srcs = srcFs.globStatus(srcPath); // 获取到文件系统srcFs中匹配srcPath模式的全部按照文件名称排好序的文件（不包括校验和文件），每个文件对应一个FileStatus  
   if (srcs==null || srcs.length==0) {  
     throw new FileNotFoundException("Cannot access " + srcf +  ": No such file or directory.");  
   }  
   boolean printHeader = (srcs.length == 1) ? true: false; // 两种情况：如果获取到一个文件FileStatus，表示只有一个目录或者文件，需要打印出列表头部信息；否则返回多个FileStatus，需要循环并递归遍历，不打印出列表头部信息  
   int numOfErrors = 0;  
   for(int i=0; i<srcs.length; i++) {  
     numOfErrors += ls(srcs[i], srcFs, recursive, printHeader); // 调用ls，递归列出文件  
   }  
   return numOfErrors == 0 ? 0 : -1;  
 }  
 
 
 实际上，执行ls命令真正实现执行的过程在重载的另一个方法ls中，如下所示：
 [java] view plaincopy
 private int ls(FileStatus src, FileSystem srcFs, boolean recursive, boolean printHeader) throws IOException {  
   final String cmd = recursive? "lsr": "ls"; // 根据recursive判断，是否递归列出文件，如果是则命令名称为lsr，否则命令为ls  
   final FileStatus[] items = shellListStatus(cmd, srcFs, src); // 调用shellListStatus方法，文件系统从srcFs中获取src中的全部FileStatus[]（如果src是文件而非目录，直接返回它自身）  
   if (items == null) {  
     return 1;  
   } else {  
     int numOfErrors = 0;  
     if (!recursive && printHeader) { // 如果指定不递归列出  
       if (items.length != 0) {  
         System.out.println("Found " + items.length + " items");  
       }  
     }  
       
     int maxReplication = 3, maxLen = 10, maxOwner = 0,maxGroup = 0; //   
   
     for(int i = 0; i < items.length; i++) {  
       FileStatus stat = items[i];  
       int replication = String.valueOf(stat.getReplication()).length(); // stat对应文件的replication因子  
       int len = String.valueOf(stat.getLen()).length(); // stat对应的文件的长度  
       int owner = String.valueOf(stat.getOwner()).length(); // stat对应的文件的属主数  
       int group = String.valueOf(stat.getGroup()).length(); // stat对应的文件属组数  
         
       if (replication > maxReplication) maxReplication = replication; // 有可能一个文件的副本数超过指定的最大replication因子值  
       if (len > maxLen) maxLen = len; // 超过文件最大长度的情况  
       if (owner > maxOwner)  maxOwner = owner; // 超过最大属主数   
       if (group > maxGroup)  maxGroup = group; // 超过最大属组数  
     }  
       
     for (int i = 0; i < items.length; i++) {  
       FileStatus stat = items[i];  
       Path cur = stat.getPath();  
       String mdate = dateForm.format(new Date(stat.getModificationTime())); // 格式化stat对应的文件的修改时间          
       System.out.print((stat.isDir() ? "d" : "-") +  stat.getPermission() + " "); // 输出stat对应文件权限信息：若是目录就以"d权限"格式输出，若是文件则以"-权限"格式输出  
       System.out.printf("%"+ maxReplication + "s ", (!stat.isDir() ? stat.getReplication() : "-")); // 输出stat对应文件最replication因子信息到输出流中  
       if (maxOwner > 0)  
         System.out.printf("%-"+ maxOwner + "s ", stat.getOwner()); // 输出stat对应文件的属主数到输出流中  
       if (maxGroup > 0)  
         System.out.printf("%-"+ maxGroup + "s ", stat.getGroup()); // 输出stat对应文件的属组数到输出流中  
       System.out.printf("%"+ maxLen + "d ", stat.getLen()); // 输出stat对应文件的最大长度信息到输出流中  
       System.out.print(mdate + " "); // 输出格式化的文件修改时间  
       System.out.println(cur.toUri().getPath()); // 输出stat对应文件的路径信息  
       if (recursive && stat.isDir()) { // 如果stat对应的是目录，而且要求递归列出  
         numOfErrors += ls(stat,srcFs, recursive, printHeader); // 递归调用ls  
       }  
     }  
     return numOfErrors;  
   }  
 }  
 
 
 lsr命令是递归列出满足给定模式的全部文件，也是基于上述方法实现的。
 通过上面的ls的实现可知，列出FileSystem文件系统中的数据，是通过获取到该文件系统中保存的文件的FileStatus实例，因为FileStatus描述了位于该文件系统中对应文件的详细信息，然后通过它来打印出文件类表（包含必要的文件属性信息）。
 du与dus命令
 du命令列出满足给定模式的全部文件对应的长度信息，dus执行后列出了满足给定模式的每个文件或目录的磁盘使用情况摘要信息，比du命令执行得到的结果信息要详细。
 du命令实现是通过du方法，如下：
 [java] view plaincopy
 void du(String src) throws IOException {  
   Path srcPath = new Path(src);  
   FileSystem srcFs = srcPath.getFileSystem(getConf()); // 获取到Path对应的FileSystem文件系统  
   Path[] pathItems = FileUtil.stat2Paths(srcFs.globStatus(srcPath), srcPath); // 调用：将从srcFs文件系统中获取到经过srcPath过滤的FileStatus[]转换为Path数组  
   FileStatus items[] = srcFs.listStatus(pathItems); // 根据得到的满足过滤条件的Path得到对应的FileStatus  
   if ((items == null) || ((items.length == 0) && (!srcFs.exists(srcPath)))){  
     throw new FileNotFoundException("Cannot access " + src + ": No such file or directory.");  
   } else {  
     System.out.println("Found " + items.length + " items");  
     int maxLength = 10;  
       
     long length[] = new long[items.length]; // length数组用来保存每个文件对应的长度信息  
     for (int i = 0; i < items.length; i++) {  
       length[i] = items[i].isDir() ?  
         srcFs.getContentSummary(items[i].getPath()).getLength() :   
         items[i].getLen(); // 若items[i]对应文件是目录，通过srcFs获取到其内容摘要信息的长度，若是普通文件，则得到其长度  
       int len = String.valueOf(length[i]).length();  
       if (len > maxLength) maxLength = len;  
     }  
     for(int i = 0; i < items.length; i++) { // 循环遍历  
       System.out.printf("%-"+ (maxLength + BORDER) +"d", length[i]); // 将每个文件或者目录的长度信息写入到流中  
       System.out.println(items[i].getPath());  
     }  
   }  
 }  
 获取文件信息的方式，基本上都是一致的，通过文件系统来得到对应文件的统计信息。dus命令实现通过dus方法，与上面的实现基本类似，与ds实现不同的是，从FileSystem文件系统中获取到的文件不管是目录还行普通文件，都获取到其摘要信息（对应org.apache.hadoop.fs.ContentSummary）的长度，最后返回执行结果。
 mkdir命令
 该命令根据跟定的字符串，创建该字符串标识的目录，实现方法为mkdir方法，实现比较简单易懂：
 [java] view plaincopy
 void mkdir(String src) throws IOException {  
   Path f = new Path(src);  
   FileSystem srcFs = f.getFileSystem(getConf());  
   FileStatus fstatus = null;  
   try {  
     fstatus = srcFs.getFileStatus(f);  
     if (fstatus.isDir()) { // 只有给定的src在文件系统中不存在时，才可以创建  
       throw new IOException("cannot create directory " + src + ": File exists");  
     }  
     else {  
       throw new IOException(src + " exists but " + "is not a directory");  
     }  
   } catch(FileNotFoundException e) {  
       if (!srcFs.mkdirs(f)) { // 通过调用文件系统srcFs的创建目录方法，执行目录的创建  
         throw new IOException("failed to create " + src);  
       }  
   }  
 }  
 touchz命令
 该命令创建一个空文件，大小为0，通过touchz方法实现，实现的原理也是，通过调用文件系统的create方法执行文件的创建，如下所示：
 [java] view plaincopy
 void touchz(String src) throws IOException {  
   Path f = new Path(src);  
   FileSystem srcFs = f.getFileSystem(getConf());  
   FileStatus st;  
   if (srcFs.exists(f)) {  
     st = srcFs.getFileStatus(f); // 尝试，是否能够从文件系统srcFs中获取到待创建文件的信息  
     if (st.isDir()) { // 如果该文件时一个目录，不能创建  
       throw new IOException(src + " is a directory");  
     } else if (st.getLen() != 0) // 如果该文件存在，并且文件不空，也不能创建  
       throw new IOException(src + " must be a zero-length file");  
   }  
   FSDataOutputStream out = srcFs.create(f); // 调用文件系统srcFs的create方法创建0长度新文件  
   out.close();  
 }  
 
 
 mv命令
 该命令是移动文件，并支持文件的重命名，在FsShell类中通过rename方法实现的。方法实现如下所示：
 [java] view plaincopy
 private int rename(String argv[], Configuration conf) throws IOException {  
   int i = 0;  
   int exitCode = 0;  
   String cmd = argv[i++];  // 提取出命令名称  
   String dest = argv[argv.length-1]; //命令行中最后一个参数  
   // 如果命令行指定了大于3个参数，最后一个一定是一个目录  
   if (argv.length > 3) {  
     Path dst = new Path(dest); // 创建目录  
     FileSystem dstFs = dst.getFileSystem(getConf()); // 得到该目录所在的文件系统dstFs  
     if (!dstFs.isDirectory(dst)) { // 如果文件系统dstFs中存在dst，而且它不是一个目录，出错  
       throw new IOException("When moving multiple files, " + "destination " + dest + " should be a directory.");  
     }  
   }  
   // 循环遍历多个输入源文件，也就是在命令名称与最后一个参数之间的参数字符串  
   for (; i < argv.length - 1; i++) {  
     try {  
       rename(argv[i], dest); // 调用：将每个源文件argv[i]移动到dest目录中  
     } catch (RemoteException e) {  
       // 移动文件过程中发生异常，由hadoop server返回，打印出错信息的第一行  
       exitCode = -1;  
       try {  
         String[] content;  
         content = e.getLocalizedMessage().split("/n");  
         System.err.println(cmd.substring(1) + ": " + content[0]);  
       } catch (Exception ex) {  
         System.err.println(cmd.substring(1) + ": " + ex.getLocalizedMessage());  
       }  
     } catch (IOException e) {  
       // 捕获异常  
       exitCode = -1;  
       System.err.println(cmd.substring(1) + ": " + e.getLocalizedMessage());  
     }  
   }  
   return exitCode;  
 }  
 
 
 接着，看一下上面调用的一个重载的rename方法，将一个文件进行移动和重命名操作：
 [java] view plaincopy
 void rename(String srcf, String dstf) throws IOException {  
   Path srcPath = new Path(srcf); // 源文件  
   Path dstPath = new Path(dstf); // 目的文件  
   FileSystem srcFs = srcPath.getFileSystem(getConf()); // 源文件系统  
   FileSystem dstFs = dstPath.getFileSystem(getConf()); // 目的文件系统  
   URI srcURI = srcFs.getUri(); // 源文件系统URI  
   URI dstURI = dstFs.getUri(); // 目的文件系统URI  
   if (srcURI.compareTo(dstURI) != 0) { // 文件移动只支持在同一个FileSystem文件系统之上进行  
     throw new IOException("src and destination filesystems do not match.");  
   }  
   Path[] srcs = FileUtil.stat2Paths(srcFs.globStatus(srcPath), srcPath); // 得到全部满足的Path  
   Path dst = new Path(dstf);  
   if (srcs.length > 1 && !srcFs.isDirectory(dst)) { // 输入源文件大于1个，如果目的文件不是目录，出错  
     throw new IOException("When moving multiple files, " + "destination should be a directory.");  
   }  
   for(int i=0; i<srcs.length; i++) { // 迭代输入源文件  
     if (!srcFs.rename(srcs[i], dst)) { // 调用文件系统srcFs的rename方法实现移动文件并重命名  
       FileStatus srcFstatus = null;  
       FileStatus dstFstatus = null;  
       try {  
         srcFstatus = srcFs.getFileStatus(srcs[i]);  
       } catch(FileNotFoundException e) {  
         throw new FileNotFoundException(srcs[i] +   
         ": No such file or directory");  
       }  
       try {  
         dstFstatus = dstFs.getFileStatus(dst);  
       } catch(IOException e) {  
       }  
       if((srcFstatus!= null) && (dstFstatus!= null)) { // 移动文件失败，捕获：输入源文件为目录，目的文件不是目录  
         if (srcFstatus.isDir()  && !dstFstatus.isDir()) {  
           throw new IOException("cannot overwrite non directory " + dst + " with directory " + srcs[i]);  
         }  
       }  
       throw new IOException("Failed to rename " + srcs[i] + " to " + dst);  
     }  
   }  
 }  
 可以看到，在FsShell类中定义的mv操作，不支持在不同的FileSystem文件系统之间进行文件的移动操作。
 rm与rmr命令
 rm命令是删除文件，rmr是递归删除给定目录的子目录中的 文件，实现方式和ls与lsr类似。也存在两个重载的delete方法实现rm与rmr命令，先看其中一个：
 [java] view plaincopy
 void delete(String srcf, final boolean recursive) throws IOException {  
   Path srcPattern = new Path(srcf); // 根据给定的srcf模式，构造一个Path  
   new DelayedExceptionThrowing() { // 延迟抛出执行该删除命令发生的异常信息  
     @Override  
     void process(Path p, FileSystem srcFs) throws IOException {  
       delete(p, srcFs, recursive); // 调用重载的delete方法，执行删除操作  
     }  
   }.globAndProcess(srcPattern, srcPattern.getFileSystem(getConf())); // 收集异常信息，以待命令执行完成后一起抛出  
 }  
 
 
 上面，实际上在org.apache.hadoop.fs.FsShell.DelayedExceptionThrowing类中定义的globAndProcess方法中，循环执行了重载的delete方法，也就是真正真正实现删除的delete方法。也就是说，每调用执行delete方法，能够删除一个指定的文件。该方法实现如下所示： 
 [java] view plaincopy
 private void delete(Path src, FileSystem srcFs, boolean recursive) throws IOException {  
   if (srcFs.isDirectory(src) && !recursive) { // src是目录，且指定不进行递归删除，报错  
     throw new IOException("Cannot remove directory /"" + src + "/", use -rmr instead");  
   }  
   Trash trashTmp = new Trash(srcFs, getConf()); // 构造一个回收站  
   if (trashTmp.moveToTrash(src)) { // 将src移动到回收站中（可能是文件或者目录）  
     System.out.println("Moved to trash: " + src);  
     return;  
   }  
   if (srcFs.delete(src, true)) { // 从文件系统srcFs中删除文件src  
     System.out.println("Deleted " + src);  
   } else {  
     if (!srcFs.exists(src)) { // 若删除失败，查找失败原因  
       throw new FileNotFoundException("cannot remove " + src + ": No such file or directory.");  
       }  
     throw new IOException("Delete failed " + src);  
   }  
 }  
 
 
 执行删除文件操作的时候，是将存在于FileSystem文件系统上的文件移动到Hadoop定义的回收站.Trash目录中。
 cat命令
 该命令取出全部满足给定模式的文件，并缓冲到标准输出流上。
 该命令实现的方法为cat方法，如下所示：
 [java] view plaincopy
 void cat(String src, boolean verifyChecksum) throws IOException {  
   Path srcPattern = new Path(src);  
   new DelayedExceptionThrowing() { // 延迟抛出执行命令捕获到的异常信息  
     @Override  
     void process(Path p, FileSystem srcFs) throws IOException {  
       if (srcFs.getFileStatus(p).isDir()) {  
         throw new IOException("Source must be a file.");  
       }  
       printToStdout(srcFs.open(p)); // 调用：执行命令  
     }  
   }.globAndProcess(srcPattern, getSrcFileSystem(srcPattern, verifyChecksum));  
 }  
 
 
 调用方法printToStdout真正执行命令，该方法实现如下所示：
 [java] view plaincopy
 private void printToStdout(InputStream in) throws IOException {  
   try {  
     IOUtils.copyBytes(in, System.out, getConf(), false); // 使用IOUtils工具类将in流拷贝到System.out流中  
   } finally {  
     in.close();  
   }  
 }  
 可以查阅IOUtils类中的具体实现。这里，先不对拷贝的具体实现进行分析，在后面会单独对涉及拷贝操作的实现进行详细分析。 
 stat命令
 该命令可以得到一个文件的详细统计信息，实现方法为stat方法，实现比较简单，不再累述。
 tail命令
 tail命令执行显示一个文件的最后1KB内容，在tail方法中实现，如下所示：
 [java] view plaincopy
 private void tail(String[] cmd, int pos) throws IOException {  
   CommandFormat c = new CommandFormat("tail", 1, 1, "f"); // 构造一个解析命令行参数的CommandFormat对象  
   String src = null;  
   Path path = null;  
   
   try {  
     List<String> parameters = c.parse(cmd, pos); // 解析cmd的参数  
     src = parameters.get(0); // 文件参数  
   } catch(IllegalArgumentException iae) {  
     System.err.println("Usage: java FsShell " + TAIL_USAGE);  
     throw iae;  
   }  
   boolean foption = c.getOpt("f") ? true: false; // 判断是否设置了-f选项  
   path = new Path(src);  
   FileSystem srcFs = path.getFileSystem(getConf()); // 获取到Path对应的文件系统  
   if (srcFs.isDirectory(path)) { // 若path是目录，出错  
     throw new IOException("Source must be a file.");  
   }  
   
   long fileSize = srcFs.getFileStatus(path).getLen(); // 计算path文件的长度  
   long offset = (fileSize > 1024) ? fileSize - 1024: 0; // 计算开始的偏移位置  
   
   while (true) {  
     FSDataInputStream in = srcFs.open(path); // 打开文件  
     in.seek(offset); // 定位到offset位置  
     IOUtils.copyBytes(in, System.out, 1024, false); // 将输入流in拷贝到Syste.out标准输出流中  
     offset = in.getPos(); // 重新设置开始偏移位置  
     in.close(); // 关闭输入流in  
     if (!foption) { // 如果没有设置-f选项，直接退出  
       break;  
     }  
     fileSize = srcFs.getFileStatus(path).getLen(); // 设置了-f选项，显示向文件path追加写入数据的起始位置  
     offset = (fileSize > offset) ? offset: fileSize;  
     try {  
       Thread.sleep(5000);  
     } catch (InterruptedException e) {  
       break;  
     }  
   }  
 }  
 setrep命令
 该命令是设置满足给定模式的文件的副本因子（replication factor）。不仅可以通过该类实现的setReplication方法对单个文件设置副本因子，也可以递归设置某个目录的所有文件的副本因子。实现设置副本因子的方法在该类中有多个，包括重载的方法，先队下面的方法来分析：
 [java] view plaincopy
 private void setReplication(String[] cmd, int pos) throws IOException {  
   CommandFormat c = new CommandFormat("setrep", 2, 2, "R", "w"); // 解析命令行  
   String dst = null;  
   short rep = 0; // 初始化副本因子  
   try {  
     List<String> parameters = c.parse(cmd, pos); // 从位置pos出开始，解析出命令行中的全部参数列表  
     rep = Short.parseShort(parameters.get(0)); // 第一个参数就是副本因子的值  
     dst = parameters.get(1); // 第二个参数是带设置副本因子的文件  
   } catch (NumberFormatException nfe) {  
     System.err.println("Illegal replication, a positive integer expected");  
     throw nfe;  
   }  
   catch(IllegalArgumentException iae) {  
     System.err.println("Usage: java FsShell " + SETREP_SHORT_USAGE);  
     throw iae;  
   }  
   
   if (rep < 1) { // 不能将副本因子设置为负数  
     System.err.println("Cannot set replication to: " + rep);  
     throw new IllegalArgumentException("replication must be >= 1");  
   }  
   
   List<Path> waitList = c.getOpt("w")? new ArrayList<Path>(): null; // 如果设置了-w选项，会将待设置副本因子完成的文件Path暂时缓存到列表ArrayList中  
   setReplication(rep, dst, c.getOpt("R"), waitList); // 调用重载的setReplication方法，设置副本因子  
   
   if (waitList != null) {  
     waitForReplication(waitList, rep); // 更新waitList中文件的块的副本因子信息  
   }  
 }  
 看一下重载的setReplication方法设置副本因子的实现过程：
 [java] view plaincopy
 void setReplication(short newRep, String srcf, boolean recursive, List<Path> waitingList) throws IOException {  
   Path srcPath = new Path(srcf);  
   FileSystem srcFs = srcPath.getFileSystem(getConf()); // 获取到srcf所在的文件系统srcFs  
   Path[] srcs = FileUtil.stat2Paths(srcFs.globStatus(srcPath), srcPath); // 得到满足srcf模式的全部Path文件  
   for(int i=0; i<srcs.length; i++) { // 对每一个Path数组srcs中的每一个文件Path设置副本因子  
     setReplication(newRep, srcFs, srcs[i], recursive, waitingList); // 调用另一个重载的setReplication方法进行副本因子的设置  
   }  
 }  
 继续看上面方法调用的setReplication方法，实现如下所示：
 [java] view plaincopy
 /** 
  * 该方法递归设置每个src及其子目录中文件的副本因子 
  */  
 private void setReplication(short newRep, FileSystem srcFs, Path src, boolean recursive, List<Path> waitingList) throws IOException {  
   if (!srcFs.getFileStatus(src).isDir()) { // 递归出口：如果src是一个普通文件（而非目录）  
     setFileReplication(src, srcFs, newRep, waitingList); // 调用setFileReplication方法设置文件src的副本因子  
     return;   
   }  
   FileStatus items[] = srcFs.listStatus(src); // 如果src是目录，获取该目录中所有的文件FileStatus数组  
   if (items == null) {  
     throw new IOException("Could not get listing for " + src);  
   } else {  
     for (int i = 0; i < items.length; i++) { // 分治思想：对每一个items[i]进行递归设置副本因子  
       if (!items[i].isDir()) {   
         setFileReplication(items[i].getPath(), srcFs, newRep, waitingList); // items[i]不是目录，调用setFileReplication方法设置副本因子  
       } else if (recursive) { // 如果指定recursive=true，且items[i]是一个目录  
         setReplication(newRep, srcFs, items[i].getPath(), recursive, waitingList); // 递归设置副本因子  
       }  
     }  
   }  
 }  
 上面方法调用了setFileReplication方法，设置一个非目录文件的副本因子，实现过程如下所示：
 [java] view plaincopy
 private void setFileReplication(Path file, FileSystem srcFs, short newRep, List<Path> waitList) throws IOException {  
   if (srcFs.setReplication(file, newRep)) { // 调用文件系统srcFs的设置副本因子的方法，设置副本因子  
     if (waitList != null) {  
       waitList.add(file); // 将设置副本因子完成的文件file加入到waitList列表  
     }  
     System.out.println("Replication " + newRep + " set: " + file);  
   } else {  
     System.err.println("Could not set replication for: " + file);  
   }  
 }  
 我们再回到最前面重载的setReplication方法，已经完成了设置副本因子的任务，然后需要执行waitForReplication(waitList, rep);语句。此时，全部需要设置副本因子的文件都已经缓存到waitList列表中，下面看调用该方法对waitList列表中的文件执行的操作：
 [java] view plaincopy
 /** 
  * 等待在waitList列表中的文件,所对应的每一个块的副本因子，都设置为指定的值rep 
  */  
 void waitForReplication(List<Path> waitList, int rep) throws IOException {  
   for(Path f : waitList) {  
     System.out.print("Waiting for " + f + " ...");  
     System.out.flush();  
   
     boolean printWarning = false; // 如果文件f对应的块超过rep，是否给出警告信息（需要减少块副本数量，直到等于rep）  
     FileStatus status = fs.getFileStatus(f); // 获取当前文件系统fs上文件f对应的FileStatus信息  
     long len = status.getLen(); // 文件f的长度  
   
     for(boolean done = false; !done; ) {  
       BlockLocation[] locations = fs.getFileBlockLocations(status, 0, len); // 在当前fs上获取文件f对应的全部块的位置信息对象（一个数组）  
        int i = 0;  
       for(; i < locations.length && locations[i].getHosts().length == rep; i++)  {  // 遍历文件f的每个块  
         if (!printWarning && locations[i].getHosts().length > rep) { // 如果文件f的某个块的位置信息locations[i]中，主机列表长度（其实就是副本因子的值）大于待设置的副本因子rep  
           System.out.println("/nWARNING: the waiting time may be long for " + "DECREASING the number of replication."); // 打印警告信息，需要适当删除该块副本，以满足副本因子要求  
           printWarning = true; // 对于同一个文件f，只打印一次警告信息（如果满足f中的条件时）  
         }  
       } // for  
       done = i == locations.length; // 对文件f对应的块都检查过以后，设置检查完成标志done  
       if (!done) { // 没有经过上述检查（文件f对应的块副本小于0的情况下）  
         System.out.print(".");  
         System.out.flush();  
         try {Thread.sleep(10000);} catch (InterruptedException e) {}  
       }  
     }  
   
     System.out.println(" done");  
   }  
 }  
 
 
 这里，有必要了解一下org.apache.hadoop.fs.BlockLocation的含义，可以看BlockLocation类定义的属性，如下所示：
 [java] view plaincopy
 private String[] hosts; //hostnames of datanodes  
 private String[] names; //hostname:portNumber of datanodes  
 private String[] topologyPaths; // full path name in network topology  
 private long offset;  //offset of the of the block in the file  
 private long length;  
 
 
 可见，一个BlockLocation包含了一个文件的一个块的详细信息，包括这个块对应的全部副本（包含它本身） ，比如上述定义的有：所在主机、所在主机及其端口号、在网络拓扑结构中的全路径名称、块在文件中的偏移位置、块长度。显然，这些块副本长度和在文件中的偏移位置都是相同的，可以共享（分别对应length和offset属性），其他三个属性的信息就不相同了（可能存在某两个相同的情况）。
 Hadoop文件系统中，一个文件对应多个块（Block），每个块默认大小设置为64M。那么，对于由多个块组成的文件来说，如果想要获取到该文件的全部块及其块副本的信息，就需要通过文件系统中文件的统计信息FileStatus来获取到一个BlockLocation[]，该数组中对应的全部快就能够构成完整的该文件。
 下面通过形式化语言来表达一下上面的含义：
 假设一个文件F由n个块组成，则分别为：
 B(1)，B(2)，……，B(n)
 假设默认块的大小为BS，那么B(1)~B(n-1)一定是大小相同的块，大小都等于BS，而B(i)<=BS，这是显而易见的。
 文件F的每个块B(i)都被存储在指定主机的文件系统中，假设存储到了主机H(i)上。为了快速计算，需要快速定位到文件F的Bi块上，也就是需要进行流式读取获取到，那么F的块B(i)需要有一个记录其详细信息的结构，也就是Hadoop定义的BlockLocation。假设Bi对应的描述信息对象为BL(i)，那么BL(i)就包含了与块B(i)相关的全部块副本的信息，当然每个块副本同样包含与BL(i)，相同的描述信息的属性，只是属性值不同而已。
 假设文件F对应的块B(i)一共具有m个副本：
 BR1(i)，BR2(i)，……，BRm(i)
 这些块副本分别存储在对应如下的主机上：
 H1(i)，H2(i)，……，Hm(i)
 这些块副本分别对应指定主机的端口号分别如下：
 H1(i):P1(i)，H2(i):P2(i)，……，Hm(i):Pm(i)
 这些块副本对应的拓扑网络中的完整路径分别为：
 U1(i)，U2(i)，……，Um(i)
 假设块Bi的长度为LENGTH(i)，偏移位置为OFFSET(i)，那么，通过该文件的FileStatus获取的BlockLocation[i]的内容，形式化的可以描述为：
 [java] view plaincopy
  new BlockLocation[]{  
                       new  String[m]{H1(i), H2(i), ……, Hm(i)},  
                       new  String[m]{H1(i):P1(i), H2(i):P2(i), ……, Hm(i):Pm(i)},  
                       new  String[m]{U1(i), U2(i), ……, Um(i)},  
                       LENGTH(i),  
                       OFFSET(i)  
 }  
 关于获取到一个文件（对应的FileStatus）的BlockLocation[]，可以看到FileSystem类中getFileBlockLocations方法的实现，如下所示：
 [c-sharp] view plaincopy
 public BlockLocation[] getFileBlockLocations(FileStatus file, long start, long len) throws IOException { // 根据文件F对应的FileStatus，及其位置start和长度信息len就能获取到  
   if (file == null) {  
     return null;  
   }  
   
   if ( (start<0) || (len < 0) ) {  
     throw new IllegalArgumentException("Invalid start or len parameter");  
   }  
   
   if (file.getLen() < start) {  
     return new BlockLocation[0];  
   
   }  
   String[] name = { "localhost:50010" };  
   String[] host = { "localhost" };  
   return new BlockLocation[] { new BlockLocation(name, host, 0, file.getLen()) };  
 }  
 
 
 上面这个方法只能获取到本机上的一个块。如果在Hadoop分布式文件系统中，这个方法就需要被重写了，使得通过客户端能够获取到指定文件的块，在不同主机上分布的块副本。 
 分享到： 
 上一篇：Hadoop-0.20.0源代码分析（06）
 下一篇：Hadoop-0.20.0源代码分析（08）
 
 
 查看评论
 
 
   暂无评论
 
 
 发表评论
 用 户 名：
 zhaogezhuoyuezhao
 评论内容：
 
 
 
 
   
 * 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
 
 
 个人资料
   
 shirdrn
 
 
 访问：68429次
 积分：1361分
 排名：第4117名
 原创：65篇转载：0篇译文：0篇评论：47条
 文章分类
 Open Source(36)
 Database(2)
 Workflow(10)
 Java(10)
 C/C++(2)
 Python(2)
 Data Mining(1)
 Servers(2)
 文章存档
 2012年02月(1)
 2012年01月(4)
 2011年12月(11)
 2011年11月(1)
 2011年10月(1)
 展开
 阅读排行
 Hadoop-0.20.0源代码分析（0... (5446)
 Activiti 5.3安装配置 (3477)
 Hadoop-0.20.0源代码分析（0... (2538)
 Hadoop-0.20.0源代码分析（0... (2180)
 Hadoop-0.20.0源代码分析（0... (2157)
 在Linux单机上运行Hadoop-0.... (2111)
 Hadoop-0.20.0源代码分析（... (2057)
 Hadoop-0.20.0源代码分析（0... (1999)
 Hadoop-0.20.0源代码分析（1... (1772)
 Hadoop-0.20.0源代码分析（1... (1695)
 最新评论
 基于Solr 3.5搭建搜索服务器
 liyueling: 学习中受教
 Hadoop-0.20.0源代码分析（03）
 liumg12345: 你这一系列源码分析很好 顶一个
 在Linux单机上运行Hadoop-0.20.0实例
 huer0625: 楼主谢谢，刚刚我也遇到类似问题。
 基于Solr 3.5搭建搜索服务器
 chunming8302: 要很多包。
 基于Solr 3.5搭建搜索服务器
 chunming8302: 好东西,试一下。
 MongoDB基本管理命令
 XuyfLy: 拜读，学习了。谢谢！
 Spring+JMS+ActiveMQ+Tomcat实现消息服务
 shirdrn: @c477986083:注意这里只是一个demo，意在说明消息服务。例如，你向外部提供服务，可能需要...
 Spring+JMS+ActiveMQ+Tomcat实现消息服务
 c477986083: 为什么要这样实现发送消息，这样比传统的方式有什么好处！
 基于Lucene多索引进行索引和搜索
 shirdrn: @cp19861214xy:你的数据怎么分布，只有你最清楚。你是如何把数据索引到对应的目录中的，更新...
 使用Solrj管理Solr索引
 helei123a: 最近刚学solr，十分受用，希望搞个项目实战。包在solr下面的lib里，记得加slf4j-nop，...
  
 公司简介|招贤纳士|广告服务|银行汇款帐号|联系方式|版权声明|法律顾问|问题报告
 北京创新乐知信息技术有限公司 版权所有, 京 ICP 证 070598 号
 世纪乐知(北京)网络技术有限公司 提供技术支持
 江苏乐知网络技术有限公司 提供商务支持
  Email:[email protected]
 Copyright © 1999-2011, CSDN.NET, All Rights Reserved
 
  

你可能感兴趣的:(java,String,File,Path,DST,代码分析)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户