shirdrn

Hadoop-0.20.0源代码分析（16）

这里对与org.apache.hadoop.hdfs.server.namenode.FSDirectory类相关的类进行阅读分析。

INodeDirectoryWithQuota类

该类org.apache.hadoop.hdfs.server.namenode.INodeDirectoryWithQuota的继承层次关系如下所示：

◦org.apache.hadoop.hdfs.server.namenode.INode(implements java.lang.Comparable<byte[]>) ◦org.apache.hadoop.hdfs.server.namenode.INodeDirectory ◦org.apache.hadoop.hdfs.server.namenode.INodeDirectoryWithQuota

1、INode抽象类

该类是一个保存在内存中的file/block层次结构，一个基本的INode包含了文件和目录inode的通用域（Field）。下面看INode类定义的属性：

protected byte[] name; // 名称 protected INodeDirectory parent; // 所在目录 protected long modificationTime; // 修改时间 protected long accessTime; // 访问时间 private long permission; // 权限，只能调用updatePermissionStatus方法设置权限

INode类提供的构造方法如下所示：

protected INode() { // 受保护构造方法，子类可以继承（初始化INode的属性值） name = null; parent = null; modificationTime = 0; accessTime = 0; } INode(PermissionStatus permissions, long mTime, long atime) { // 根据指定权限创建INode this.name = null; this.parent = null; this.modificationTime = mTime; setAccessTime(atime); setPermissionStatus(permissions); // 设置权限：包括用户名、组、FsPermission信息 } protected INode(String name, PermissionStatus permissions) { // 受保护构造方法 this(permissions, 0L, 0L); setLocalName(name); } /** * 通过拷贝构造INode实例 */ INode(INode other) { setLocalName(other.getLocalName()); this.parent = other.getParent(); setPermissionStatus(other.getPermissionStatus()); setModificationTime(other.getModificationTime()); setAccessTime(other.getAccessTime()); }

INode类主要就是针对一个INode的名称、所在目录、修改时间、访问时间、权限这些属性来实现操作的，该类中的方法无非实现对这些属性的操作。另外还包括删除该INode，其它几个抽象方法，如下所示：

/** * 检查该INode是否是一个目录 */ public abstract boolean isDirectory(); /** * 收集该INode的所有块（包括该INode的孩子结点），并清除全部对该INode的引用 */ abstract int collectSubtreeBlocksAndClear(List<Block> v); /** * 计算摘要信息，返回数组包含如下内容： * 0: 内容摘要长度, 1: 文件数量, 2: 目录数量 3: 磁盘空间 */ abstract long[] computeContentSummary(long[] summary); /** * 获取以该INode为根的磁盘空间与命名空间统计信息 * 其中，DirCounts包含nsCount (namespace consumed)和dsCount (diskspace consumed)两个计数器变量 */ abstract DirCounts spaceConsumedInTree(DirCounts counts);

2、INodeDirectory类

INodeDirectory类是一个目录INode，因此该类内部定义了一个INode列表。该类定义的属性如下：

protected static final int DEFAULT_FILES_PER_DIRECTORY = 5; // 一个目录INode中默认可以存储5个文件 private List<INode> children; // 以该目录INode为根的INode实例列表

可以想象得到，作为一个目录，应该提供从目录中检索得到指定的INode的操作，还有就是对引用该INode的INode进行的一些基本操作。这里就不过多阐述了，可以阅读该类的源代码。

3、INodeDirectoryWithQuota类

INodeDirectoryWithQuota类继承自INodeDirectory类，INodeDirectoryWithQuota类表示具有配额限制的目录INode实现类。我们通过该类中定义的一些与配额有关的属性就能了解到这样一种目录INode有什么样的特点：

private long nsQuota; // 命名空间配额限制 private long nsCount; // 命名空间大小 private long dsQuota; // 磁盘空间配额限制 private long diskspace; // 磁盘空间大小

INodeFileUnderConstruction类

该类的继承层次关系如下所示：

◦org.apache.hadoop.hdfs.server.namenode.INode(implements java.lang.Comparable<byte[]>) ◦org.apache.hadoop.hdfs.server.namenode.INodeFile ◦org.apache.hadoop.hdfs.server.namenode.INodeFileUnderConstruction

其中，INode类前面已经介绍了，它是一个目录或者文件的INode的抽象。

1、INodeFile类

该类表示一个文件INode，正好与目录INode相对应。因为我们已经阅读分析过目录INode的实现，对该文件INode的实现就比较简单了。看该类的属性：

static final FsPermission UMASK = FsPermission.createImmutable((short)0111); // 文件INode默认权限 protected BlockInfo blocks[] = null; // 块的元数据信息实体的数组 protected short blockReplication; // 块副本数 protected long preferredBlockSize; // 块大小

该类定义了如下几个基本的操作：

/** * 将块加入到列表blocks中 */ void addBlock(BlockInfo newblock); /** * 为该文件设置块副本数 */ void setReplication(short replication); /** * 根据索引位置和块（属于该文件）设置该文件中该块 */ void setBlock(int idx, BlockInfo blk);

对应的set方法，也存在get实现。

可见，一个INodeFile类实例是不持有任何客户端或者Datanode信息的，就是一个基本的实在的文件。因为在HDFS集群中需要执行计算任务，这要涉及到块的复制等操作，而某些块需要由Namenode调度分派给指定的进程去执行，这就需要一种实体类，既能够包含INodeFile的基本信息，又能够包含与在该INodeFile上执行操作的进程，所以，Hadoop实现了一个INodeFileUnderConstruction类，并在INodeFile类中实现了由INodeFile到INodeFileUnderConstruction的转换，如下所示：

INodeFileUnderConstruction toINodeFileUnderConstruction(String clientName, String clientMachine, DatanodeDescriptor clientNode) throws IOException { if (isUnderConstruction()) { // 如果该INodeFile已经被创建 return (INodeFileUnderConstruction)this; // 转换为INodeFileUnderConstruction实例 } // 如果该INodeFile没有创建，则直接构造一个INodeFileUnderConstruction实例 return new INodeFileUnderConstruction(name, blockReplication, modificationTime, preferredBlockSize, blocks, getPermissionStatus(), clientName, clientMachine, clientNode); }

2、INodeFileUnderConstruction类

该类所含有的信息包括与执行计算任务相关的一些属性，如下所示：

final String clientName; // 租约（lease）持有者 private final String clientMachine; // 客户端主机 private final DatanodeDescriptor clientNode; // 如果客户端同时也是HDFS集群中的Datanode private int primaryNodeIndex = -1; // 客户端结点激活租约（lease） private DatanodeDescriptor[] targets = null; // 文件最后一个块的存储位置信息 private long lastRecoveryTime = 0;

通过上面属性信息可以知道，一个INodeFileUnderConstruction文件具有持有操作该文件的进程（客户端）的一些信息，如果客户端进程同时也是HDFS集群中Datanode，它就能够根据租约的有效性来执行与该文件相关的操作，例如复制等。

下面介绍个主要方法：

1）assignPrimaryDatanode方法

INodeFileUnderConstruction类中实现的assignPrimaryDatanode方法，能够将该INodeFileUnderConstruction文件分配给指定的客户端进程，也就是执行租约恢复的操作，并通过setLastRecoveryTime更新最后租约恢复时间lastRecoveryTime。下面是assignPrimaryDatanode方法的实现：

/** * 为该文件初始化租约的恢复的处理（存储选择的主Datanode所激活的块列表） */ void assignPrimaryDatanode() { // 指派第一个活跃的为主Datanode结点 if (targets.length == 0) { NameNode.stateChangeLog.warn("BLOCK*" + " INodeFileUnderConstruction.initLeaseRecovery:" + " No blocks found, lease removed."); } int previous = primaryNodeIndex; // 从索引previous开始查找到一个活跃的Datanode进程 for(int i = 1; i <= targets.length; i++) { int j = (previous + i)%targets.length; if (targets[j].isAlive) { // 保证第j个Datanode处于活跃状态 DatanodeDescriptor primary = targets[primaryNodeIndex = j]; primary.addBlockToBeRecovered(blocks[blocks.length - 1], targets); // 存储被主Datanode激活的块，实际存储到该Datanode的块队列中 NameNode.stateChangeLog.info("BLOCK* " + blocks[blocks.length - 1] + " recovery started, primary=" + primary); return; } } }

2）removeBlock方法

该类的removeBlock方法从该文件的块列表中删除一个块，并且只能删除列表中的最后一个块。实现如下所示：

void removeBlock(Block oldblock) throws IOException { if (blocks == null) { throw new IOException("Trying to delete non-existant block " + oldblock); } int size_1 = blocks.length - 1; if (!blocks[size_1].equals(oldblock)) { throw new IOException("Trying to delete non-last block " + oldblock); } BlockInfo[] newlist = new BlockInfo[size_1]; // 创建一个新的块列表（比原来的块列表小1） System.arraycopy(blocks, 0, newlist, 0, size_1); // 将原来的块列表中除去最后一个块以外的全部块，拷贝到新的块列表中 blocks = newlist; // 修改当前文件的块列表 targets = null; // 因为最后一个块删除了，该块对应的存储位置信息也不存在了 }

3）convertToInodeFile方法

该方法将一个INodeFileUnderConstruction文件转化为INodeFile文件，如下所示：

INodeFile convertToInodeFile() { INodeFile obj = new INodeFile(getPermissionStatus(), getBlocks(), getReplication(), getModificationTime(), getModificationTime(), getPreferredBlockSize()); return obj; }

FSDirectory类

该类org.apache.hadoop.hdfs.server.namenode.FSDirectory用来存储文件系统目录的状态。它处理向磁盘中写入或加载数据，并且对目录中的数据发生的改变记录到日志中。它保存了一个最新的filename->blockset的映射表，并且将它写入到磁盘中。

该类定义的属性如下所示：

final FSNamesystem namesystem; // 文件系统命名空间系统实例 final INodeDirectoryWithQuota rootDir; // 具有配额限制的目录INode，这里即是根目录 FSImage fsImage; // FSImage映像 private boolean ready = false; // 该目录是否准备好处理writing/loading到磁盘 private MetricsRecord directoryMetrics = null; // 目录元数据记录实体

该类构造方法如下所示：

FSDirectory(FSNamesystem ns, Configuration conf) { this(new FSImage(), ns, conf); fsImage.setCheckpointDirectories(FSImage.getCheckpointDirs(conf, null), FSImage.getCheckpointEditsDirs(conf, null)); } FSDirectory(FSImage fsImage, FSNamesystem ns, Configuration conf) { rootDir = new INodeDirectoryWithQuota(INodeDirectory.ROOT_NAME, ns.createFsOwnerPermissions(new FsPermission((short)0755)), Integer.MAX_VALUE, -1); // 目录的权限设为755（drwxrw-rw-） this.fsImage = fsImage; // 后面会详细分析FSImage映像类的 namesystem = ns; initialize(conf); // 调用，根据配置类实例conf初始化directoryMetrics }

通过上面的FSDirectory的构造可以看出，通过FSNamesystem ns访问一个已经存在的DFS的命名空间系统目录，为FSDirectory的根目录rootDir设置访问权限。

下面介绍FSDirectory类的方法，选择几个重要的方法详细分析：

1、加载FSImage映像

方法loadFSImage实现如下所示：

void loadFSImage(Collection<File> dataDirs, Collection<File> editsDirs, StartupOption startOpt) throws IOException { // 根据Hadoop servers启动选项进行操作 if (startOpt == StartupOption.FORMAT) { // 如果启动选项类型为FORMAT（格式化），在启动之前需要进行格式化 fsImage.setStorageDirectories(dataDirs, editsDirs); // 设置FSImage映像文件文件的存储目录 fsImage.format(); // 对FSImage执行格式化操作 startOpt = StartupOption.REGULAR; // 动态修改启动选项REGULAR（正常启动） } try { if (fsImage.recoverTransitionRead(dataDirs, editsDirs, startOpt)) { // 根据启动选项及其对应存储目录，分析存储目录，必要的话从先前的事务恢复过来 fsImage.saveFSImage(); // 保存FSImage映像文件内容，并创建一个空的edits文件 } FSEditLog editLog = fsImage.getEditLog(); // 获取到存FSImage映像对应的EditLog文件 assert editLog != null : "editLog must be initialized"; if (!editLog.isOpen()) editLog.open(); // 打开EditLog文件 fsImage.setCheckpointDirectories(null, null); // 设置检查点存储目录 } catch(IOException e) { fsImage.close(); throw e; } synchronized (this) { this.ready = true; // 设置当前FSDirectory状态 this.notifyAll(); // 通知阻塞在该FSDirectory对象上的全部其它线程 } }

通过该方法，我们可以看到加载一个FSImage映像的过程：首先需要对内存中的FSImage对象进行格式化；然后从将指定存储目录中的EditLog日志文件作用到格式化完成的FSImage内存映像上；最后需要再创建一个空的EditLog日志准备记录对命名空间进行修改的操作，以备检查点进程根据需要将EditLog内容作用到FSImage映像上，保持FSImage总是最新的，保证EditLog与FSImage同步。

2、更新INode文件计数

实现的方法为updateCount，如下所示：

/** * 批量更新：更新具有配额限制的每一个INode的计数 * * @param inodes 某个Path下的INode数组 * @param numOfINodes 需要更新的INode的数量（从数组inodes的索引0开始计数） * @param nsDelta 文件系统命名空间大小的改变量 * @param dsDelta 磁盘空间大小的改变量 */ private void updateCount(INode[] inodes, int numOfINodes, long nsDelta, long dsDelta) throws QuotaExceededException { if (!ready) { return; } if (numOfINodes>inodes.length) { // 检查numOfINodes，当大于inodes数组大小时，设置为inodes数组大小 numOfINodes = inodes.length; } // check existing components in the path int i=0; try { for(; i < numOfINodes; i++) { if (inodes[i].isQuotaSet()) { // 如果是一个具有配额限制的目录INode INodeDirectoryWithQuota node =(INodeDirectoryWithQuota)inodes[i]; // 转换，得到INodeDirectoryWithQuota实例 node.updateNumItemsInTree(nsDelta, dsDelta); // 更新node目录树的大小 } } } catch (QuotaExceededException e) { e.setPathName(getFullPathName(inodes, i)); // 发生异常，执行回滚上述更新操作 for( ; i-- > 0; ) { try { if (inodes[i].isQuotaSet()) { INodeDirectoryWithQuota node =(INodeDirectoryWithQuota)inodes[i]; node.updateNumItemsInTree(-nsDelta, -dsDelta); } } catch (IOException ingored) { } } throw e; } }

文件系统中的INode（目录或文件）可能因为在执行计算任务过程中，某个INode（树）的内容发生变化，为保证HDFS中文件管理的一致性，在必要的时候需要更新INode的统计数据。

3、向该目录中添加一个孩子INode

实现方法为addChild，如下所示：

private <T extends INode> T addChild(INode[] pathComponents, int pos, T child, long childDiskspace, boolean inheritPermission) throws QuotaExceededException { INode.DirCounts counts = new INode.DirCounts(); child.spaceConsumedInTree(counts); // 更新counts对象（该对象包含child在目录树中INode名字的数量与占用磁盘空间） if (childDiskspace < 0) { childDiskspace = counts.getDsCount(); // 获取child的磁盘空间大小 } updateCount(pathComponents, pos, counts.getNsCount(), childDiskspace); // 更新pathComponents数组从0到pos-1位置的每一个INode的统计计数 T addedNode = ((INodeDirectory)pathComponents[pos-1]).addChild(child, inheritPermission); // 将child添加到((INodeDirectory)pathComponents[pos-1])目录中，并返回child结点 if (addedNode == null) { // 如果((INodeDirectory)pathComponents[pos-1])中已经存在child结点 updateCount(pathComponents, pos, -counts.getNsCount(), -childDiskspace); // 回滚上述更新操作 } return addedNode; // 返回添加到该目录中的INode }

4、向namespace中添加一个INode

实现的方法为addNode，如下所示：

/** * 将node添加到namespace中，node的完整路径为src，如果该node磁盘空间childDiskspace未知则应该为-1 */ private <T extends INode> T addNode(String src, T child, long childDiskspace, boolean inheritPermission) throws QuotaExceededException { byte[][] components = INode.getPathComponents(src); // 将路径src转换为UTF-8编码的字节数组 child.setLocalName(components[components.length-1]); // 为child设置本地文件名称 INode[] inodes = new INode[components.length]; // 分配一个components.length大小的INode[] synchronized (rootDir) { rootDir.getExistingPathINodes(components, inodes); return addChild(inodes, inodes.length-1, child, childDiskspace, inheritPermission); } }

上面调用了INodeDirectory类的getExistingPathINodes方法，这里说明一下该方法。

例如，给定一个路径/c1/c2/c3，其中只有/c1/c2是存在的，而/c3不存在，则得到这样一个字节数组["","c1","c2","c3"]。

如果想要执行调用getExistingPathINodes(["","c1","c2"], [?])，则应该使用[c2]填充占位数组；

如果想要执行调用getExistingPathINodes(["","c1","c2","c3"], [?])，则应该使用[null]填充占位数组；

如果想要执行调用getExistingPathINodes(["","c1","c2"], [?,?])，则应该使用[c1,c2]填充占位数组；

如果想要执行调用getExistingPathINodes(["","c1","c2","c3"], [?,?])，则应该使用[c2,null]填充占位数组；

如果想要执行调用getExistingPathINodes(["","c1","c2"], [?,?,?,?])，则应该使用[rootINode,c1,c2,null]填充占位数组；

如果想要执行调用getExistingPathINodes(["","c1","c2","c3"], [?,?,?,?])，则应该使用[rootINode,c1,c2,null]填充占位数组。

对应于上面方法中，对getExistingPathINodes方法的调用，指定一个完整路径components（例如上面的src转化后得到的components数组），执行调用后，会根据上述举例中的规则来对inodes数组进行填充。得到一个inodes数组以后，就可以调用addChild方法向该目录FSDirectory中添加一个child。

5、向文件系统中添加一个文件

实现的方法为addFile，如下所示：

INodeFileUnderConstruction addFile( String path, PermissionStatus permissions, short replication, long preferredBlockSize, String clientName, String clientMachine, DatanodeDescriptor clientNode, long generationStamp) throws IOException { waitForReady(); // 等待该目录已经准备好，能够被使用 long modTime = FSNamesystem.now(); // 取当前时间 if (!mkdirs(new Path(path).getParent().toString(), permissions, true, modTime)) { // 创建path的父目录 return null; } INodeFileUnderConstruction newNode = new INodeFileUnderConstruction( permissions,replication, preferredBlockSize, modTime, clientName, clientMachine, clientNode); // 创建一个新的INode文件 synchronized (rootDir) { newNode = addNode(path, newNode, -1, false); // 将newNode加入到namespace中去 } if (newNode == null) { // 添加失败 NameNode.stateChangeLog.info("DIR* FSDirectory.addFile: " +"failed to add "+path +" to the file system"); return null; } fsImage.getEditLog().logOpenFile(path, newNode); // 将namespace中新添加INode的事务写入到FSImage对应的EditLog日志文件中 NameNode.stateChangeLog.debug("DIR* FSDirectory.addFile: " +path+" is added to the file system"); return newNode; }

通过该方法，我们了解到，当向namespace中添加一个文件的时候，需要通过FSImage映像获取到其所对应的EditLog日志文件，将对使namespace发生改变的事务记录下来。只要当对namespace执行的操作生效的时候，才会被记录到EditLog日志文件中，如果失败的话是不会登陆日志的。

6、向指定文件中写入块（Block）

如下所示：

Block addBlock(String path, INode[] inodes, Block block) throws IOException { waitForReady(); synchronized (rootDir) { INodeFile fileNode = (INodeFile) inodes[inodes.length-1]; // inodes数组中最后一个INodeFile // 检查配额限制，更新空间用量 updateCount(inodes, inodes.length-1, 0, fileNode.getPreferredBlockSize()*fileNode.getReplication()); // associate the new list of blocks with this file namesystem.blocksMap.addINode(block, fileNode); // 将该块block加入到namesystem所维护的映射表blocksMap中的fileNode文件中去 BlockInfo blockInfo = namesystem.blocksMap.getStoredBlock(block); // 获取到namesystem所维护的blocksMap映射表中，block块的信息blockInfo fileNode.addBlock(blockInfo); // 将blockInfo信息添加到fileNode文件中 NameNode.stateChangeLog.debug("DIR* FSDirectory.addFile: " + path + " with " + block + " block is added to the in-memory " + "file system"); } return block; }

可见，每当需要向目录中写入块（Block）的时候，都需要向FSNamesystem的blocksMap映射表中登记，同时通过从FSNamesystem的blocksMap映射表中获取待写入块已经存在的信息，一同写入到该目录中该块所属的文件中去。

7、需要写入EditLog日志文件的操作

这里，对FSDirectory类中实现的，与namespace相关的需要写入到EditLog日志文件的事务进行总结，给出具体的操作说明。

一共涉及到12个操作，执行这些操作的时候，需要登录到EditLog日志中，如下所示：

/** * 将文件添加到文件系统中 */ INodeFileUnderConstruction addFile( String path, PermissionStatus permissions, short replication, long preferredBlockSize, String clientName, String clientMachine, DatanodeDescriptor clientNode, long generationStamp) throws IOException; /** * 将一个文件对应的块列表持久化到文件系统 */ void persistBlocks(String path, INodeFileUnderConstruction file) IOException； /** * 关闭文件 */ void closeFile(String path, INodeFile file) throws IOException; /** * 删除指定文件的某个块 */ boolean removeBlock(String path, INodeFileUnderConstruction fileNode, Block block) throws IOException; /** * 文件重命名 */ boolean renameTo(String src, String dst) throws QuotaExceededException; /** * 为指定文件设置副本因子 */ Block[] setReplication(String src, short replication, int[] oldReplication) throws IOException; /** * 为指定文件设置权限 */ void setPermission(String src, FsPermission permission) throws IOException; /** * 设置文件属主 */ void setOwner(String src, String username, String groupname) throws IOException; /** * 删除文件 */ INode delete(String src); /** * 创建目录 */ boolean mkdirs(String src, PermissionStatus permissions, boolean inheritPermission, long now) throws FileNotFoundException, QuotaExceededException; /** * 为指定目录设置配额 */ void setQuota(String src, long nsQuota, long dsQuota) throws FileNotFoundException, QuotaExceededException; /** * 设置一个文件的访问时间 */ void setTimes(String src, INodeFile inode, long mtime, long atime, boolean force) throws IOException;

对于FSDirectory类，我们就分析这么多。通过上面分析，我们知道了FSDirectory类主要是管理对于属于一个FSDirectory类目录实例的文件的基本操作，而一个FSDirectory类是位于文件系统中的，对于指定的文件进行的操作都由FSDirectory类来管理维护，并对特定的事务写入到EditLog日志文件中。

你可能感兴趣的:(String,null,Path,permissions,代码分析,Components)

LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
【Bugs】Python：“ModuleNotFoundError: No module named ‘XXX‘” 系'辞工具箱 python bug anaconda
问题描述Python使用库的前提是必须已安装了相应的库，往往利用“命令行指令”实现安装，一般安装解法类似。但，还是具有延伸问题，本博客对此作记录。【1】Nomodulenamed‘seaborn’(1.1):情况1：为Anaconda安装【图1-2】.定位Anaconda路径【图3】.Anaconda路径加入Path>&
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
leetcode-617. 合并二叉树 manba_ leetcode hot100 leetcode 算法
题目描述给你两棵二叉树：root1和root2。想象一下，当你将其中一棵覆盖到另一棵之上时，两棵树上的一些节点将会重叠（而另一些不会）。你需要将这两棵树合并成一棵新二叉树。合并的规则是：如果两个节点重叠，那么将这两个节点的值相加作为合并后节点的新值；否则，不为null的节点将直接作为新二叉树的节点。返回合并后的二叉树。注意:合并过程必须从两个树的根节点开始。示例1：输入：root1=[1,3,2,
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
Golang语言基础知识点总结最帅猪猪侠 golang 开发语言后端
Golang语言基础知识点小总结1.go语言有两大类型：值类型：数值类型，bool，string，数组，struct结构体变量直接存储值，内存通常在栈中分配,修改值,不会对源对象产生影响引用类型：指针，slice切片，管道chan，map，interface变量存储的是一个地址，这个地址对应的空间才真正存储数据值，内存通常在堆上分配，当没有任何变量引用这个地址时，该地址对应的数据空间就成为一个垃圾
string trim的实现 JamesSawyer
if(typeofString.prototype.trim!=='function'){String.prototype.trim=function(){//这个正则的意思是//'^''$'表示结束和开始//'^\s*'表示任意以空格开头的空格//'\s*$'表示任意以空格结尾的空格//'\S*'表示任意非空字符//'$1'表示'(\S*(\s*\S*)*)'returnthis.replace
[Swift]LeetCode943. 最短超级串 | Find the Shortest Superstring 黄小二哥 swift
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号：山青咏芝（shanqingyongzhi）➤博客园地址：山青咏芝（https://www.cnblogs.com/strengthen/）➤GitHub地址：https://github.com/strengthen/LeetCode➤原文地址：https://www.cnblogs.com/streng
[Swift]LeetCode767. 重构字符串 | Reorganize String weixin_30591551 swift runtime
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号：山青咏芝（shanqingyongzhi）➤博客园地址：山青咏芝（https://www.cnblogs.com/strengthen/）➤GitHub地址：https://github.com/strengthen/LeetCode➤原文地址：https://www.cnblogs.com/streng
golang获取用户输入的几种方式余生逆风飞翔 golang 开发语言后端
一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
leetcode-124 Binary Tree Maximum Path Sum 乐观的大鹏 LeetCode
Givenanon-emptybinarytree,findthemaximumpathsum.Forthisproblem,apathisdefinedasanysequenceofnodesfromsomestartingnodetoanynodeinthetreealongtheparent-childconnections.Thepathmustcontainatleastonenodea
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
详解“c:/work/src/components/a/b.vue“‘ has no default export报错原因 hw_happy 开发语言前端 vue.js javascript
前情提要在一个vue文件中需要引入定义的b.vue文件，但是提示b文件没有默认导出，对于vue2文件来说有exportdefault，在中，所有定义的变量、函数和组件都会自动被视为默认导出的组件内容。因此，不需要显式地使用exportdefault来导出组件。但是在我引用这个文件的时候还是提示了这个错误，原来是我的项目使用了ts和vite\webpack，因为TypeScript和Vue的默认导出
自定义分区我的K8409 Hadoop hdfs hadoop 大数据
通过简单例子了解partition分区类的重写方法分区是在MR的过程中进行的，属于Shuffle阶段但是在Job端不要忘记进行调用：job.setPartitionerClass(xxx.class)按照年龄分区：classAgePartitionerextendsPartitioner{@OverridepublicintgetPartition(MyComparablekey,NullWrit
golang实现从服务器下载文件到本地指定目录余生逆风飞翔 golang 服务器开发语言
一、连接服务器，采用sftp连接模式packagemiddlewaresimport("fmt""time""github.com/pkg/sftp""golang.org/x/crypto/ssh")//建立服务器连接funcConnect(user,password,hoststring,portint)(*sftp.Client,error){var(auth[]ssh.AuthMethod
spring mvc @RequestBody String类型参数 zoyation spring-mvc spring mvc
通过如下配置：text/html;charset=UTF-8application/json;charset=UTF-8在springmvc的Controller层使用@RequestBody接收Content-Type为application/json的数据时，默认支持Map方式和对象方式参数@RequestMapping(value="/{code}/saveUser",method=Requ
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他