liran728729

pycurl实现hadoop的客户端功能

pycurl实现hadoop的客户端功能

目前在测试一个hadoop的功能，需要频繁的和hadoop打交道。刚开始采用的python的subprocess模块来调用底层的hadoop提供的命令行工具实现的。

一，hadoop提供的命令行格式说明：

hadoop fs [cmd]具体的命令有:

hadoop fs [-fs ] [-conf ]

[-D ] [-ls ] [-lsr ] [-du ]

[-dus ] [-mv ] [-cp ] [-rm [-skipTrash] ]

[-rmr [-skipTrash] ] [-put ... ] [-copyFromLocal ... ]

[-moveFromLocal ... ] [-get [-ignoreCrc] [-crc]

[-getmerge [addnl]] [-cat ]

[-copyToLocal [-ignoreCrc] [-crc] ] [-moveToLocal ]

[-mkdir ] [-report] [-setrep [-R] [-w] ]

[-touchz ] [-test -[ezd] ] [-stat [format] ]

[-tail [-f] ] [-text ]

[-chmod [-R] PATH...]

[-chown [-R] [OWNER][:[GROUP]] PATH...]

[-chgrp [-R] GROUP PATH...]

[-count[-q] ]

[-help [cmd]]

从上面可以看出命令提供的功能还是挺强大的。包括了文件和对目录的各种操作。

举个例子：

要列出hadoop的根目录下面的文件,具体命令如下：

#hadoop fs -ls hdfs://192.168.0.112:50081/

drwx---r-x - test test 0 2013-03-08 11:20 /static

drwx---r-x - test test 0 2013-02-19 15:40 /system

drwxrwxrwx - test test 0 2013-01-22 18:42 /video

其他的命令功能就不一一介绍了，相信看帮组文档自己也可以看懂。

这样会有一个问题，每执行一个命令都会新生成一个jvm，对运行命令的机器造成很大的负担，在命令多的情况下，查看top可以看到java的进程会跑到99%，严重影响到的使用。于是有了下面的实现方法。

二，hadoop提供的web方式

在网上查看官方的客户端API，发现hadoop提供一个web REST API，既采用curl的方式可以轻松实现。官方文档连接为：http://hadoop.apache.org/docs/stable/webhdfs.html

上面对使用方式进行充分的说明。

curl的方式可以进行对hadoop中的文件和目录进行一些基本的操作。

目前官网上提供的有

1,创建并写入文件

2，追加文件

3，打开并读入文件

4，创建目录

5，重命名文件或者目录

6，删除文件或者目录

7，列出文件或者目录状态

8，列出目录列表

下面提供一些具体的使用例子：

a，列出目录的状态

#curl -i http://192.168.0.112:50071/webhdfs/v1/?op=GETFILESTATUS

HTTP/1.1 200 OK

Content-Type: application/json

Transfer-Encoding: chunked

Server: Jetty(6.1.26)

{"FileStatus":{"accessTime":0,"blockSize":0,"group":"TEST","length":0,"modificationTime":1362812718704,"owner":"TEST","pathSuffix":"","permission":"705","replication":0,"type":"DIRECTORY"}}

b，重命名目录

#curl -i -X PUT http://192.168.0.112:50071/webhdfs/v1/test?op=RENAME&destination=/test1

HTTP/1.1 200 OK

Content-Type: application/json

Transfer-Encoding: chunked

{"boolean":true}

其他的功能就不一一介绍了。具体的实现方式请看官方文档

三，由curl的方式想到的

因为我的程序是用python跑的，那么采用curl命令行的方式同样是调用底层命令，python的模块那么多，那么我如果使用python的curl库那不是可以轻松实现python对hadoop中文件和目录的操作。

在经过查资料后，写了一个基本的webhadoop的class，基本的功能大概完成了，其他的东西以后再加吧。

具体的代码如下：

   
   
   
   
    
    
    
    #!/usr/bin/env python 
    
    
    
    # -*- encoding:utf-8 -*- 
    
    
    
    """A library to access Hadoop HTTP REST API, 
    
    
    
       make sure you hadoop cluster open the http access . 
    
    
    
    """ 
    
    
    
    ''' 
    
    
    
    author : liran 
    
    
    
    data   : 2013-03-11 
    
    
    
     
    
    
    
    致谢：xwu 
    
    
    
         武汉云雅科技有限公司 
    
    
    
         
    
    
    
    ''' 
    
    
    
    import StringIO 
    
    
    
    import pycurl 
    
    
    
    import re 
    
    
    
    import sys 
    
    
    
    import logging 
    
    
    
    import os 
    
    
    
     
    
    
    
    class WebHadoop(object): 
    
    
    
        def __init__(self,host,port,username,logger,prefix="/webhdfs/v1"): 
    
    
    
            self.host = host 
    
    
    
            self.port = port 
    
    
    
            self.user = username 
    
    
    
            self.logger = logger 
    
    
    
            self.prefix = prefix 
    
    
    
            self.status = None 
    
    
    
            self.url = "http://%s:%s" % (host,port) 
    
    
    
            selfself.url_path = self.url + self.prefix  
    
    
    
     
    
    
    
     
    
    
    
     
    
    
    
        def checklink(self): 
    
    
    
            try: 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                c = pycurl.Curl() 
    
    
    
                checkurl = self.url + "/dfsnodelist.jsp?whatNodes=LIVE" 
    
    
    
                c.setopt(pycurl.URL, checkurl) 
    
    
    
                c.setopt(pycurl.HTTPHEADER, ["Accept:"]) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                self.status = c.getinfo(c.HTTP_CODE) 
    
    
    
                bbody = b.getvalue() 
    
    
    
                self.Write_Debug_Log(self.status,checkurl) 
    
    
    
                p = re.compile(r'''Live Datanodes :(.*)a''') 
    
    
    
                results = p.findall(body) 
    
    
    
                b.close() 
    
    
    
                if results[0] == "0": 
    
    
    
                    self.logger.error("Sorry, There are not live datanodes in Hadoop Cluster!!!") 
    
    
    
                    self.curlObj.close() 
    
    
    
                    sys.exit(255) 
    
    
    
                return results[0] 
    
    
    
            except pycurl.error,e: 
    
    
    
                self.logger.error("Sorry, can not get the hadoop http link .Erros: %s" % e) 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
                sys.exit(255) 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
                 
    
    
    
         
    
    
    
        def lsdir(self,path): 
    
    
    
            try: 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                put_str = '[{"op":LISTSTATUS}]' 
    
    
    
     
    
    
    
                c = pycurl.Curl() 
    
    
    
                     
    
    
    
                lsdir_url = self.url_path + path + "?op=LISTSTATUS" 
    
    
    
                c.setopt(pycurl.URL, lsdir_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER, ["Accept:"]) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                bbody = b.getvalue() 
    
    
    
                self.status = c.getinfo(c.HTTP_CODE) 
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
             
    
    
    
             
    
    
    
            if self.status == 200: 
    
    
    
                data_dir = eval(body) 
    
    
    
                return data_dir['FileStatuses']['FileStatus'] 
    
    
    
                 
    
    
    
            else: 
    
    
    
                self.logger.error("Sorry,can not list the dir or file status!!!") 
    
    
    
                self.Write_Debug_Log(self.status,lsdir_url) 
    
    
    
                return False 
    
    
    
             
    
    
    
                  
    
    
    
        def lsfile(self,path): 
    
    
    
            try: 
    
    
    
                c = pycurl.Curl() 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                put_str = '[{"op":LISTSTATUS}]' 
    
    
    
                lsdir_url = self.url_path + path + "?op=GETFILESTATUS" 
    
    
    
                c.setopt(pycurl.URL, lsdir_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER, ["Accept:"]) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                bbody = b.getvalue() 
    
    
    
                self.status = c.getinfo(c.HTTP_CODE) 
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
                 
    
    
    
            if self.status == 200: 
    
    
    
                data_dir = eval(body) 
    
    
    
                if data_dir['FileStatus']['type'] == "DIRECTORY": 
    
    
    
                    self.logger.error("Sorry,this file %s is a dir actually!!!" % (path)) 
    
    
    
                    return False 
    
    
    
                else: 
    
    
    
                    return data_dir['FileStatus'] 
    
    
    
            else: 
    
    
    
                self.logger.error("Sorry,can not list the dir or file status!!!") 
    
    
    
                self.Write_Debug_Log(self.status,lsdir_url) 
    
    
    
                return False 
    
    
    
                 
    
    
    
        def mkdir(self,path,permission="755"): 
    
    
    
            try: 
    
    
    
                print "yes ,mkdir function" 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                c = pycurl.Curl() 
    
    
    
                mkdir_str = '[{"op":"MKDIRS","permission"=permission}]' 
    
    
    
                mkdir_url = "%s%s?op=MKDIRS&permission=%s" % (self.url_path,path,permission) 
    
    
    
                c.setopt(pycurl.URL, mkdir_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(mkdir_str))]) 
    
    
    
                c.setopt(pycurl.CUSTOMREQUEST,"PUT") 
    
    
    
                c.setopt(pycurl.POSTFIELDS,mkdir_str) 
    
    
    
               
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                self.status = c.getinfo(c.HTTP_CODE) 
    
    
    
                bbody = b.getvalue() 
    
    
    
                b.close() 
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                 
    
    
    
              
    
    
    
            if self.status == 200 : 
    
    
    
                if "true" in body: 
    
    
    
                    self.logger.info("Great,Successfully Create dir %s in hadoop cluster!!" % (path)) 
    
    
    
                    return True 
    
    
    
                elif "false" in body: 
    
    
    
                    self.logger.info("Sorry,can't create this %s dir in hadoop cluster!!1!!") 
    
    
    
                    return False 
    
    
    
                else: 
    
    
    
                    return False 
    
    
    
            else: 
    
    
    
                self.logger.error("Sorry,can't create this %s dir in hadoop cluster!!1" % (path)) 
    
    
    
                self.Write_Debug_Log(self.status,mkdir_url)  
    
    
    
                         
    
    
    
     
    
    
    
        def remove(self,path,recursive="True"): 
    
    
    
            try: 
    
    
    
                c = pycurl.Curl() 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                remove_str = '[{"op":"DELETE","recursive"=recursive}]' 
    
    
    
                remvoe_url = "%s%s?op=DELETE&recursive=%s" % (self.url_path,path,recursive) 
    
    
    
                c.setopt(pycurl.URL, remvoe_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(remove_str))]) 
    
    
    
                c.setopt(pycurl.CUSTOMREQUEST,"DELETE") 
    
    
    
                c.setopt(pycurl.POSTFIELDS,remove_str) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                bbody = b.getvalue() 
    
    
    
                print type(body) 
    
    
    
                self.status = c.getinfo(c.HTTP_CODE)  
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
            if self.status == 200 : 
    
    
    
                if "true" in body: 
    
    
    
                    print "yes ,it in" 
    
    
    
                    self.logger.info("Great,Successfully delete dir or file %s in hadoop cluster!!" % (path)) 
    
    
    
                    return True 
    
    
    
                elif "false" in body: 
    
    
    
                    print "no ,it is not" 
    
    
    
                    self.logger.info("Sorry,can't delete dir or file,maybe this dir is not exsited!!") 
    
    
    
                    return False 
    
    
    
                else: 
    
    
    
                    return False 
    
    
    
                 
    
    
    
            else: 
    
    
    
                self.logger.error("Sorry,can't create this %s dir in hadoop cluster!!1" % (path)) 
    
    
    
                self.Write_Debug_Log(self.status,remvoe_url) 
    
    
    
                 
    
    
    
        def rename(self,src,dst): 
    
    
    
            try: 
    
    
    
                c = pycurl.Curl() 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                rename_str = '[{"op":"RENAME"}]' 
    
    
    
                rename_url = "%s%s?op=RENAME&destination=%s" % (self.url_path,src,dst) 
    
    
    
                c.setopt(pycurl.URL, rename_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(rename_str))]) 
    
    
    
                c.setopt(pycurl.CUSTOMREQUEST,"PUT") 
    
    
    
                c.setopt(pycurl.POSTFIELDS,rename_str) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                bbody = b.getvalue() 
    
    
    
                self.status = c.getinfo(c.HTTP_CODE)   
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
            if self.status == 200 : 
    
    
    
                if "true" in body: 
    
    
    
                    self.logger.info("Great,Successfully rename dir or file %s in hadoop cluster!!" % (rename_url)) 
    
    
    
                    return True 
    
    
    
                elif "false" in body: 
    
    
    
                    self.logger.info("Sorry,can't rename dir or file,maybe this dir is not exsited!!") 
    
    
    
                    return False 
    
    
    
                else: 
    
    
    
                    return False 
    
    
    
                 
    
    
    
            else: 
    
    
    
                self.logger.error("Sorry,can't create this %s dir in hadoop cluster!!1" % (rename_url)) 
    
    
    
                self.Write_Debug_Log(self.status,rename_url)      
    
    
    
     
    
    
    
        def put_file(self,local_path,hdfs_path,overwrite="true",permission="755",buffersize="128"): 
    
    
    
            print "yes ,put fils ing!!!" 
    
    
    
            try: 
    
    
    
                c = pycurl.Curl() 
    
    
    
                put_str = '[{"op":"CREATE","overwrite":overwrite,"permission":permission,"buffersize":buffersize}]' 
    
    
    
                put_url = "%s%s?op=CREATE&overwrite=%s&permission=%s&buffersize=%s" % (self.url_path,hdfs_path,overwrite,permission,buffersize) 
    
    
    
                c.setopt(pycurl.URL, put_url) 
    
    
    
                header_str = StringIO.StringIO() 
    
    
    
                c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(put_str))]) 
    
    
    
                c.setopt(pycurl.CUSTOMREQUEST,"PUT") 
    
    
    
                c.setopt(pycurl.HEADER,1) 
    
    
    
                c.setopt(pycurl.HEADERFUNCTION,header_str.write) 
    
    
    
                c.setopt(pycurl.POSTFIELDS,put_str) 
    
    
    
                b = StringIO.StringIO() 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                redirect_url = c.getinfo(pycurl.EFFECTIVE_URL) 
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
             
    
    
    
            if os.path.isfile(local_path): 
    
    
    
                try: 
    
    
    
                    f = file(local_path) 
    
    
    
                    filesize = os.path.getsize(local_path) 
    
    
    
                    c.setopt(pycurl.URL, redirect_url) 
    
    
    
                    c.setopt(pycurl.HEADER,1) 
    
    
    
                    c.setopt(pycurl.CUSTOMREQUEST,"PUT") 
    
    
    
                    c.setopt(pycurl.PUT,1) 
    
    
    
                    c.setopt(pycurl.INFILE,f) 
    
    
    
                    c.setopt(pycurl.INFILESIZE,filesize) 
    
    
    
                    c.setopt(pycurl.WRITEFUNCTION, b.write) 
    
    
    
                    c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                    c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                    c.perform() 
    
    
    
                    print "yes.is ready to putting..." 
    
    
    
                    self.status = c.getinfo(c.HTTP_CODE) 
    
    
    
                    print b.getvalue() 
    
    
    
                except Exception,e: 
    
    
    
                    print e 
    
    
    
              finally: 
    
    
    
                    b.close() 
    
    
    
                    header_str.close() 
    
    
    
                    f.close() 
    
    
    
            else: 
    
    
    
                self.logger.error("Sorry,the %s is not existed,maybe it is not a file." % local_path) 
    
    
    
                return False 
    
    
    
             
    
    
    
     
    
    
    
            if self.status != 201: 
    
    
    
                print self.status 
    
    
    
                self.Write_Debug_Log(self.status,put_str) 
    
    
    
                return False 
    
    
    
            else: 
    
    
    
                self.logger.info("Great,successfully put file into hdfs %s " % hdfs_path) 
    
    
    
                return True 
    
    
    
     
    
    
    
        def append(self,local_path,hdfs_path,buffersize=None): 
    
    
    
            pass         
    
    
    
     
    
    
    
         
    
    
    
         
    
    
    
        def get_file(self, local_path, hdfs_path,buffersize="128"): 
    
    
    
     
    
    
    
            if not os.path.isfile(local_path): 
    
    
    
                print local_path 
    
    
    
                os.mknod(local_path) 
    
    
    
            c = pycurl.Curl() 
    
    
    
            f = file(local_path,'wb') 
    
    
    
            put_str = '[{"op":"OPEN"}]' 
    
    
    
            put_url = "%s%s?op=OPEN&buffersize=%s" % (self.url_path,hdfs_path,buffersize)         
    
    
    
            try: 
    
    
    
                print "yes .aaaaaaaaaaaaaaaaaaaaa" 
    
    
    
                c.setopt(pycurl.URL, put_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(put_str))]) 
    
    
    
                c.setopt(pycurl.CUSTOMREQUEST,"GET") 
    
    
    
                f = file(local_path,'wb') 
    
    
    
                c.setopt(pycurl.POSTFIELDS,put_str) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION,f.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.setopt(pycurl.CONNECTTIMEOUT,60) 
    
    
    
                c.setopt(pycurl.TIMEOUT,300)             
    
    
    
                c.perform() 
    
    
    
     
    
    
    
                print c.getinfo(pycurl.HTTP_CODE) 
    
    
    
                self.status = c.getinfo(pycurl.HTTP_CODE) 
    
    
    
            except Exception,e: 
    
    
    
                print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                f.close() 
    
    
    
     
    
    
    
            if self.status != 200: 
    
    
    
                print self.status 
    
    
    
                self.Write_Debug_Log(self.status,put_str) 
    
    
    
                return False 
    
    
    
            else: 
    
    
    
                self.logger.info("Great,successfully put file into hdfs %s " % hdfs_path) 
    
    
    
                return True 
    
    
    
     
    
    
    
             
    
    
    
             
    
    
    
        def cat_file(self, hdfs_path,buffersize="128"): 
    
    
    
            c = pycurl.Curl() 
    
    
    
            b = StringIO.StringIO() 
    
    
    
            put_str = '[{"op":"OPEN"}]' 
    
    
    
            put_url = "%s%s?op=OPEN&buffersize=%s" % (self.url_path,hdfs_path,buffersize)         
    
    
    
            try: 
    
    
    
                print "yes .ready to open" 
    
    
    
                c.setopt(pycurl.URL, put_url) 
    
    
    
                c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(put_str))]) 
    
    
    
                c.setopt(pycurl.CUSTOMREQUEST,"GET") 
    
    
    
     
    
    
    
                c.setopt(pycurl.POSTFIELDS,put_str) 
    
    
    
                c.setopt(pycurl.WRITEFUNCTION,b.write) 
    
    
    
                c.setopt(pycurl.FOLLOWLOCATION, 1) 
    
    
    
                c.setopt(pycurl.MAXREDIRS, 5) 
    
    
    
                c.perform() 
    
    
    
                self.status = c.getinfo(pycurl.HTTP_CODE) 
    
    
    
                print c.getinfo(pycurl.HTTP_CODE) 
    
    
    
                print "###-------------------------------------------###" 
    
    
    
                print b.getvalue() 
    
    
    
            except Exception,e: 
    
    
    
                        print e 
    
    
    
            finally: 
    
    
    
                c.close() 
    
    
    
                b.close() 
    
    
    
     
    
    
    
            if self.status != 200: 
    
    
    
                print self.status 
    
    
    
                self.Write_Debug_Log(self.status,put_str) 
    
    
    
                return False 
    
    
    
            else: 
    
    
    
                self.logger.info("Great,successfully put file into hdfs %s " % hdfs_path) 
    
    
    
                return True 
    
    
    
             
    
    
    
        def copy_in_hdfs(self,src,dst,overwrite="true",permission="755",buffersize="128"): 
    
    
    
            tmpfile = "/tmp/copy_inhdfs_tmpfile" 
    
    
    
            self.get_file(tmpfile,src) 
    
    
    
            if self.status == 200: 
    
    
    
                self.put_file(tmpfile,dst,overwrite="true") 
    
    
    
                if self.status == 201: 
    
    
    
                    os.remove(tmpfile) 
    
    
    
                    return True 
    
    
    
                else: 
    
    
    
                    os.remove(tmpfile) 
    
    
    
                    return False 
    
    
    
            else: 
    
    
    
                os.remove(tmpfile) 
    
    
    
                return False          
    
    
    
             
    
    
    
                      
    
    
    
        def Write_Debug_Log(self,status,url): 
    
    
    
            if status != 200 or status != 201 : 
    
    
    
                self.logger.error("Url : \"%s\" ,Exit code : %s"%(url,self.status)) 
    
    
    
                self.logger.error("fetch a error ,but don't quit")

采用curl的方式实现的功能和java自带的命令行工具比较，还是有些不足的

1，不支持hadoop内部文件copy

2，不支持目录上传或者下载

3，测试的时候， shell的方式上传，如果文件已经存在回报错；curl的方式上传默认参数必须是overwrite=true，才能成功，不知道为什么。

唯一的好处就是，执行的时间大大提高了。

同样一个列出目录列表的命令，

#time hadoop fs -ls hdfs://192.168.0.112:50081/

real 0m10.916s

user 0m4.082s

sys 0m6.799s

#time curl -i http://192.168.0.112:50071/webhdfs/v1/?op=LISTSTATUS

real 0m0.005s

user 0m0.002s

sys 0m0.000s

而采用python的方式调用pycurl的模式来看

运行时间应该在0.01s左右。

快了很多啊。类的代码还在继续完善中。

继续努力了！呵呵呵

uvx.exe 跨环境 Python 工具执行器的原理与实战指南
在Windows安装uv时，系统会同时生成一个可执行文件uvx.exe。它并不是新的打包管理器，而是uvtoolrun命令的便捷别名：调用uvx.exe就能在瞬间解析依赖、构建隔离虚拟环境并执行来自Python生态的任意命令行工具，完成过程无需事先创建venv，也不会污染当前项目。官方文档把这种体验类比为npx或pipx的一次性执行，但uvx速度更快、磁盘开销更小，更能契合CI/CD流水线、临时脚
vscode怎么装python_vscode如何安装python
vscode安装python的方法：1、在vscode的扩展中输入"extinstallpython"安装python插件打开VScode，Ctrl+p输入"extinstallpython"，搜索时间可能会比较长安装过程不能停止，否则重新安装；2、在配置文件“settings.json”修改python的安装路径修改用户设置-settings.json，将"python.pythonPath":
关于python的一些面试题
1.技术面试题（1）TCP与UDP的区别是什么？答：在工作机制上TCP采用三次握手四次挥手的机制保障信息传递的稳定性，更适合文件的传输和下载。而UDP采用的是直接传输和直接接受的机制提高信息传递的高效性，更适合点对点的实时交流的环境。（2）DHCP和DNS的作用是什么？答：DHCP相当于网络中的智能管家，他会自动将局域网内的设备进行配置包括但不限于：IP地址、子网掩码、DNS服务器地址。而DNS相
python里面ca_Python SSL服务器提供中间CA证书洗心岛 python里面ca
我使用Python(2.7)SSL模块编写一些服务器代码，如下所示：ssock=ssl.wrap_socket(sock,ca_certs="all-ca.crt",keyfile="server.key",certfile="server.crt",server_side=True,ssl_version=ssl.PROTOCOL_TLSv1)全部-约阴极射线管'包含签名CA证书和根CA证书：-
服务器搭建python响应https,python实现简单的https服务器
以下提供一个简单的方式快速部署一个https服务器，用于非生产环境的测试使用，如果是正式的生产环境，考虑到性能安全等因素，就不要使用这个了。1、使用pyOpenSSL库：#coding:utf-8fromBaseHTTPServerimportHTTPServer,BaseHTTPRequestHandlerfromSocketServerimportThreadingMixInfromSocke
Leetcode刷题笔记——哈希表篇 code_lover_forever Leetcode刷题笔记 leetcode 笔记散列表 python
Leetcode刷题笔记——哈希表篇一、哈希表在面试中的高频考题第一题：两数之和Leetcode1:两数之和：中等题（详情点击链接见原题）给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标python代码解法classSolution:deftwoSum(self,nums:List[int],target:int)->
Various ways to integrate Python and C (C++) a13393665983 c/c++人工智能 python
VariouswaystointegratePythonandC(C++)KoichiTamura'sblog:VariouswaystointegratePythonandC(C++)VariouswaystointegratePythonandC(C++)ThisisoriginallywhatIwroteinamailIsenttoafriendofmine.Imodifieditalitt
How to setup a Mac with Python dev tools whackw mac mac
HowtosetupaMacwithPythondevtoolsNotesforhowtosetupa64-bitMacwithimportantPythondevelopmenttoolsDeprecated–clickhereforupdatedpageforYosemiteversionCreatedbyTrondKristiansenon27.7.2009,andlastupdated05
理解module, script, library, package in Python ikeepo #小白学Python module library script package setup
OverviewPythonmodulesandPythonpackagesaretwomechanismsthatfacilitatemodularprogramming.AscriptisaPythonfilethat’sintendedtoberundirectly.AmoduleisaPythonfilethat’sintendedtobeimportedintoscriptsorothe
Python 服务器端与客户端的加密通信（SSL/TLS）解析现实逃脱计划TA python ssl 网络
```htmlPython服务器端与客户端的加密通信（SSL/TLS）解析在当今互联网时代，数据安全变得越来越重要。为了保护数据在传输过程中的安全，使用SSL/TLS协议进行加密通信成为了一种常见的做法。本文将详细介绍如何在Python中实现服务器端和客户端之间的SSL/TLS加密通信。什么是SSL/TLS？SSL（SecureSocketsLayer）和TLS（TransportLayerSec
python教程修订版 Ethan learn English python
9/23Inthiscourse,I'mgoingtoteachyoueverythingyouneedtoknowtogetstartedprogramminginPython.Now,Pythonisoneofthemostpopularprogramminglanguagesoutthere在众多的……中.Andit'sbyfar目前为止oneofthemostsõughtafter受欢迎的
Three ways to run a python script file captainOO7 python
Pythonoffersthreedistinctwaystorunascriptormodule,andeachoneaffectssys.path,__name__,andimportbehaviorinsubtlebutimportantways.Let’sbreakthemdownclearly:TheThreeWaystoRunPythonCode1.DirectScriptExecut
Python自动化神器：Pyautogui库实战指南码界奇点 Python python 自动化开发语言 python3.11 ui
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。持续学习，不断总结，共同进步，为了踏实，做好当下事儿~非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨TheStart点点关注，收藏不迷路文章目录1.PyAutoGUI简介1.1什么是PyAutoGUI？1.2安装
tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导 CrazyWolf_081c
tensorflowsigmoid_cross_entropy_with_logits函数解释及公式推导tensorflow官方文档解释参考pytorch--BCELosspytorch--BCELoss解释参考定义在tensorflow/python/ops/nn_impl.py.功能：计算在给定logits和label之间的sigmoidcrossentropy。测量离散分类任务中的概率误差，
写一个空调风机时长统计系统
需求：通过python图形化程序需要实现空调风机的时长统计。界面功能介绍：该空调系统分为8页，通过右上角左右翻页的方式进行页面切换，翻页按钮是翻到最后一页后只能通过上一页往前面，同理第一页也是这样。做了颜色采样，采样而且每页的风机数量是不同的，灰色：#515151RGB:818181绿色：#1bf928RGB：2724940底色：#033047RGB：34871灰色是未开机状态、绿色是开机状态、底
超简单linux上部署Apache 悟空骑猪看电影 apache linux 运维网络
1.Apache是什么？Apache是世界上最流行的开源Web服务器软件，由Apache软件基金会维护。主要功能：接收客户端（如浏览器）的HTTP请求，返回网页、图片等静态/动态资源。特点：跨平台（Linux、Windows、macOS）模块化设计（按需加载功能）支持多语言扩展（PHP、Python等）高稳定性和安全性2.核心架构与工作原理多进程模型（MPM）Prefork：多进程模式，每个请求由
nodejs关于后端服务开发的探究墨水白云 node.js
前提在当前的环境中关于webserver的主流开发基本上都是java、php之类的，其中javaspring系列基本上占了大头，而python之流也在奋起直追，但别忘了nodejs也是可以做这个服务的，只是位置有点尴尬，现在就来探究下nodejs做webserver的当前现状。nodejs简介Node.js是一个基于ChromeV8引擎的JavaScript运行环境。Node.js使用了一个事件驱
Python自动操作GUI神器PyAutoGUI 小菜菜-K PYTHON
日常使用计算机，命令行程序可以说是为批量操作文件而生，但作为普通用户，最多的还是通过鼠标键盘操作形形色色的图形界面程序。试想下面一个场景：有成千上万个文件，都需要通过图形界面进行同样的一套编辑、保存工作，靠手工一遍一遍地重复做，累死人不说，时间久了必然出现错误，作为程序猿，怎么能忍重复3次以上的工作，必须利用程序自动化。要想图形界面也能像命令行程序那样精确控制，就需要GUI自动化工具了。不得不赞P
Python练习（7）Python模块与方法：20道核心实战练习题（含答案与深度解析）（上）
目录引言基础篇（5题）练习1：模块导入方式对比练习2：模块别名应用练习3：条件导入模块练习4：模块搜索路径管理练习5：包结构初始化进阶篇（5题）练习6：模块重载机制练习7：类方法与静态方法区分练习8：魔术方法应用练习9：模块级变量作用域练习10：装饰器实现方法注册高级技巧篇（5题）练习11：动态模块导入练习12：命名空间包练习13：模块卸载陷阱练习14：元类方法控制练习15：上下文管理器方法实战案
python启动其他程序或命令（pandoc） SUN_SU3 python
编写python脚本时，有些功能由其他程序执行，直接在python脚本中启动对应的程序或命令执行即可，现记录用过的几种方法：查看程序的安装目录：whichpandoc1）subprocess:importsubprocessa=subprocess.Popen(['/opt/***/pandoc','/home/***/test.docx','-o','/home/***/test.html'])
全国青少年软件编程(Python)等级考试四级考试真题2024年3月——持续更新..... owbc_ 电子学会（python）三四级考试真题及答案（持续更新）python 算法开发语言青少年编程
青少年软件编程（Python）等级考试试卷（四级）分数：100题数：38一、单选题(共25题，共50分)1.运行如下代码，若输入整数3，则最终输出的结果为？（）deff(x):ifx==1:s=1else:s=f(x-1)*xreturnsn=int(input(“请输入一个大于1的整数：”))print(f(n)+f(n-1))A.2B.4C.8D.16标准答案：C试题解析：由于f(3)=f(2
【亲测免费】 PyPandoc 项目常见问题解决方案
PyPandoc项目常见问题解决方案基础介绍PyPandoc是一个为Pandoc提供的Python薄壳包装器。Pandoc是一个通用的文档转换工具，能够将标记格式的文档转换为多种格式。PyPandoc主要使用Python编程语言，旨在简化Pandoc在Python项目中的使用。新手常见问题及解决步骤问题1：如何安装PyPandoc问题描述：新手在使用PyPandoc时，首先需要了解如何正确安装。解
青少年人工智能Python编程水平测试四级模拟试卷9 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法数据结构排序算法
1、以下选项中，说法正确的是？（）A、条件1and条件2，表示条件满足其中1个即可B、条件1or条件2，表示2个条件需要同时满足C、and和or不能在一个条件表达式中同时使用D、andor一般和if语句搭配使用正确答案：D试题解析：and是逻辑与，同时满足结果才满足；or是逻辑或，满足一个结果就是满足；
青少年人工智能Python编程水平测试四级模拟试卷5 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法推荐算法
【单选题】（每题2分）1、运行下列代码后，输入4，输出的结果是？（）num_1=input()num_2="3"print(num_1+num_2)A、7B
十年老Python程序员：给我一个链接，没有我不能爬的视频，只有我顶不住的视频 IT孔乙己
一、写在前面真的，为什么别人发游戏这么多人看，我发了两次了加起来才一百个。算了算了，不整游戏了，反正你们也不爱看~python今天来试试把头条上扭腰上热门的那些妹子爬一爬，不知道我顶不顶得住~python二、准备工作1、使用的环境python3.8pycharm2021.2专业版2、要用的第三方模块seleniumrequestsparsel三、大致流程鉴于你们不喜欢我啰嗦，但是流程呢，我还是要给
Python中win32com的用法详解：自动化办公与COM交互的利器 detayun Python python 自动化交互 win32
在Python自动化办公场景中，win32com模块凭借其与WindowsCOM（ComponentObjectModel）的深度集成能力，成为操控MicrosoftOffice、工业设备甚至第三方软件的核心工具。本文将通过实战案例、技术细节和避坑指南，系统解析这一模块的核心用法。一、核心功能与安装配置1.1模块定位与优势win32com是pywin32扩展包的核心组件，其核心价值在于：跨软件交互
Python 进阶（一）：多线程
目录1.相关概念1.1解释器1.2GIL2.threading2.1方法属性2.2线程对象2.3锁对象2.4条件对象2.5信号量对象2.6事件对象1.相关概念1.1解释器Python解释器的主要作用是将我们在.py文件中写好的代码交给机器去执行，比较常见的解释器包括如下几种：CPython：官方解释器，我们从官网下载安装后获得的就是这个解释器，它使用C语言开发，是使用范围最广泛的Python解释器
Python 基础（十四）：错误和异常
目录1错误2异常2.1内置异常2.2异常处理2.3抛出异常2.4自定义异常程序中的错误我们通常称为bug，工作中我们不仅需要改自己程序中的bug，还需要改别人程序中的bug，新项目有bug要改，老项目也有bug要改，可以说bug几乎贯穿一个程序员的职业生涯…我们通常将bug分为Error（错误）和Exception（异常），我们下面来具体学习下Python中的错误和异常。1错误错误通常是指程序中的
word python 域操作_Python进阶：关于 Word 基本操作铃木大宝 word python 域操作
1.概述Word是一个十分常用的文字处理工具，通常我们都是手动来操作它，本节我们来看一下如何通过Python来操作。Python提供了python-docx库，该库就是为Word文档量身定制的，安装使用pipinstallpython-docx命令即可。2.写入首先，我们使用Python来创建一个Word文档并向其中写入一些内容。2.1标题我们先来创建Word文档并向其中添加标题，完整实现代码如下
华为OD机试2025 B卷 - 通过软盘拷贝文件 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试华为OD机试 2025B卷华为OD2025B卷华为OD机考 2025B卷
通过软盘拷贝文件华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述有一名科学家想要从一台古董电脑中拷贝文件到自己的电脑中加以研究。但此电脑除了有一个3.5寸软盘驱动器以外，没有任何手段可以将文件持贝出来，而且只有一张软盘可以使用。因此这一张软盘是唯一可以用来拷贝文件的载体。科学家想要尽可能多地将计算机中的信息拷贝到
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

pycurl实现hadoop的客户端功能

你可能感兴趣的:(python,hadoop,python)