python3利用ftp传输文件名含有中文的文件报错问题解决

ftp是常用的文件传输协议,在python中使用ftp传输时一般采用ftplib的包来进行文件传输;在进行文件传输时,当文件名是中文时,会报错,以下是文件传输的代码和报错信息:

class FTPSync(object):
    conn = ftplib.FTP()


    def __init__(self, host, port):
        self.conn.connect(host, port)

    def login(self, username, password):
        '''
        登录操作
        :param username:用户名
        :param password:密码
        :return:
        '''
        self.conn.login(username, password)
        self.conn.set_pasv(False)

    def getFile(self,filename ,download_path):
        '''
        下载单个文件,这里下载的文件名和指定的文件名一样
        :param filename:文件名
        :param download_path:下载的路径
        :return:
        '''
        if not os.path.isdir(download_path):
            os.makedirs(download_path)
        bufsize = 1024
        fp = open(download_path + '/' + filename, 'wb+').write
        self.conn.retrbinary('RETR %s' %filename, fp, bufsize)

    def create_path(self, path):
        '''
        创建dir路径,如果路径存在,不创建,如果存在,则进行创建
        :param path:需要创建或者切换的路径
        :return:
        '''
        #先切换到远程的根目录
        self.conn.cwd('~')
        dirs = path.rstrip('/')
        base_dir, dirs = self.conn.pwd(), dirs.split('/')
        for dir in dirs[1:]:
            try:
                self.conn.cwd(dir)
            except Exception as e:
                self.conn.mkd(dir)
                #创建好路径之后切换到指定的路径下面,为下载做准备
                self.conn.cwd(dir)

    def putFile(self,ftp_path, uploadFile):
        '''
        进行单个文件的上传操作
        :param ftp_path:远程ftp的路径
        :param uploadFile:上传的本地路径
        :return:
        '''
        #判断远程的目录是否存在,不存在则创建,且切换到指定的路径下
        self.create_path(ftp_path)
        print(self.conn.pwd())
        #本地文件名和上传的文件名保持一致
        local_file = uploadFile.split('/')[-1]
        fp = open(uploadFile, "rb")
        buf_size = 1024
        self.conn.storbinary('STOR {}'.format(local_file), fp, buf_size)
        fp.close()

采用该方法,在传输文件中有中文时,会报错,报错信息如下:

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 5-8: ordinal not in range(256)

根据分析以及查看源码得知,ftplib包中使用的编码方式为latin-1,即他会以latin-1的方式进行文件编码,尽管我们在文件上传时使用的是二进制上传,但是文件名需要转换成二进制编码,它采用latin-1的形式对文件名进行编码,而latin-1不能对中文名称进行编码,所以报错;
对于这个问题,修改的方式修改ftplib的默认编码格式,因为要传输到windows服务器上,我们要将ftplib的默认编码格式修改成gbk的形式,具体修改的方式如下:

class FTPSync(object):
    conn = ftplib.FTP()
    
    def __init__(self, host, port):
        self.conn.connect(host, port)

    def login(self, username, password):
        '''
        登录操作
        :param username:用户名
        :param password:密码
        :return:
        '''
        self.conn.login(username, password)
        self.conn.set_pasv(False)
        self.conn.encoding = 'gbk'

这样,在登录时,就将ftplib的编码改成gbk,在对中文名称编码时,gbk可以对文件进行编码

你可能感兴趣的:(python,ftplib)