ftp是常用的文件传输协议,在python中使用ftp传输时一般采用ftplib的包来进行文件传输;在进行文件传输时,当文件名是中文时,会报错,以下是文件传输的代码和报错信息:
class FTPSync(object):
conn = ftplib.FTP()
def __init__(self, host, port):
self.conn.connect(host, port)
def login(self, username, password):
'''
登录操作
:param username:用户名
:param password:密码
:return:
'''
self.conn.login(username, password)
self.conn.set_pasv(False)
def getFile(self,filename ,download_path):
'''
下载单个文件,这里下载的文件名和指定的文件名一样
:param filename:文件名
:param download_path:下载的路径
:return:
'''
if not os.path.isdir(download_path):
os.makedirs(download_path)
bufsize = 1024
fp = open(download_path + '/' + filename, 'wb+').write
self.conn.retrbinary('RETR %s' %filename, fp, bufsize)
def create_path(self, path):
'''
创建dir路径,如果路径存在,不创建,如果存在,则进行创建
:param path:需要创建或者切换的路径
:return:
'''
#先切换到远程的根目录
self.conn.cwd('~')
dirs = path.rstrip('/')
base_dir, dirs = self.conn.pwd(), dirs.split('/')
for dir in dirs[1:]:
try:
self.conn.cwd(dir)
except Exception as e:
self.conn.mkd(dir)
#创建好路径之后切换到指定的路径下面,为下载做准备
self.conn.cwd(dir)
def putFile(self,ftp_path, uploadFile):
'''
进行单个文件的上传操作
:param ftp_path:远程ftp的路径
:param uploadFile:上传的本地路径
:return:
'''
#判断远程的目录是否存在,不存在则创建,且切换到指定的路径下
self.create_path(ftp_path)
print(self.conn.pwd())
#本地文件名和上传的文件名保持一致
local_file = uploadFile.split('/')[-1]
fp = open(uploadFile, "rb")
buf_size = 1024
self.conn.storbinary('STOR {}'.format(local_file), fp, buf_size)
fp.close()
采用该方法,在传输文件中有中文时,会报错,报错信息如下:
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 5-8: ordinal not in range(256)
根据分析以及查看源码得知,ftplib包中使用的编码方式为latin-1,即他会以latin-1的方式进行文件编码,尽管我们在文件上传时使用的是二进制上传,但是文件名需要转换成二进制编码,它采用latin-1的形式对文件名进行编码,而latin-1不能对中文名称进行编码,所以报错;
对于这个问题,修改的方式修改ftplib的默认编码格式,因为要传输到windows服务器上,我们要将ftplib的默认编码格式修改成gbk的形式,具体修改的方式如下:
class FTPSync(object):
conn = ftplib.FTP()
def __init__(self, host, port):
self.conn.connect(host, port)
def login(self, username, password):
'''
登录操作
:param username:用户名
:param password:密码
:return:
'''
self.conn.login(username, password)
self.conn.set_pasv(False)
self.conn.encoding = 'gbk'
这样,在登录时,就将ftplib的编码改成gbk,在对中文名称编码时,gbk可以对文件进行编码