Python操作Azure Storage Blob经验

本文不同于官网的HelloWorld式入门,它没考虑账号安全和数据量等实际应用情况

本文经验并不全面,因为一般会使用StorageExplorer和AzCopyV10,Python只是用于做下脚本操作;

搭建

  • 默认已安装好Python,已拥有Azure存储账号;
  • 安装依赖项( Git SDK地址):
pip install azure-storage-blob

创建

不应该

block_blob_service = BlockBlobService(account_name = 'accountname', account_key = 'accountkey') 

而应该

block_blob_service = BlockBlobService(account_name = 'accountname', sas_token= '连接字符串') 

使用经验:代码应尽可能不放置密钥,而是使用账号+SAS(shared access signature)的方式;官方文档的SDK说明都是使用账号+密钥的连接字符串方式,其实听危险的。应该为不同的容器获取不同的SAS,设置合理的过期时间和操作权限,做好管理工作;

遍历(list)

#可以视为“目录路径”,一般不会要列出一整个container的文件
path_preffix = "blob_path1/blob_path2"
marker = None
while True:
    generator = block_blob_service.list_blob_names(container_name, path_preffix, num_results=100, marker=marker)
#返回的是一个生成器
    for blob_name in generator:
        print(blob_name)
        marker=generator.next_marker
        if not marker:
            break
  • list_blob_names和list_blobs主要参数相同,只是返回不同,如果只是遍历操作,自然是选择IO和耗时更小的list_blob_names
  • path_preffix是路径前缀,因为不是文件系统,目录都是假的;实际影响是:1)不可能创建一个空目录,上传空目录也是非法的;2)list返回的只有blob文件,带有路径前缀的文件,不像Linux有目录文件;
  • num_results 返回结果数,类似分页,数据量大时需要分页获取,配合next_marker 可以获取全部结果

上传

block_blob_service.create_blob_from_path(container_name, local_file_name, full_path_to_file)

下载

block_blob_service.get_blob_to_path(container_name, local_file_name, full_path_to_file)

没有实际使用,所以不详述了;有需要可以了解下AzCopy的sync命令

读取文件

content = block_blob_service.get_blob_to_text(container_name, blob_name).content
  • get_blob_to_text其实也是下载的一种,同类操作有:get_blob_to_path(下载为文件),get_blob_to_byte(二进制),get_blob_to_stream(读取为流);上传create_blob_也有这四种方式;
  • blob_name是完整路径加文件名,只适合读取小文本文件;

复制

这里我希望做个操作:将一个blob文件重命名复制到另一个位置,不用下载本地修改后再上传;

copy_opt = block_blob_service.copy_blob(container_name, "target_blod_name", "source_file_url")
  • target_blod_name是要复制到的文件路径
    source_file_url是复制的Azure存储源文件的地址,https格式的url;此处需要加SAS,使用带连接字符串的URL,因为上方我是使用账号+SAS的方式连接,无法自动判断是同一个账号下的资源。哪怕加了连接字符串,但实际也是云内的操作,速度有保证
  • copy_blob会返回一个操作对象,可以查看状态;操作默认是异步的,可以通过requires_sync参数改为同步;

删除

#你真的需要删除吗?

如果对你有帮助,希望能点个关注,或者点个喜欢

你可能感兴趣的:(Python操作Azure Storage Blob经验)