diffusers中blip描述使用详解

1 blip细节

diffusers中blip描述使用详解_第1张图片

2 blip读取代码

if __name__ == '__main__':
    args = parse_args()
    blix_list = []
    img_list = []
    for file_name in os.listdir(args.dataset_dir):
        if file_name.endswith(".txt"):
            continue
        img_list.append(file_name)
    if args.blip_type == "in_one_txt":
        import pdb
        pdb.set_trace()
        file = open(args.blip_path, "r") # xxx/blip.txt 
        
        tmp = file.readlines()
        k_v = {}
        for i in tmp:
            t = i.replace('\n', '').split('|')
            k_v[t[0]] = t[1]
        for i in img_list:
            
            import pdb
            # pdb.set_trace()
            
            blix_list.append(k_v[i])

diffusers中blip描述使用详解_第2张图片

0 首先看args.dataset_dir就是数据集位置,里面有blip.txt文件
然后如果是txt结尾就跳过
如果是png jpg就留下
这里可以做如下改进

for file_name in os.listdir(args.dataset_dir):
        if file_name.endswith(".txt"):
            continue
        if file_name.endswith(".png") of file_name.endswith(".jpg"):
        img_list.append(file_name)

因此img_list是所有非txt结尾文件名!!!

1 args.blip_path
/share/huanggao/zjc/code_mid/data/test_data/blip.txt'

2 tmp是列表

diffusers中blip描述使用详解_第3张图片

3 for i in tmp
'0726_yitian_diffusion_sketch_9.jpg|a woman posing for the camera\n'

4 以|分割str
t[0]                                                                                
'0726_yitian_diffusion_sketch_9.jpg'      
t[1]                                         
'a woman posing for the camera'

5 k_v[t[0]] = t[1] 构成字典

6 img_list里面是所有图片名

你可能感兴趣的:(java,linux,数据库)