望non

TT100K数据集转换成coco格式，并重新划分

统计每个类别

import os
import json

os.makedirs('annotations',exist_ok=True)
#存放数据的父路径
parent_path = '/path/to/your/TT100K/data'

#读TT100K原始数据集标注文件
with open(os.path.join(parent_path,'annotations.json')) as origin_json:
    origin_dict = json.load(origin_json)
    classes = origin_dict['types']
#建立统计每个类别包含的图片的字典
sta={}
for i in classes:
    sta[i]=[]

images_dic = origin_dict['imgs']

#记录所有保留的图片
saved_images=[]
#遍历TT100K的imgs
for image_id in images_dic:
    image_element=images_dic[image_id]
    image_path=image_element['path']
    
    # 添加图像的信息到dataset中
    image_path=image_path.split('/')[-1]
    obj_list=image_element['objects']

    #遍历每张图片的标注信息
    for anno_dic in obj_list:
        label_key=anno_dic['category']
        #防止一个图片多次加入一个标签类别
        if image_path not in sta[label_key]:
            sta[label_key].append(image_path)


#只保留包含图片数超过100的类别
result={k: v for k,v in sta.items() if len(v)>=100}

for i in result:
    print("the type of {} includes {} images".format(i,len(result[i])))
    saved_images.extend(result[i])

saved_images=list(set(saved_images))
print("total types is {}".format(len(result)))

type_list=list(result.keys())
result={"type":type_list,"details":result,"images":saved_images}
print(type_list)
# 保存结果
json_name = os.path.join(parent_path, 'annotations/statistics.json')
with open(json_name, 'w',encoding="utf-8") as f:
    json.dump(result, f,ensure_ascii=False,indent=1)

转换成coco格式

我这里根据上边统计的类别的结果重新划分了数据集，根据每个类别类别的总数量按7：2：1分为了train_set,val_set,test_set。其中每个图片所属类别根据该图片包含的类别的数量决定（归属为含有类别最多的类别）

import os
import cv2
import json
import shutil

os.makedirs('dataset/annotations',exist_ok=True)
#存放数据的父路径
parent_path = '/path/to/your/TT100K/data'

#读TT100K原始数据集标注文件
with open(os.path.join(parent_path,'annotations.json')) as origin_json:
    origin_dict = json.load(origin_json)

with open(os.path.join(parent_path,'annotations/statistics.json')) as select_json:
    select_dict = json.load(select_json)
    classes = select_dict['type']

train_dataset = {'info':{},'licenses':[],'categories': [],'images': [] , 'annotations': []}
val_dataset = {'info':{},'licenses':[],'categories': [],'images': [] , 'annotations': []}
test_dataset = {'info':{},'licenses':[],'categories': [],'images': [] , 'annotations': []}
label={}#记录每个标志类别的id
count={}#记录每个类别的图片数
owntype_sum={}

info={
    "year":2021,# 年份
    "version":'1.0',# 版本
    "description":"TT100k_to_coco", # 数据集描述
    "contributor":"Tecent&Tsinghua",# 提供者
    "url":'https://cg.cs.tsinghua.edu.cn/traffic-sign/',# 下载地址
    "date_created":2021-1-15
}
licenses={
    "id" :1,
    "name" :"null",
    "url" :"null",
}

train_dataset['info']=info
val_dataset['info']=info
test_dataset['info']=info
train_dataset['licenses']=licenses
val_dataset['licenses']=licenses
test_dataset['licenses']=licenses

#建立类别和id的关系
for i, cls in enumerate(classes):
    train_dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'traffic_sign'})
    val_dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'traffic_sign'})
    test_dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'traffic_sign'})
    label[cls]=i
    count[cls]=0
    owntype_sum[cls]=0


images_dic = origin_dict['imgs']

obj_id=1

#计算出每个类别共‘包含’的图片数
for image_id in images_dic:
    
    image_element=images_dic[image_id]
    image_path=image_element['path']
    image_name=image_path.split('/')[-1]
    #在所选的类别图片中
    if image_name not in select_dict['images']:
        continue

    #处理TT100K中的标注信息
    obj_list=image_element['objects']
    #记录图片中包含最多的实例所属的type
    includes_type={}
    for anno_dic in obj_list:
        if anno_dic["category"] not in select_dict["type"]:
            continue
        # print(anno_dic["category"])
        if anno_dic["category"] in includes_type:
            includes_type[anno_dic["category"]]+=1
        else:
            includes_type[anno_dic["category"]]=1
    # print(includes_type)
    own_type=max(includes_type,key=includes_type.get)
    owntype_sum[own_type]+=1

#TT100K的annotation转换成coco的
for image_id in images_dic:
    
    image_element=images_dic[image_id]
    image_path=image_element['path']
    image_name=image_path.split('/')[-1]
    #在所选的类别图片中
    if image_name not in select_dict['images']:
        continue
    print("dealing with {} image".format(image_path))
    #shutil.copy(os.path.join(parent_path,image_path),os.path.join(parent_path,"dataset/JPEGImages"))


    #处理TT100K中的标注信息
    obj_list=image_element['objects']
    #记录图片中包含最多的实例所属的type
    includes_type={}
    for anno_dic in obj_list:
        if anno_dic["category"] not in select_dict["type"]:
            continue
        # print(anno_dic["category"])
        if anno_dic["category"] in includes_type:
            includes_type[anno_dic["category"]]+=1
        else:
            includes_type[anno_dic["category"]]=1
    # print(includes_type)
    own_type=max(includes_type,key=includes_type.get)
    count[own_type]+=1
    num_rate=count[own_type]/owntype_sum[own_type]

    # 切换dataset的引用对象，从而划分数据集
    if num_rate<0.7:
        dataset =train_dataset
    elif num_rate<0.9:
        dataset=val_dataset
    else :
        print("dataset=test_dataset")
        dataset=test_dataset
    
    for anno_dic in obj_list:
        if anno_dic["category"] not in select_dict["type"]:
            continue
        x=anno_dic['bbox']['xmin']
        y=anno_dic['bbox']['ymin']
        width=anno_dic['bbox']['xmax']-anno_dic['bbox']['xmin']
        height=anno_dic['bbox']['ymax']-anno_dic['bbox']['ymin']
        label_key=anno_dic['category']
        
        dataset['annotations'].append({
                                    'area': width * height,
                                    'bbox': [x, y, width, height],
                                    'category_id':label[label_key],
                                    'id': obj_id,
                                    'image_id': image_id,
                                    'iscrowd': 0,
                                    # mask, 矩形是从左上角点按顺时针的四个顶点
                                    'segmentation': [[x, y, x+width, y, x+width, y+height, x, y+height]]
                                })
        #每个标注的对象id唯一
        obj_id+=1
    
    # 用opencv读取图片，得到图像的宽和高
    im = cv2.imread(image_path)
    H, W, _ = im.shape
    # 添加图像的信息到dataset中
    dataset['images'].append({'file_name': image_name,
                                'id': image_id,
                                'width': W,
                                'height': H})


# 保存结果
for phase in ['train','val','test']:
    json_name = os.path.join(parent_path, 'dataset/annotations/{}.json'.format(phase))
    with open(json_name, 'w',encoding="utf-8") as f:
        if phase == 'train':
            json.dump(train_dataset, f,ensure_ascii=False,indent=1)
        if phase == 'val':
            json.dump(val_dataset, f,ensure_ascii=False,indent=1)
        if phase == 'test':
            json.dump(test_dataset, f,ensure_ascii=False,indent=1)

没有重新划分，直接转换成coco格式

按着原来的划分保存，发现221类中Train中居然好多类别没有标志信息。所以，这种并不合适。

import os
import cv2
import json

os.makedirs('annotations',exist_ok=True)
#存放数据的父路径
parent_path = '/path/to/your/TT100K/data'

#读TT100K原始数据集标注文件
with open(os.path.join(parent_path,'annotations.json')) as origin_json:
    origin_dict = json.load(origin_json)
    classes = origin_dict['types']

train_dataset = {'info':{},'licenses':[],'categories': [],'images': [] , 'annotations': []}
val_dataset = {'info':{},'licenses':[],'categories': [],'images': [] , 'annotations': []}
test_dataset = {'info':{},'licenses':[],'categories': [],'images': [] , 'annotations': []}
label={}

info={
    "year":2021,# 年份
    "version":'1.0',# 版本
    "description":"TT100k_to_coco", # 数据集描述
    "contributor":"Tecent&Tsinghua",# 提供者
    "url":'https://cg.cs.tsinghua.edu.cn/traffic-sign/',# 下载地址
    "date_created":2021-1-15
}
licenses={
    "id" :1,
    "name" :"null",
    "url" :"null",
}

train_dataset['info']=info
val_dataset['info']=info
test_dataset['info']=info
train_dataset['licenses']=licenses
val_dataset['licenses']=licenses
test_dataset['licenses']=licenses

#建立类别和id的关系
for i, cls in enumerate(classes):
    train_dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'traffic_sign'})
    val_dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'traffic_sign'})
    test_dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'traffic_sign'})
    label[cls]=i

images_dic = origin_dict['imgs']

obj_id=1

#TT100K的annotation转换成coco的
for image_id in images_dic:
    image_element=images_dic[image_id]
    image_path=image_element['path']
    
    # 用opencv读取图片，得到图像的宽和高
    im = cv2.imread(image_path)
    H, W, _ = im.shape

    
    # 切换dataset的引用对象，从而划分数据集
    if 'train' in image_path:
            dataset = train_dataset
    elif 'test' in image_path:
            dataset = val_dataset
    else:
        dataset = test_dataset
    
    # 添加图像的信息到dataset中
    image_path=image_path.split('/')[-1]
    dataset['images'].append({'file_name': image_path,
                                'id': image_id,
                                'width': W,
                                'height': H})
    obj_list=image_element['objects']

    for anno_dic in obj_list:
        
        x=anno_dic['bbox']['xmin']
        y=anno_dic['bbox']['ymin']
        width=anno_dic['bbox']['xmax']-anno_dic['bbox']['xmin']
        height=anno_dic['bbox']['ymax']-anno_dic['bbox']['ymin']
        label_key=anno_dic['category']
        
        dataset['annotations'].append({
                                    'area': width * height,
                                    'bbox': [x, y, width, height],
                                    'category_id':label[label_key],
                                    'id': obj_id,
                                    'image_id': image_id,
                                    'iscrowd': 0,
                                    # mask, 矩形是从左上角点按顺时针的四个顶点
                                    'segmentation': [[x, y, x+width, y, x+width, y+height, x, y+height]]
                                })
        #每个标注的对象id唯一
        obj_id+=1

# 保存结果
for phase in ['train','val','test']:
    json_name = os.path.join(parent_path, 'annotations/{}.json'.format(phase))
    with open(json_name, 'w',encoding="utf-8") as f:
        if phase == 'train':
            json.dump(train_dataset, f,ensure_ascii=False,indent=1)
        if phase == 'val':
            json.dump(val_dataset, f,ensure_ascii=False,indent=1)
        if phase == 'test':
            json.dump(test_dataset, f,ensure_ascii=False,indent=1)

TT100K中的一些标注示例

文件太大了，拿出TT100K中的一部分annotations，字典中的内容都包含全了。

{"imgs": {
    "32770": {"path": "other/32770.jpg", "objects": [], "id": 32770},
    "32773": {"path": "test/32773.jpg", 
        "objects": [
        {"category": "ph2", "bbox": {"xmin": 924.0, "ymin": 1132.0, "ymax": 1177.3333, "xmax": 966.6667}, 
        "ellipse_org": [[942.725, 1132.14], [926.19, 1144.18], [922.884, 1156.61], [931.746, 1173.02], [949.471, 1174.07], [959.921, 1169.58], [962.037, 1142.72]],
        "ellipse": [[943.6439208984375, 1154.060791015625], [41.572391510009766, 45.09551239013672], 36.37429428100586]}, 
        {"category": "p11", "bbox": {"xmin": 970.667, "ymin": 1128.0, "ymax": 1170.6667, "xmax": 1013.3333}, 
        "ellipse_org": [[997.385, 1130.51], [977.584, 1137.36], [974.222, 1161.52], [990.286, 1170.61], [1012.7, 1157.41]], 
        "ellipse": [[992.5154418945312, 1149.9034423828125], [39.68983840942383, 43.2476692199707], 66.92964172363281]}, 
        {"category": "pl5", "bbox": {"xmin": 1146.67, "ymin": 1108.0, "ymax": 1150.6667, "xmax": 1190.6733000000002}, 
        "ellipse_org": [[1170.5, 1110.58], [1151.81, 1121.04], [1155.43, 1148.58], [1176.6, 1150.32], [1190.93, 1125.4]], 
        "ellipse": [[1168.935546875, 1130.9200439453125], [40.40793991088867, 44.34447479248047], 53.05292892456055]}], "id": 32773}, 
    "8": {"path": "other/8.jpg", "objects": [], "id": 8}, 
    "65547": {"path": "other/65547.jpg", "objects": [], "id": 65547}, 
    "2": {"path": "test/2.jpg", "objects": [{"category": "pne", "bbox": {"xmin": 489.6, "ymin": 993.6, "ymax": 1010.4, "xmax": 507.20000000000005}, 
        "ellipse_org": [[498.899, 995.698], [505.703, 1004.15], [498.899, 1010.06], [492.496, 1003.3], [494.497, 1008.55], [494.1, 998.1]], 
        "ellipse": [[498.7543029785156, 1002.3943481445312], [12.916229248046875, 15.343103408813477], 20.536766052246094]}, 
        {"category": "pb", "bbox": {"xmin": 1465.6, "ymin": 775.2, "ymax": 823.2, "xmax": 1510.3999999999999}, 
        "ellipse_org": [[1486.13, 776.471], [1508.96, 800.14], [1486.83, 821.849], [1466.11, 802.661], [1486.13, 776.471]], 
        "ellipse": [[1486.7872314453125, 798.53955078125], [42.06432342529297, 45.424739837646484], 161.0270233154297]}, 
        {"category": "il60", "bbox": {"xmin": 1296.8, "ymin": 769.6, "ymax": 822.4, "xmax": 1344.0}, 
        "ellipse_org": [[1320.18, 770.724], [1344.38, 797.843], [1319.57, 820.339], [1297.07, 796.61], [1320.18, 770.724]], 
        "ellipse": [[1320.454833984375, 795.0762939453125], [46.60488510131836, 50.64521408081055], 159.8419189453125]}, 
        {"category": "pl80", "bbox": {"xmin": 1207.2, "ymin": 769.6, "ymax": 820.8000000000001, "xmax": 1259.2}, 
        "ellipse_org": [[1234.93, 771.065], [1257.8, 794.684], [1234.18, 818.901], [1209.67, 796.777], [1216.1, 810.081], [1214.45, 780.482], [1253.77, 780.035]], 
        "ellipse": [[1233.2791748046875, 794.2261352539062], [47.03112030029297, 48.21159362792969], 92.2869873046875]},
        {"category": "il70", "bbox": {"xmin": 1056.8, "ymin": 772.8, "ymax": 821.5999999999999, "xmax": 1104.8}, 
        "ellipse_org": [[1080.48, 773.219], [1104.84, 798.148], [1078.35, 821.083], [1056.7, 796.581], [1096.86, 778.776], [1063.96, 779.345]], 
        "ellipse": [[1079.98828125, 796.7401123046875], [48.33481216430664, 48.59633255004883], 32.45444107055664]}, 
        {"category": "pl100", "bbox": {"xmin": 965.6, "ymin": 771.2, "ymax": 822.4000000000001, "xmax": 1017.6}, 
        "ellipse_org": [[992.607, 773.456], [1016.23, 798.122], [990.963, 820.994], [968.839, 798.421], [971.981, 809.931], [973.323, 782.426]], 
        "ellipse": [[991.9072265625, 796.5220947265625], [46.99789047241211, 48.43968963623047], 72.09580993652344]}, 
        {"category": "il80", "bbox": {"xmin": 844.8, "ymin": 776.8, "ymax": 826.4, "xmax": 893.5999999999999}, 
        "ellipse_org": [[867.583, 777.713], [892.33, 802.605], [868.017, 826.194], [844.284, 801.447], [847.902, 816.064], [848.046, 787.843]], 
        "ellipse": [[867.6563110351562, 801.4813232421875], [48.00596237182617, 50.005287170410156], 34.71076965332031]}, 
        {"category": "pl100", "bbox": {"xmin": 757.6, "ymin": 779.2, "ymax": 831.2, "xmax": 807.2}, 
        "ellipse_org": [[781.487, 781.335], [805.918, 805.159], [781.032, 828.68], [758.725, 805.766], [766.768, 786.95], [799.545, 820.182]], 
        "ellipse": [[781.3561401367188, 804.3736572265625], [46.509883880615234, 47.53220748901367], 136.26280212402344]}], "id": 2}, 
    "98318": {"path": "test/98318.jpg", "objects": [{"category": "po", "bbox": {"xmin": 1594.67, "ymin": 985.333, "ymax": 1026.6667, "xmax": 1636.0}, 
        "ellipse_org": [[1617.31, 986.408], [1603.07, 991.424], [1597.41, 1002.75], [1603.07, 1017.8], [1616.83, 1023.79], [1634.95, 1009.71], [1630.27, 993.042], [1603.26, 1019.9]], 
        "ellipse": [[1615.67822265625, 1004.5797729492188], [36.9547119140625, 37.54513931274414], 110.10639953613281]}, 
        {"category": "w55", "bbox": {"xmin": 1278.67, "ymin": 989.333, "ymax": 1008.0, "xmax": 1301.3333}, "polygon": [[1291.49, 989.534], [1279.22, 1008.97], [1302.09, 1008.82]]}, 
        {"category": "pl40", "bbox": {"xmin": 1284.0, "ymin": 1009.33, "ymax": 1028.0, "xmax": 1302.6667}, 
        "ellipse_org": [[1292.72, 1009.42], [1285.56, 1013.15], [1285.12, 1021.55], [1292.2, 1026.02], [1297.47, 1023.82], [1300.25, 1019.58], [1297.33, 1011.4], [1291.18, 1010.99], [1299.91, 1017.82]], 
        "ellipse": [[1291.8165283203125, 1017.4920654296875], [15.608173370361328, 16.49311637878418], 4.2683329582214355]}], "id": 98318}, 
    "65551": {"path": "other/65551.jpg", "objects": [], "id": 65551}, 
    "65552": {"path": "other/65552.jpg", "objects": [], "id": 65552}, 
    "10926": {"path": "train/10926.jpg", "objects": [{"category": "pn", "bbox": {"xmin": 1126.37, "ymin": 991.542, "ymax": 1002.9851, "xmax": 1137.8084999999999}, 
        "ellipse_org": [[1136.35, 993.95], [1127.25, 995.1], [1129.05, 1002.1], [1132.6, 1002.95], [1136.95, 1000.0]], "ellipse": [[1131.77197265625, 997.223876953125], [9.32163143157959, 12.719460487365723], 68.103515625]}, 
        {"category": "pl80", "bbox": {"xmin": 1172.14, "ymin": 982.089, "ymax": 999.5020000000001, "xmax": 1190.0498},
        "ellipse_org": [[1186.12, 984.395], [1173.19, 989.232], [1177.72, 999.16], [1182.51, 1000.03], [1188.82, 992.897], [1179.15, 984.14]], 
        "ellipse": [[1180.553955078125, 991.4905395507812], [15.228023529052734, 17.70697593688965], 33.04566192626953]}], "id": 10926}},
"types": ["i1", "i10", "i11", "i12", "i13", "i14", "i15", "i2", "i3", "i4", "i5", "il100", "il110", "il50", "il60", "il70", "il80", "il90", "io", "ip", "p1", "p10", "p11", "p12", "p13", "p14", "p15", "p16", "p17", "p18", "p19", "p2", "p20", "p21", "p22", "p23", "p24", "p25", "p26", "p27", "p28", "p3", "p4", "p5", "p6", "p7", "p8", "p9", "pa10", "pa12", "pa13", "pa14", "pa8", "pb", "pc", "pg", "ph1.5", "ph2", "ph2.1", "ph2.2", "ph2.4", "ph2.5", "ph2.8", "ph2.9", "ph3", "ph3.2", "ph3.5", "ph3.8", "ph4", "ph4.2", "ph4.3", "ph4.5", "ph4.8", "ph5", "ph5.3", "ph5.5", "pl10", "pl100", "pl110", "pl120", "pl15", "pl20", "pl25", "pl30", "pl35", "pl40", "pl5", "pl50", "pl60", "pl65", "pl70", "pl80", "pl90", "pm10", "pm13", "pm15", "pm1.5", "pm2", "pm20", "pm25", "pm30", "pm35", "pm40", "pm46", "pm5", "pm50", "pm55", "pm8", "pn", "pne", "po", "pr10", "pr100", "pr20", "pr30", "pr40", "pr45", "pr50", "pr60", "pr70", "pr80", "ps", "pw2", "pw2.5", "pw3", "pw3.2", "pw3.5", "pw4", "pw4.2", "pw4.5", "w1", "w10", "w12", "w13", "w16", "w18", "w20", "w21", "w22", "w24", "w28", "w3", "w30", "w31", "w32", "w34", "w35", "w37", "w38", "w41", "w42", "w43", "w44", "w45", "w46", "w47", "w48", "w49", "w5", "w50", "w55", "w56", "w57", "w58", "w59", "w60", "w62", "w63", "w66", "w8", "wo", "i6", "i7", "i8", "i9", "ilx", "p29", "w29", "w33", "w36", "w39", "w4", "w40", "w51", "w52", "w53", "w54", "w6", "w61", "w64", "w65", "w67", "w7", "w9", "pax", "pd", "pe", "phx", "plx", "pmx", "pnl", "prx", "pwx", "w11", "w14", "w15", "w17", "w19", "w2", "w23", "w25", "w26", "w27", "pl0", "pl4", "pl3", "pm2.5", "ph4.4", "pn40", "ph3.3", "ph2.6"]}

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

TT100K数据集转换成coco格式，并重新划分

TT100K数据集转换成coco格式，并重新划分

统计每个类别

转换成coco格式

没有重新划分，直接转换成coco格式

TT100K中的一些标注示例

你可能感兴趣的:(数据集处理,python,cv,深度学习)