星空•物语

自建数据集系列：从二值mask-＞labelme格式-＞coco格式

文章目录

- 前言
- mask转labelme格式
- 切分数据
- 补充labelme的imageData
- 生成coco格式
- 汇总
- - 1.从labelImg格式->txt格式（YOLO格式、ICDAR2015格式）
  - 2.从二值mask-＞labelme格式-＞coco格式
  - 3.从labelme格式-＞VOC格式+从二值mask-＞VOC格式
  - 4.从RGB-＞二值mask-＞coco格式
  - 5.实例分割mask-＞语义分割mask-＞扩增mask
  - 6.COCO格式-＞YOLO格式
  - 双模图片数据与对应标注文件的命名对齐
  - xml标注文件的节点、属性、文本的修正
  - cocoJson数据集统计分析

前言

当公开的数据只有分割mask，没有json数据格式的时候，你的模型训练将会很受局限。为了突破，故撰写该文档，这样可用于检测的验证数据集又多了一些。

mask转labelme格式

mask2Labelme\mask2labelme.py

#!/usr/bin/env python3
#功能批量将多个同类mask 转单个json 
 
import datetime
import json
import os
import io
import re
import fnmatch
import json
from PIL import Image
import numpy as np
from pycococreatortools import pycococreatortools
from PIL import Image
import base64
from base64 import b64encode
 
ROOT_DIR = 'C:/Users/awei/Desktop/mask2Labelme/tank/Tank_train/'
IMAGE_DIR = os.path.join(ROOT_DIR, "Image")
ANNOTATION_DIR = os.path.join(ROOT_DIR, "GT")
 
def img_tobyte(img_pil):
# 类型转换 重要代码
    # img_pil = Image.fromarray(roi)
    ENCODING='utf-8'
    img_byte=io.BytesIO()
    img_pil.save(img_byte,format='PNG')
    binary_str2=img_byte.getvalue()
    imageData = base64.b64encode(binary_str2)
    base64_string = imageData.decode(ENCODING)
    return base64_string
 
 
annotation_files=os.listdir(ANNOTATION_DIR)
for annotation_filename in annotation_files:
    coco_output = {
        "version": "3.16.7",
        "flags": {},
   "fillColor": [255, 0,0,128],
  "lineColor": [0,255,0, 128],
  "imagePath": {},
  "shapes": [],
  "imageData": {} }
    
    print(annotation_filename)
    class_id = 1
    name = annotation_filename.split('.',3)[0]
    name1=name+'.jpg'
    coco_output["imagePath"]=name1 
 
    image = Image.open(IMAGE_DIR+'/'+ name1)
    imageData=img_tobyte(image)
    coco_output["imageData"]= imageData 
    
    binary_mask = np.asarray(Image.open(ANNOTATION_DIR+'/'+annotation_filename)
        .convert('1')).astype(np.uint8)
    segmentation=pycococreatortools.binary_mask_to_polygon(binary_mask, tolerance=3)
    #筛选多余的点集合
    for item in segmentation:
        if(len(item)>10):
 
            list1=[]
            
            for i in range(0, len(item), 2):
                list1.append( [item[i],item[i+1]])
            
            label = "tank" # 
            seg_info = {'points': list1, "fill_color":'null'  ,"line_color":'null' ,"label": label, "shape_type": "polygon","flags": {}}
            coco_output["shapes"].append(seg_info)
    coco_output[ "imageHeight"]=binary_mask.shape[0]
    coco_output[ "imageWidth"]=binary_mask.shape[1]
    
 
    full_path='{}/'+name+'.json'
 
    with open( full_path.format(ROOT_DIR), 'w') as output_json_file:
        json.dump(coco_output, output_json_file)

切分数据

总共有3类数据，每类文件夹下对应的就是jpg和对应的json标注文件，借助splidata_labelMe.py将每类切分为训练测试两部分

labelme2coco\splitData_labelMe.py

import os, random, shutil

fileDir = './hangar485/'
testDir = fileDir+'Test/'
trainDir = fileDir+'Train/'

def moveFile(fileDir,toTest=True):
        
        dir = testDir
        pathDir = [i for i in os.listdir(fileDir) if i.endswith('.json')]    #取所有labelme标注名
        rate=0.1    #自定义抽取图片的比例，比方说100张抽10张，那就是0.1
        filenumber=len(pathDir)
        if not toTest:
            dir = trainDir
            rate = 1 # 将剩下的都作为train
        
        picknumber=int(filenumber*rate) #按照rate比例从文件夹中取一定数量图片
        # picknumber=200   #直接取1000张
        sample = random.sample(pathDir, picknumber)  #随机选取picknumber数量的样本图片
        print (sample)
        
        for name in sample:
                shutil.move(fileDir+name, dir+name)
                jpgName = name.split(".")[0]+'.jpg'
                shutil.move(fileDir+jpgName, dir+jpgName)
        return

if __name__ == '__main__':
    if not os.path.exists(testDir):
        os.makedirs(testDir)
    if not os.path.exists(trainDir):
        os.makedirs(trainDir)
    
    moveFile(fileDir)

    moveFile(fileDir,toTest=False)  # 剩下移动到train

但是吧你会发现不同类下，文件名都是一样的，这样在后面会导致替换丢失

借助linux下的shell命令，增加对应类别名前缀：

for i in `ls`;do mv -f $i `echo "tank_"$i`; done

补充labelme的imageData

JPEGImages中的原始图片，是从labelme的json标注文件中ImageData解码产生
但是吧，有些labelme标注的json，该项为None，所以就会导致labelme2coco_xu无法解码生成原始图片
譬如：

{
  "version": "4.5.13",
  "flags": {},
  "shapes": [
    {
      "label": "tank",
      "points": [
        [
          1351.129363449692,
          407.18685831622173
        ],
        [
          1361.1909650924024,
          408.4188911704312
        ],
        [
          1375.359342915811,
          415.4004106776181
        ],
        [
          1385.4209445585216,
          422.17659137577
        ],
        [
          1373.100616016427,
          435.3182751540041
        ],
        [
          1364.476386036961,
          444.96919917864477
        ],
        [
          1361.3963039014372,
          447.22792607802876
        ],
        [
          1358.7268993839834,
          453.7987679671458
        ],
        [
          1351.9507186858316,
          460.7802874743326
        ],
        [
          1339.2197125256673,
          456.26283367556465
        ],
        [
          1325.4620123203285,
          450.51334702258725
        ],
        [
          1320.3285420944558,
          445.37987679671454
        ],
        [
          1321.1498973305954,
          438.3983572895277
        ],
        [
          1324.640657084189,
          433.88090349075975
        ],
        [
          1328.747433264887,
          429.15811088295686
        ],
        [
          1331.006160164271,
          425.87268993839837
        ],
        [
          1340.6570841889118,
          421.5605749486653
        ]
      ],
      "group_id": null,
      "shape_type": "polygon",
      "flags": {}
    }
  ],
  "imagePath": "2235.jpg",
  "imageData": null,
  "imageHeight": 1080,
  "imageWidth": 1920

labelme2coco\checkImgData_labelme.py

#!/usr/bin/env python3
#功能 填补labelme的json中缺失的imageData
 
import datetime
import json
import os
import io
import json
from PIL import Image
import base64
from base64 import b64encode
 
ROOT_DIR = './tank1073/Test'
IMAGE_DIR = ROOT_DIR
ANNOTATION_DIR = ROOT_DIR
 
def img_tobyte(img_pil):
# 类型转换 重要代码
    # img_pil = Image.fromarray(roi)
    ENCODING='utf-8'
    img_byte=io.BytesIO()
    img_pil.save(img_byte,format='PNG')
    binary_str2=img_byte.getvalue()
    imageData = base64.b64encode(binary_str2)
    base64_string = imageData.decode(ENCODING)
    return base64_string
 
 
annotation_files=[i for i in os.listdir(ANNOTATION_DIR) if i.endswith('.json')]
for annotation_filename in annotation_files:
    with open(ANNOTATION_DIR+'/'+annotation_filename,'r') as f:
        coco_output = json.load(f)

    if coco_output["imageData"] is None:
    
        print(annotation_filename+" without imageData")

        name = annotation_filename.split('.',3)[0]
        name1=name+'.jpg'
 
        image = Image.open(IMAGE_DIR+'/'+ name1)
        imageData=img_tobyte(image)
        coco_output["imageData"]= imageData 
 
        full_path='{}/'+name+'.json'
    
        with open( full_path.format(ROOT_DIR), 'w') as output_json_file:
            json.dump(coco_output, output_json_file)

生成coco格式

labelme2coco\labelme2coco_xu.py

#!/usr/bin/env python

import argparse
import collections
import datetime
import glob
import json
import os
import os.path as osp
import sys
import uuid

import imgviz
import numpy as np

import labelme

try:
    import pycocotools.mask
except ImportError:
    print("Please install pycocotools:\n\n    pip install pycocotools\n")
    sys.exit(1)

#https://blog.csdn.net/sinat_29957455/article/details/82778306
def get_dir_path(root_path,dir_list):
    #获取该目录下所有的文件名称和目录名称
    dir_or_files = os.listdir(root_path)
    for dir_file in dir_or_files:
        #获取目录或者文件的路径
        dir_file_path = os.path.join(root_path,dir_file)
        #判断该路径为文件还是路径
        if os.path.isdir(dir_file_path):
            dir_list.append(dir_file_path)
            #递归获取所有目录的路径
            get_dir_path(dir_file_path,dir_list)

def main():
    parser = argparse.ArgumentParser(
        formatter_class=argparse.ArgumentDefaultsHelpFormatter
    )
    parser.add_argument("--input_dir",type=str,default="./", help="input annotated directory")
    parser.add_argument("--output_dir",type=str,default="./cocoFormat", help="output dataset directory")
    parser.add_argument("--labels",type=str,default="./labels.txt", help="labels file")
    parser.add_argument("--train_flag",type=bool,default=False, help="generate train or val")  # True
    parser.add_argument(
        "--noviz", help="no visualization", action="store_true"
    )

    args = parser.parse_args()

    if osp.exists(args.output_dir):
        print("Output directory already exists:", args.output_dir)
        sys.exit(1)
    os.makedirs(args.output_dir)
    os.makedirs(osp.join(args.output_dir, "JPEGImages"))
    if not args.noviz:
        os.makedirs(osp.join(args.output_dir, "Visualization"))
    print("Creating dataset:", args.output_dir)

    now = datetime.datetime.now()

    data = dict(
        info=dict(
            description=None,
            url=None,
            version=None,
            year=now.year,
            contributor=None,
            date_created=now.strftime("%Y-%m-%d %H:%M:%S.%f"),
        ),
        licenses=[dict(url=None, id=0, name=None,)],
        images=[
            # license, url, file_name, height, width, date_captured, id
        ],
        type="instances",
        annotations=[
            # segmentation, area, iscrowd, image_id, bbox, category_id, id
        ],
        categories=[
            # supercategory, id, name
        ],
    )

    class_name_to_id = {}
    for i, line in enumerate(open(args.labels).readlines()):
        class_id = i - 1  # starts with -1
        class_name = line.strip()
        if class_id == -1:
            assert class_name == "__ignore__"
            continue
        class_name_to_id[class_name] = class_id
        data["categories"].append(
            dict(supercategory=None, id=class_id, name=class_name,)
        )
    dir_list = []
    get_dir_path(args.input_dir,dir_list)
    if args.train_flag:
        out_ann_file = osp.join(args.output_dir, "train_annotations.json")
        dirs = [i for i in dir_list if i.endswith("Train")]

    else:
        out_ann_file = osp.join(args.output_dir, "val_annotations.json")
        dirs = [i for i in dir_list if i.endswith("Test")]

    label_files = []
    for dir in dirs:
        label_files +=glob.glob(osp.join(dir, "*.json"))
    for image_id, filename in enumerate(label_files):
        print("Generating dataset from:", filename)

        label_file = labelme.LabelFile(filename=filename)

        base = osp.splitext(osp.basename(filename))[0]
        out_img_file = osp.join(args.output_dir, "JPEGImages", base + ".jpg")

        img = labelme.utils.img_data_to_arr(label_file.imageData)
        imgviz.io.imsave(out_img_file, img)
        data["images"].append(
            dict(
                license=0,
                url=None,
                file_name=osp.relpath(out_img_file, osp.dirname(out_ann_file)),
                height=img.shape[0],
                width=img.shape[1],
                date_captured=None,
                id=image_id,
            )
        )

        masks = {}  # for area
        segmentations = collections.defaultdict(list)  # for segmentation
        for shape in label_file.shapes:
            points = shape["points"]
            label = shape["label"]
            group_id = shape.get("group_id")
            shape_type = shape.get("shape_type", "polygon")
            mask = labelme.utils.shape_to_mask(
                img.shape[:2], points, shape_type
            )

            if group_id is None:
                group_id = uuid.uuid1()

            instance = (label, group_id)

            if instance in masks:
                masks[instance] = masks[instance] | mask
            else:
                masks[instance] = mask

            if shape_type == "rectangle":
                (x1, y1), (x2, y2) = points
                x1, x2 = sorted([x1, x2])
                y1, y2 = sorted([y1, y2])
                points = [x1, y1, x2, y1, x2, y2, x1, y2]
            if shape_type == "circle":
                (x1, y1), (x2, y2) = points
                r = np.linalg.norm([x2 - x1, y2 - y1])
                n_points_circle = 12
                i = np.arange(n_points_circle)
                x = x1 + r * np.sin(2 * np.pi / n_points_circle * i)
                y = y1 + r * np.cos(2 * np.pi / n_points_circle * i)
                points = np.stack((x, y), axis=1).flatten().tolist()
            else:
                points = np.asarray(points).flatten().tolist()

            segmentations[instance].append(points)
        segmentations = dict(segmentations)

        for instance, mask in masks.items():
            cls_name, group_id = instance
            if cls_name not in class_name_to_id:
                continue
            cls_id = class_name_to_id[cls_name]

            mask = np.asfortranarray(mask.astype(np.uint8))
            mask = pycocotools.mask.encode(mask)
            area = float(pycocotools.mask.area(mask))
            bbox = pycocotools.mask.toBbox(mask).flatten().tolist()

            data["annotations"].append(
                dict(
                    id=len(data["annotations"]),
                    image_id=image_id,
                    category_id=cls_id,
                    segmentation=segmentations[instance],
                    area=area,
                    bbox=bbox,
                    iscrowd=0,
                )
            )

        if not args.noviz:
            viz = img
            if masks:
                labels, captions, masks = zip(
                    *[
                        (class_name_to_id[cnm], cnm, msk)
                        for (cnm, gid), msk in masks.items()
                        if cnm in class_name_to_id
                    ]
                )
                viz = imgviz.instances2rgb(
                    image=img,
                    labels=labels,
                    masks=masks,
                    captions=captions,
                    font_size=15,
                    line_width=2,
                )
            out_viz_file = osp.join(
                args.output_dir, "Visualization", base + ".jpg"
            )
            imgviz.io.imsave(out_viz_file, viz)

    with open(out_ann_file, "w") as f:
        json.dump(data, f)


if __name__ == "__main__":
    main()

之后稍微调整下文件夹名方可，这里稍微注意下coco的instance_{train,val}2017.json文件中的"file_name": "JPEGImages/person_dataset07_08_00010578.jpg"故在train2017文件夹下得有个JPEGImages文件夹，然后再放原始图片

汇总

1.从labelImg格式->txt格式（YOLO格式、ICDAR2015格式）

2.从二值mask-＞labelme格式-＞coco格式

3.从labelme格式-＞VOC格式+从二值mask-＞VOC格式

4.从RGB-＞二值mask-＞coco格式

5.实例分割mask-＞语义分割mask-＞扩增mask

6.COCO格式-＞YOLO格式

双模图片数据与对应标注文件的命名对齐

xml标注文件的节点、属性、文本的修正

cocoJson数据集统计分析

Qt: QT图形绘制简介大白萝卜不紧张 qt qt 开发语言
1.QPainter描述：QPainter是Qt最常用的绘图类。它提供了一组丰富的功能来绘制各种形状、文本和图像。用途：适用于自定义绘制，比如在QWidget或QGraphicsView中绘制。功能：绘制基本图形（线条、矩形、圆形、多边形等）。绘制文本和图像。支持渐变、纹理和抗锯齿效果。2.QGraphicsView和QGraphicsScene描述：QGraphicsView是一个用于显示和管理
Invocation of init method failed； nested exception is java.sql.SQLException: com.mysql.cj.jdbc.Drive weixin_42277889 mysql java sql
代码更新后连不上数据库，前天都还可以，现在不行了，一直报错mysql没有。Pom文件全局搜也灭有。一开始是查不到的，但是实际上pom文件中引入了，maven没有更新。。。。
python3多线程传参_python多线程怎么传送多个参数 weixin_39808803 python3多线程传参
对于python来说，作为解释型语言，Python的解释器必须做到既安全又高效。我们都知道多线程编程会遇到的问题，解释器要留意的是避免在不同的线程操作内部共享的数据，同时它还要保证在管理用户线程时保证总是有最大化的计算资源。而python是通过使用全局解释器锁来保护数据的安全性：python代码的执行由python虚拟机来控制，即Python先把代码(.py文件)编译成字节码(字节码在Python
Qt绘制图像 MechMaster QT qt c++
Qt绘制图像1.例程代码2.四个常用的绘图设备2.1QImage2.2QPixmap2.3QBitmap2.4QPicture3.复合模式1.例程代码voidWidget::paintEvent(QPaintEvent*event){QPainterpainter;//绘制imageQImageimage(100,100,QImage::Format_ARGB32);painter.begin(&
Spark Streaming的背压机制的原理与实现代码及分析 weixin_30777913 spark 大数据 python
SparkStreaming的背压机制是一种根据JobScheduler反馈的作业执行信息来动态调整Receiver数据接收率的机制。在Spark1.5.0及以上版本中，可以通过设置spark.streaming.backpressure.enabled为true来启用背压机制。当启用背压机制时，SparkStreaming会自动根据系统的处理能力来调整数据的输入速率，从而在流量高峰时保证最大的吞
HDFS读写流程金州饿霸 Hadoop Big Data hdfs hadoop 大数据
因为namenode维护管理了文件系统的元数据信息，这就造成了不管是读还是写数据都是基于NameNode开始的，也就是说NameNode成为了HDFS访问的唯一入口。入口地址是：http://nn_host:8020。一、写数据流程1.1Pipeline管道、ACK应答响应Pipeline，中文翻译为管道。这是HDFS在上传文件写数据过程中采用的一种数据传输方式。客户端将数据块写入第一个数据节点，
HDFS读写流程（全面深入理解） AnAn-66. hadoop hdfs 面试 hadoop
1、HDFS写流程（1）客户端通过对FileSystem.create()对象创建建文件，DistributedFileSystem会创建输出流FSDataOutputStream。（2）DistributedFileSystem通过RPC远程调用名称节点，在文件系统的命名空间中创建一个新的文件，此时该文件中还没有相应的数据块。（3）名称节会执行一些检查，比如文件是否已经存在、客户端是
HDFS的读写流程熊與猫v 大数据 hadoop big data
一，HDFS的读写流程1.hdfs的写入流程文上传流程如下：创建文件：①HDFSclient向HDFS写入数据，先调用DistributedFileSystem.create()②RPC调用namenode的create()，会在HDFS目录树中指定的路径，添加新文件；并将操作记录在edits.log中namenode.create()方法执行完后，返回一个FSDataOutputStream，它
Window系统下开发Qt——在图片上绘制图形十年编程老舅 QT开发 qt c++qt5 开发语言 ui
在图像处理程序中，经常需要在图片上绘制一些图像，用以提示用户或展示一些信息。例如，需要绘制一个矩形框，显示当前处理的图像是原图像的一部分。一般在Qt中，可以使用QLabel控件来显示图片。但是使用QLabel既显示图片又显示自己绘制的图形，会很不方便。可以自定义个类，继承自QLabel，并且重写QLabel的paintEvent方法，在此方法中，绘制自己的图形。QT文章推荐阅读：Qt开发必备技术栈
hdfs的读写流程披星戴月的蝈蝈 hadoop面试题 hdfs hadoop 大数据
1.hdfs写数据面试回答方式1、客户端向NameNode发起上传请求2、NameNode进行权限检查，如果没有问题，返回可以上传通知3、客户端将文件切分多个block，并上传第一个block，NameNode返回主机列表4、客户端开始和对应的主机建立关联，开始上传第一个block及它的副本5、上传完第一个之后，接着上传剩余的block及副本，上传完成之后，由NameNode更新元数据2.hdfs
基于 Spring 的本地事务管理可儿·四系桜 java 数据库
1.什么是本地事务？本地事务是指在单一数据库系统内执行的一组操作，这些操作要么全部完成，要么全部不执行，是一个不可分割的工作单元。本地事务具有ACID特性：原子性（Atomicity）：事务中的所有操作都作为一个整体提交或回滚；如果事务的一部分失败，则整个事务都会被撤销。一致性（Consistency）：事务将数据库从一个一致状态转换到另一个一致状态，确保数据的完整性和规则得到遵守。隔离性（Iso
Spring MVC学习笔记万般滋味皆生活后端开发 spring springmvc
文章目录SpringMVC什么是MVC设计模式？SpringMVC的核心组件SpringMVC的工作流程如何使用？SpringMVC注解SpringMVC数据绑定SpringMVC模型数据解析SpringMVC自定义数据转换器SpringMVCREST特点如何使用SpringMVC文件上传下载SpringMVC表单标签库常用的表单标签SpringMVC数据校验SpringMVCSpringMVC是
python多线程并发加速 AI算法网奇 python宝典 mysql python基础数据库
目录python多线程并发加速多线程例子打印线程号，进程号由于Python的全局解释器锁（GIL）限制，在CPU密集型任务中多线程的效果并不理想，但对于I/O密集型任务，多线程仍然是有效的。python多线程并发加速python多线程并发遍历数据库，然后查询历史记录，然后分析数据查询100ms，这时需要3分钟，加了并发处理后，需要1.2分钟后来数据库加了索引，需要6秒就可以了，总结：加索引能带来3
unity3d tilemap hewei+ unity3d
2019的unity3d需要进入packageManager添加tilemap。不然找不到tilepalette瓦片碰撞器compositecollider2d是将多个碰撞器融合提高性能的。自动添加的刚体改成static，勾选tilemapcollider2d的usedBycomposite不添加碰撞器的瓦片设置为none;图片有间隙。改为能被图片像素除断的值，也不能太小
Failed to resolve: com.github.* 冰峰雪岭安卓 gradle maven java
引入外部包时常见说要在项目根目录的build.gradle中添加allprojects{repositories{......maven{url'https://jitpack.io'}}}但还是会报错Failedtoresolve:com.github.*最新的androidStudio要到根目录的settings.gradle中去添加repositories{......maven{url'h
用红黑树实现map和set RadiumYang 算法 C++
用红黑树实现map和set上一篇文章讲解了如何实现红黑树：https://blog.csdn.net/Radium_1209/article/details/104873813这里我们用已经实现的红黑树来写一个简单的map和set。因为map有两个参数，所以我们要先对原来的代码进行微调，将传入的参数调整为Key和Value。还有一些地方需要微调，详见https://github.com/Radiu
科研绘图系列：R语言绘制线性回归连线图（line chart）生信学习者1 SCI科研绘图系列 r语言线性回归数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图保存图片系统信息参考介绍科研绘图系列：R语言绘制线性回归连线图（linechart）加载R包library(tidyverse)library(ggthemes)library(readxl)数据下载所需要的数据和代码通过以下链接下载：百度网盘链接:
HDFS安全模式哒啵Q297 hdfs hadoop 大数据
当hdfs集群启动的时候，由于要做很多的事情，这期间集群进入了安全模式离开安全模式的条件：NameNode启动后会进入一个称为安全模式的特殊状态。处于安全模式的NameNode对于客户端来说是只读的。NameNode从所有的DataNode接收心跳信号和块状态报告（blockreport）每个数据块都有一个指定的最小副本数（dfs.replication.min），当NameNode检测确认某个数
Python语言的安全开发慕璃嫣包罗万象 golang 开发语言后端
Python语言的安全开发引言在信息技术迅速发展的今天，网络安全问题愈发凸显。随着Python语言的广泛应用，尤其是在数据分析、人工智能、Web开发等领域，其安全问题越来越受到重视。Python作为一门高效且易于学习的编程语言，虽然在开发过程中为我们提供了很多便利，但如果忽视了安全性，将可能导致严重的安全漏洞和数据泄露等问题。因此，本文将围绕Python语言的安全开发展开讨论，重点分析常见的安全问
工业相机常用词语解释机器视觉小小测试员 ui 自动化运维工业相机
线阵相机和面阵相机：线阵相机，是采用线阵图像传感器的相机。线阵图像传感器以CCD为主，一行的数据可以到几K甚至几十K，但是高度只有几个像素，行频很高，可以到每秒几万行，适合做非常高精度、宽画幅的扫描。面阵相机，是采用面阵图像传感器的相机，CMOS和CCD都有面阵相机，面阵相机的分辨率一行的宽度相比线阵相机会小很多，但是画面是整画幅的感应，一次成像的像素高度会比线阵相机大很多。同时程序开发上也相对简
知识图谱与大语言模型：构建智能问答系统 AGI大模型与大数据研究院大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
1.背景介绍在当今的信息时代，数据的获取和处理已经成为了我们生活中不可或缺的一部分。然而，随着数据量的爆炸性增长，如何从海量的数据中提取有用的信息，进而为用户提供精准的服务，已经成为了一个重要的研究课题。在这个背景下，知识图谱和大语言模型应运而生，它们通过对数据的深度挖掘和智能处理，为构建智能问答系统提供了可能。2.核心概念与联系2.1知识图谱知识图谱是一种新型的数据结构，它以图的形式表示实体之间
全面解析文件包含漏洞：原理、危害与防护垚垚 Securify 前沿站十大漏洞网络安全 web安全系统安全网络安全
目录前言漏洞介绍漏洞原理产生条件攻击方式造成的影响经典漏洞介绍防御措施结语前言在当今复杂的网络安全环境中，文件包含漏洞就像潜藏在暗处的危险陷阱，随时可能对防护薄弱的Web应用发起致命攻击。随着互联网的迅猛发展，各类Web应用如雨后春笋般涌现，文件包含漏洞也随之成为Web应用安全的一大隐患。深入了解文件包含漏洞的原理、危害及防范措施，对于保障网络安全、维护数据隐私以及确保系统稳定运行至关重要。漏洞介
前端el-table导出pdf 努力奋进的前端小菜鸟 javascript 前端 vue.js
1、首先来看下效果图2、使用技术：html2Canvas、JsPDF插件，mode_modules下载两个插件npm i html2Canvas JsPDF其中，html2Canvas负责把html转为图片，JsPDF负责把图片转为pdf文件3、点击按钮触发打印事件//点击按钮触发打印事件button@click='htmlToPdf(节点ID',文件名')'>print//传入打印节点，文件名,
vue 中利用canvas 给pdf文件加水印---详细教程（附上完整代码）阿土不土 pdf 前端 vue.js
需求：在h5网页中打开pdf文件，要求给文件添加水印实现技术及插件:vue，vue-pdf,canvas插件安装:npmivue-pdf--savenpmipdf-lib--save原理：实现pdf预览，在显示pdf的容器上添加一层遮罩，用来存放水印具体实现代码详细介绍:{{pageNum}}/{{totalPages}}上一页下一页相关解释::page从第几页开始显示:src:pdf存放路径@p
Vue3的el-table-column下拉输入实时查询API数据选择的实现方法 KrityCat vue.js javascript ecmascript
由于本人对el-table-column有下拉输入选择的要求，根据网上搜索的资料及本人优化，推出我比较满意的方法，供各位读者参考使用。效果图el-table-column写法changeProduct写法选择货品编号，展示接口提供的信息清空选择的数据获取选择的数据字段读取并展示对应的数据//选择货品functionchangeProduct(index,row){form.value.detail
【React】React中将 Props 传递给组件笨鸟程序员 react 前端技术前端 javascript react.js
当使用React时，props是组件之间传递数据的主要方式。以下是针对您提到的五个问题的详细解答：1.如何向组件传递props在父组件中，你可以通过组件标签的属性（attributes）将props传递给子组件。这些属性在子组件内部可以通过props对象来访问。functionParentComponent(){constname='Alice';constage=30;return();}fun
vue项目html页面生成PDF预览、下载及生成页面水印我是槑槑 Vue html5 vue.js javascript canvas
html2canvas官方文档jspdf官方文档目录概述原理过程中遇到的问题生成的PDF截图代码示例加水印版代码示例现存问题概述因为生成的PDF内还有富文本，后端不好生成PDF，故由前端完成。原理html2canva生成截图，jsPDF利用图片生成PDF。过程中遇到的问题1、生成大于30多页时，容易造成生成页面黑屏问题。原因：canvas生成图片时，对内容高度有一定的限制，超过这个高度，canva
c语言wchar转化为char_科学网—c++中 char*和wchar*之间的互相转换 - 林清莹的博文... weixin_39605345 c语言wchar转化为char
1.问题描述编写程序时通常会面对一些不同的编码格式，例如把wchar*的字符串转换为char*的字符串，有时还需要把char*类型的字符串转换为wchar*类型。下面提供几种解决方案。2.解决方案2.0函数方法//charconverttowchar_twchar_t*char2wchar_t(char*cstr){intlen=MultiByteToWideChar(CP_ACP，0，cstr,
MFC单文档下读取BMP图片显示勿忘初心91 vs2008 机器视觉自动化 visual studio 2008 bmp
1.建立单文档MFC程序（我用的是VS2008），加入菜单命令，ImageSourse_ImageFromFile2.定义相关变量:CStringImagePath;HBITMAPhBitmap;CBitmapm_Bitmap;BITMAPBitmap;intImageWidth,ImageHeight;CDCMemDC;3.在菜单命令下编辑代码:DeleteObject(&m_Bitmap);M
Android车机DIY开发之软件篇(三)编译Automotive OS错误(1) 勿忘初心91 android 嵌入式硬件 mcu github 单片机
Android车机DIY开发之软件篇(三)编译AutomotiveOS错误(1)问题FAILED:out/soong/build.ninjacd“KaTeXparseerror:Expected'EOF',got'&'atposition49:…soong_build")"&̲&BUILDER="PWD/KaTeXparseerror:Expected'EOF',got'&'atposition5
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它