吨吨不打野

OpenMMLab-AI实战营第二期——相关1. COCO数据集格式和pycocotools使用（目标检测方向）

文章目录

1. COCO数据集
- 1.1 COCO数据集介绍
- 1.2 COCO数据集格式
- - 1.2.1 常见目标检测数据格式
  - 1.2.2 COCO数据集文件结构及标注文件说明
  - 1.2.3 COCO的evaluation指标
- 1.3 其他
2. pycocotools
- 2.1 pycocotools简介和安装
- 2.2 基本使用
3. 图像的EXIF使用
- 3.1 图像的EXIF
- - 3.1.1 基本介绍
  - 3.1.2 JEPG等格式说明
  - 3.1.3 EXIF属性和对应code
  - 3.1.4 EXIF中的key和value意义（EXIF Tags）
  - 3.1.5 借助EXIF信息处理图像的意义
- 3.2 使用PIL借助EXIF校正图像旋转
- - 3.2.0 PIL支持的EXIF Tags
  - 3.2.1 推荐简单的写法
  - 3.2.2 朴实的写法
- 3.3 OpenCV中的EXIF信息问题
- - 3.3.1 imread默认应用了EXIF
  - 3.3.2 imread默认不应用EXIF

1. COCO数据集

参考：目标检测实战篇1——数据集介绍(PASCAL VOC，MS COCO)

现在说的COCO数据集一般指的就是2017年的数据集：图像一共25GB，看看就好了，肯定不会训练的。

图像	标注
2017 Train images [118K/18GB]	2017 Train/Val annotations [241MB]
2017 Val images [5K/1GB]
2017 Test images [41K/6GB]	2017 Testing Image info [1MB]

1.1 COCO数据集介绍

COCO是一个用于目标检测、分割和图像描述生成的大型数据集，有以下特点：

图像分割
上下文识别
超像素分割
33w图像，其中有标记的超过20w
150w目标实例
80个目标类别，这80个类别是做目标检测时的类别，详见：COCO Explorer，标注的不错，下图左上角的那些标签是可以点击的，会和下面的图像有交互效果。
91个物体类别：除了上面那确定对象的80个类别，还有天空、海洋等一些别的，不是目标检测类别，是全景分割等需要的内容。
每张图像5个情景描述，如上图
有25w人的关键点标注

1.2 COCO数据集格式

1.2.1 常见目标检测数据格式

一般目标检测任务使用Pascal VOC，YOLO和COCO数据集格式，
语义分割任务Pascal VOC和COCO都有，还有一些街景、遥感图像、医疗影像特定领域的格式，不是通用类的。
后续会另外介绍语义分割任务相关部分，这里只关注目标检测方面的

1.2.2 COCO数据集文件结构及标注文件说明

1. 基本的文件结构：

data
├─  annotations
│   ├─  instances_train2017.json
│   └─  instances_val2017.json
├─  train2017
│   ├─  000000000???.jpg
│   ├─  000000000???.jpg
│   └─  ...
└─  val2017
    ├─  000000000???.jpg
    ├─  000000000???.jpg
    └─  ...

参考： COCO with YOLO

2. 标注文件格式

标注文件以json格式存在，不是PASAL VOC那种一个xml对应一个文件标注，这里是所有图像的标注都存在于一个文件里，看下图左侧的行号：

具体点：

{
    "images": [
        {
            "id": 0,
            "file_name": "34020010494_e5cb88e1c4_k.jpg",
            "height": 1536,
            "width": 2048
        }, //这是一个示例
    ],//"images"字段结束
    "annotations": [
        {
            "image_id": 0,
            "id": 0,
            "category_id": 0,
            "bbox": [
                994,
                619,
                451,
                547
            ],
            "area": 246697,
            "segmentation": [
                [
                    1020.5,
                    963.5,
                    1000.5,
                    ...
                    963.5
                ]
            ],
            "iscrowd": 0
        },//这是一个示例
	],//"annotations"字段结束
    "categories": [
        {
            "id": 0,
            "name": "balloon"
        }
    ]//"annotations"字段结束
}

其遵循的数据格式参见：COCO-Data format。

COCO有分别用于目标检测、关键点检测和实例分割、全景分割、姿态估计和图像描述生成的多种数据标注类型，这些标注都使用JSON格式存储。
COCO API（例如：pycocotools）可以用于访问处理上面所有的标注，这些标注都遵循以下基本数据结构
上面展示的那个数据集没有info字段和licenses字段，其他都是基本符合的

{
    "info": info,
    "images": [image],
    "annotations": [annotation],
    "licenses": [license],
}

info{
    "year": int,
    "version": str,
    "description": str,
    "contributor": str,
    "url": str,
    "date_created": datetime,
}

image{
    "id": int,
    "width": int,
    "height": int,
    "file_name": str,
    "license": int,
    "flickr_url": str,
    "coco_url": str,
    "date_captured": datetime,
}

license{
    "id": int,
    "name": str,
    "url": str,
}

另外，针对不同类型，其annotations字段一般不同，同时有些还会有categories字段，目标检测任务这两个字段的规范是：

annotation{
    "id": int,
    "image_id": int,
    "category_id": int,
    "segmentation": RLE or [polygon
    ],
    "area": float,
    "bbox": [x,y,width,height
    ],
    "iscrowd": 0 or 1,
    // iscrowd是1，表示要使用RLE
}

categories[
    {
        "id": int,
        "name": str,
        "supercategory": str, 
        // 比如 蓝猫的父类是猫咪，类别的层次
    }
]

这和上面的例子也是差不多的，这就是COCO的标注格式了。

1.2.3 COCO的evaluation指标

Evaluation指标：参考 Metrics

截了个图，不做具体说明了

1.3 其他

除了COCO API，还有MASK API和FiftyOne

MASK API：处理RLE格式存储的mask
FiftyOne：开源的可视化和访问COCO的工具，也可以对COCO模型做可视化的评估
- 有兴趣可以看看：FIFTYONE
- 也提供了一个colab上的快速体验：quickstart.ipynb

2. pycocotools

2.1 pycocotools简介和安装

来源：cocoapi/PythonAPI/pycocotools/

其实就是个对json格式进行解析的库，就三个.py脚本，不要和protobuf这个库搞混了，名字有一丢丢像（我之前以为这个库很难，就是和这个搞混了）
简单到网上连个document都没有，直接自己安装看函数help吧

安装：

# windows下（直接pip需要编译，需要visual studio）
conda install pycocotools -c conda-forge

# macos （也需要编译，但是macOS系统包含编译工具，不需要进行额外依赖安装）
pip install pycocotools

2.2 基本使用

主要就是以下几个函数（其中，“ann”=annotation, “cat”=category, “img”=image）

函数名称	功能
`getAnnIds`	返回满足筛选条件的标注id
`getCatIds`	返回满足筛选条件的类别id
`getImgIds`	返回满足筛选条件的图像id
`loadAnns`	加载指定id的标注
`loadCats`	加载指定id的类别
`loadImgs`	加载指定id的图像
`loadRes`	eval评估模型效果时加载预测结果的
`showAnns`	显示特定的标注

示例代码：上传到github了（jupyter），详见：openMMLabCampusLearn/selfExercise/1.pycocotools.ipynb

参考：

2. COCO API
cocoapi/PythonAPI/pycocoDemo.ipynb
cocoapi/PythonAPI/pycocoEvalDemo.ipynb

3. 图像的EXIF使用

这部分对应的代码详见Github: openMMLabCampusLearn/selfExercise/2.图像EXIF信息.ipynb

3.1 图像的EXIF

3.1.1 基本介绍

可交换图像文件格式（英语：Exchangeable image file format，官方简称Exif），是专门为数码相机的照片设定的，可以记录数码照片的属性信息和拍摄数据。

Exif可以附加于JPEG、TIFF、RIFF等文件之中，为其增加有关数码相机拍摄信息的内容和索引图或图像处理软件的版本信息。
Windows 7操作系统具备对Exif的原生支持，通过鼠标右键点击图片打开菜单，点击属性并切换到详细信息标签下即可直接查看Exif信息。
macOS也可以看，双击图像，在预览中->点击检查器->点击i符号，就可以看到了
Exif信息是可以被任意编辑的，因此只有参考的功能。Exif信息以0xFFE1作为开头标记，后两个字节表示Exif信息的长度。所以Exif信息最大为64 kb，而内部采用TIFF格式。

关于EXIF中tags的介绍，可以看EXIF标准的pdf文件：https://www.cipa.jp/std/documents/e/DC-X008-Translation-2019-E.pdf

可以把一个jpeg图像后缀名改为txt格式，用文本文件打开，就可以看到读取JPG图片的Exif属性（一） - Exif信息简介里介绍的那些十六进制码流了

参考：

百度百科-Exif
wiki百科-https://en.wikipedia.org/wiki/Exif
- 这里提供了EXIF标准的pdf文件链接：https://www.cipa.jp/std/documents/e/DC-X008-Translation-2019-E.pdf
- 进而可以知道JPEG中EXIF信息的规定，要去看JPEG的标准：ISO/IEC 10918-1
读取JPG图片的Exif属性（一） - Exif信息简介

3.1.2 JEPG等格式说明

关于JEPG解码的格式，主要要去看这个协议：
ISO/IEC 10918-1（ISO/IEC 10918-1:1994
Information technology — Digital compression and coding of continuous-tone still images: Requirements and guidelines）

参考：

读取JPG图片的Exif属性（一） - Exif信息简介
- 这里涉及到一些JEPG格式中EXIF的内容
JPEG文件编/解码详解
JPEG文件格式及其解码流程

3.1.3 EXIF属性和对应code

from PIL import Image

demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"
demo_image = Image.open(demo_path)

for k, v in demo_image.getexif().items():
    print("Tag", k, "Value", v)  
> Tag 274 Value 6

这里的274表示的是图像的朝向（Orientation），
参考：

【记录】PIL img.getexif()获取图像信息
https://pillow.readthedocs.io/en/stable/reference/Image.html#PIL.Image.Exif

3.1.4 EXIF中的key和value意义（EXIF Tags）

Tag (hex)	Tag (dec)	IFD	Key	Type	Tag description
0x000b	11	Image	Exif.Image.ProcessingSoftware	Ascii	The name and version of the software used to post-process the picture
0x0100	256	Image	Exif.Image.ImageWidth	Long	The number of columns of image data, equal to the number of pixels per row. In JPEG compressed data a JPEG marker is used instead of this tag.
0x0101	257	Image	Exif.Image.ImageLength	Long	The number of rows of image data. In JPEG compressed data a JPEG marker is used instead of this tag.
0x0103	259	Image	Exif.Image.Compression	Short	The compression scheme used for the image data. When a primary image is JPEG compressed, this designation is not necessary and is omitted. When thumbnails use JPEG compression, this tag value is set to 6.
0x0106	262	Image	Exif.Image.PhotometricInterpretation	Short	The pixel composition. In JPEG compressed data a JPEG marker is used instead of this tag.
0x0107	263	Image	Exif.Image.Thresholding	Short	For black and white TIFF files that represent shades of gray, the technique used to convert from gray to black and white pixels.
0x0108	264	Image	Exif.Image.CellWidth	Short	The width of the dithering or halftoning matrix used to create a dithered or halftoned bilevel file.
0x010a	266	Image	Exif.Image.FillOrder	Short	The logical order of bits within a byte
0x010f	271	Image	Exif.Image.Make	Ascii	The manufacturer of the recording equipment. This is the manufacturer of the DSC, scanner, video digitizer or other equipment that generated the image. When the field is left blank, it is treated as unknown.
0x0110	272	Image	Exif.Image.Model	Ascii	The model name or model number of the equipment. This is the model name or number of the DSC, scanner, video digitizer or other equipment that generated the image. When the field is left blank, it is treated as unknown.
0x0112	274	Image	Exif.Image.Orientation	Short	The image orientation viewed in terms of rows and columns
0x011a	282	Image	Exif.Image.XResolution	Rational	The number of pixels per in the direction. When the image resolution is unknown, 72 [dpi] is designated.
0x011b	283	Image	Exif.Image.YResolution	Rational	The number of pixels per in the direction. The same value as is designated.

上面只贴了一部分，完整的可以参考：

Standard Exif Tags
TIFF Tag Reference, Exif Tags
在线表格转markdown语法可以使用：https://jakebathman.github.io/Markdown-Table-Generator/

另外，有些字段的取值是枚举的，每个值都有自己的意义，以Exif.Image.Orientation为例，在参考网站中搜索Orientation字段，可以得到：

1 = Horizontal (normal)
2 = Mirror horizontal
3 = Rotate 180
4 = Mirror vertical
5 = Mirror horizontal and rotate 270 CW（ClockWise rotation，顺时针方向）
6 = Rotate 90 CW
7 = Mirror horizontal and rotate 90 CW
8 = Rotate 270 CW

具体字段的值可以看看：

https://exiftool.org/TagNames/EXIF.html
https://www.media.mit.edu/pia/Research/deepview/exif.html
不嫌麻烦的也可以在原始标准文档中看：https://www.cipa.jp/std/documents/e/DC-X008-Translation-2019-E.pdf

3.1.5 借助EXIF信息处理图像的意义

以下内容转载自：

✅计算机视觉模型效果不佳，你可能是被相机的Exif信息坑了来源：量子位
✅知乎-计算机视觉应用开发中踩到EXIF的坑

日常用手机拍照的时候应该都遇到过这种情况：竖着拿手机拍横向的内容时，手机里的画面会自动变成横向，拍摄结束后，也会以横向的格式保存。

以手机为例： iOS的设备中也是包含了这样的方向传感器，它也采用了同样的方式来保存照片的方向信息到EXIF中。但是它默认的照片方向并不是竖着拿手机时的情况，而是横向，即Home键在右侧，如下：
如此一来，如果竖着拿手机拍摄时，就相当于对手机顺时针旋转了90度，也即上面相机图片中的最后一幅，那么它的Orientation值为6。即，默认存储图像格式是横屏的，显示时会加上EXIF的信息。（软件中看到的图是进行了EXIF信息变换之后的）
EXIF原先是用在TIFF图像格式上，后来才加入到JPEG图像格式中，而图像数据集中的图片大多是JPEG格式。大多数训练图像中则不含EXIF信息（PNG图像无法保存EXIF信息）。
一些程序为了保持向后兼容性，不会去解析EXIF信息。大多数用于处理图像数据的Python库（如NumPy、SciPy，TensorFlow，Keras等）就是这样的。
- 这意味着当你使用这些工具导入图像时，都将获得原始的未旋转图像数据。
- 如果把这些侧躺着或上下颠倒的图像输入到CV模型中，会得到错误的检测结果；
- 如在我现在描述的场景中，图像就旋转了270度，导致图像的宽高颠倒了。
电脑软件和手机可以正确显示图像方向，是因为其会对EXIF进行解析和处理
所以同一张图，手机可以正常显示，而使用matplotlib这些进行显示则长宽就可能错位。

为什么手机不直接把图像旋转存成旋转后的图像，有个说法：
jpg旋转以后二次编码会损失画质。
所以相机默认不旋转原始数据，而是在语义层面添加旋转语义供后续使用。

3.2 使用PIL借助EXIF校正图像旋转

3.2.0 PIL支持的EXIF Tags

from PIL import ExifTags
for k,v in ExifTags.TAGS.items():
    print(f"Tag:{k}, Value:{v}")
>...
Tag:271, Value:Make
Tag:272, Value:Model
Tag:273, Value:StripOffsets
Tag:274, Value:Orientation
...

参考：

Get date and time when photo was taken from EXIF data using PIL
https://pillow.readthedocs.io/en/stable/reference/ExifTags.html

3.2.1 推荐简单的写法

在Pillow>=6.0.0的版本里，已经有一个现成的工具帮助用户根据EXIF的Orientation信息旋转图像

from PIL import ImageOps
image = ImageOps.exif_transpose(image)
"""
ImageOps.exif_transpose:
如果一个图像的EXIF朝向标签的值不是1，根据其方向值对图像进行转换，然后删除方向标签
"""

# 完整代码
from PIL import ImageOps,Image
demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"
demo_image = Image.open(demo_path)

image = ImageOps.exif_transpose(demo_image)

plt.figure(figsize=(8,6))
plt.subplot(1,2,1)
plt.title(f"Orientation:{demo_image.getexif()[274]}")
plt.imshow(demo_image)
plt.axis("off")

plt.subplot(1,2,2)
plt.title("Modified")
plt.imshow(image)
plt.axis("off")

对于numpy、matplotlib等库来说，默认不使用EXIF信息，所以呈现的就是左侧的样子。
但是对于标注数据来说，标注软件会读取EXIF信息，所以在标注软件中显示的是右侧的图像，则标注信息对应的也是右边。
所以如果不对原图进行旋转，重新保存的话，在大部分的python程序里，读入都是不对的。
另外，还有一点：
- ImageOps.exif_transpose在完成数据转换后，会删除方向标签
- 防止转换后的图像还有方向标签，后续处理程序不断进行旋转。
- 以及防止再次标注时，标注软件等解析EXIF，导致显示错误

参考：

Rotating an image with orientation specified in EXIF using Python without PIL including the thumbnail
https://pillow.readthedocs.io/en/latest/_modules/PIL/ImageOps.html#exif_transpose

3.2.2 朴实的写法

老式的写法（MMDetection课上写的，其实是来自PIL提供的exif_transpose函数的改写，点击这里）

下面的脚本，在旋转图像后，并没有删除方向标签，可能会给之后的重新标记或者其他处理带来隐患。。

def apply_exif_orientation(image):
    _EXIF_ORIENT =274
    if not hasattr(image,'getexif'):
        return image
    try:
        exif = image.getexif()
    except Exception:
        exif=None
        return image
    orientation = exif.get(_EXIF_ORIENT)
    """
	1 = Horizontal (normal)
	2 = Mirror horizontal # 水平镜像
	3 = Rotate 180 # 旋转180度
	4 = Mirror vertical # 竖直镜像
	5 = Mirror horizontal and rotate 270 CW（ClockWise rotation，顺时针方向）
	6 = Rotate 90 CW # orientation=6 表示这张图在标注软件上显示是  顺时针旋转原图90度之后的样子
	7 = Mirror horizontal and rotate 90 CW
	8 = Rotate 270 CW
    """
    method = {2:Image.FLIP_LEFT_RIGHT,
            3:Image.ROTATE_180,
            4:Image.FLIP_TOP_BOTTOM,
            5:Image.TRANSPOSE,
            6:Image.ROTATE_270, # PIL库旋转都是以逆时针方向角度来算的，所以这里和上面90度是互补的
            7:Image.TRANSVERSE,
            8:Image.ROTATE_90}.get(orientation)
    if method is not None:
        return image.transpose(method)
        # 注意，旋转的时候是以左上角的顶点为旋转中心进行旋转的
    return image

根据：Image.rotate(angle, resample=Resampling.NEAREST, expand=0, center=None, translate=None, fillcolor=None)可知：

Image这个库旋转使用的是逆时针的角度。。。
angle – In degrees counter clockwise.

参考：

Image.rotate(angle, resample=Resampling.NEAREST, expand=0, center=None, translate=None, fillcolor=None)
image_to_numpy/image_to_numpy/src.py
Python: PIL读取的图像发生自动旋转
PIL Image 旋转 Rotate函数的坑和解决方案

3.3 OpenCV中的EXIF信息问题

3.3.1 imread默认应用了EXIF

默认OpenCV在读取图像时已经应用了EXIF信息

import cv2
demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"

demo_image = cv2.imread(demo_path)
plt.imshow(demo_image[:,:,::-1])

详见：Opencv4.x-imread()-文档
或者看看这个讲解：20170227. EXIF信息的说明（opencv320 ApplyExifOrientation）

3.3.2 imread默认不应用EXIF

如果不想OpenCV默认使用EXIF信息，可以：

import cv2
demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"

plt.figure(figsize=(15,5))
plt.subplot(1,3,1)
demo_image = cv2.imread(demo_path)
plt.title("With EXIF(Default)")
plt.imshow(demo_image[:,:,::-1])

plt.subplot(1,3,2)
# opencv-python要求Flag必须是整数，所以要找Flag对应的整数值
withOut_image_1 = cv2.imread(demo_path,-1)
plt.title("cv::IMREAD_UNCHANGED")
# cv::IMREAD_UNCHANGED 会保持原图的通道数
plt.imshow(withOut_image_1[:,:,::-1])

plt.subplot(1,3,3)
withOut_image_2 = cv2.imread(demo_path,128)
plt.title(" cv::IMREAD_IGNORE_ORIENTATION")
# cv::IMREAD_IGNORE_ORIENTATION输出单通道图像
plt.imshow(withOut_image_2)

参考：

https://docs.opencv.org/4.x/d8/d6a/group__imgcodecs__flags.html#ga61d9b0126a3e57d9277ac48327799c80
https://docs.opencv.org/4.x/d8/d6a/group__imgcodecs__flags.html#gga61d9b0126a3e57d9277ac48327799c80a34f91a514cd95127d8ba900840af548e

【Sharding-Jdbc总结】壹佰大多 java java spring 数据库 spring cloud
文章目录shard-jdbc介绍核心功能分库分表：分布式事务：客户端框架：适用场景核心组件代码实现导包配置文件sql语句java代码shard-jdbc介绍Sharding-JDBC是ApacheShardingSphere的一个模块，它是一个轻量级的Java数据访问框架，通过增强JDBC驱动实现了分库分表、分布式事务、读写分离和数据加密等功能。它适用于任何基于JDBC的应用程序。核心功能分库分表
【SpringAop实现切片注解】壹佰大多 java android 数据库
文章目录AOP的目的AOP代码实现导包：aop实现注解实现异步监听AOP的目的SpringAOP（Aspect-OrientedProgramming）是Spring框架中的一项功能，旨在通过切面（Aspect）将横切关注点（Cross-CuttingConcerns）与业务逻辑解耦，从而使代码更加模块化和易维护。以下是SpringAOP的主要目的和应用场景：解耦横切关注点横切关注点是指多个模块中
机试题——考古学家指针从不空 #hw机试题算法 c++
题目描述有一个考古学家发现一个石碑，但是很可惜，发现时其已经断成多段，原地发现n个断口整齐的石碑碎片。为了破解石碑内容，考古学家希望有程序能帮忙计算复原后的石碑文字组合数，你能帮忙吗？输入描述第一行输入一个整数n，表示石碑碎片的个数。第二行输入n个字符串，表示n个石碑碎片的内容，每个字符串之间有空格。输出描述输出石碑文字的所有组合（按照升序排列），每个组合占一行。如果存在石碑碎片内容完全相同，则由
机试题——连续出牌数量指针从不空 #hw机试题算法 c++
题目描述有这么一款单人卡牌游戏，牌面由颜色和数字组成，颜色为红、黄、蓝、绿中的一种，数字为0-9中的一个。游戏开始时玩家从手牌中选取一张卡牌打出，接下来如果玩家手中有和他上一次打出的手牌颜色或者数字相同的手牌，他可以继续将该手牌打出，直至手牌打光或者没有符合条件可以继续打出的手牌。现给定一副手牌，请找到最优的出牌策略，使打出的手牌最多。输入描述输入为两行：第一行是手牌的数字，每张卡牌的数字由空格分
机试题——跳格子指针从不空 #hw机试题 c++数据结构
题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]。从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入一个整数n，表示格子的数量。第二行输入n个整数，表示每个格子的分数score[i]。第三行输入一个整数k，表示最大跳的步长。输出描述输出最大得分。用例输入61-1-
2024年数据平台建设指南 DataHub数据社区数据资产管理大数据数据分析数据仓库嵌入式实时数据库
在当前的数据时代,企业对数据管理和分析能力的需求与日俱增。构建一个现代化、高效、灵活的数据平台不仅是应对这一挑战的必由之路,更是赋能业务创新、提升运营效率的关键所在。作为一名资深的首席数据工程专家,我将在本指南中全面解析数据平台建设的方方面面,涵盖架构设计、技术选型、开发实施、运维管理、新兴实践与趋势等内容,并结合真实案例分享业内最佳实践,为您指引数据平台建设之路。更多详情，请搜索公众号：Data
Python之读取文件指定字符串 Hi Man Python python
Python之读取文件指定字符串打开文件pmcdr，按行读取，取出以changeset：开头的行并保存到文本文件out.txt中importref=open('out.txt','w')withopen('pmcdr','rU')asfile_object:forlineinfile_object
LeetCode算法——滑动窗口&矩阵篇胡迪警长不许动算法 leetcode 数据结构
1、长度最小的子数组题目描述：解法：设一个for循环来改变指向窗口末尾的指针，再不断抛弃当前窗口内的首元素最终确定满足条件的最小长度classSolution{public:intminSubArrayLen(inttarget,vector&nums){intn=nums.size(),result=INT_MAX,sum=0,left=0;for(intright=0;right=target
被怼了：acks=all消息也会丢失？ java
消息队列是面试中一定会被问到的技术模块，虽然它在面试题占比不及并发编程和数据库，但也属于面试中的关键性问题。所以今天我们就来看一道，MQ中高频，但可能会打破你以往认知的一道面试题。所谓的关键问题指的是这道面试题会影响你整体面试结果。我们在面试消息队列（MessageQueue，MQ）时，尤其是面试Kafka时，经常会被问到：如何保证消息不丢失？那么，我们的回答会分为以下3部分：保证生产者消息不丢失
web api 与html 部署,详解.net core webapi 前后端开发分离后的配置和部署万小柯要努力学习 web api 与html 部署
背景：现在越来越多的企业都采用了在开发上前后端分离，前后端开发上的分离有很多种，那么今天，我来分享一下项目中得的前后端分离。B/SSaas项目：(这个项目可以理解成个人中心，当然不止这么点功能)前端：node.js+vue后端：.netcorewebapi前端安装node.js跟创建vue项目这些不是这篇文章的重点，重点在于项目完成后的部署。.netcorewebapi创建后，默认就创建了一个ww
自动化测试-短信验证码处理 weixin_30719711 数据库测试 c/c++
之前接触的的验证码都是图形验证码，可以借助图片识别来实现，不过识别率不太高后又研究绕过验证码实现登录。最近有遇到短信验证码的问题，网上看了有各种处理方法。1、cookie登录自己先尝试了，使用cookie登录的方法，具体详见代码1、获取cookie#FileName:VerifyCodeLogin.py#Author:Adil#DateTime:2018/4/913:09#SoftWare:PyC
c语言蛇形填充数组,蛇形周杰伦的小粉丝
题目描述蛇形矩阵是由1开始的自然数依次排列成的一个矩阵上三角形。例如，当输入5时，应该输出的三角形为：136101525914481371211请注意本题含有多组样例输入。输入描述:输入正整数N(N不大于100)输出描述:输出一个N行的蛇形矩阵。示例1输入4输出136蛇形矩阵2021-05-1020:02:14题目：输入两个整数n和m，输出一个n行m列的矩阵，将数字1到n×m按照回字蛇形填充至矩阵
ASP.NET Core 增加后台定时托管任务醉の虾 asp.net 后端 .net core mvc
项目：ASP.NETCoreMVC7.0简述：主要创建一个继承BackgroundService类的对象，配合一个定时器，在主程序启动后在后台运行。1、在项目中创建执行任务的类文件，继承BackgroundServicepublicclassTestTask:BackgroundService{privateTimer?_timer;//定时器//////启动后台托管/////////protec
车联网技术的隐私和数据安全挑战色宁科技人工智能人工智能
引言：随着科技的迅猛发展，车联网技术正逐渐改变着我们的出行方式和交通系统。这项技术将汽车、互联网和通信技术相结合，使车辆能够相互通信、共享数据和连接到外部网络。然而，随之而来的是隐私和数据安全的挑战。本文将探讨车联网技术在隐私保护和数据安全方面所面临的挑战，并提出应对这些挑战的措施。第一部分：车联网技术的隐私挑战车联网技术的发展给我们带来了许多便利，但同时也对个人隐私构成了潜在威胁。以下是一些车联
离线环境下通过docker安装redis镜像 MonkeyKing.sun docker redis 容器
1.在其他机器上下载Redis镜像你可以在一台能够访问外网的机器上拉取Redis镜像，并将其导出为文件，然后将文件传输到你的目标机器进行加载。步骤：在有网络访问的机器上拉取Redis镜像：在有网络的机器上，使用以下命令拉取Redis镜像：dockerpullredis将镜像保存为tar文件：使用dockersave命令将拉取的镜像保存为一个tar文件：dockersave-oredis_image
【面试题】简述rabbitmq的组织架构土掉渣的二傻子 rabbitmq 架构分布式 python
@[面试题]简述rabbitmq的组织架构RabbitMQ是一种流行的消息中间件，其架构设计围绕消息生产者,消息消费者和消息中转（Broker）展开。以下是RabbitMQ的主要组织架构组件和它们之间的关系：1.核心组件1.1Producer（生产者）生产者是消息的发送方，负责将消息发送到RabbitMQ的交换器（Exchange）。通常是应用程序的一部分，使用RabbitMQ客户端库与消息队列通
圈乘运算问题 panjyash 算法动态规划
题目描述关于整数的2元圈乘运算⊕⊕⊕定义为X⊕⊕⊕Y=十进制整数X的各位数字之和×\times×十进制整数Y的最大数字+Y的最小数字。例如，9⊕30=9×3+0=279⊕30=9\times3+0=279⊕30=9×3+0=27。对于给定的十进制整数X和K，由X和⊕⊕⊕运算可以组成各种不同的表达式。试设计一个算法，计算出由X和⊕⊕⊕运算组成的值为K的表达式最少需用多少个⊕⊕⊕运算。算法设计：给定十
vue3+ts实现图片上传并可拖拽温暖前端 vue.js 前端 javascript
实现多张图片拖拽上传，并且可以拖拽调整图片顺序的示例：拖拽文件到此处或点击上传import{ref,onMounted}from'vue'import{ElUpload,ElImage}from'element-plus'import{UploadFilled}from'@element-plus/icons-vue'interfaceImageItem{id:numberurl:string}c
高级java每日一道面试题-2025年01月25日-框架篇[Mybatis篇]-MyBatis实现一对一有几种方式?具体怎么操作的? java我跟你拼了 java每日一道面试题 java mybatis association标签事务管理
如果有遗漏,评论区告诉我进行补充面试官:MyBatis实现一对一有几种方式?具体怎么操作的?我回答:1.使用XML配置文件实现一对一关系主表和从表的设计假设我们有两个实体：Person和Address，其中Person表包含一个address_id字段，指向Address表的主键。CREATETABLEAddress(idINTPRIMARYKEY,streetVARCHAR(255),cityV
【LeetCode】只出现一次的数字 Seal^_^ 编程专栏 #LeetCode‌leetcode 算法数据结构 C语言
【LeetCode】只出现一次的数字TheBegin点点关注，收藏不迷路给你一个非空整数数组nums，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。你必须设计并实现线性时间复杂度的算法来解决此问题，且该算法只使用常量额外空间。示例1：输入：nums=[2,2,1]输出：1示例2：输入：nums=[4,1,2,1,2]输出：4示例3：输入：nums=[1]输出：1提
[Linux]Docker快速上手操作教程 wingaso 经验总结运维 linux docker 运维
前言以下命令并不是docker的所有，仅涉及日常使用时最最常用的命令。目的之一时给入门的朋友熟悉学习，其二时我自己偶尔使用时备忘。一、概念简单介绍下docker的相关概念：镜像：Docker镜像是一个轻量级、可执行的独立软件包，可以看作是一个构建容器的基础层。容器：Docker容器是镜像的运行实例，容器之间是隔离的。仓库：Docker仓库是用于存储和分发Docker镜像的地方如果你是初次学习以上概
Git 的基本概念和使用方式九月十九 git
Git是一个版本控制系统，用于跟踪文件的更改并协作开发。它具有以下基本概念和使用方式：1.代码仓库（Repository）：Git将项目存储在一个称为代码仓库的文件夹中。代码仓库包含项目的所有文件和历史记录。2.提交（Commit）：提交是对项目进行更改的记录。每次提交都有一个唯一的标识符，可以包含更改的文件、提交消息等信息。3.分支（Branch）：分支是代码仓库中的不同版本。使用分支可以在开发
ISBN 号码——蓝桥杯走啦小孩算法 c++蓝桥杯数据结构
1.题目描述每一本正式出版的图书都有一个ISBN号码与之对应，ISBN码包括9位数字、1位识别码和3位分隔符，其规定格式如“x-xxx-xxxxx-x”，其中符号“-”是分隔符（键盘上的减号），最后一位是识别码，例如0-670-82162-4就是一个标准的ISBN码。ISBN码的首位数字表示书籍的出版语言，例如0代表英语；第一个分隔符“-”之后的三位数字代表出版社，例如670代表维京出版社；第二个
linux指定脚本运行的python版本白蛇仙人笔记
1.使用which命令获得自己指定的python版本路径whichpython2.7输出：/usr/bin/python2.7whichpython3.4输出：/usr/bin/python3.42.将下列代码放入到脚本文件的开头#!/usr/bin/python2.73.就这样，就可以在其他IDE中运行该脚本了，此时python版本就是指定的版本
Node.js多线程：性能提升的关键
Node.js扩展：你需要了解的多线程原文链接：https://dev.to/leapcell/scaling-nodejs-multi-threading-you-need-to-know-2nhi作者：Leapcell译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢
深度学习-笔记1 深度学习神经网络
刚开始接触深度学习相关内容，在这儿做一个笔记：网址：https://gitee.com/paddlepaddle/PaddleNLPpaddle-nlp是一个自然语言处理NLP方面的工具包(代码库)ERNIEERNIE是百度基于BERT改进的预训练大模型，结合了Transformer架构和知识增强机制。整体上可以分为预训练模型层和任务适配层，预训练模型层负责学习通用的语言知识和语义表示，任务适配层
LInux tr 命令使用详解 linux
简介tr（translate）命令用于在Linux中翻译或删除输入流（通常是stdin）中的字符。它主要用于文本操作，并且可以作为转换或删除文本文件或流中的特定字符的方便工具。基本语法tr[OPTION][SET1][SET2]SET1：要替换或删除的字符集SET2：将替换SET1中的字符的字符集常用选项-d：删除SET1中的字符-s：挤压SET1中的连续相同字符-c：对SET1中的字符进行补充（
撤销 | 图形天下思维导图入门操作前端思维
撤销是指在图形天下思维导图软件中，对之前进行的编辑操作进行反向操作，恢复到操作前的状态。这一功能有助于用户在编辑过程中及时纠正错误，提高编辑效率。以下介绍图形天下思维导图工具撤销功能的几种方法。方法一：通过工具栏的“撤销”功能撤销在图形天下思维导图软件中，可以通过点击工具栏上的“撤销”功能按钮来撤销之前的编辑操作。用户只需点击一次即可撤销上一步的操作。如果需要撤销多步操作，可以连续点击“撤销”功能
[JS+CSS+HTML]实现图片拖拽放大缩小功能神似彭于晏的男人前端开发功能库 css html 前端
实现效果：JS(核心代码)1.定义全局缩放值letscale=1;2.获取img标签以及盒子的实例letscale=1;//+++++++++++constimgBox=document.getElementById("imgBox");constimg=document.getElementById("img");3.实现图片的缩放效果//缩放效果(wheel--鼠标滚轮事件)img.addEv
Day07：缓存-数据淘汰策略 Charlie__ZS 笔记缓存
Redis的数据淘汰策略有哪些?（key过期导致的）在redis中提供了两种数据过期删除策略第一种是惰性删除，在设置该key过期时间后，我们不去管它，当需要该key时，我们再检查其是否过期，如果过期，我们就删掉它，反之返回该key。优点：对CPU友好，只有使用该key时才会进行过期检查，对于很多用不到的key不用浪费时间进行过期检查。缺点：对内存不友好，如果一个key已经过期，但是一直没有使用，那
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring