知来者逆

真实案例扫描APP开发——基于实例分割实现拍照文档实时边缘检测（C++/JNI实现）

前言

这是一个安卓NDK的项目，想要实现的效果就是拍照扫描，这里只涉及到的只有边缘检测，之后会写文档滤镜、证件识别与证件1比1打印，OCR、版面分析之后的文档还原。我的开发环境是Android Studio 北极狐，真机是华为mate 30 pro，系统是HarmonyOS 4.0.0, NDK 是21.1.6352462这个版本，可实现CPU与GPU、NPU推理，推理速度与精度可以按真机去匹配，测试的效果不输于当前市面上排APP市场靠前的几个商业应用。实现的效果如下，有书本和单开页面两种效果，运行速度可以看看下面的视频：

手机拍照扫描边缘检测效果

一、边缘检测

1.传统方法

传统的边缘检测方案的难度和局限性：

阈值参数的依赖： Canny算法的检测效果依赖于一系列阈值参数的设置，这包括高阈值和低阈值。这些阈值通常是经验值，需要通过调试和实验来确定。引入额外步骤可能导致引入新的阈值参数，使得调参更为复杂。
阈值参数数量的限制： 阈值参数的数量不能太多，因为过多的参数会增加调试的复杂性，难以准确设置。同时，过多的参数可能降低算法的鲁棒性，使其在不同场景下难以表现理想效果。
算法鲁棒性的问题： 尽管存在一系列阈值参数，最终只有一组或少数几组固定的组合。这可能导致算法在某些场景下的鲁棒性受到影响，使得在一些情况下边缘检测效果不理想。
边缘图上的数学模型复杂： Canny算法在边缘图上建立复杂的数学模型，这增加了算法的实现难度。对于某些情况，算法可能无法提供令人满意的边缘检测结果。

综合而言，Canny算法在实际应用中需要仔细调参，并且其性能可能受到特定场景的限制。在某些复杂情况下，可能需要考虑其他边缘检测方法或进一步改进以提高算法的鲁棒性。
传统的检测分割方法计算成本较低，但效果相对较差，往往难以满足我们的要求。相反，深度学习为主的端到端检测分割方法计算成本较高，通常需要GPU进行计算，但其效果卓越。目前，实际应用中基本上都采用以深度学习为主的端到端分割算法，这使得图像分割在实际落地应用中取得了显著的进展。

2.图像分割

图像分割是将一幅数字图像划分为多个组成部分（一系列像素或超像素）的过程。分割的目标是通过简化和/或变换图像，使其转换为更有意义和更易于分析的内容表示。图像分割通常用于定位图像中目标和边界（如线和曲面）的位置。更准确地说，图像分割是为图像中的每个像素分配标签，其中具有相同标签的像素具有相似的特征。在图像分割领域中有多种技术，包括基于区域的分割技术、边界检测分割技术和基于聚类的分割技术。

图像分割领域的一些经典算法：

阈值技术： 该技术的主要目的是确定图像的最佳阈值。强度值超过阈值的像素被分配为1，其余像素的强度值被分配为零，从而形成二值图。选择阈值的方法包括Otsu、k均值聚类和最大熵法。
运动与交互分割： 该技术基于图像中的运动进行分割。其思想是在假设目标是运动的情况下找出两幅图中的差异，从而确定目标位置。
边界检测： 包括多种数学方法，其目的是标记图像中亮度变化剧烈或具有不连贯性的区域中的点。边界检测通常是其他分割技术的前提步骤，因为区域边界和边之间存在很高的关联性。
区域增长方法： 建立在相邻像素具有相似像素值的假设上。该方法比较每个像素与其相邻像素，如果满足相似性标准，则像素被划分到一个或多个相邻点组成的聚类中。相似性标准的选择对结果影响很大，容易受到噪声的影响。

此外，还有其他一些未在上文中提及的图像分割方法，如双聚类方法、快速匹配法、分水岭变换法等。这些方法在不同的应用场景中具有各自的优势和适用性。

二. Enet实例分割

1. 算法简介

ENet算法旨在实现快速的语义分割，同时考虑了分割的准确性和实时性能。其基本网络结构为编码-解码结构，通过下采样实现像素级的分类和上采样实现图像目标的定位。为了提高实时性，ENet采用了一些策略来减少计算量和提高采样速度。

在下采样层，滤波器操作扩大了图片的感受野，允许网络收集更多的目标上下文信息。然而，在图像语义分割中，下采样操作有两个缺点：

空间信息的损失： 由于特征图分辨率的降低，导致了空间信息的损失。
模型尺寸和计算量增加： 对于整张图像的像素分割，需要输入和输出具有相同的分辨率，因此在进行下采样操作后同样需要上采样与之匹配，这增加了模型尺寸和计算量。

对于第一个问题，FCN算法融合不同编码层产生的特征图，但这会增加网络的参数量，不利于语义分割的实时性。对于第二个问题，SegNet算法通过在最大池化层中保存特征元素索引，在解码器中进行搜索，实现解码特征的稀疏上采样图。然而，下采样仍然会损害目标空间信息的精度。

2、ENet算法网络结构

ENet算法在设计上采用了一些关键策略，以实现高效的实时语义分割：

初始化模块设计： ENet在初始化模块中采用了一个池化操作和一个步长为2的卷积操作并行，然后将结果特征图进行合并。这种设计旨在在网络早期使用较小尺寸和较少数量的特征图，从而大大减少了网络的参数量，提高了网络的运行速度。
扩张卷积的下采样： 在下采样过程中，ENet算法使用了扩张卷积（Dilated Convolution），这有助于平衡图像分辨率和图像感受野。扩张卷积允许在不降低特征图分辨率的同时扩大图像目标的感受野，提高了对更广泛上下文信息的学习能力。
不对称的编码器-解码器结构： ENet的结构不同于对称的结构，它包含了一个大的编码器和一个小的解码器。这样的设计有助于降低ENet网络的参数量，同时保持了对输入图像的有效表示。这种不对称结构的设计是为了更好地平衡模型的复杂性和实时性能。

3. 网络实现代码

import torch.nn as nn
import torch


class InitialBlock(nn.Module):

    def __init__(self,
                 in_channels,
                 out_channels,
                 bias=False,
                 relu=True):
        super().__init__()

        if relu:
            activation = nn.ReLU
        else:
            activation = nn.PReLU

        # Main branch - As stated above the number of output channels for this
        # branch is the total minus 3, since the remaining channels come from
        # the extension branch
        self.main_branch = nn.Conv2d(
            in_channels,
            out_channels - 3,
            kernel_size=3,
            stride=2,
            padding=1,
            bias=bias)

        # Extension branch
        self.ext_branch = nn.MaxPool2d(3, stride=2, padding=1)

        # Initialize batch normalization to be used after concatenation
        self.batch_norm = nn.BatchNorm2d(out_channels)

        # PReLU layer to apply after concatenating the branches
        self.out_activation = activation()

    def forward(self, x):
        main = self.main_branch(x)
        ext = self.ext_branch(x)

        # Concatenate branches
        out = torch.cat((main, ext), 1)

        # Apply batch normalization
        out = self.batch_norm(out)

        return self.out_activation(out)


class RegularBottleneck(nn.Module):
    def __init__(self,
                 channels,
                 internal_ratio=4,
                 kernel_size=3,
                 padding=0,
                 dilation=1,
                 asymmetric=False,
                 dropout_prob=0,
                 bias=False,
                 relu=True):
        super().__init__()

        # Check in the internal_scale parameter is within the expected range
        # [1, channels]
        if internal_ratio <= 1 or internal_ratio > channels:
            raise RuntimeError("Value out of range. Expected value in the "
                               "interval [1, {0}], got internal_scale={1}."
                               .format(channels, internal_ratio))

        internal_channels = channels // internal_ratio

        if relu:
            activation = nn.ReLU
        else:
            activation = nn.PReLU

        # Main branch - shortcut connection

        # Extension branch - 1x1 convolution, followed by a regular, dilated or
        # asymmetric convolution, followed by another 1x1 convolution, and,
        # finally, a regularizer (spatial dropout). Number of channels is constant.

        # 1x1 projection convolution
        self.ext_conv1 = nn.Sequential(
            nn.Conv2d(
                channels,
                internal_channels,
                kernel_size=1,
                stride=1,
                bias=bias), nn.BatchNorm2d(internal_channels), activation())

        # If the convolution is asymmetric we split the main convolution in
        # two. Eg. for a 5x5 asymmetric convolution we have two convolution:
        # the first is 5x1 and the second is 1x5.
        if asymmetric:
            self.ext_conv2 = nn.Sequential(
                nn.Conv2d(
                    internal_channels,
                    internal_channels,
                    kernel_size=(kernel_size, 1),
                    stride=1,
                    padding=(padding, 0),
                    dilation=dilation,
                    bias=bias), nn.BatchNorm2d(internal_channels), activation(),
                nn.Conv2d(
                    internal_channels,
                    internal_channels,
                    kernel_size=(1, kernel_size),
                    stride=1,
                    padding=(0, padding),
                    dilation=dilation,
                    bias=bias), nn.BatchNorm2d(internal_channels), activation())
        else:
            self.ext_conv2 = nn.Sequential(
                nn.Conv2d(
                    internal_channels,
                    internal_channels,
                    kernel_size=kernel_size,
                    stride=1,
                    padding=padding,
                    dilation=dilation,
                    bias=bias), nn.BatchNorm2d(internal_channels), activation())

        # 1x1 expansion convolution
        self.ext_conv3 = nn.Sequential(
            nn.Conv2d(
                internal_channels,
                channels,
                kernel_size=1,
                stride=1,
                bias=bias), nn.BatchNorm2d(channels), activation())

        self.ext_regul = nn.Dropout2d(p=dropout_prob)

        # PReLU layer to apply after adding the branches
        self.out_activation = activation()

    def forward(self, x):
        # Main branch shortcut
        main = x

        # Extension branch
        ext = self.ext_conv1(x)
        ext = self.ext_conv2(ext)
        ext = self.ext_conv3(ext)
        ext = self.ext_regul(ext)

        # Add main and extension branches
        out = main + ext

        return self.out_activation(out)


class DownsamplingBottleneck(nn.Module):
  
    def __init__(self,
                 in_channels,
                 out_channels,
                 internal_ratio=4,
                 return_indices=False,
                 dropout_prob=0,
                 bias=False,
                 relu=True):
        super().__init__()

        # Store parameters that are needed later
        self.return_indices = return_indices

        # Check in the internal_scale parameter is within the expected range
        # [1, channels]
        if internal_ratio <= 1 or internal_ratio > in_channels:
            raise RuntimeError("Value out of range. Expected value in the "
                               "interval [1, {0}], got internal_scale={1}. "
                               .format(in_channels, internal_ratio))

        internal_channels = in_channels // internal_ratio

        if relu:
            activation = nn.ReLU
        else:
            activation = nn.PReLU

        # Main branch - max pooling followed by feature map (channels) padding
        self.main_max1 = nn.MaxPool2d(
            2,
            stride=2,
            return_indices=return_indices)

        # Extension branch - 2x2 convolution, followed by a regular, dilated or
        # asymmetric convolution, followed by another 1x1 convolution. Number
        # of channels is doubled.

        # 2x2 projection convolution with stride 2
        self.ext_conv1 = nn.Sequential(
            nn.Conv2d(
                in_channels,
                internal_channels,
                kernel_size=2,
                stride=2,
                bias=bias), nn.BatchNorm2d(internal_channels), activation())

        # Convolution
        self.ext_conv2 = nn.Sequential(
            nn.Conv2d(
                internal_channels,
                internal_channels,
                kernel_size=3,
                stride=1,
                padding=1,
                bias=bias), nn.BatchNorm2d(internal_channels), activation())

        # 1x1 expansion convolution
        self.ext_conv3 = nn.Sequential(
            nn.Conv2d(
                internal_channels,
                out_channels,
                kernel_size=1,
                stride=1,
                bias=bias), nn.BatchNorm2d(out_channels), activation())

        self.ext_regul = nn.Dropout2d(p=dropout_prob)

        # PReLU layer to apply after concatenating the branches
        self.out_activation = activation()

    def forward(self, x):
        # Main branch shortcut
        if self.return_indices:
            main, max_indices = self.main_max1(x)
        else:
            main = self.main_max1(x)

        # Extension branch
        ext = self.ext_conv1(x)
        ext = self.ext_conv2(ext)
        ext = self.ext_conv3(ext)
        ext = self.ext_regul(ext)

        # Main branch channel padding
        n, ch_ext, h, w = ext.size()
        ch_main = main.size()[1]
        padding = torch.zeros(n, ch_ext - ch_main, h, w)

        # Before concatenating, check if main is on the CPU or GPU and
        # convert padding accordingly
        if main.is_cuda:
            padding = padding.cuda()

        # Concatenate
        main = torch.cat((main, padding), 1)

        # Add main and extension branches
        out = main + ext

        return self.out_activation(out), max_indices


class UpsamplingBottleneck(nn.Module):
   
    def __init__(self,
                 in_channels,
                 out_channels,
                 internal_ratio=4,
                 dropout_prob=0,
                 bias=False,
                 relu=True):
        super().__init__()

        # Check in the internal_scale parameter is within the expected range
        # [1, channels]
        if internal_ratio <= 1 or internal_ratio > in_channels:
            raise RuntimeError("Value out of range. Expected value in the "
                               "interval [1, {0}], got internal_scale={1}. "
                               .format(in_channels, internal_ratio))

        internal_channels = in_channels // internal_ratio

        if relu:
            activation = nn.ReLU
        else:
            activation = nn.PReLU

        # Main branch - max pooling followed by feature map (channels) padding
        self.main_conv1 = nn.Sequential(
            nn.Conv2d(in_channels, out_channels, kernel_size=1, bias=bias),
            nn.BatchNorm2d(out_channels))

        # Remember that the stride is the same as the kernel_size, just like
        # the max pooling layers
        self.main_unpool1 = nn.MaxUnpool2d(kernel_size=2)

        # Extension branch - 1x1 convolution, followed by a regular, dilated or
        # asymmetric convolution, followed by another 1x1 convolution. Number
        # of channels is doubled.

        # 1x1 projection convolution with stride 1
        self.ext_conv1 = nn.Sequential(
            nn.Conv2d(
                in_channels, internal_channels, kernel_size=1, bias=bias),
            nn.BatchNorm2d(internal_channels), activation())

        # Transposed convolution
        self.ext_tconv1 = nn.ConvTranspose2d(
            internal_channels,
            internal_channels,
            kernel_size=2,
            stride=2,
            bias=bias)
        self.ext_tconv1_bnorm = nn.BatchNorm2d(internal_channels)
        self.ext_tconv1_activation = activation()

        # 1x1 expansion convolution
        self.ext_conv2 = nn.Sequential(
            nn.Conv2d(
                internal_channels, out_channels, kernel_size=1, bias=bias),
            nn.BatchNorm2d(out_channels))

        self.ext_regul = nn.Dropout2d(p=dropout_prob)

        # PReLU layer to apply after concatenating the branches
        self.out_activation = activation()

    def forward(self, x, max_indices, output_size):
        # Main branch shortcut
        main = self.main_conv1(x)
        main = self.main_unpool1(
            main, max_indices, output_size=output_size)

        # Extension branch
        ext = self.ext_conv1(x)
        ext = self.ext_tconv1(ext, output_size=output_size)
        ext = self.ext_tconv1_bnorm(ext)
        ext = self.ext_tconv1_activation(ext)
        ext = self.ext_conv2(ext)
        ext = self.ext_regul(ext)

        # Add main and extension branches
        out = main + ext

        return self.out_activation(out)


class ENet(nn.Module):
  
    def __init__(self, num_classes, encoder_relu=False, decoder_relu=True):
        super().__init__()

        self.initial_block = InitialBlock(3, 16, relu=encoder_relu)

        # Stage 1 - Encoder
        self.downsample1_0 = DownsamplingBottleneck(
            16,
            64,
            return_indices=True,
            dropout_prob=0.01,
            relu=encoder_relu)
        self.regular1_1 = RegularBottleneck(
            64, padding=1, dropout_prob=0.01, relu=encoder_relu)
        self.regular1_2 = RegularBottleneck(
            64, padding=1, dropout_prob=0.01, relu=encoder_relu)
        self.regular1_3 = RegularBottleneck(
            64, padding=1, dropout_prob=0.01, relu=encoder_relu)
        self.regular1_4 = RegularBottleneck(
            64, padding=1, dropout_prob=0.01, relu=encoder_relu)

        # Stage 2 - Encoder
        self.downsample2_0 = DownsamplingBottleneck(
            64,
            128,
            return_indices=True,
            dropout_prob=0.1,
            relu=encoder_relu)
        self.regular2_1 = RegularBottleneck(
            128, padding=1, dropout_prob=0.1, relu=encoder_relu)
        self.dilated2_2 = RegularBottleneck(
            128, dilation=2, padding=2, dropout_prob=0.1, relu=encoder_relu)
        self.asymmetric2_3 = RegularBottleneck(
            128,
            kernel_size=5,
            padding=2,
            asymmetric=True,
            dropout_prob=0.1,
            relu=encoder_relu)
        self.dilated2_4 = RegularBottleneck(
            128, dilation=4, padding=4, dropout_prob=0.1, relu=encoder_relu)
        self.regular2_5 = RegularBottleneck(
            128, padding=1, dropout_prob=0.1, relu=encoder_relu)
        self.dilated2_6 = RegularBottleneck(
            128, dilation=8, padding=8, dropout_prob=0.1, relu=encoder_relu)
        self.asymmetric2_7 = RegularBottleneck(
            128,
            kernel_size=5,
            asymmetric=True,
            padding=2,
            dropout_prob=0.1,
            relu=encoder_relu)
        self.dilated2_8 = RegularBottleneck(
            128, dilation=16, padding=16, dropout_prob=0.1, relu=encoder_relu)

        # Stage 3 - Encoder
        self.regular3_0 = RegularBottleneck(
            128, padding=1, dropout_prob=0.1, relu=encoder_relu)
        self.dilated3_1 = RegularBottleneck(
            128, dilation=2, padding=2, dropout_prob=0.1, relu=encoder_relu)
        self.asymmetric3_2 = RegularBottleneck(
            128,
            kernel_size=5,
            padding=2,
            asymmetric=True,
            dropout_prob=0.1,
            relu=encoder_relu)
        self.dilated3_3 = RegularBottleneck(
            128, dilation=4, padding=4, dropout_prob=0.1, relu=encoder_relu)
        self.regular3_4 = RegularBottleneck(
            128, padding=1, dropout_prob=0.1, relu=encoder_relu)
        self.dilated3_5 = RegularBottleneck(
            128, dilation=8, padding=8, dropout_prob=0.1, relu=encoder_relu)
        self.asymmetric3_6 = RegularBottleneck(
            128,
            kernel_size=5,
            asymmetric=True,
            padding=2,
            dropout_prob=0.1,
            relu=encoder_relu)
        self.dilated3_7 = RegularBottleneck(
            128, dilation=16, padding=16, dropout_prob=0.1, relu=encoder_relu)

        # Stage 4 - Decoder
        self.upsample4_0 = UpsamplingBottleneck(
            128, 64, dropout_prob=0.1, relu=decoder_relu)
        self.regular4_1 = RegularBottleneck(
            64, padding=1, dropout_prob=0.1, relu=decoder_relu)
        self.regular4_2 = RegularBottleneck(
            64, padding=1, dropout_prob=0.1, relu=decoder_relu)

        # Stage 5 - Decoder
        self.upsample5_0 = UpsamplingBottleneck(
            64, 16, dropout_prob=0.1, relu=decoder_relu)
        self.regular5_1 = RegularBottleneck(
            16, padding=1, dropout_prob=0.1, relu=decoder_relu)
        self.transposed_conv = nn.ConvTranspose2d(
            16,
            num_classes,
            kernel_size=3,
            stride=2,
            padding=1,
            bias=False)

    def forward(self, x):
        # Initial block
        input_size = x.size()
        x = self.initial_block(x)

        # Stage 1 - Encoder
        stage1_input_size = x.size()
        x, max_indices1_0 = self.downsample1_0(x)
        x = self.regular1_1(x)
        x = self.regular1_2(x)
        x = self.regular1_3(x)
        x = self.regular1_4(x)

        # Stage 2 - Encoder
        stage2_input_size = x.size()
        x, max_indices2_0 = self.downsample2_0(x)
        x = self.regular2_1(x)
        x = self.dilated2_2(x)
        x = self.asymmetric2_3(x)
        x = self.dilated2_4(x)
        x = self.regular2_5(x)
        x = self.dilated2_6(x)
        x = self.asymmetric2_7(x)
        x = self.dilated2_8(x)

        # Stage 3 - Encoder
        x = self.regular3_0(x)
        x = self.dilated3_1(x)
        x = self.asymmetric3_2(x)
        x = self.dilated3_3(x)
        x = self.regular3_4(x)
        x = self.dilated3_5(x)
        x = self.asymmetric3_6(x)
        x = self.dilated3_7(x)

        # Stage 4 - Decoder
        x = self.upsample4_0(x, max_indices2_0, output_size=stage2_input_size)
        x = self.regular4_1(x)
        x = self.regular4_2(x)

        # Stage 5 - Decoder
        x = self.upsample5_0(x, max_indices1_0, output_size=stage1_input_size)
        x = self.regular5_1(x)
        x = self.transposed_conv(x, output_size=input_size)

        return x


if __name__ == '__main__':
    x = torch.randn(1, 3, 256, 256)
    net = ENet(13)(x)
    print(net.shape)  # torch.Size([1, 13, 256, 256])

4、不对称卷积：

标准卷积权重存在相当数量的冗余。通过将一个滤波器为nxn的卷积层分解成两个连续的卷积层，其中一个卷积层具有一个nx1的滤波器，另一个卷积层具有一个1xn的滤波器，可以减少这种冗余信息。这种分解卷积也被称为不对称卷积。ENet算法中采用了n=5的不对称卷积，通过这两个步骤产生的计算量与一个3x3的卷积层相似。这有助于增加模型学习函数的多样性，并增加感受野。

5、扩张卷积：

为了避免特征图的过度下采样，ENet算法使用了扩张卷积替代了最小分辨率操作阶段中的几个编码模型的主要卷积层。这种操作使得精度显著提升。

6、正则化：

由于大多数像素级分割数据集相当较小，复杂的神经网络模型容易过拟合，从而导致模型泛化能力下降。正则化参数相当于对参数引入先验分布，调节模型允许存储的信息量，并对其加以约束，从而降低模型的复杂度，有助于减少过拟合。

7、模型推理：

ENet在CmaVid数据集上训练后的模型大小为4.27M，非常轻量。这使得ENet在嵌入式系统和移动设备上的推理过程更加高效。

三、NDK开发

1.NCNN

NCNN是一个轻量级的深度学习框架，专为移动设备和嵌入式系统设计。它在模型推理过程中注重速度和轻量级，采用C++实现，支持多种硬件平台，包括CPU、GPU、以及一些专用的神经网络加速器。

轻量级设计： NCNN的设计目标是轻量级，使其适用于移动设备和嵌入式系统。它采用C++实现，具有较小的代码体积和内存占用。
硬件加速支持： NCNN支持多种硬件平台，包括通用的CPU和GPU，以及一些专用的神经网络加速器，如华为的NPU（神经处理单元）等。
高性能： NCNN在模型推理过程中注重性能，采用了一系列优化策略，包括内存重用、多线程并发等，以提高推理速度。
跨平台支持： NCNN在多个操作系统上运行，包括Linux、Windows、Android等，为开发者提供了较大的灵活性。
丰富的模型支持： NCNN支持多种深度学习模型的加载和推理，包括常见的卷积神经网络（CNN）、循环神经网络（RNN）等。
模型转换工具： NCNN提供了模型转换工具，支持从主流深度学习框架（如TensorFlow、Caffe、ONNX等）中导入模型，以便在NCNN上进行推理。

2. 模型转换

将ONNX模型转换为NCNN模型可以通过使用NCNN框架提供的工具进行。NCNN提供了一个名为onnx2ncnn的工具，可以将ONNX模型转换为NCNN模型。

onnx2ncnn input.onnx output.param output.bin

input.onnx 是输入的 ONNX 模型文件。
output.param 和 output.bin 是输出的 NCNN 模型文件，其中 output.param 包含了网络结构的参数，output.bin 包含了模型的权重参数。

3.NDK推理代码

#pragma once
#include "net.h"
#include 
#include 
#include 

namespace SCAN
{
	class DocumentEdge
	{
	public:
		DocumentEdge();
		~DocumentEdge();


		int read_model(std::string edge_model_parma = "ED210113FP16.param",
			std::string edge_model_bin = "ED210113FP16.bin",
			std::string mid_model_parma = "M20210325F.param",
			std::string mid_model_bin = "M20210325F.bin",
			bool use_gpu = true, int _book_mid = 1);

		int read_model(AAssetManager* mgr,std::string edge_model_parma = "ED210113FP16.param",
					   std::string edge_model_bin = "ED210113FP16.bin",
					   std::string mid_model_parma = "M20210325F.param",
					   std::string mid_model_bin = "M20210325F.bin",
					   bool use_gpu = true, int _book_mid = 1);

		int detect(cv::Mat cv_src, std::vector<cv::Point>& points_out, int _od_label);

		int revise_image(cv::Mat& cv_src, cv::Mat& cv_dst, std::vector<cv::Point>& in_points);

		void draw_out_points(cv::Mat cv_src, cv::Mat& cv_dst, std::vector<cv::Point>& points_out);

	public:
//		static DocumentEdge *doc_edge;
		bool book_mid = false;

	private:
		int inference(ncnn::Net& net, cv::Mat& cv_src, cv::Mat& cv_dst, int target_size);
		int read_model(std::string param_path, std::string bin_path, ncnn::Net& net, bool use_gpu);
		int read_model(AAssetManager* mgr,std::string param_path, std::string bin_path, ncnn::Net& net, bool use_gpu);
		int targetArea(cv::Mat& cv_src, cv::Mat& cv_seg, int e, int d);
		std::vector<cv::Point> getMidLine(cv::Mat cv_src, cv::Mat& cv_seg, int area);

		ncnn::Net edge_net, mid_net;
		int target_size = 512;
		int threads = 4;
	};
}

#include "DocumentEdge.h"

namespace SCAN 
{
    struct Line
    {
        cv::Point _p1;
        cv::Point _p2;
        cv::Point _center;

        Line(cv::Point p1, cv::Point p2)
        {
            _p1 = p1;
            _p2 = p2;
            _center = cv::Point((p1.x + p2.x) / 2, (p1.y + p2.y) / 2);
        }
    };

    DocumentEdge::DocumentEdge()
    {

    }
    DocumentEdge::~DocumentEdge()
    {

    }

    int DocumentEdge::read_model(std::string param_path, std::string bin_path, ncnn::Net& net, bool use_gpu)
    {
        bool has_GPU = false;
#if NCNN_VULKAN
        ncnn::create_gpu_instance();
        has_GPU = ncnn::get_gpu_count() > 0;
#endif
        bool to_use_GPU = has_GPU && use_gpu;

        net.opt.use_vulkan_compute = to_use_GPU;

        int rb = -1;
        int rm = -1;

        rb = net.load_param(param_path.c_str());
        rm = net.load_model(bin_path.c_str());

        if (rb < 0 || rm < 0)
        {
            return -1;
        }
        if (to_use_GPU)
        {
            return 1;
        }
        return 0;
    }

    int DocumentEdge::read_model(std::string edge_model_parma,std::string edge_model_bin,
        std::string mid_model_parma,std::string mid_model_bin,bool use_gpu, int book_mid)
    {
        if (book_mid == 1)
        {
            read_model(mid_model_parma, mid_model_bin, mid_net, use_gpu);
        }

        read_model(edge_model_parma, edge_model_bin, edge_net, use_gpu);

        return 0;
    }

    

    int DocumentEdge::inference(ncnn::Net& net, cv::Mat& cv_src, cv::Mat& cv_dst, int target_size)
    {
        if (cv_src.empty())
        {
            return -20;
        }

        ncnn::Mat in = ncnn::Mat::from_pixels_resize(cv_src.data, ncnn::Mat::PIXEL_BGR, 
            cv_src.cols, cv_src.rows, target_size, target_size);

        const float norm_vals[3] = { 1 / 255.f, 1 / 255.f, 1 / 255.f };
        in.substract_mean_normalize(0, norm_vals);
        ncnn::Extractor ex = net.create_extractor();
        ex.set_num_threads(threads);

        ncnn::Mat out;

        ex.input("input.1", in);
        ex.extract("887", out);

        cv::Mat cv_seg = cv::Mat::zeros(cv::Size(out.w, out.h), CV_8UC1);
        for (int i = 0; i < out.h; ++i)
        {
            for (int j = 0; j < out.w; ++j)
            {
                const float* bg = out.channel(0);
                const float* fg = out.channel(1);
                if (bg[i * out.w + j] < fg[i * out.w + j])
                {
                    cv_seg.data[i * out.w + j] = 255;
                }
            }
        }

        cv::resize(cv_seg, cv_dst, cv::Size(cv_src.cols, cv_src.rows), cv::INTER_LINEAR);
        return 0;
    }


    int DocumentEdge::targetArea(cv::Mat &cv_src, cv::Mat& cv_seg, int e = 7, int d = 5)
    {
        cv::Mat cv_temp = cv_src.clone();
        //计算分割到的面积
        float seg_total = countNonZero(cv_temp);
        float pix_total = cv_src.cols * cv_src.rows;


        int index = 0;

        if (seg_total >= pix_total * 0.9)
        {
            e = 7;
            d = 7;
            index = 9;
        }
        else if ((seg_total < pix_total * 0.9) && (seg_total >= pix_total * 0.7))
        {
            e = 7;
            d = 5;
            index = 8;
        }
        else if ((seg_total < pix_total * 0.7) && (seg_total >= pix_total * 0.5))
        {
            e = 6;
            d = 5;
            index = 7;
        }
        else if ((seg_total < pix_total * 0.5) && (seg_total >= pix_total * 0.3))
        {
            e = 4;
            d = 3;
            index = 6;
        }
        else
        {
            e = 1;
            d = 1;
            index = 0;
        }

        cv::Mat cv_dilate, cv_erode;
        cv::Mat element_e = getStructuringElement(cv::MORPH_RECT, cv::Size(e, e), cv::Point(-1, -1));
        cv::Mat element_d = getStructuringElement(cv::MORPH_RECT, cv::Size(d, d), cv::Point(-1, -1));

        cv::erode(cv_src, cv_dilate, element_e);

        cv::dilate(cv_dilate, cv_seg, element_d);

        cv::threshold(cv_seg, cv_seg, 100, 255, cv::THRESH_BINARY);
        return index;
    }

    //线排序Y轴
    static bool cmp_y(const Line& p1, const Line& p2)
    {
        return p1._center.y < p2._center.y;
    }

    //线排序X轴
    static bool cmp_x(const Line& p1, const Line& p2)
    {
        return p1._center.x < p2._center.x;
    }

    //点排序
    static bool point_y(const cv::Point& p1, const cv::Point& p2)
    {
        return p1.y < p2.y;
    }

    //点排序
    static bool point_x(const cv::Point& p1, const cv::Point& p2)
    {
        return p1.x < p2.x;
    }

    //两条线的交点
    static cv::Point2f computeIntersect(Line& l1, Line& l2)
    {
        int x1 = l1._p1.x;
        int x2 = l1._p2.x;
        int y1 = l1._p1.y;
        int y2 = l1._p2.y;
        int x3 = l2._p1.x, x4 = l2._p2.x, y3 = l2._p1.y, y4 = l2._p2.y;
        if (float d = (x1 - x2) * (y3 - y4) - (y1 - y2) * (x3 - x4))
        {
            cv::Point2f pt;
            pt.x = ((x1 * y2 - y1 * x2) * (x3 - x4) - (x1 - x2) * (x3 * y4 - y3 * x4)) / d;
            pt.y = ((x1 * y2 - y1 * x2) * (y3 - y4) - (y1 - y2) * (x3 * y4 - y3 * x4)) / d;
            return pt;
        }
        return cv::Point2f(-1, -1);
    }

    static bool cmpPointX(const cv::Point& p1, const cv::Point& p2)
    {
        return p1.x < p2.x;
    }
    //点排序
    static void sortPoint(std::vector<cv::Point>& old_point, std::vector<cv::Point>& new_point)
    {
        sort(old_point.begin(), old_point.end(), cmpPointX);
        new_point = std::vector<cv::Point>(4);
        if (old_point.at(0).y < old_point.at(1).y)
        {
            new_point.at(0) = old_point.at(0);
            new_point.at(2) = old_point.at(1);
        }
        else
        {
            new_point.at(2) = old_point.at(0);
            new_point.at(0) = old_point.at(1);
        }
        if (old_point.at(2).y < old_point.at(3).y)
        {
            new_point.at(1) = old_point.at(2);
            new_point.at(3) = old_point.at(3);
        }
        else
        {
            new_point.at(1) = old_point.at(3);
            new_point.at(3) = old_point.at(2);
        }

    }

    //得到直线斜率
    static std::vector <float> getLinesArctan(std::vector<cv::Vec4f> lines)
    {
        float k = 0; //直线斜率
        std::vector <float> lines_arctan;//直线斜率的反正切值
        for (unsigned int i = 0; i < lines.size(); i++)
        {
            k = (double)(lines[i][3] - lines[i][1]) / (double)(lines[i][2] - lines[i][0]); //求出直线的斜率
            lines_arctan.push_back(atan(k));
        }
        return lines_arctan;
    }
    //得到线的角度
    static void getLinesAngle(std::vector<cv::Vec4f> lines, std::vector<double>& angle)
    {
        //显示每条直线的角度
        std::vector <float> lines_arctan;//直线斜率的反正切值
        lines_arctan = getLinesArctan(lines);

        for (unsigned int i = 0; i < lines.size(); i++)
        {
            angle.push_back(lines_arctan[i] * 180.0 / 3.1415926);
        }
    }

    static double angle(cv::Point pt1, cv::Point pt2, cv::Point pt0)
    {
        double dx1 = pt1.x - pt0.x;
        double dy1 = pt1.y - pt0.y;
        double dx2 = pt2.x - pt0.x;
        double dy2 = pt2.y - pt0.y;
        return (dx1 * dx2 + dy1 * dy2) / sqrt((dx1 * dx1 + dy1 * dy1) * (dx2 * dx2 + dy2 * dy2) + 1e-10);
    }

    /// 
    /// 矩形检测
    /// 
    /// 输入图像
    /// 输出矩形的四个点
    /// 
    static int findSquares(const cv::Mat& image, std::vector<cv::Point>& out_points)
    {
        std::vector<std::vector<cv::Point> > squares;

        cv::Mat src, dst, gray_one, gray;
        if (image.channels() == 3)
        {
            gray_one = cv::Mat(src.size(), CV_8UC1);
            //滤波增强边缘检测
            medianBlur(image, dst, 7);
            cv::cvtColor(dst, gray_one, cv::COLOR_BGR2GRAY);
            Canny(gray_one, gray, 10, 40, 3);
        }
        else if (image.channels() == 1)
        {
            cv::Mat erodeStruct = getStructuringElement(cv::MORPH_RECT, cv::Size(5, 5));
            dilate(image, gray, erodeStruct);
        }
        else
        {
            return -401;
        }

        std::vector<std::vector<cv::Point> > contours;
        std::vector<cv::Vec4i> hierarchy;

        findContours(gray, contours, hierarchy, cv::RETR_CCOMP, cv::CHAIN_APPROX_SIMPLE);

        std::vector<cv::Point> approx;

        if (contours.size() > 4)
        {
            // 检测所找到的轮廓
            for (int i = 0; i < contours.size(); i++)
            {
                //使用图像轮廓点进行多边形拟合
                approxPolyDP(cv::Mat(contours[i]), approx, arcLength(cv::Mat(contours[i]), true) * 0.02, true);
                //drawContours(image, contours, i, cv::Scalar(255,255,255), cv::FILLED, 8, hierarchy);
                //计算轮廓面积后，得到矩形4个顶点
                if (approx.size() == 4 && fabs(contourArea(cv::Mat(approx))) > 1000 && isContourConvex(cv::Mat(approx)))
                {
                    double maxCosine = 0;

                    for (int j = 2; j < 5; j++)
                    {
                        // 求轮廓边缘之间角度的最大余弦
                        double cosine = fabs(angle(approx[j % 4], approx[j - 2], approx[j - 1]));
                        maxCosine = MAX(maxCosine, cosine);
                    }

                    if (maxCosine < 0.8)
                    {
                        squares.push_back(approx);
                    }
                }
            }
        }
        else
        {
            return -103;
        }

        if (squares.size() > 0)
        {
            for (int j = 0; j < squares.at(0).size(); j++)
            {
                out_points.push_back(squares.at(0)[j]);
            }
            return 100;
        }
        else
        {
            return -104;
        }
        return 101;
    }

    int getIntersectionPoint(std::vector<Line>& h_lines, std::vector<Line>& v_lines, std::vector<cv::Point>& points)
    {
        sort(h_lines.begin(), h_lines.end(), cmp_y);
        sort(v_lines.begin(), v_lines.end(), cmp_x);

        if (h_lines.size() < 2 || v_lines.size() < 2)
        {
            return -421;
        }
        points.push_back(computeIntersect(h_lines[0], v_lines[0]));
        points.push_back(computeIntersect(h_lines[0], v_lines[v_lines.size() - 1]));
        points.push_back(computeIntersect(h_lines[h_lines.size() - 1], v_lines[0]));
        points.push_back(computeIntersect(h_lines[h_lines.size() - 1], v_lines[v_lines.size() - 1]));

        return 0;
    }

    //拟合直线画四形
    void drawQuadrangleToLines(std::vector<cv::Point>& in_points, cv::Mat& cv_src)
    {
        cv::line(cv_src, in_points.at(0), in_points.at(1), cv::Scalar(255), 2, cv::LINE_8);
        cv::line(cv_src, in_points.at(0), in_points.at(2), cv::Scalar(255), 2, cv::LINE_8);
        cv::line(cv_src, in_points.at(1), in_points.at(3), cv::Scalar(255), 2, cv::LINE_8);
        cv::line(cv_src, in_points.at(2), in_points.at(3), cv::Scalar(255), 2, cv::LINE_8);
    }

    //求两点间距离
    static float getDistance(cv::Point& point_1, cv::Point& point_2)
    {
        float distance;
        distance = powf((point_1.x - point_2.x), 2) + powf((point_1.y - point_2.y), 2);
        distance = sqrtf(distance);
        return distance;
    }

    //缩放矩形
    cv::Rect rectScale(cv::Rect& rect, float x_scale, float y_scale)
    {
        cv::Rect cv_rect;

        cv_rect.x = rect.x / x_scale;
        cv_rect.y = rect.y / y_scale;
        cv_rect.width = rect.width / x_scale;
        cv_rect.height = rect.height / y_scale;

        return cv_rect;
    }
    cv::Rect rectScale(cv::Rect& rect, float x_scale, float y_scale, int i)
    {
        cv::Rect cv_rect;
        if (i >= 0)
        {
            cv_rect.x = rect.x * x_scale;
            cv_rect.y = rect.y * y_scale;
            cv_rect.width = rect.width * x_scale;
            cv_rect.height = rect.height * y_scale;
        }
        else
        {
            cv_rect.x = rect.x / x_scale;
            cv_rect.y = rect.y / y_scale;
            cv_rect.width = rect.width / x_scale;
            cv_rect.height = rect.height / y_scale;
        }

        return cv_rect;
    }


    /// 
    /// 传统图像分割
    /// 
    /// 输入图像
    /// 输出分割后的图像
    /// 输入要分割的位置矩形
    /// 迭代次数
    void grabCutRoi(cv::Mat& src, cv::Mat& dst, cv::Rect& cv_rect, int it)
    {
        cv::Mat  result = cv::Mat::zeros(src.size(), CV_8UC1);
        cv::Mat bgModel, fgModel;
        grabCut(src, result, cv_rect, bgModel, fgModel, it, cv::GC_INIT_WITH_RECT);
        compare(result, cv::GC_PR_FGD, result, cv::CMP_EQ);
        dst = cv::Mat(src.size(), CV_8UC3, cv::Scalar(0, 0, 0));
        src.copyTo(dst, result);
    }

    //canny边缘检测
    void getCanny(cv::Mat& src, cv::Mat& dst)
    {
        cv::Mat cv_blur;
        if (src.channels() != 1)
        {
            cvtColor(src, src, cv::COLOR_BGR2GRAY);
        }
        medianBlur(src, cv_blur, 11);
        cv::Mat thres;
        cv::Canny(cv_blur, dst, 10, 40);
    }

    /// 
    /// 画二值图像的外框
    /// 
    /// 输入图像
    /// 输出图像
    /// 线段大小
    /// 
    int drawpoly(cv::Mat& cv_src, cv::Mat& cv_dst, int line)
    {
        if (cv_src.empty() || cv_src.channels() > 1)
        {
            return -446;
        }

        cv::Mat cv_dilate;
        cv::Mat element_d = getStructuringElement(cv::MORPH_RECT, cv::Size(3, 3), cv::Point(-1, -1));
        cv::dilate(cv_src, cv_dilate, element_d);

        std::vector<std::vector<cv::Point> > contours;
        std::vector<std::vector<cv::Point> > f_contours;
        std::vector<cv::Point> approx2;

        findContours(cv_dilate, f_contours, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE);

        int max_area = 0;
        int index = 0;

        if (f_contours.size() > 0)
        {
            for (int i = 0; i < f_contours.size(); i++)
            {
                double tmparea = fabs(contourArea(f_contours[i]));
                if (tmparea > max_area)
                {
                    index = i;
                    max_area = tmparea;
                }

            }
        }
        else
        {
            return 2104;
        }
        contours.push_back(f_contours[index]);

        std::vector<cv::Point> tmp = contours[0];

        cv_dst = cv::Mat(cv_src.size(), CV_8UC1, cv::Scalar(0));

        drawContours(cv_dst, contours, 0, cv::Scalar(255), line, cv::LINE_AA);

        return 0;
    }

    int drawpoly(cv::Mat& cv_src, cv::Mat& cv_dst)
    {
        if (cv_src.empty() || cv_src.channels() > 1)
        {
            return -446;
        }

        cv::Mat cv_dilate;
        cv::Mat element_d = getStructuringElement(cv::MORPH_RECT, cv::Size(3, 3), cv::Point(-1, -1));
        cv::dilate(cv_src, cv_dilate, element_d);

        std::vector<std::vector<cv::Point> > contours;
        std::vector<std::vector<cv::Point> > f_contours;
        std::vector<cv::Point> approx2;
        //注意第5个参数为CV_RETR_EXTERNAL，只检索外框
        findContours(cv_dilate, f_contours, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE); //找轮廓
        //求出面积最大的轮廓
        int max_area = 0;
        int index = 0;
        for (int i = 0; i < f_contours.size(); i++)
        {
            double tmparea = fabs(contourArea(f_contours[i]));
            //std::cout << tmparea << "  " ;
            if (tmparea > max_area)
            {
                //std::cout <<"max_area = " << tmparea << std::endl;
                index = i;
                max_area = tmparea;
            }

        }

        contours.push_back(f_contours[index]);

        std::vector<cv::Point> tmp = contours[0];

        cv_dst = cv::Mat(cv_src.size(), CV_8UC1, cv::Scalar(0));

        drawContours(cv_dst, contours, 0, cv::Scalar(255), 2, cv::LINE_AA); //注意线的厚度，不要选择太细的

        return 0;
    }

    //二值图像凸包
    void binConvexHull(cv::Mat& src, cv::Mat& dst)
    {
        cv::Mat src_gray, bin_output;
        if (src.channels() > 1)
        {
            cvtColor(src, src_gray, cv::COLOR_BGR2GRAY);
            threshold(src_gray, bin_output, 100, 255, cv::THRESH_BINARY);
        }
        else
        {
            threshold(src, bin_output, 100, 255, cv::THRESH_BINARY);
        }

        std::vector<std::vector<cv::Point>> contours;
        std::vector<cv::Vec4i> hierachy;

        findContours(bin_output, contours, hierachy, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE);


        //发现轮廓得到的候选点
        std::vector<std::vector<cv::Point>> convexs(contours.size());
        for (size_t i = 0; i < contours.size(); i++)
        {
            convexHull(contours[i], convexs[i], false, true);
        }

        dst = cv::Mat(src.size(), CV_8UC1, cv::Scalar(0));
        // 绘制
        std::vector<cv::Vec4i> empty(0);
        for (int k = 0; k < contours.size(); k++)
        {
            drawContours(dst, convexs, k, cv::Scalar(255), 2, cv::LINE_AA);
        }
    }

    /// 
    /// 二值图像边缘滤波
    /// 
    /// 输入图像
    /// 输出图像
    /// 分别表示突出部的宽度阈值和高度阈值
    /// 代表突出部的颜色，0表示黑色，1代表白色
    void binImageBlur(cv::Mat& src, cv::Mat& dst, cv::Size size, int threshold)
    {
        int height = src.rows;
        int width = src.cols;
        blur(src, dst, size);
        for (int i = 0; i < height; i++)
        {
            uchar* p = dst.ptr<uchar>(i);
            for (int j = 0; j < width; j++)
            {
                if (p[j] < threshold)
                    p[j] = 0;
                else p[j] = 255;
            }
        }
    }

    static bool sortArea(const std::vector<cv::Point>& v1, const std::vector<cv::Point>& v2)
    {
        double v1Area = fabs(contourArea(cv::Mat(v1)));
        double v2Area = fabs(contourArea(cv::Mat(v2)));
        return v1Area > v2Area;
    }


    /// 
    /// 找出二值图像最大块
    /// 
    /// 输入图像
    /// 输出最大面积
    /// 
    static int findContoursArea(cv::Mat& cv_src, int& area)
    {
        //auto t0 = cv::getTickCount();

        if (cv_src.empty() || cv_src.channels() != 1)
        {
            return -2;
        }
        area = 0;
        std::vector<std::vector<cv::Point>> contours;
        std::vector<cv::Vec4i> hierarcy;

        cv::Mat  cv_canny_e, cv_canny_d;
        cv::Mat element_d = getStructuringElement(cv::MORPH_RECT, cv::Size(7, 7));
        cv::dilate(cv_src, cv_canny_d, element_d);

        cv::Mat element_e = getStructuringElement(cv::MORPH_RECT, cv::Size(5, 5));
        cv::erode(cv_canny_d, cv_canny_e, element_e);

        cv::findContours(cv_canny_e, contours, hierarcy, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE);


        if (contours.size() == 0)
        {
            return -420;
        }

        //按面积排序
        ///2021.6.10更新了按面积排序，处理速度没有明显的优化，但更易于代码管理
        std::sort(contours.begin(), contours.end(), sortArea);
        cv::Rect rect = boundingRect(cv::Mat(contours[0]));
        area = rect.area();

        ///旧代码，编历排序
        /*std::vector box(contours.size());
        for (int i = 0; i < contours.size(); i++)
        {
            approxPolyDP(cv::Mat(contours[i]), contours[i], 3, true);
            cv::Rect rect = boundingRect(cv::Mat(contours[i]));
            int area_t = rect.area();

            if (area_t >= area)
            {
                area = area_t;
            }
        }*/
        //auto t1 = cv::getTickCount();
        //std::cout << "elapsed time: " << (t1 - t0) * 1000.0 / cv::getTickFrequency() << "ms" << std::endl;
        return 0;
    }

    /// 
    /// 线分类
    /// 
    /// 输入线段集
    /// 输出H分类线
    /// 输出V分类线
    /// 输入图像
    /// 
    int linesDichotomy(std::vector<cv::Vec4f>& lines, std::vector<Line>& horizontals, std::vector<Line>& verticals, cv::Mat& cv_debug)
    {
        std::vector<double> angle;
        getLinesAngle(lines, angle);
        int mask = 0;
        for (int i = 0; i < angle.size(); i++)
        {
            if (angle.at(i) >= 75 || angle.at(i) <= -75)
            {
                mask++;
            }
        }
        if (mask > 2)
        {
            for (size_t i = 0; i < lines.size(); i++)
            {
                cv::Vec4i v = lines[i];

                double delta_x = fabs(v[0] - v[2]);
                double delta_y = fabs(v[1] - v[3]);

                Line l(cv::Point(v[0], v[1]), cv::Point(v[2], v[3]));
                if (delta_x > delta_y)
                {
                    horizontals.push_back(l);
                }
                else
                {
                    verticals.push_back(l);

                }
            }
        }
        else
        {
            std::vector<Line> lines_1, lines_2;
            for (size_t i = 0; i < lines.size(); i++)
            {
                cv::Vec4i v = lines[i];

                Line l(cv::Point(v[0], v[1]), cv::Point(v[2], v[3]));
                if (angle.at(i) > 0)
                {
                    lines_1.push_back(l);

                }
                else
                {
                    lines_2.push_back(l);

                }
            }
            if (lines_1.size() < 2 || lines_2.size() < 2)
            {
                return -431;
            }
            std::vector<cv::Point> points_1, points_2;
            getIntersectionPoint(lines_1, lines_2, points_1);
            getIntersectionPoint(lines_2, lines_1, points_2);
            cv::Mat cv_line_1(cv_debug.size(), CV_8UC1, cv::Scalar(0));
            cv::Mat cv_line_2(cv_debug.size(), CV_8UC1, cv::Scalar(0));
            drawQuadrangleToLines(points_1, cv_line_1);
            drawQuadrangleToLines(points_2, cv_line_2);
            int area_1, area_2;
            findContoursArea(cv_line_1, area_1);
            findContoursArea(cv_line_2, area_2);
            if (area_1 < area_2)
            {
                horizontals = lines_2;
                verticals = lines_1;
            }
            else
            {
                horizontals = lines_1;
                verticals = lines_2;
            }
        }
        return 0;
    }

    /// 
    /// 筛选线段(线的近邻算法)
    /// 
    /// 输入H分类线
    /// 输入V分类线
    /// 输出筛选之后的四条线
    /// 近邻值
    /// 
    int screenLines(std::vector<Line>& h_lines, std::vector<Line>& v_lines, std::vector<Line>& lines_c, int near_val)
    {
        sort(h_lines.begin(), h_lines.end(), cmp_y);
        sort(v_lines.begin(), v_lines.end(), cmp_x);

        std::vector<Line> h_l_t, v_l_l, h_l_d, v_l_r;
        for (int i = 0; i < h_lines.size(); i++)
        {
            if (abs(h_lines.at(i)._center.y - (h_lines.at(0)._center.y)) < near_val)
            {
                h_l_t.push_back(h_lines.at(i));
            }

            if (abs(h_lines.at(i)._center.y - (h_lines.back()._center.y)) < near_val)
            {
                h_l_d.push_back(h_lines.at(i));
            }
        }

        for (int i = 0; i < v_lines.size(); i++)
        {
            if (abs(v_lines.at(i)._center.x - (v_lines.at(0)._center.x)) < near_val)
            {
                v_l_l.push_back(v_lines.at(i));
            }
            if (abs(v_lines.at(i)._center.x - (v_lines.back()._center.x)) < near_val)
            {
                v_l_r.push_back(v_lines.at(i));
            }
        }


        std::vector<Line> H_LT_C, V_LL_C, H_LD_C, V_LR_C;
        if (h_l_t.size() >= 2)
        {
            for (int i = 0; i < h_l_t.size(); i++)
            {
                if ((h_l_t.at(i)._p1.x > ((v_l_l.front()._p2.x) - near_val)) && (h_l_t.at(i)._p1.x < ((v_l_r.front()._p2.x) + near_val)))
                {
                    H_LT_C.push_back(h_l_t.at(i));
                }
            }
            if (H_LT_C.empty())
            {
                H_LT_C.push_back(h_l_t.front());
            }
        }
        else
        {
            H_LT_C.push_back(h_l_t.front());
        }

        if (h_l_d.size() >= 2)
        {
            for (int i = 0; i < h_l_d.size(); i++)
            {
                if ((h_l_d.at(i)._p1.x > ((v_l_l.front()._p1.x) - near_val)) && (h_l_d.at(i)._p1.x < ((v_l_r.front()._p1.x) + near_val)))
                {
                    H_LD_C.push_back(h_l_d.at(i));
                }
            }
            if (H_LD_C.empty())
            {
                H_LD_C.push_back(h_l_d.front());
            }
        }
        else
        {
            H_LD_C.push_back(h_l_d.front());
        }


        if (v_l_l.size() >= 2)
        {
            for (int i = 0; i < v_l_l.size(); i++)
            {
                if (v_l_l.at(i)._p1.y > (h_l_t.at(0)._p1.y) && ((v_l_l.at(i)._p1.y < h_l_d.front()._p1.x) + near_val))
                {
                    V_LL_C.push_back(v_l_l.at(i));
                }
            }
            if (V_LL_C.empty())
            {
                V_LL_C.push_back(v_l_l.front());
            }
        }
        else
        {
            V_LL_C.push_back(v_l_l.front());
        }

        if (v_l_r.size() >= 2)
        {
            for (int i = 0; i < v_l_r.size(); i++)
            {
                if ((v_l_r.at(i)._p1.y < (h_l_d.at(0)._p1.y)) && ((v_l_r.at(i)._p1.y < h_l_d.front()._p1.x) + near_val))
                {
                    V_LR_C.push_back(v_l_r.at(i));
                }
            }
            if (V_LR_C.empty())
            {
                V_LR_C.push_back(v_l_r.front());
            }
        }
        else
        {
            V_LR_C.push_back(v_l_r.front());
        }

        if (H_LT_C.size() >= 2)
        {
            sort(H_LT_C.begin(), H_LT_C.end(), cmp_x);

            std::vector<cv::Point> p1;
            p1.push_back(H_LT_C.front()._p1);
            p1.push_back(H_LT_C.front()._p2);
            p1.push_back(H_LT_C.back()._p1);
            p1.push_back(H_LT_C.back()._p2);

            sort(p1.begin(), p1.end(), point_x);

            lines_c.push_back(Line(cv::Point(p1.front()), cv::Point(p1.back())));
        }
        else
        {
            lines_c.push_back(H_LT_C.front());
        }

        if (H_LD_C.size() >= 2)
        {
            sort(H_LD_C.begin(), H_LD_C.end(), cmp_x);

            std::vector<cv::Point> p1;
            p1.push_back(H_LD_C.front()._p1);
            p1.push_back(H_LD_C.front()._p2);
            p1.push_back(H_LD_C.back()._p1);
            p1.push_back(H_LD_C.back()._p2);

            sort(p1.begin(), p1.end(), point_x);

            lines_c.push_back(Line(cv::Point(p1.front()), cv::Point(p1.back())));

        }
        else
        {
            lines_c.push_back(H_LD_C.front());
        }

        if (V_LL_C.size() >= 2)
        {
            sort(V_LL_C.begin(), V_LL_C.end(), cmp_y);
            std::vector<cv::Point> p1;
            p1.push_back(V_LL_C.front()._p1);
            p1.push_back(V_LL_C.front()._p2);
            p1.push_back(V_LL_C.back()._p1);
            p1.push_back(V_LL_C.back()._p2);

            sort(p1.begin(), p1.end(), point_y);
            lines_c.push_back(Line(cv::Point(p1.front()), cv::Point(p1.back())));
        }
        else
        {
            lines_c.push_back(V_LL_C.front());
        }

        if (V_LR_C.size() >= 2)
        {
            sort(V_LR_C.begin(), V_LR_C.end(), cmp_y);

            std::vector<cv::Point> p1;
            p1.push_back(V_LR_C.front()._p1);
            p1.push_back(V_LR_C.front()._p2);
            p1.push_back(V_LR_C.back()._p1);
            p1.push_back(V_LR_C.back()._p2);

            sort(p1.begin(), p1.end(), point_y);
            lines_c.push_back(Line(cv::Point(p1.front()), cv::Point(p1.back())));
        }
        else
        {
            lines_c.push_back(V_LR_C.front());
        }
        return 0;
    }
    //选择全部
    void selectAll(cv::Mat& cv_src, std::vector<cv::Point>& out_points)
    {
        out_points.push_back(cv::Point2f(2, 2));
        out_points.push_back(cv::Point2f(2, cv_src.rows - 2));
        out_points.push_back(cv::Point2f(cv_src.cols - 2, 2));
        out_points.push_back(cv::Point2f(cv_src.cols - 2, cv_src.rows - 2));
    }

    double linesIntersectionAngle(cv::Vec4i l1, const cv::Vec4i l2)
    {
        cv::Point point;
        double x1 = l1[0], y1 = l1[1], x2 = l1[2], y2 = l1[3];
        double a1 = -(y2 - y1), b1 = x2 - x1, c1 = (y2 - y1) * x1 - (x2 - x1) * y1;
        double x3 = l2[0], y3 = l2[1], x4 = l2[2], y4 = l2[3];
        double a2 = -(y4 - y3), b2 = x4 - x3, c2 = (y4 - y3) * x3 - (x4 - x3) * y3;
        bool r = false;
        double x0 = 0, y0 = 0;
        double angle = 0;

        if (b1 == 0 && b2 != 0)
            r = true;
        else if (b1 != 0 && b2 == 0)
            r = true;
        else if (b1 != 0 && b2 != 0 && a1 / b1 != a2 / b2)
            r = true;
        if (r)
        {
            x0 = (b1 * c2 - b2 * c1) / (a1 * b2 - a2 * b1);
            y0 = (a1 * c2 - a2 * c1) / (a2 * b1 - a1 * b2);

            double a = sqrt(pow(x4 - x2, 2) + pow(y4 - y2, 2));
            double b = sqrt(pow(x4 - x0, 2) + pow(y4 - y0, 2));
            double c = sqrt(pow(x2 - x0, 2) + pow(y2 - y0, 2));
            angle = acos((b * b + c * c - a * a) / (2 * b * c)) * 180 / CV_PI;

        }
        return angle;
    }

    bool decodeArea(cv::Mat cv_enet, std::vector<cv::Point> points, float mu)
    {
        cv::Mat cv_lines_a(cv_enet.size(), CV_8UC1, cv::Scalar(0));
        drawQuadrangleToLines(points, cv_lines_a);
        int lines_a = 0, enet_a = 0;
        findContoursArea(cv_lines_a, lines_a);
        findContoursArea(cv_enet, enet_a);
        if (enet_a > lines_a * mu)
        {
            return true;
        }
        return false;
    }

    bool decideAngle(std::vector<Line> lines_in)
    {
        std::vector<cv::Vec4i> lines;
        for (int i = 0; i < lines_in.size(); i++)
        {
            lines.push_back(cv::Vec4i(lines_in.at(i)._p1.x, lines_in.at(i)._p1.y, lines_in.at(i)._p2.x, lines_in.at(i)._p2.y));
        }

        double a0 = linesIntersectionAngle(lines.at(0), lines.at(2));
        double a1 = linesIntersectionAngle(lines.at(0), lines.at(3));
        double a2 = linesIntersectionAngle(lines.at(2), lines.at(1));
        double a3 = linesIntersectionAngle(lines.at(1), lines.at(3));
        if ((a0 > 120 || a0 < 40) || (a1 > 120 || a1 < 40) || (a2 > 120 || a2 < 40) || (a3 > 120 || a3 < 40))
        {
            return true;
        }

        return false;
    }

    void quadrangleDetection(cv::Mat& cv_src, std::vector<cv::Point>& out_point, cv::Size& size_d, cv::Size& size_e)
    {
        std::vector<std::vector<cv::Point>> contours;
        std::vector<cv::Vec4i> hierarcy;

        cv::Mat  cv_canny_e, cv_canny_d;
        cv::Mat element_d = getStructuringElement(cv::MORPH_RECT, size_d);
        cv::Mat element_e = getStructuringElement(cv::MORPH_RECT, size_e);
        cv::dilate(cv_src, cv_canny_d, element_d);
        cv::erode(cv_canny_d, cv_canny_e, element_e);

        findContours(cv_canny_e, contours, hierarcy, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE);

        std::vector<cv::Rect> boundRect(contours.size());
        std::vector<cv::RotatedRect> box(contours.size());
        cv::Point2f rect[4];
        int area = 0;
        for (int i = 0; i < contours.size(); i++)
        {
            box[i] = cv::minAreaRect(cv::Mat(contours[i]));
            int area_t = cv::contourArea(contours[i]);
            if (area_t > area)
            {
                area = area_t;
            }
        }
        if (area < 5000)
        {
            selectAll(cv_src, out_point);
        }
        else
        {
            for (int i = 0; i < contours.size(); i++)
            {
                box[i] = cv::minAreaRect(cv::Mat(contours[i]));
                int area_t = cv::contourArea(contours[i]);
                if (area_t >= area)
                {
                    box[i].points(rect);
                    for (int j = 0; j < 4; j++)
                    {
                        out_point.push_back(rect[j]);
                        //line(cv_src, rect[j], rect[(j + 1) % 4], cv::Scalar(255), 1, 1);
                    }
                }
            }
        }
    }
    int enetToCorrectionPoint(cv::Mat cv_enet, std::vector<cv::Point>& points_out)
    {
        cv::Mat d = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(7, 7), cv::Point(-1, -1));
        cv::Mat cv_dilate;
        cv::dilate(cv_enet, cv_dilate, d);

        cv::Mat cv_erode;
        cv::Mat e = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(17, 17), cv::Point(-1, -1));
        cv::erode(cv_dilate, cv_erode, e);

        cv::Mat cv_blur;
        binImageBlur(cv_erode, cv_blur, cv::Size(5, 5), 130);

        //cv::imshow("cv_blur", cv_blur);

        cv::Size size_d(5, 5);
        cv::Size size_e(3, 3);
        std::vector<cv::Point> point_t;
        quadrangleDetection(cv_blur, point_t, size_d, size_e);
        sortPoint(point_t, points_out);

        return 0;
    }

    int enetLinesToPoint(cv::Mat& cv_enet, std::vector<cv::Point>& points_out)
    {
        cv::Mat d = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(7, 7), cv::Point(-1, -1));
        cv::Mat cv_dilate;
        cv::dilate(cv_enet, cv_dilate, d);

        cv::Mat cv_erode;
        cv::Mat e = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(9, 9), cv::Point(-1, -1));
        cv::erode(cv_dilate, cv_erode, e);

        cv::Mat cv_blur;
        binImageBlur(cv_erode, cv_blur, cv::Size(3, 3), 130);

        cv::Mat cv_canny;
        cv::Canny(cv_blur, cv_canny, 20, 60);

        double theta = 60;
        int threshold = 40;
        double minLineLength = 8;

        std::vector<cv::Vec4f> lines;
        HoughLinesP(cv_canny, lines, 1, CV_PI * 1 / 180, theta, threshold, minLineLength);


        if (lines.size() <= 3)
        {
            enetToCorrectionPoint(cv_enet, points_out);
            return 2;
        }

        std::vector<Line> horizontals, verticals;


        linesDichotomy(lines, horizontals, verticals, cv_enet);


        if (horizontals.size() < 2 || verticals.size() < 2)
        {
            enetToCorrectionPoint(cv_enet, points_out);
            return 3;
        }

        std::vector<Line> lines_out;
        screenLines(horizontals, verticals, lines_out, 20);

        if (lines_out.size() < 4)
        {
            enetToCorrectionPoint(cv_enet, points_out);
            return 4;
        }
        if (decideAngle(lines_out))
        {
            enetToCorrectionPoint(cv_enet, points_out);
            return 5;
        }

        std::vector<cv::Point> points;
        points.push_back(computeIntersect(lines_out.at(0), lines_out.at(2)));
        points.push_back(computeIntersect(lines_out.at(0), lines_out.at(3)));
        points.push_back(computeIntersect(lines_out.at(2), lines_out.at(1)));
        points.push_back(computeIntersect(lines_out.at(1), lines_out.at(3)));

        if (decodeArea(cv_enet, points, 2.2))
        {
            enetToCorrectionPoint(cv_enet, points_out);
            return 6;
        }
        if (((points.at(1).x - points.at(0).x) < 200) || ((points.at(3).x - points.at(2).x) < 200) || ((points.at(2).y - points.at(0).y) < 200) || ((points.at(3).y - points.at(1).y) < 200))
        {
            enetToCorrectionPoint(cv_enet, points_out);
            return 7;
        }

        points_out = points;

        return 0;
    }

    static int getCorrectionPoint(cv::Mat cv_edge, cv::Mat& cv_enet, std::vector<cv::Point>& points_out,
        double theta = 50, int threshold = 30, double minLineLength = 10)
    {
        std::vector<cv::Vec4f> lines;
        HoughLinesP(cv_edge, lines, 1, CV_PI * 1 / 180, theta, threshold, minLineLength);

        if (lines.size() <= 3)
        {
            int mask = enetLinesToPoint(cv_enet, points_out);

            return std::stoi(std::to_string(42) + std::to_string(mask));
        }

        std::vector<Line> horizontals, verticals;

        linesDichotomy(lines, horizontals, verticals, cv_edge);

        if (horizontals.size() < 2 || verticals.size() < 2)
        {
            int mask = enetLinesToPoint(cv_enet, points_out);

            return std::stoi(std::to_string(43) + std::to_string(mask));
        }
        std::vector<Line> lines_out;
        screenLines(horizontals, verticals, lines_out, 40);

        if (lines_out.size() < 4)
        {
            int mask = enetLinesToPoint(cv_enet, points_out);

            return std::stoi(std::to_string(44) + std::to_string(mask));
        }

        if (decideAngle(lines_out))
        {
            int mask = enetLinesToPoint(cv_enet, points_out);

            return std::stoi(std::to_string(45) + std::to_string(mask));
        }

        std::vector<cv::Point> points;
        points.push_back(computeIntersect(lines_out.at(0), lines_out.at(2)));
        points.push_back(computeIntersect(lines_out.at(0), lines_out.at(3)));
        points.push_back(computeIntersect(lines_out.at(2), lines_out.at(1)));
        points.push_back(computeIntersect(lines_out.at(1), lines_out.at(3)));

        if (decodeArea(cv_enet, points, 4))
        {
            int mask = enetLinesToPoint(cv_enet, points_out);

            return std::stoi(std::to_string(46) + std::to_string(mask));
        }
        if (((points.at(1).x - points.at(0).x) < 60) || ((points.at(3).x - points.at(2).x) < 60) ||
            ((points.at(2).y - points.at(0).y) < 60) || ((points.at(3).y - points.at(1).y) < 60))
        {
            int mask = enetLinesToPoint(cv_enet, points_out);

            return std::stoi(std::to_string(47) + std::to_string(mask));
        }

        points_out = points;

        return 400;
    }

    static int getCorrectionPoint(cv::Mat& cv_seg, std::vector<cv::Point>& points_out)
    {
        double theta = 50;
        int threshold = 30;
        double minLineLength = 10;

        cv::Mat cv_canny;
        cv::Canny(cv_seg, cv_canny, 30, 110, 5, true);
        std::vector<cv::Vec4f> lines;
        HoughLinesP(cv_canny, lines, 1, CV_PI * 1 / 180, theta, threshold, minLineLength);

        if (lines.size() <= 3)
        {
            int mask = enetLinesToPoint(cv_seg, points_out);

            return std::stoi(std::to_string(42) + std::to_string(mask));
        }

        std::vector<Line> horizontals, verticals;

        linesDichotomy(lines, horizontals, verticals, cv_seg);

        if (horizontals.size() < 2 || verticals.size() < 2)
        {
            int mask = enetLinesToPoint(cv_seg, points_out);

            return std::stoi(std::to_string(43) + std::to_string(mask));
        }
        std::vector<Line> lines_out;
        screenLines(horizontals, verticals, lines_out, 40);

        if (lines_out.size() < 4)
        {
            int mask = enetLinesToPoint(cv_seg, points_out);

            return std::stoi(std::to_string(44) + std::to_string(mask));
        }

        if (decideAngle(lines_out))
        {
            int mask = enetLinesToPoint(cv_seg, points_out);

            return std::stoi(std::to_string(45) + std::to_string(mask));
        }

        std::vector<cv::Point> points;
        points.push_back(computeIntersect(lines_out.at(0), lines_out.at(2)));
        points.push_back(computeIntersect(lines_out.at(0), lines_out.at(3)));
        points.push_back(computeIntersect(lines_out.at(2), lines_out.at(1)));
        points.push_back(computeIntersect(lines_out.at(1), lines_out.at(3)));

        if (decodeArea(cv_seg, points, 4))
        {
            int mask = enetLinesToPoint(cv_seg, points_out);

            return std::stoi(std::to_string(46) + std::to_string(mask));
        }
        if (((points.at(1).x - points.at(0).x) < 60) || ((points.at(3).x - points.at(2).x) < 60) || ((points.at(2).y - points.at(0).y) < 60) || ((points.at(3).y - points.at(1).y) < 60))
        {
            int mask = enetLinesToPoint(cv_seg, points_out);

            return std::stoi(std::to_string(47) + std::to_string(mask));
        }

        points_out = points;

        return 400;
    }


    /// 
    /// 线映射到图像边缘
    /// 
    /// 输入图像
    /// 线的起点
    /// 线的终点
    void drawFullImageLine(cv::Mat cv_src, cv::Point& p1, cv::Point& p2)
    {
        cv::Point p, q;

        if (p2.x == p1.x)
        {
            p = cv::Point(p1.x, 0);
            q = cv::Point(p1.x, cv_src.rows);
        }
        else
        {
            double a = (double)(p2.y - p1.y) / (double)(p2.x - p1.x);
            double b = p1.y - a * p1.x;

            p = cv::Point(0, b);
            q = cv::Point(cv_src.rows, a * cv_src.rows + b);

            cv::clipLine(cv::Size(cv_src.rows, cv_src.cols), p, q);
        }
        p1 = p;
        p2 = q;
    }

    int getMidcourtLine(cv::Mat cv_mid, cv::Point& p1_c, cv::Point& p2_c)
    {
        std::vector<std::vector<cv::Point>> contours;
        std::vector<cv::Vec4i> hierarchy;
        findContours(cv_mid, contours, hierarchy, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE, cv::Point());

        //求出面积最大的轮;
        int max_area = 0;

        for (int i = 0; i < contours.size(); i++)
        {
            double tmparea = fabs(contourArea(contours[i]));
            if (tmparea > max_area)
            {
                max_area = tmparea;
            }

        }
        for (int i = 0; i < contours.size(); i++)
        {
            double tmparea = fabs(contourArea(contours[i]));

            if (tmparea >= max_area || tmparea * 1.1 >= max_area)
            {
                //绘制轮廓的最小外结矩形  
                cv::RotatedRect rect = minAreaRect(contours[i]);

                cv::Rect r = rect.boundingRect();

                int max = r.width > r.height ? r.width : r.height;
                if (max <= 200)
                {
                    return 2;
                }
                cv::Point2f point[4];
                rect.points(point);

                cv::Size size = rect.size;

                if (size.width > size.height)
                {
                    p1_c = cv::Point((point[0].x + point[1].x) / 2, (point[0].y + point[1].y) / 2);
                    p2_c = cv::Point((point[2].x + point[3].x) / 2, (point[2].y + point[3].y) / 2);
                }
                else
                {
                    p1_c = cv::Point((point[1].x + point[2].x) / 2, (point[1].y + point[2].y) / 2);
                    p2_c = cv::Point((point[0].x + point[3].x) / 2, (point[0].y + point[3].y) / 2);
                }
            }

        }

        cv::Rect rect(p1_c, p2_c);
        Line mid(p1_c, p2_c);
        if (rect.height > rect.width)
        {
            if (mid._center.x >= 220 && mid._center.x <= 440)
            {
                return 2;
            }
            else
            {
                drawFullImageLine(cv_mid, p1_c, p2_c);
            }
        }
        else
        {
            if (mid._center.y >= 220 && mid._center.y <= 440)
            {
                return 2;
            }
            else
            {
                drawFullImageLine(cv_mid, p1_c, p2_c);
            }
        }


        return 0;
    }

    /// 
    /// 以中线为基准分割出书本两页图像返回边缘图像
    /// 
    /// 语义分割图像
    /// 返回边缘二值图像
    /// 中线点
    /// 中线点
    void midLineCutBook(cv::Mat cv_src, cv::Mat& cv_edge, cv::Point& p1, cv::Point& p2)
    {
        cv::Mat cv_canny;

        cv::Rect rect(p1, p2);

        cv::Canny(cv_src, cv_canny, 30, 110, 5, true);

        cv::Mat cv_p1, cv_p2;
        cv::Point p_bl, p_tr;
        cv::Point p_top(0, 0);
        cv::Point p_base(cv_src.cols, cv_src.rows);
        cv::Rect rect_1, rect_2;
        p_tr = cv::Point(rect.br().x, rect.tl().y);
        p_bl = cv::Point(rect.tl().x, rect.br().y);

        //垂直中线
        if (rect.width < rect.height)
        {
            p_tr.x = p_tr.x < 0 ? 0 : p_tr.x;
            p_tr.x = p_tr.x > cv_src.cols ? cv_src.cols : p_tr.x;
            p_tr.y = 0;
            //p_tr.y = p_tr.y < 0 ? 0 : p_tr.y;
            //p_tr.y = p_tr.y > cv_src.rows ? cv_src.rows : p_tr.y;

            p_bl.x = p_bl.x < 0 ? 0 : p_bl.x;
            p_bl.x = p_bl.x > cv_src.cols ? cv_src.cols : p_bl.x;
            p_bl.y = cv_src.rows;
            //p_bl.y = p_bl.y < 0 ? 0 : p_bl.y;
            //p_bl.y = p_bl.y > cv_src.rows ? cv_src.rows : p_bl.y;

            rect_1 = cv::Rect(p_top, p_bl);
            rect_2 = cv::Rect(p_tr, p_base);

        }
        else//水平中线
        {
            //std::cout << "matt" << std::endl;
            p_tr.x = cv_src.cols;
            //p_tr.x = p_tr.x > cv_src.cols ? cv_src.cols : p_tr.x;
            p_tr.y = p_tr.y < 0 ? 0 : p_tr.y;
            p_tr.y = p_tr.y > cv_src.rows ? cv_src.rows : p_tr.y;

            p_bl.x = 0;
            //p_bl.x = p_bl.x > cv_src.cols ? cv_src.cols : p_bl.x;
            //p_bl.y = cv_src.rows;
            p_bl.y = p_bl.y < 0 ? 0 : p_bl.y;
            p_bl.y = p_bl.y > cv_src.rows ? cv_src.rows : p_bl.y;

            rect_1 = cv::Rect(p_top, p_tr);
            rect_2 = cv::Rect(p_bl, p_base);
        }


        p_tr = cv::Point(rect.br().x, rect.tl().y);
        p_bl = cv::Point(rect.tl().x, rect.br().y);

        p_tr.x = p_tr.x < 0 ? 0 : p_tr.x;

        cv_edge = cv::Mat(cv_src.size(), CV_8UC1, cv::Scalar(0));

        cv::Rect rect_roi = (rect_1.area() >= rect_2.area()) ? rect_1 : rect_2;

        //cv::rectangle(cv_edge, rect, cv::Scalar(255));
        cv::Mat cv_paper = cv_canny(rect_roi);
        // cv::imshow("rect_roi", cv_edge);
        cv::Mat roi = cv_edge(rect_roi);

        cv_paper.copyTo(roi);
        cv::line(cv_edge, p1, p2, cv::Scalar(255), 2);
    }


    std::vector<cv::Point> DocumentEdge::getMidLine(cv::Mat cv_src, cv::Mat& cv_seg,int area)
    {
        std::vector<cv::Point> mid_line;
        cv::Mat cv_roi_c, cv_mid;
        //1.得到分割的目标
        cv_src.copyTo(cv_roi_c, cv_seg);
        //2.对目标做中线分割

        //enetSegmentationMid(cv_roi_c, cv_mid, mid_net, threads, 512);
        inference(mid_net, cv_roi_c, cv_mid,target_size);
        //3.判断是否能分割到
        int mid_total = countNonZero(cv_mid);

        cv::Point p1_c, p2_c;
        if (mid_total > 1500)
        {
            getMidcourtLine(cv_mid, p1_c, p2_c);
            double segment_length = cv::sqrt(((float)p1_c.y - p2_c.y) * ((float)p1_c.y - p2_c.y) + ((float)p1_c.x - p2_c.x) * ((float)p1_c.x - p2_c.x));

            //3.1 按分割面积做中线长度判断，先过滤掉一部分
            switch (area)
            {
            case 9:
                if (segment_length > 500)
                {
                    mid_line.push_back(p1_c);
                    mid_line.push_back(p2_c);
                }
                break;
            case 8:
                if (segment_length > 400)
                {
                    mid_line.push_back(p1_c);
                    mid_line.push_back(p2_c);
                }
                break;
            case 7:
                if (segment_length > 300)
                {
                    mid_line.push_back(p1_c);
                    mid_line.push_back(p2_c);
                }
                break;
            case 6:
                if (segment_length > 200)
                {
                    mid_line.push_back(p1_c);
                    mid_line.push_back(p2_c);
                }
                break;
            default:
                break;
            }
        }
        return mid_line;
    }

    int positioningBookEdgeLines(cv::Mat& cv_src, cv::Mat& cv_seg, std::vector<cv::Point>& mid_line, std::vector<cv::Point>& points_out, int area_index)
    {
        double theta = 50;
        int threshold = 30;
        double minLineLength = 10;

        std::vector<Line> lines_out;
        cv::Rect rect(mid_line[0], mid_line[1]);

        Line mid(mid_line[0], mid_line[1]);

        cv::Mat cv_canny;

        switch (area_index)
         {
         case 9:
         //垂直中线
        if (rect.height > rect.width)
        {
            //1.1 判断中线位置，如果是正中间，则不做处理
            if (mid._center.x >= 220 && mid._center.x <= 440)
            {
                return getCorrectionPoint(cv_seg, points_out);
            }
            else
            {
                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
                getCorrectionPoint(cv_canny, cv_seg, points_out);
            }
        }
	        else//水平中线
	        {
	            if (mid._center.y >= 220 && mid._center.y <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        break;
	    case 8:
	        if (rect.height > rect.width)
	        {
	            //1.1 判断中线位置，如果是正中间，则不做处理
	            if (mid._center.x >= 220 && mid._center.x <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        else//水平中线
	        {
	            if (mid._center.y >= 220 && mid._center.y <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                return  getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        break;
	    case 7:
	        if (rect.height > rect.width)
	        {
	            //1.1 判断中线位置，如果是正中间，则不做处理
	            if (mid._center.x >= 220 && mid._center.x <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                return getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        else//水平中线
	        {
	            if (mid._center.y >= 220 && mid._center.y <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                return getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        break;
	    case 6:
	        if (rect.height > rect.width)
	        {
	            //1.1 判断中线位置，如果是正中间，则不做处理
	            if (mid._center.x >= 220 && mid._center.x <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                return getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        else//水平中线
	        {
	            if (mid._center.y >= 220 && mid._center.y <= 440)
	            {
	                return getCorrectionPoint(cv_seg, points_out);
	            }
	            else
	            {
	                midLineCutBook(cv_seg, cv_canny, mid_line[0], mid_line[1]);
	                return getCorrectionPoint(cv_canny, cv_seg, points_out);
	            }
	        }
	        break;
	    default:
	        selectAll(cv_seg, points_out);
	        return 49999;
	        break;
	    }
        return 0;
    }


    int DocumentEdge::detect(cv::Mat cv_src, std::vector<cv::Point>& points_out, int _od_label)
    {
        if (cv_src.empty())
        {
            return -20;
        }

        //1.为了提升速度，对原图做压缩
        float w_s = cv_src.cols / 660.00;
        float h_s = cv_src.rows / 660.00;
        cv::Mat cv_resize;
        cv::resize(cv_src, cv_resize, cv::Size(660, 660), cv::INTER_AREA);

        //2.语义分割
        cv::Mat cv_enet;
        inference(edge_net,cv_resize,cv_enet,target_size);

        //3.对分割出来的ROI做面积判断
        cv::Mat cv_seg;
        int area_index = targetArea(cv_enet, cv_seg);

        int mark = 0;

        //4.目标是书本
        if (_od_label == 10 && book_mid)
        {
            cv::Mat cv_roi_c, cv_mid, cv_edge;

            //4.1 中线检测并返回中线
            std::vector<cv::Point> mid_line;

            mid_line = getMidLine(cv_resize, cv_seg,area_index);
            //4.2 判断到中线
            if (mid_line.size() >= 2)
            {
                mark = positioningBookEdgeLines(cv_resize, cv_seg, mid_line, points_out, area_index);
            }
            //4.3 判断不到中线
            else
            {

                mark = getCorrectionPoint(cv_seg, points_out);

            }
        }
        //5.目标不是书本
        else
        {
            mark = getCorrectionPoint(cv_seg, points_out);
        }

        for (int i = 0; i < points_out.size(); i++)
        {
            points_out.at(i).x = points_out.at(i).x * w_s;
            points_out.at(i).y = points_out.at(i).y * h_s;
            points_out.at(i).x = points_out.at(i).x < 0 ? 0 : points_out.at(i).x;
            points_out.at(i).y = points_out.at(i).y < 0 ? 0 : points_out.at(i).y;
            points_out.at(i).x = points_out.at(i).x > cv_src.cols ? cv_src.cols : points_out.at(i).x;
            points_out.at(i).y = points_out.at(i).y > cv_src.rows ? cv_src.rows : points_out.at(i).y;
        }

        return mark;
    }


    int DocumentEdge::revise_image(cv::Mat& cv_src, cv::Mat& cv_dst, std::vector<cv::Point>& in_points)
    {
        if (cv_src.empty())
        {
            return -20;
        }
        cv::Mat cv_warp = cv_src.clone();
        if (in_points.size() != 4)
        {
            return -444;
        }

        cv::Point point_f, point_b;

        point_f.x = (in_points.at(0).x < in_points.at(2).x) ? in_points.at(0).x : in_points.at(2).x;
        point_f.y = (in_points.at(0).y < in_points.at(1).y) ? in_points.at(0).y : in_points.at(1).y;
        point_b.x = (in_points.at(3).x > in_points.at(1).x) ? in_points.at(3).x : in_points.at(1).x;
        point_b.y = (in_points.at(3).y > in_points.at(2).y) ? in_points.at(3).y : in_points.at(2).y;

        //2020.8.24更新了比例不对的问题，加了点到点之间的距离运算，最终取水平与垂直线最长线
        float l_1 = getDistance(in_points.at(0), in_points.at(1));
        float l_2 = getDistance(in_points.at(2), in_points.at(3));
        float l_3 = getDistance(in_points.at(1), in_points.at(3));
        float l_4 = getDistance(in_points.at(0), in_points.at(2));

        int width = l_1 >= l_2 ? l_1 : l_2;
        int height = l_3 >= l_4 ? l_3 : l_4;

        //旧代码取目标的最小外接矩形，但倾斜45度时会出现比例变形的现象
        //cv::Rect rect(point_f, point_b);
        cv_dst = cv::Mat::zeros(height, width, CV_8UC3);

        std::vector<cv::Point2f> dst_pts;
        dst_pts.push_back(cv::Point2f(0, 0));
        dst_pts.push_back(cv::Point2f(width - 1, 0));
        dst_pts.push_back(cv::Point2f(0, height - 1));
        dst_pts.push_back(cv::Point2f(width - 1, height - 1));

        std::vector<cv::Point2f> tr_points;
        tr_points.push_back(in_points.at(0));
        tr_points.push_back(in_points.at(1));
        tr_points.push_back(in_points.at(2));
        tr_points.push_back(in_points.at(3));

        cv::Mat transmtx = getPerspectiveTransform(tr_points, dst_pts);

        cv::warpPerspective(cv_warp, cv_dst, transmtx, cv_dst.size());

        return 0;
    }

    void DocumentEdge::draw_out_points(cv::Mat cv_src, cv::Mat& cv_dst, std::vector<cv::Point>& points_out)
    {
        cv_dst = cv_src.clone();
        cv::line(cv_dst, points_out.at(0), points_out.at(1), cv::Scalar(0, 255, 0), 2, cv::LINE_8);
        cv::line(cv_dst, points_out.at(0), points_out.at(2), cv::Scalar(0, 0, 255), 2, cv::LINE_8);
        cv::line(cv_dst, points_out.at(1), points_out.at(3), cv::Scalar(255, 0, 0), 2, cv::LINE_8);
        cv::line(cv_dst, points_out.at(2), points_out.at(3), cv::Scalar(0, 255, 255), 2, cv::LINE_8);
    }
}

4.实现效果

你可能感兴趣的:(安卓,鸿蒙,Android,深度学习,拍照扫描,扫描王,边缘检测,边缘计算)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
谁家酒器最绝唱，藏在酒厂人未知？景阳冈酒厂先秦藏品大揭秘李虓酒评论
文/王赛时中国的酒器酒具历史久远，举世闻名。从北京的故宫博物院、中国国家博物馆，到世界各国的大型博物馆，都以能够收藏中国古代酒具而夸耀。但很少有人知道，在山东阳谷景阳冈酒厂，默默地收藏了两千件中国酒器。这些酒器，就封藏在景阳冈的酒道馆里。其中有一些青铜酒器，一睡就是三、四千年，堪称无声国宝，堪作无字史书！今天，我将引领诸位首先窥视一下景阳冈酒道馆的9件先秦藏品，你自己来说震撼不震撼。提示：这只是景
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【穿过丛林看见你】2015年在《诗歌报》读诗日记（一）快快_ce70
写完《三月的领土》和《手握一把锄头，在翻动诗歌的春天》之后，安稳的睡了个好觉，这是从2013年的五月之后，第一次睡的如此安稳和香甜。其实这对于我来说，也没有什么特别的意义和变故，就像我现在的生活在人人忙着踏青、写生、拍照的春天。在我脚下，没有领土的完整，也没有加剧的破碎。我曾经和现在都是个辛勤的“蜂农”，在这样一个角色里，尽管有人盗走了我所有的蜜，但不妨碍我对甜蜜的不懈追求和喜爱。翻开最近的阅读笔
一个历史事件和查理一世走上断头台有很大关系，这个事件是什么？王老师聊围棋
今天我要讲的历史事件，查理一世被处死的始末。其实查理一世给被处死的时候，与一个事件有很大的联系。这个事件是“普莱德清洗”。提到这个事件，我们不得不提到一个人，这个人就是克伦威尔。可以说，查理一世能够走上断头台，克伦威尔有很大的功劳。为什么这么说呢。那我们就成英国内战的终结说起吧。我们都知道英国的内战是有保王党挑起来。在保王党军队一路凯歌进攻的同时。就在1645年6月14日，在纳西比荒原上进行最后的
王东伟，中原焦点秦皇岛站第五期，每日分享第181天 Vivian_c8c7
《解码青春期》让孩子懂得承担责任，学会道歉。英国诗人亚历山大•蒲柏有句名言：凡人难免犯错宽恕方显神性。学会如何请求对方宽恕对于保持健康的关系至关重要。当青少年把事情搞砸的时候，他们需要从关心他们的成年人那里获得帮助。家长的目标是要培养一个能为自己的行为承担责任的青少年，培养一个敢于诚恳的承认错误，愿意真心悔改的青少年。青少年只关注自己如何委屈，而且会竭尽全力为自己的行为辩解。所以，家长得小心地拆除
舜公郑金锋书辛丑自剪扇面书法作品（四O六）舜公郑金锋
辛丑小阳春，新自剪扇面400品，大多为各色撒金、撒银、描金、描银、水印、彩绘、荧光等亚粉、色宣纸，以及域外包装填充纸等；王一品长锋羊毫秃笔；一得阁云头艳墨、宿墨、水等。书体有甲骨文，金文(商周金文、春秋战国金文、中山王厝器金文、汉金文……)，楚简帛书，侯马盟书，温县盟书，小篆，果蝙书等，隶书(秦简、汉简帛书、汉碑……)，草书(章草、小草、大草……)，行书(行楷、行草)，楷书(魏碑及北朝墓志、隋朝墓
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
每天都有“小感动” 河北张海霞
上次开学，在楼道值班儿的我，回到办公室后，发现我的办公桌上了一个小饭盒，打开一看，是自家腌的萝卜片，闻起来香香的，是哪位有心的孩子带来的？我猜测着……会不会是杨同学，记得开学第一天，她胃疼再加上低血糖，我曾陪她去医务室看病，并给她带回了早餐……还是李同学，那次她被别的同学欺侮，我为她主持公道。晚餐时间到了，我还带她去餐厅吃饭，引得同学们一阵羡慕……会不会是王同学，那次她眼睛不好，我陪她聊天，关心地
2018-12-07 旅一06丁琪琪
旅管一班6组学号链接06丁琪琪16家国鑫26孟令慧30王思宁36温红丽46朱赵筱楠
三梦 | 心碎了还是醉了培根不是肉
今天，让我一起走进彝族火把节。图片发自App“中国彝族火把节之乡·2016布拖民间火把节”在离学校走约一个时辰路程的地方举行，奔着要在如此隆重的节日之中好好欣赏一番的目的，三梦团队一早便和随队的两个孩子整装待发。图片发自App第一部分:吉尔吉呷我万万没有想到，从踏出校门开始，从我牵上那个孩子的手开始，我心的触动就没有停过。图片发自App我以为我这一路会在观察、拍照和思考中度过，但我发现我错了。这个
2.2.6 通知类控件 Toast、Menu 常思行
本文例程下载：WillFlow_Toast、WillFlowMenu一、什么是Toast？Toast也被叫做吐司，是Android系统提供的一种非常好的提醒方式，在程序中可以使用它将一些短小的信息通知给用户，它有如下两个特点：Toast是没有焦点的Toast显示的时间有限过一定的时间就会自动消失所以一般来讲Toast的使用并不会影响我们的正常操作，并且它通常不会占用太大的屏幕空间，有着良好的用户体
2023-08-08 2023梦启支教团张牧泽
学汉字历史，行传统书法——中国矿业大学梦启支教团梦启三班开展书法文化课7月20日上午8时，中国矿业大学梦启支教团在贵州省金沙县西洛街道彩虹小学开展了“书法文化”课程。该课程意在向孩子们传授汉字演变的相关知识，围绕书法发展历史讲解不同时期的字形字体特点。此课程由梦启支教团成员王耀民讲授，梦启三班全体成员参加。中国文字的发展有数千年的历史，从早期雏形的象形文字到殷商时期的甲骨文、金文，再到西周、秦朝的
海拔五千 3点8度
【海拔五千】连续几天到宿舍盯学生早起情况，今天早上都能及时离开宿舍，没有迟到的了。早读复习宋词，新背一首，晚上又忘了[流泪]断续听王静老师的一堂课，深度语文名不虚传！下课问学生如何，学生答曰比你讲的有趣[捂脸]继续读《娱乐至死》美国在不同的历史时期，代表城市不一样，从波士顿的政治中心，到纽约的大熔炉（自由女神就是其象征），再到芝加哥的工业发展中心，最后到拉斯维加斯的娱乐之城。不同历史时期美国精神的
《前夫如龙》王昊江琼（独家小说）精彩TXT阅读海边书楼
《前夫如龙》王昊江琼（独家小说）精彩TXT阅读主角：王昊江琼简介：离婚那天，她视他如泥土。谁曾想，消息一出，天下震动！可关注微信公众号【风车文楼】去回个书号【203】，即可免费阅读【前夫如龙】全文！江芸并未听出华少龙声音里的冷漠，依旧一脸笑容道：“是啊，那个废物哪儿配得上我姐？这些年，我姐对他仁至义尽了。以后，华少爷可以多跟我姐接触接触，只有华少爷这样的人，才配得上我姐啊！”江琼低着头，微微有些娇
#王六六日记 3a15f0e47473
怎么突然忘了写日记了呢？今天补一下昨天的，从佘山回来，和xh一起，我太幸福了下午新人培训，没啥事儿干
数幸福D10 3c807316efec
王多妈妈幸福能力提升计划依靠皇上托举皇上做一个五半三平的小女人一：感知到的幸福和快乐1：点赞皇上①下班前皇上问我晚上吃饭准备怎么弄，我们买点菜回家做饭吧皇上问我想吃什么，我说多可以，皇上很用心的准备晚饭，一回到家皇上先回家做饭，我说后备箱还有我的行李，皇上说等一下我再下来拿好吗？语气特别好，眼神多是商量的，皇上现在总是有意识的考虑我的感受②吃完饭我们准备一起接女儿放学，皇上说碗他洗，我想着一起收拾
mac 备份android 手机通讯录导入iphone,iphone如何导出通讯录（轻松教你iPhone备份通讯录的方法）... weixin_39762838 mac 备份android 手机通讯录导入iphone
在日新月异的手机更替中，换手机已经成为一个非常稀松平常的事情，但将旧手机上面的通讯录导入到新手机还是让不少小伙伴为难，本篇将给大家详细讲解这方面的知识：“苹果手机通讯录怎么导入到新手机”及“安卓手机通讯录导入到新手机”的方法。一、苹果手机通讯录导入到新手机常用方法(SIM卡导入)在苹果手机主频幕上找到“设置”，单击进入设置菜单，下拉菜单列表，点击“邮件、通讯录、日历”，然后找到“导入SIM卡通讯录
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
Android应用性能优化轻口味 Android
Android手机由于其本身的后台机制和硬件特点，性能上一直被诟病，所以软件开发者对软件本身的性能优化就显得尤为重要；本文将对Android开发过程中性能优化的各个方面做一个回顾与总结。Cache优化ListView缓存：ListView中有一个回收器，Item滑出界面的时候View会回收到这里，需要显示新的Item的时候，就尽量重用回收器里面的View；每次在getView函数中inflate新
iPhone怎么删除重复照片，可以尝试这几种方法 2401_85240355 iphone ios
在数字化时代，智能手机尤其是iPhone成为我们日常生活中不可或缺的一部分。随着我们不断使用iPhone拍照，重复照片的积累逐渐成为一个普遍问题。这不仅占用了大量的存储空间，也使得照片库变得杂乱无章。本文将介绍几种有效的iPhone怎么删除重复照片方法，并介绍如何利用CleanMyPhone来简化这一过程。iPhone怎么删除重复照片方法一：人工筛查人工筛查是最直接的方法，尽管它可能比较耗时。这种
《错嫁傻王：王妃她又黑化了》南君宥乔洛染（独家小说）精彩TXT阅读海边书楼
《错嫁傻王：王妃她又黑化了》南君宥乔洛染（独家小说）精彩TXT阅读主角：南君宥乔洛染简介：堂堂21世纪金牌特种兵乔洛染，穿来的第一天，就被人诬陷私通被逼投江。而前来解救她的，正是她的夫婿——智力受损的痴傻王爷南君宥。傻子娶了一个不贞女，全京城都在等着看他们的笑话。殊不知，乔洛染一手医术济天下，一手制毒退万敌。关注微信公众号【花车文学】去回个书號【36】，即可阅读【错嫁傻王：王妃她又黑化了】小说全文
2019-04-10 shuaigefeng
姓名：王林锋企业名称：三亚蔚蓝时代实业有限公司组别：420期努力6组【日精进打卡251天】【知~学习、诵读】《六项精进》2遍，累计256遍《大学》2遍，累计220遍【经典分享】1、想过成功、想过失败、也想过放弃。【行~实践】一、修身：（对自己个人）1.拍打腿部两侧50下，舌顶上颚50下。2.坚持诵读、阅读。3.坚持锻炼、按时睡觉起床。4.控制健康饮食，饭后走动30分钟。5.每天反省自己的思想和行为
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
【刘美莹】我的好朋友刘美莹
我有一个好朋友，今天我来给你们介绍一下她们吧！我的第一个好朋友是王思雯，她的学习很好，而且多才多艺，还有很多爱好，比如说画画，舞蹈，读书等，她很擅长舞蹈，经常上大舞台演出呢！她经常会和我一起倾诉她的心事和烦恼，虽然我们俩有时候会闹一些别扭，但是我们俩依旧是好朋友的，对吗？图片发自App
Android实现监听事件的方法 Amy木婉清
1.通过内部类实现2.通过匿名内部类实现3.通过事件源所在类实现4.通过外部类实现5.布局文件中onclick属性(针对点击事件)1.通过内部类实现代码:privateButtonmBtnEvent;//oncreate中mBtnEvent.setOnClickListener(newOnClick());//内部类实现监听classOnClickimplementsView.OnClickLis
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情