qq_41576083

EAST-tensorflow 源码解读

EAST网络提供了对自然场景中文字区域的目标检测功能

源码：https://github.com/argman/EAST

主要侧重于对样本标签的制作部分

一、网络结构

二、loss定义

三、训练标签的生成

3.1 crop_area图片切割

3.2 generate_rbox标签生成

一、网络结构

网络结构不难理解，如下图所示：

为了检测不同大小尺度的文字目标，网络从不同的卷积层提取了f1-f4四个卷积层输出，并通过不同模块h2-h4的上采样后，将不同卷积层的输出按通道叠加，最后输出结果分别经过[1,1,1]，[1,1,4]，[1,1,1]的卷积核，得到3个输出：

1.score map：[H/4，W/4，1]的张量，表示其中每个像素在文本内容框内的置信。

2.text boxes：[H/4，W/4，4]的张量，表示在文本内容框内的像素到框四边的距离信息。

3.text rotation：[H/4，W/4，1]的张量，表示所处文本框的倾斜角度

下面是源码中的相应部分：

def model(images, weight_decay=1e-5, is_training=True):
    '''
    define the model, we use slim's implemention of resnet
    '''
    # 对RGB像素值做标准化，即减去均值
    images = mean_image_subtraction(images)

    # 先将图片经过resnet_v1网络
    # 得到resnet_v1的全部stage的输出，存在end_points里面
    with slim.arg_scope(resnet_v1.resnet_arg_scope(weight_decay=weight_decay)):
        logits, end_points = resnet_v1.resnet_v1_50(images, is_training=is_training, scope='resnet_v1_50')

    with tf.variable_scope('feature_fusion', values=[end_points.values]):
        batch_norm_params = {
        'decay': 0.997,
        'epsilon': 1e-5,
        'scale': True,
        'is_training': is_training
        }
        with slim.arg_scope([slim.conv2d],
                            activation_fn=tf.nn.relu,
                            normalizer_fn=slim.batch_norm,
                            normalizer_params=batch_norm_params,
                            weights_regularizer=slim.l2_regularizer(weight_decay)):
            # 取第2，3，4，5次池化后的输出
            f = [end_points['pool5'], end_points['pool4'],
                 end_points['pool3'], end_points['pool2']]
            for i in range(4):
                print('Shape of f_{} {}'.format(i, f[i].shape))
            g = [None, None, None, None]
            h = [None, None, None, None]
            num_outputs = [None, 128, 64, 32]
            for i in range(4):
                # 由网络结构图可知h0=f0
                if i == 0:
                    h[i] = f[i]
                # 对其他的hi有，hi = conv（concat（fi，unpool（hi-1）））
                else:
                    c1_1 = slim.conv2d(tf.concat([g[i-1], f[i]], axis=-1), num_outputs[i], 1)
                    h[i] = slim.conv2d(c1_1, num_outputs[i], 3)
                # 由网络结构可知，对于h0，h1，h2都要先经过unpool在与fi进行叠加
                if i <= 2:
                    g[i] = unpool(h[i])
                else:
                    g[i] = slim.conv2d(h[i], num_outputs[i], 3)
                print('Shape of h_{} {}, g_{} {}'.format(i, h[i].shape, i, g[i].shape))

            # score map
            F_score = slim.conv2d(g[3], 1, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None)
            # text boxes
            geo_map = slim.conv2d(g[3], 4, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None) * FLAGS.text_scale
            # text rotation
            angle_map = (slim.conv2d(g[3], 1, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None) - 0.5) * np.pi/2 # angle is between [-45, 45]
            # 这里将坐标与角度信息合并输出
            F_geometry = tf.concat([geo_map, angle_map], axis=-1)

    return F_score, F_geometry

二、loss定义

整个loss主要由三部分组成：

1. 分类loss，即对score_map中预测像素是否处于文本内容内的预测结果的交叉熵

2. 角度loss，对旋转角度预测的一个简单误差函数

3. 定位loss，这里采用了IOU loss

代码很简短，如下：

def loss(y_true_cls, y_pred_cls,
         y_true_geo, y_pred_geo,
         training_mask):
    '''
    define the loss used for training, contraning two part,
    the first part we use dice loss instead of weighted logloss,
    the second part is the iou loss defined in the paper
    :param y_true_cls: ground truth of text
    :param y_pred_cls: prediction os text
    :param y_true_geo: ground truth of geometry
    :param y_pred_geo: prediction of geometry
    :param training_mask: mask used in training, to ignore some text annotated by ###
    :return:
    '''
    # score交叉熵
    classification_loss = dice_coefficient(y_true_cls, y_pred_cls, training_mask)
    classification_loss *= 0.01

    # d1 -> top, d2->right, d3->bottom, d4->left
    # IOU loss计算
    d1_gt, d2_gt, d3_gt, d4_gt, theta_gt = tf.split(value=y_true_geo, num_or_size_splits=5, axis=3)
    d1_pred, d2_pred, d3_pred, d4_pred, theta_pred = tf.split(value=y_pred_geo, num_or_size_splits=5, axis=3)
    area_gt = (d1_gt + d3_gt) * (d2_gt + d4_gt)
    area_pred = (d1_pred + d3_pred) * (d2_pred + d4_pred)
    w_union = tf.minimum(d2_gt, d2_pred) + tf.minimum(d4_gt, d4_pred)
    h_union = tf.minimum(d1_gt, d1_pred) + tf.minimum(d3_gt, d3_pred)
    area_intersect = w_union * h_union
    area_union = area_gt + area_pred - area_intersect
    L_AABB = -tf.log((area_intersect + 1.0)/(area_union + 1.0))

    # 角度误差函数
    L_theta = 1 - tf.cos(theta_pred - theta_gt)

    
    tf.summary.scalar('geometry_AABB', tf.reduce_mean(L_AABB * y_true_cls * training_mask))
    tf.summary.scalar('geometry_theta', tf.reduce_mean(L_theta * y_true_cls * training_mask))

    # 加权和得到geo loss
    L_g = L_AABB + 20 * L_theta

    # 考虑training_mask，背景像素不参与误差计算
    return tf.reduce_mean(L_g * y_true_cls * training_mask) + classification_loss

三、训练标签的生成

训练集针对每一幅图片，都有一个txt文件记录其中的文本框位置及内容，如下所示：

txt文件内容如下所示：

显然，每一行记录了一个文本框的位置信息，以及文本内容，而以###或者*标注的则是无法辨识的内容。

对每一幅图片，读入txt内容后要进行的操作主要有以下几步：

1. 随机切割图片中的带文字部分与背景部分，并resize以及pad成要求尺寸的样本图片

2. 根据切割部分的gt内容制作score_map, geo_map, rotation_map。

源代码如下：


def generator(input_size=512, batch_size=32,
              background_ratio=3./8,
              random_scale=np.array([0.5, 1, 2.0, 3.0]),
              vis=False):
    # 获得训练集路径下所有图片名字
    image_list = np.array(get_images())
    print('{} training images in {}'.format(
        image_list.shape[0], FLAGS.training_data_path))
    # index ：总样本数
    index = np.arange(0, image_list.shape[0])
    while True:
        np.random.shuffle(index)
        images = []
        image_fns = []
        score_maps = []
        geo_maps = []
        training_masks = []
        for i in index:
            try:
                # 读取图片
                im_fn = image_list[i]
                im = cv2.imread(im_fn)
                # print im_fn
                h, w, _ = im.shape

                # 读取标签txt
                txt_fn = im_fn.replace(os.path.basename(im_fn).split('.')[1], 'txt')
                if not os.path.exists(txt_fn):
                    print('text file {} does not exists'.format(txt_fn))
                    continue

                # 读出对应label文档中的内容
                # text_polys：样本中文字坐标
                # text_tags：文字框内容是否可辨识
                text_polys, text_tags = load_annoataion(txt_fn)
                # 保存其中的有效标签框，并修正文本框坐标溢出边界现象
                text_polys, text_tags = check_and_validate_polys(text_polys, text_tags, (h, w))

                # 随机resize一下图片，并将text_polys中的坐标做等比例改变
                rd_scale = np.random.choice(random_scale)
                im = cv2.resize(im, dsize=None, fx=rd_scale, fy=rd_scale)
                text_polys *= rd_scale


                # random crop a area from image
                # crop_area函数：圈出图中的某一块文字或者空区域，并生成其polys，即文本框标签数据
                # 随机做一些无字符样本，也就是背景样本
                if np.random.rand() < background_ratio:
                    # crop background
                    im, text_polys, text_tags = crop_area(im, text_polys, text_tags, crop_background=True)
                    # 图片里没找到纯背景就切换下一幅图
                    if text_polys.shape[0] > 0:
                        # cannot find background
                        continue
                    # pad and resize image
                    # 对得到的背景图片进行扩充至size=input_size
                    # score标签全为0，因为是背景
                    # 同理，geo标签全为0
                    new_h, new_w, _ = im.shape
                    max_h_w_i = np.max([new_h, new_w, input_size])
                    im_padded = np.zeros((max_h_w_i, max_h_w_i, 3), dtype=np.uint8)
                    im_padded[:new_h, :new_w, :] = im.copy()
                    im = cv2.resize(im_padded, dsize=(input_size, input_size))
                    score_map = np.zeros((input_size, input_size), dtype=np.uint8)
                    geo_map_channels = 5 if FLAGS.geometry == 'RBOX' else 8
                    geo_map = np.zeros((input_size, input_size, geo_map_channels), dtype=np.float32)
                    training_mask = np.ones((input_size, input_size), dtype=np.uint8)
                # 另一部分作为正常样本
                else:
                    im, text_polys, text_tags = crop_area(im, text_polys, text_tags, crop_background=False)
                    # 如果图片中本身就没有文字则跳过该样本
                    if text_polys.shape[0] == 0:
                        continue
                    h, w, _ = im.shape

                    # 填充，resize图像至设定尺寸
                    new_h, new_w, _ = im.shape
                    max_h_w_i = np.max([new_h, new_w, input_size])
                    im_padded = np.zeros((max_h_w_i, max_h_w_i, 3), dtype=np.uint8)
                    im_padded[:new_h, :new_w, :] = im.copy()
                    im = im_padded
                    # resize the image to input size
                    new_h, new_w, _ = im.shape
                    resize_h = input_size
                    resize_w = input_size
                    im = cv2.resize(im, dsize=(resize_w, resize_h))
                    # 将文本框坐标标签等比例修改
                    resize_ratio_3_x = resize_w/float(new_w)
                    resize_ratio_3_y = resize_h/float(new_h)
                    text_polys[:, :, 0] *= resize_ratio_3_x
                    text_polys[:, :, 1] *= resize_ratio_3_y
                    new_h, new_w, _ = im.shape
                    # 结合文本框真值标签生成score图和geo图
                    score_map, geo_map, training_mask = generate_rbox((new_h, new_w), text_polys, text_tags)

                # 是否显示样本切割填充结果
                if vis:
                    fig, axs = plt.subplots(3, 2, figsize=(20, 30))

                    axs[0, 0].imshow(im[:, :, ::-1])
                    axs[0, 0].set_xticks([])
                    axs[0, 0].set_yticks([])
                    for poly in text_polys:
                        poly_h = min(abs(poly[3, 1] - poly[0, 1]), abs(poly[2, 1] - poly[1, 1]))
                        poly_w = min(abs(poly[1, 0] - poly[0, 0]), abs(poly[2, 0] - poly[3, 0]))
                        axs[0, 0].add_artist(Patches.Polygon(
                            poly, facecolor='none', edgecolor='green', linewidth=2, linestyle='-', fill=True))
                        axs[0, 0].text(poly[0, 0], poly[0, 1], '{:.0f}-{:.0f}'.format(poly_h, poly_w), color='purple')
                    axs[0, 1].imshow(score_map[::, ::])
                    axs[0, 1].set_xticks([])
                    axs[0, 1].set_yticks([])
                    axs[1, 0].imshow(geo_map[::, ::, 0])
                    axs[1, 0].set_xticks([])
                    axs[1, 0].set_yticks([])
                    axs[1, 1].imshow(geo_map[::, ::, 1])
                    axs[1, 1].set_xticks([])
                    axs[1, 1].set_yticks([])
                    axs[2, 0].imshow(geo_map[::, ::, 2])
                    axs[2, 0].set_xticks([])
                    axs[2, 0].set_yticks([])
                    axs[2, 1].imshow(training_mask[::, ::])
                    axs[2, 1].set_xticks([])
                    axs[2, 1].set_yticks([])
                    plt.tight_layout()
                    plt.show()
                    plt.close()

                # 将一个样本的样本内容和标签信息append
                images.append(im[:, :, ::-1].astype(np.float32))
                image_fns.append(im_fn)
                score_maps.append(score_map[::4, ::4, np.newaxis].astype(np.float32))
                geo_maps.append(geo_map[::4, ::4, :].astype(np.float32))
                training_masks.append(training_mask[::4, ::4, np.newaxis].astype(np.float32))

                # 处理并append足够多样本后发布一次
                if len(images) == batch_size:
                    yield images, image_fns, score_maps, geo_maps, training_masks
                    images = []
                    image_fns = []
                    score_maps = []
                    geo_maps = []
                    training_masks = []
            except Exception as e:
                import traceback
                traceback.print_exc()
                continue

在上述程序中有两个比较重要的函数，分别是crop_area函数和generate_rbox函数。

3.1 crop_area图片切割

前者主要是对样本图片进行切割，以一定的几率切出来一副图片中的某一完整的文字块，或者一块没有文字的部分，之后对其进行填充，重定义尺寸，以产生样本。代码如下

def crop_area(im, polys, tags, crop_background=False, max_tries=50):
    '''
    make random crop from the input image
    :param im:
    :param polys:[[[x1, y1], [x2, y2], [x3, y3], [x4, y4]] , ....]
    :param tags:
    :param crop_background:
    :param max_tries:
    :return:
    '''
    h, w, _ = im.shape
    pad_h = h//10
    pad_w = w//10
    h_array = np.zeros((h + pad_h*2), dtype=np.int32)
    w_array = np.zeros((w + pad_w*2), dtype=np.int32)
    for poly in polys:
        # [[x1, y1], [x2, y2], [x3, y3], [x4, y4]]
        # 取整
        poly = np.round(poly, decimals=0).astype(np.int32)
        # x，y坐标极值
        # 将文字框的最大外包矩形区域投影至x，y轴
        minx = np.min(poly[:, 0])
        maxx = np.max(poly[:, 0])
        w_array[minx+pad_w:maxx+pad_w] = 1
        miny = np.min(poly[:, 1])
        maxy = np.max(poly[:, 1])
        h_array[miny+pad_h:maxy+pad_h] = 1

    # 如果投影后，x，y轴全部为1，则不能直接找到完整取出某一块文字块，而不割裂其他文字块的部分
    # 就直接返回原图
    h_axis = np.where(h_array == 0)[0]
    w_axis = np.where(w_array == 0)[0]
    if len(h_axis) == 0 or len(w_axis) == 0:
        return im, polys, tags
    # 尝试max_tries次切分
    for i in range(max_tries):
        # 寻找x，y轴投影的两个0值之间的区域
        # 可能包含完整文字块，也可能包含某一块无文字背景
        xx = np.random.choice(w_axis, size=2)
        xmin = np.min(xx) - pad_w
        xmax = np.max(xx) - pad_w
        xmin = np.clip(xmin, 0, w-1)
        xmax = np.clip(xmax, 0, w-1)
        yy = np.random.choice(h_axis, size=2)
        ymin = np.min(yy) - pad_h
        ymax = np.max(yy) - pad_h
        ymin = np.clip(ymin, 0, h-1)
        ymax = np.clip(ymax, 0, h-1)
        # 寻找的区域过小则再次尝试
        if xmax - xmin < FLAGS.min_crop_side_ratio*w or ymax - ymin < FLAGS.min_crop_side_ratio*h:
            # area too small
            continue
        # 如果不是背景图片，则重置文本框真值标签为包含在截取部分内的部分标签
        if polys.shape[0] != 0:
            poly_axis_in_area = (polys[:, :, 0] >= xmin) & (polys[:, :, 0] <= xmax) \
                                & (polys[:, :, 1] >= ymin) & (polys[:, :, 1] <= ymax)
            selected_polys = np.where(np.sum(poly_axis_in_area, axis=1) == 4)[0]
        # 如果是背景图，则无文本框真值标签
        else:
            selected_polys = []

        # 如果没有选择到文本框真值标签
        if len(selected_polys) == 0:
            # no text in this area
            # 若是在找背景则直接返回截取区域，文本框真值标签置为空
            if crop_background:
                return im[ymin:ymax+1, xmin:xmax+1, :], polys[selected_polys], tags[selected_polys]
            # 若不是，则进行下一次尝试
            else:
                continue
        # 达到最大尝试次数仍为成功则返回最后一次的寻找结果
        im = im[ymin:ymax+1, xmin:xmax+1, :]
        polys = polys[selected_polys]
        tags = tags[selected_polys]
        polys[:, :, 0] -= xmin
        polys[:, :, 1] -= ymin
        return im, polys, tags

    return im, polys, tags

关于这种方法的大致效果如下图所示，黑色框是文字ABC的真值标签框，其在x，y轴的投影部分为1，x，y轴其他部分为0。在x，y轴上任选两处为0点，组成矩形：

1. 若为A,B,C,D四个点，则生成图中的红色框，可以将文字ABC整块的连带部分背景切割下来

2. 若为A,B,C',D'四个点，则生成图中的红色阴影部分，可以切割出一块没有任何文字的纯背景区域

真实应用如下所示：

原图：

切割后生成图：

可以看到把部分文字区域整块的挖了下来。

3.2 generate_rbox标签生成

下一个函数是generate_rbox函数，该函数主要是根据图像及文本框真值标签来生成score_map，geo_map，其原理是：

如下图，对于（a）的文字区域，我们先对其边框进行0.3倍的放缩，然后获得其二值图（b）。

在（c）图中，我们可以看到，对每一块文字框，我们先根据二值图获得能包含整段文字部分的平行四边形，即图（c）中的黄色虚线部分，再获得能完全包围该平行四边形的矩形框，即图（c）中的粉色矩形框。

之后对于框内的每一个像素，取其至矩形四边的距离得到[None，None，4]的geo_map标签，例如针对图中所示的某一像素，可以得到图（d）所示的[1，1，4]的四通道张量。

由矩形框的倾斜角度得到[None，None，1]的rotation_map标签。

而二值图像本身即[None，None，1]的score_map标签。

源代码如下：

def generate_rbox(im_size, polys, tags):
    h, w = im_size
    poly_mask = np.zeros((h, w), dtype=np.uint8)
    score_map = np.zeros((h, w), dtype=np.uint8)
    geo_map = np.zeros((h, w, 5), dtype=np.float32)
    # mask used during traning, to ignore some hard areas
    training_mask = np.ones((h, w), dtype=np.uint8)

    # 对每个文本框标签
    for poly_idx, poly_tag in enumerate(zip(polys, tags)):
        poly = poly_tag[0]
        tag = poly_tag[1]

        # 对每个顶点，找到经过他的两条边中较短的那条
        r = [None, None, None, None]
        for i in range(4):
            r[i] = min(np.linalg.norm(poly[i] - poly[(i + 1) % 4]),
                       np.linalg.norm(poly[i] - poly[(i - 1) % 4]))

        # score map
        # 放缩边框为之前的0.3倍，并对边框对应score图中的位置进行填充
        shrinked_poly = shrink_poly(poly.copy(), r).astype(np.int32)[np.newaxis, :, :]
        # score_map是框类像素均为1，poly_mask则按文字框个数递增填充
        cv2.fillPoly(score_map, shrinked_poly, 1)
        cv2.fillPoly(poly_mask, shrinked_poly, poly_idx + 1)

        # 如果文本框标签太小或者txt中没具体标记是什么内容，即*或者###，则加掩模，训练时忽略该部分
        poly_h = min(np.linalg.norm(poly[0] - poly[3]), np.linalg.norm(poly[1] - poly[2]))
        poly_w = min(np.linalg.norm(poly[0] - poly[1]), np.linalg.norm(poly[2] - poly[3]))
        if min(poly_h, poly_w) < FLAGS.min_text_size:
            cv2.fillPoly(training_mask, poly.astype(np.int32)[np.newaxis, :, :], 0)
        if tag:
            cv2.fillPoly(training_mask, poly.astype(np.int32)[np.newaxis, :, :], 0)

        # 当前新加入的文本框区域像素点
        xy_in_poly = np.argwhere(poly_mask == (poly_idx + 1))
        # if geometry == 'RBOX':
        # 对任意两个顶点的组合生成一个平行四边形 - generate a parallelogram for any combination of two vertices
        # 对于四个顶点，确定两个顶点组成的一条边，再结合剩下的两个点可以得到两个包含这四个点的平行四边形
        # 这里就是遍历两个顶点的组合，生成8个平行四边形
        fitted_parallelograms = []
        for i in range(4):
            # 选中p0和p1的连线边，生成两个平行四边形
            p0 = poly[i]
            p1 = poly[(i + 1) % 4]
            p2 = poly[(i + 2) % 4]
            p3 = poly[(i + 3) % 4]
            # 拟合ax+by+c=0
            edge = fit_line([p0[0], p1[0]], [p0[1], p1[1]])
            backward_edge = fit_line([p0[0], p3[0]], [p0[1], p3[1]])
            forward_edge = fit_line([p1[0], p2[0]], [p1[1], p2[1]])
            # 通过另外两个点距离edge的距离，来决定edge对应的平行线应该过p2还是p3
            if point_dist_to_line(p0, p1, p2) > point_dist_to_line(p0, p1, p3):
                # 平行线经过p2 - parallel lines through p2
                if edge[1] == 0:
                    edge_opposite = [1, 0, -p2[0]]
                else:
                    edge_opposite = [edge[0], -1, p2[1] - edge[0] * p2[0]]
            else:
                # 经过p3 - after p3
                if edge[1] == 0:
                    edge_opposite = [1, 0, -p3[0]]
                else:
                    edge_opposite = [edge[0], -1, p3[1] - edge[0] * p3[0]]

            # move forward edge
            # 第一个平行四边形保留p1和p2的连线
            new_p0 = p0
            new_p1 = p1
            new_p2 = p2
            new_p3 = p3
            new_p2 = line_cross_point(forward_edge, edge_opposite)
            if point_dist_to_line(p1, new_p2, p0) > point_dist_to_line(p1, new_p2, p3):
                # across p0
                if forward_edge[1] == 0:
                    forward_opposite = [1, 0, -p0[0]]
                else:
                    forward_opposite = [forward_edge[0], -1, p0[1] - forward_edge[0] * p0[0]]
            else:
                # across p3
                if forward_edge[1] == 0:
                    forward_opposite = [1, 0, -p3[0]]
                else:
                    forward_opposite = [forward_edge[0], -1, p3[1] - forward_edge[0] * p3[0]]
            new_p0 = line_cross_point(forward_opposite, edge)
            new_p3 = line_cross_point(forward_opposite, edge_opposite)
            fitted_parallelograms.append([new_p0, new_p1, new_p2, new_p3, new_p0])
            # or move backward edge
            # 第二个平行四边形保留p0和p3的连线
            new_p0 = p0
            new_p1 = p1
            new_p2 = p2
            new_p3 = p3
            new_p3 = line_cross_point(backward_edge, edge_opposite)
            if point_dist_to_line(p0, p3, p1) > point_dist_to_line(p0, p3, p2):
                # across p1
                if backward_edge[1] == 0:
                    backward_opposite = [1, 0, -p1[0]]
                else:
                    backward_opposite = [backward_edge[0], -1, p1[1] - backward_edge[0] * p1[0]]
            else:
                # across p2
                if backward_edge[1] == 0:
                    backward_opposite = [1, 0, -p2[0]]
                else:
                    backward_opposite = [backward_edge[0], -1, p2[1] - backward_edge[0] * p2[0]]
            new_p1 = line_cross_point(backward_opposite, edge)
            new_p2 = line_cross_point(backward_opposite, edge_opposite)
            fitted_parallelograms.append([new_p0, new_p1, new_p2, new_p3, new_p0])
        # 选定面积最小的平行四边形
        areas = [Polygon(t).area for t in fitted_parallelograms]
        parallelogram = np.array(fitted_parallelograms[np.argmin(areas)][:-1], dtype=np.float32)
        # sort thie polygon
        parallelogram_coord_sum = np.sum(parallelogram, axis=1)
        min_coord_idx = np.argmin(parallelogram_coord_sum)
        parallelogram = parallelogram[
            [min_coord_idx, (min_coord_idx + 1) % 4, (min_coord_idx + 2) % 4, (min_coord_idx + 3) % 4]]
        # 得到外包矩形即旋转角
        rectange = rectangle_from_parallelogram(parallelogram)
        rectange, rotate_angle = sort_rectangle(rectange)

        p0_rect, p1_rect, p2_rect, p3_rect = rectange
        # 对当前新加入的文本框区域像素点，根据其到矩形四边的距离修改geo_map
        for y, x in xy_in_poly:
            point = np.array([x, y], dtype=np.float32)
            # top
            geo_map[y, x, 0] = point_dist_to_line(p0_rect, p1_rect, point)
            # right
            geo_map[y, x, 1] = point_dist_to_line(p1_rect, p2_rect, point)
            # down
            geo_map[y, x, 2] = point_dist_to_line(p2_rect, p3_rect, point)
            # left
            geo_map[y, x, 3] = point_dist_to_line(p3_rect, p0_rect, point)
            # angle
            geo_map[y, x, 4] = rotate_angle
    return score_map, geo_map, training_mask

其实很好理解，每次固定两个点，也就是找到了平行四边形的一条边，然后根据另外两个点又可以确定两个边，分别取这两个边即可得到两个平行四边形，如下图中的黑色和红色平行四边形，就是在固定P0和P1两点后得到的两个平行四边形。

singlefligt使用方法和源码解读思无邪6675 后端
singlefligt使用方法和源码解读介绍sync.once保证其整个生命周期内只调用一次；而singleflight则可以保证在一定范围内其只调用一次。背景|使用场景应对缓存击穿：加锁可以解决这个问题，但是加锁不太灵活（不能控制访问频率之类的），singlefilght可以通过定时清除的方式限制频率去除重复请求：当一定时间范围内存在了大量的重复请求，可以考虑使用：一致性hash负载均衡+sin
15.springcloud_openfeign之FeignClientFactoryBean uncleqiao feign spring cloud 后端 feign
文章目录前言源码解读配置举例通过@EnableFeignClients#defaultConfiguration实现全局配置配置单个客户端组件总结前言在上一篇中我们介绍了springcloud_openfeign通过EnableFeignClients注解扫描并注册每个@FeignClient标识的接口对应的FeignClientFactoryBean到spring容器中,本节我们来了解一下这个类
llama3源码解读之推理-infer tangjunjun-owen 语言模型-多模态大模型 llama3 推理大语言模型 huggingface
文章目录前言一、整体源码解读1、完整main源码2、tokenizer加载3、llama3模型加载4、llama3测试数据文本加载5、llama3模型推理模块1、模型推理模块的数据处理2、模型推理模块的model.generate预测3、模型推理模块的预测结果处理6、多轮对话二、llama3推理数据处理1、完整数据处理源码2、使用prompt方式询问数据加载3、推理处理数据三、llama3推理ge
3DGS源码解读 - 高斯模型 __星辰大海__ 3DGS 人工智能
高斯模型三维高斯分布的概率密度函数定义为：f(x)=1(2π)3/2∣Σ∣1/2exp⁡(−12(x−μ)TΣ−1(x−μ))f(\mathbf{x})=\frac{1}{(2\pi)^{3/2}|\Sigma|^{1/2}}\exp\left(-\frac{1}{2}(\mathbf{x}-\mu)^T\Sigma^{-1}(\mathbf{x}-\mu)\right)f(x)=(2π)3/2∣
云原生时代 Kafka 深度实践：06原理剖析与源码解读忆雾屿 Kafka深度实践 kafka 云原生 java 后端
6.1消息存储机制日志分段（LogSegment）Kafka的消息日志以分段（Segment）形式存储，每个Segment包含一个数据文件（.log）和两个索引文件（.index和.timeindex）：数据文件：按时间顺序存储消息的二进制内容。偏移量索引文件：记录消息的Offset到物理位置的映射。时间戳索引文件：记录时间戳到Offset的映射。日志分段文件示例：0000000000000000
论文阅读：Deformable DETR: Deformable Transformers for End-to-End Object Detection fishfuck 论文阅读论文阅读目标检测人工智能
论文阅读：DeformableDETR:DeformableTransformersforEnd-to-EndObjectDetectionDeformableDETR:基于稀疏空间采样的注意力机制，让DCN与Transformer一起玩！-知乎(zhihu.com)【DeformableDETR论文+源码解读】DeformableTransformersforEnd-to-EndObjectDe
MyBatis 核心组件剖析：架构、协作与源码解读 shangjg3 Mybatis mybatis 架构 java
MyBatis作为一款经典的持久层框架，其设计精妙之处在于通过几个核心组件的协作，将SQL操作与Java对象优雅地结合起来。本文将深入剖析MyBatis的核心组件，包括它们的作用、相互关系以及底层实现原理。1.MyBatis核心组件概览MyBatis的核心组件主要包括以下几个部分：SqlSessionFactoryBuilder：负责从XML配置文件或Java代码中构建SqlSessionFact
Condition源码解读(二) 烙印601 并发编程 java 开发语言
本章我们继续将Condition的最后一个方法signal方法，如果前面没有看过的可以点击LockSupport与Condition解析来看看Condition解读的前半部分。signal方法：publicfinalvoidsignal(){if(!AbstractQueuedLongSynchronizer.this.isHeldExclusively()){thrownewIllegalMon
SpringBoot-SpringBoot源码解读世纪摆渡人 SpringBoot spring boot 后端 java
SpringBoot-SpringBoot源码解读一、SpringBoot启动过程概述SpringBoot通过一系列的类和机制，简化了Spring应用的启动流程。当你执行SpringApplication.run()时，SpringBoot会自动完成应用的初始化、环境配置、组件加载、自动配置等任务，最终启动嵌入式Web服务器或其他应用容器。1、SpringBoot的启动流程SpringBoot的启
天才程序员周弈帆 | Stable Diffusion 解读（四）：Diffusers实现源码解读双木的木 Diffusion Model专栏 stable diffusion 算法人工智能 python 神经网络 cnn .net
本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：StableDiffusion解读（四）：Diffusers实现源码解读接上一篇文章[天才程序员周弈帆|StableDiffusion解读（三）：原版实现源码解读(篇幅略长，建议收藏！)-CSDN博客]，我们来学习StableDiffusion在Diffusers中的实现。本文用到的StableDiffusion版本是
实验笔记之——Ubuntu20.04配置nvidia以及cuda并测试3DGS与SIBR_viewers gwpscut 3D Gaussian Splatting (3DGS)三维重建 3DGS
之前博文测试3DGS的时候一直用服务器进行开发，没有用过笔记本，本博文记录下用笔记本ubuntu20.04配置过程～学习笔记之——3DGaussianSplatting源码解读_3dgs运行代码-CSDN博客文章浏览阅读3.2k次，点赞34次，收藏62次。高斯模型的初始化，初始化过程中加载或定义了各种相关的属性使用的球谐阶数、最大球谐阶数、各种张量（_xyz等）、优化器和其他参数。self.act
TenantLineInnerInterceptor源码解读 changelzj MyBatis-Plus java
目录一、引言二、主要源码解读2.1beforeQuery/beforePrepare2.2processSelect2.3processInsert2.3.1最常见的新增SQL语句2.3.2批量新增数据的SQL语句2.3.3ONDUPLICATEKEYUPDATE的SQL2.3.4INSERTSELECT的SQL2.3.5SELECTINTO的结构2.4processUpdate2.5proces
【科研】YOLOv8中anchor_points可视化（更新中） KleinLan YOLO
目录写在前面anchor-point可视化YOLOv8官方源码解读predictor写在前面感叹一下：如果GPT能在我刚上大学的时候出来，也许我能学的比现在好太多，毕竟大学有一个比自己优秀太多的人引导着是多么地捷径。anchor-point可视化YOLOv8官方源码解读predictorultralytics/ultralytics/models/yolo/obb/predict.py中源码有一个
String 类及源码阅读、面试题详解努力的白小胖 java基础进阶 java 字符串 jvm
String源码解读在了解String类之前，先给大家总结一句话：“所有对String类进行过改变操作的方法，所返回的结果都是一个新的String对象，因为String字符串是不可变的！！！”由于包子是刚开始写文章，所以对于一些语言描述可能不是特别的通俗易懂，在以后小编会尽量学习使用通俗易懂的语言来为大家解释。对于上边的总结，我们通过下边的内容能够更容易理解。String类java.lang.St
深入剖析Android Volley缓存机制(18) Android 小码蜂 Volley详解 android kotlin flutter android-studio android studio
深入剖析AndroidVolley缓存机制：从源码解读数据读取与更新全流程一、引言在移动应用开发中，网络请求是不可或缺的一环。然而，频繁的网络请求不仅会消耗用户的流量，还会影响应用的响应速度和性能。为了解决这些问题，缓存机制应运而生。AndroidVolley作为一款强大的网络请求库，提供了灵活且高效的缓存策略，能够显著提升应用的性能和用户体验。本文将深入剖析AndroidVolley的缓存读取与
seata分布式事务源码解读 aking23 分布式 java spring
全局事务核心类：一、通用逻辑：0、io.seata.spring.annotation.GlobalTransactionScanner全局事务扫描类，初始化Bean时调用io.seata.spring.annotation.GlobalTransactionScanner#wrapIfNecessary方法创建全局事务拦截器，TCC模式（Bean方法有@TwoPhaseBusinessActio
SpringBoot自动装配原理进朱者赤 java #Spring 架构设计 spring boot 后端 SpringBoot自动装配自动装配原理自动装配 SpringBoot
目录一、引入二、基本流程三、源码解读3.1.启动类3.2.@SpringBootApplication注解：[email protected][email protected].@AutoConfigurationImportSelector类：3.3.2.1.AutoConfigurationPackages.Registrar3.3.
【基础篇】prometheus热更新解读闫利朋基于Prometheus公司硬软监控【项目实战】prometheus
文章目录本篇内容讲解热更新参数源码解读本篇总结本篇内容讲解prometheus热更新源码解读热更新参数–web.enable-lifecycle：代表开启热更新配置修改配置文件发http请求#curl-XPOST-vvvlocalhost:9090/-/reload*Abouttoconnect()tolocalhostport9090(#0)*Trying::1...*Connectedtolo
golang-ErrGroup用法以及源码解读笔记帕米尔的鸢 golang
介绍ErrGroup可以并发执行多个goroutine，并可以很方便的处理错误与sync.WaitGroup相比错误处理sync.WaitGroup只负责等待goroutine执行完成，而不处理返回值或者错误errgroup.Group目前虽然不能直接处理函数的返回值或错误。但是当goroutine返回错误的时候，可以取消正在运行的其他goroutine，在Wait方法中返回第一个非nil的错误上
Vue 3响应式核心：深入解析ref与reactive的区别与实现原理小钟H呀前端常见面试题 vue vue.js 前端
一、引言在Vue3的响应式系统中，ref和reactive是最核心的API。许多开发者在使用时容易混淆两者的区别，本文将通过用法对比、原理分析和源码解读，帮助开发者深入理解这两个API的设计思想。二、基础用法对比1.ref的使用import{ref}from'vue'//基本类型constcount=ref(0)console.log(count.value)//0//引用类型constobjRe
Spring选择代理 Emil S. 理解八股文（持续更新！！！）Spring源码笔记 spring java 后端开发语言 spring boot
Spring选择代理更美观清晰的版本在：Github本笔记基于黑马程序员Spring高级源码解读建议先了解JDK动态代理与CGLIB动态代理相关内容：从零开始的JDK动态代理从零开始的CGLIB动态代理0.前置知识：切面、通知、切点切面（aspect）由通知（advice）和切点（pointcut）组成的一个或多个顾问（advisor，有人将advisor也称为切面，用来指代更基本更底层的切面）共
3DGS源码解读 - duplicateWithKeys 和 RadixSort Ivan-CG 3DGS 人工智能
duplicateWithKeys和RadixSort我们先来看一下duplicateWithKeys和RadixSort的大致流程：图片来源于文献FlashGS:Efficient3DGaussianSplattingforLarge-scaleandHigh-resolutionRenderingduplicateWithKeys部分的关键代码如下：//如果radii[idx]0){//每个高
开源的仿红色警戒OpenRA经典RPG游戏, 源码解读world.cs openwin_top OpenRA游戏源码解读开源游戏 c#
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位代码注释与解读这段代码是OpenRA游戏引擎的核心World类的实现，它负责管理游戏世界的所有方面，包括角
SpringSecurity源码解读AbstractAuthenticationProcessingFilter 【非典型Coder】进阶架构师 Spring 源码 java 开发语言
一、介绍AbstractAuthenticationProcessingFilter是SpringSecurity框架里的一个抽象过滤器，它在处理基于表单的认证等认证流程时起着关键作用。它继承自GenericFilterBean，并实现了javax.servlet.Filter接口。此过滤器的主要功能是拦截客户端发送的认证请求，对请求中的认证信息（如用户名和密码）进行提取，然后将这些信息封装成Au
源码解读 | Java中ReentrantReadWriteLock的实现原理 javajuc并发编程源码
本文将介绍Java中ReentrantReadWriteLock的实现原理，从JDK源码层面讲解读写锁的加锁、释放锁的流程，最后对流程进行总结。读写锁概述读写锁ReentrantReadWriteLock的依赖关系如下图所示。读写锁的基本使用如下ReentrantReadWriteLocklock=newReentrantReadWriteLock();ReentrantReadWriteLock
源码解读 | Java中ReentrantLock的实现原理 java并发juc并发编程
ReentrantLock依赖关系如下图所示非公平锁实现原理ReentrantLock默认采用非公平锁。//ReentrantLockpublicReentrantLock(){sync=newNonfairSync();}加锁流程ReentrantLock的lock方法通过同步器的lock方法实现。//ReentrantLockpublicvoidlock(){sync.lock();}同步器的
深入剖析Redis分布式锁：Redlock算法源码解读与实战猿享天开 java 开发语言
《深入剖析Redis分布式锁：Redlock算法源码解读与实战》一、分布式锁的挑战与Redlock的诞生1.1单机Redis锁的局限性//单机Redis锁示例(SETNX+EXPIRE)Jedisjedis=newJedis("localhost",6379);StringlockKey="my_lock";StringlockValue=UUID.randomUUID().toString();
【Dify 前端源码解读系列】MDX 让 API 文档焕发生机程序员查理 web前端 AI javascript 前端架构 react.js
什么是MDX？MDX是一种强大的文档格式，它允许在Markdown内容中使用JSX。这意味着你可以在Markdown的简洁语法中嵌入交互式组件，使文档不再局限于静态内容。MDX完美地将Markdown的简单与JSX的灵活性结合在一起，特别适合需要丰富交互体验的文档场景。MDX的优势：组件化-在Markdown中使用现有组件，甚至将其他MDX文件作为组件导入可定制-可以为每个Markdown元素指定
【架构设计（一）】常见的Java架构模式架构学院 Java成神之路-架构师进阶 java 架构开发语言
常见的Java架构模式解析在Java开发领域，选择合适的架构模式对于构建高效、可维护且能满足业务需求的软件系统至关重要。本文将深入探讨几种常见的Java架构模式，包括单体架构与微服务架构、分层架构与微服务架构的对比，以及事件驱动架构与CQRS（命令与查询职责分离），通过源码解读、分析实现原理、探讨性能特点以及呈现应用场景等方面，帮助大家更好地理解和应用这些架构模式。无套路、关注即可领。持续更新中关
AI 大模型微调原理深度剖析与源码解读 Android 小码蜂 AI 大模型人工智能神经网络 transformer 架构机器学习
AI大模型微调原理深度剖析与源码解读本人掘金号，欢迎点击关注：掘金号地址本人公众号，欢迎点击关注：公众号地址一、引言在人工智能领域，大型语言模型（LLMs）如GPT-3、BERT等展现出了强大的语言理解和生成能力。然而，这些预训练的大模型往往是在大规模的通用数据上进行训练的，在特定的下游任务中可能无法达到最佳性能。为了让大模型更好地适应特定任务，微调（Fine-Tuning）技术应运而生。微调是指
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

EAST-tensorflow 源码解读

一、网络结构

二、loss定义

三、训练标签的生成

3.1 crop_area图片切割

3.2 generate_rbox标签生成

你可能感兴趣的:(EAST-tensorflow 源码解读)