watersink

EAST: An Efficient and Accurate Scene Text Detector

论文：An Efficient and Accurate Scene Text Detector

github:https://github.com/argman/EAST

旷世科技在CVPR2017的作品

优势：

提供了方向信息，可以检测各个方向的文本

缺点：

对较长的文本检测效果不好，感受野不够长

网络结构：

整体网络结构分为3个部分

(1) 特征提取层：

使用的基础网络结构是PVANet，分别从stage1，stage2，stage3，stage4抽出特征，一种FPN(feature pyramid network)的思想。

(2) 特征融合层：

第一步抽出的特征层从后向前做上采样，然后concat

(3) 输出层：

输出一个score map和4个回归的框+1个角度信息，或者输出，一个scoremap和8个坐标信息。

由于程序实现使用的基础网络不是pvanet网络，而是resnet50-v1。

在caffe版本的resnet50实现中，只有第一个卷积后面的pooling和最后一层的gloabl pooling，详细结构见reference，网络通过卷积层的stride=2操作实现类似pooling的效果

而本程序使用的slim中带的resnet50包含了5个pooling。

Resnet50结构，最后一个featuremap本质上将输入图像缩小16倍(4个pooling)，最后一个gloabl pooling，类似于vgg中的全连接。gloabl pooling是googlenet和Resnet的专利。

本文网络结构主要取了pool2，pool3，pool4，pool5，的featuremap引出，分别进行uppooling，concat，conv操作，得到最终的featuremap，然后进行卷积，分别输出channel=1的F_score

，channel=4的geo_map，channel=1的angle_map。

标签生成过程：

(a) 中黄色的为人工标注的框，绿色为对黄色框进行0.3倍边长的缩放后的框，这样做可以进一步去除人工标注的误差，拿到更准确的label信息。

(b) 为根据(a)中绿色框生成的label信息

损失函数：

总体loss:

分类loss:

分类loss的实现上没有采用论文中的class balanced cross-entrop loss，而是使用了dice_loss。

def dice_coefficient(y_true_cls, y_pred_cls,training_mask):
    '''
    dice loss
    :param y_true_cls:
    :param y_pred_cls:
    :param training_mask:
    :return:
    '''
    eps = 1e-5
    intersection = tf.reduce_sum(y_true_cls * y_pred_cls * training_mask)
    union = tf.reduce_sum(y_true_cls * training_mask) + tf.reduce_sum(y_pred_cls * training_mask) + eps
    loss = 1. - (2 * intersection / union)
    tf.summary.scalar('classification_dice_loss', loss)
    return loss

首先需要说明一下training_mask，

if min(poly_h, poly_w) < FLAGS.min_text_size:
    cv2.fillPoly(training_mask,poly.astype(np.int32)[np.newaxis, :, :], 0)

training_mask就是为了将长或宽小于某个阈值的框当做hard-example，这些样本太难训练，所以需要将这些样本去掉。所以，将包含这些样本的框里面置为黑色。正好和score_map的取值相反，从而去掉。

dice_loss 实现的就是交并比，由于loss需要不断减少，所以使用了1-操作。

看到这里是不是又可以想到什么，有没有感觉这个dice_loss 和F1_score值很像。

dice_loss =(2*y_true_cls * y_pred_cls)/(y_true_cls+ y_pred_cls)

F1_score=(2*precision*recall)/(precision+recall)

回归loss:

def loss(y_true_cls, y_pred_cls,
         y_true_geo, y_pred_geo,
         training_mask):
    '''
    define the loss used for training, contraning two part,
    the first part we use dice loss instead of weighted logloss,
    the second part is the iou loss defined in the paper
    :param y_true_cls: ground truth of text
    :param y_pred_cls: prediction os text
    :param y_true_geo: ground truth of geometry
    :param y_pred_geo: prediction of geometry
    :param training_mask: mask used in training, to ignore some text annotated by ###
    :return:
    '''
    classification_loss = dice_coefficient(y_true_cls, y_pred_cls, training_mask)
    # scale classification loss to match the iou loss part
    classification_loss *= 0.01

    # d1 -> top, d2->right, d3->bottom, d4->left
    d1_gt, d2_gt, d3_gt, d4_gt, theta_gt = tf.split(value=y_true_geo, num_or_size_splits=5, axis=3)
    d1_pred, d2_pred, d3_pred, d4_pred, theta_pred = tf.split(value=y_pred_geo, num_or_size_splits=5, axis=3)
    area_gt = (d1_gt + d3_gt) * (d2_gt + d4_gt)
    area_pred = (d1_pred + d3_pred) * (d2_pred + d4_pred)
    w_union = tf.minimum(d2_gt, d2_pred) + tf.minimum(d4_gt, d4_pred)
    h_union = tf.minimum(d1_gt, d1_pred) + tf.minimum(d3_gt, d3_pred)
    area_intersect = w_union * h_union
    area_union = area_gt + area_pred - area_intersect
    L_AABB = -tf.log((area_intersect + 1.0)/(area_union + 1.0))
    L_theta = 1 - tf.cos(theta_pred - theta_gt)
    tf.summary.scalar('geometry_AABB', tf.reduce_mean(L_AABB * y_true_cls * training_mask))
    tf.summary.scalar('geometry_theta', tf.reduce_mean(L_theta * y_true_cls * training_mask))
    L_g = L_AABB + 20 * L_theta

    return tf.reduce_mean(L_g * y_true_cls * training_mask) + classification_loss

回归有2个loss，分别回归边框的上下左右距离L_AABB，和边框与水平方向的夹角L_theta。

其中，

L_AABB=-log(area_intersect/area_union)，

L_theta = 1 - tf.cos(theta_pred - theta_gt)

其中，

d1_pred, d2_pred, d3_pred, d4_pred分别为距离上，右，下，左，边框的预测的距离。

d1 -> top, d2->right, d3->bottom, d4->left分别为距离上，右，下，左，边框的label的距离。

theta_pred为预测的角度。

theta_gt为label的角度。

Input_image(512*512),y_true_cls(128*128),y_pred_cls(128*128),y_true_geo(128*128),y_pred_geo(128*128),training_mask(128*128)这几个特征图的可视化如下：

training_mask的外圈黑线为为了显示的需要（白底上显示白框）加的，实际没有。

Locality-Aware NMS：

locality_aware_nms在标准nms的基础上加了weighted_merge，所谓weighted_merge就是将2个IOU高于某个threshold的输出框，进行基于得分的合并。合并后的输出框的坐标数值介于2个合并的输入框之间，感觉这样操作可以将所有回归出的框的坐标信息都利用起来，有助于减少位置误差，而不是像传统的nms一样，直接取分数最高的那个。

详细过程如下程序：

def weighted_merge(g, p):
    g[:8] = (g[8] * g[:8] + p[8] * p[:8])/(g[8] + p[8])
    g[8] = (g[8] + p[8])
    return g

看到这里，有木有感觉和凸函数的性质的那个不等式很像。

假设，2个点g和p，假设其分数分别为k1,k2，

上面程序表达是公式就是：

weighted_merge(g, p)=(k1*g+k2*p)/(k1+k2)

而凸函数的性质的公式是，(k1*f(x1)+k2*f(x2))/(k1+k2)>=f((k1*x1+k2*x2)/2)

举例如下：

其中g和p分别为2个输出框，假设都为1*9的大小，前8个为4个坐标的（x,y），最后一个为框的置信度分数。

g=[ 114.08222961 , 29.94154549 , 270.02160645 , 28.1983242 ,

270.58172607, 78.30197144 , 114.64233398 , 80.04519653 , 0.87047273]

P=[ 110.07213085 , 29.98007349 , 267.0800416 , 27.57254931 ,

267.85499947 , 78.08751085 , 110.84708252 , 80.49503197 , 7.11734003]

weighted_merge(g,p)=[110.50913178 , 29.9758749 , 267.40059893 , 27.64074319 , 268.15214478 , 78.11088172 , 111.26067044 , 80.4460111 , 7.98781276]

作者程序中提供了python和c++两种实现方式，其中，c++实现的locality_aware_nms相比python实现的速度快了近120倍。

求任意多边形面积：

def polygon_area(poly):
    '''
    compute area of a polygon
    :param poly:
    :return:
    '''
    edge = [
        (poly[1][0] - poly[0][0]) * (poly[1][1] + poly[0][1]),
        (poly[2][0] - poly[1][0]) * (poly[2][1] + poly[1][1]),
        (poly[3][0] - poly[2][0]) * (poly[3][1] + poly[2][1]),
        (poly[0][0] - poly[3][0]) * (poly[0][1] + poly[3][1])
    ]
    return np.sum(edge)/2.

具体思路如下，每算一次相当于计算一次梯形的面积。

ps，制作gif动图的程序，

#-*- coding: UTF-8 -*-  
 
import imageio
import os
 
def create_gif(image_list, gif_name):
 
    frames = []
    for image_name in image_list:
        frames.append(imageio.imread("./pic/"+image_name))
    # Save them as frames into a gif 
    imageio.mimsave(gif_name, frames, 'GIF', duration = 1.0)
 
    return
 
def main():
    image_list = os.listdir("./pic")
    gif_name = 'created_gif.gif'
    create_gif(image_list, gif_name)
 
if __name__ == "__main__":
    main()

训练事项:

程序实现中只实现了RBOX的方式，QUAD方式没有实现。

训练的话可以使用ICDAR2013，ICDAR2015，ICDAR2017。其中，2013,2015位英文，2017为中文。

ICDAR2013标注格式：xmin, ymin, xmax, ymax, text

其中，xmin, ymin为左上角坐标，xmax, ymax为右下角坐标

eg：38, 43, 920, 215, "Tiredness"

ICDAR2015标注格式：x1,y1,x2,y2,x3,y3,x4,y4,text

其中，x1,y1为左上角坐标,x2,y2为右上角坐标,x3,y3为右下角坐标,x4,y4为左下角坐标。‘###’表示text难以辨认。

eg：377,117,463,117,465,130,378,130,Genaxis Theatre

eg：374,155,409,155,409,170,374,170,###

ICDAR2018标注格式：x1,y1,x2,y2,x3,y3,x4,y4,difficult,text

x1,y1为左上角坐标,x2,y2为右上角坐标,x3,y3为右下角坐标,x4,y4为左下角坐标。difficult为1表示text难以辨认，0表示容易辨认。

eg：390,902,1856,902,1856,1225,390,1225,0,"金氏眼镜"

其中ICDAR2013的label只有左上和右下的坐标，需要自己做label，改为本文的label接口。

ICDAR2015，ICDAR2017可以直接使用，但是ICDAR2017中好多label的标注不是按照顺时针方向标的坐标，但是程序需要严格要求label坐标必须为顺时针方向。当然作者的程序中也会自动进行纠正。

针对EAST边界不准的一些改进尝试：

改进思想1：

直接取程序预测出的框的4个顶点坐标，然后以边框长边的60%长度为边长，做4个矩形，分别重新预测4个顶点的坐标。源于advanced EAST的改进思想，但是和而不同。

效果：no work

原因：如果第一次作者预测的框就不准确，那么这一次的矫正也会因为第一次的不准确而不准确。

#original
boxes, timer = detect(score_map=score, geo_map=geometry, timer=timer)
height_score,width_score=score.shape[1:3]
height_score-=1
width_score-=1
coor_mask=np.zeros_like(score)
for box in boxes:
    x1,y1,x2,y2,x3,y3,x4,y4=np.asarray(box[:8],np.int32)//4
    radius=max(int(min(x2-x1,x3-x4,y3-y2,y4-y1)*2.0),2)
    coor_mask[:,max(0,y1-radius):min(height_score,y1+radius),max(0,x1-radius):min(width_score,x1+radius),:]=1
    coor_mask[:,max(0,y2-radius):min(height_score,y2+radius),max(0,x2-radius):min(width_score,x2+radius),:]=1
    coor_mask[:,max(0,y3-radius):min(height_score,y3+radius),max(0,x3-radius):min(width_score,x3+radius),:]=1
    coor_mask[:,max(0,y4-radius):min(height_score,y4+radius),max(0,x4-radius):min(width_score,x4+radius),:]=1
    print(ratio_w,ratio_h)

#4_coor
boxes, timer = detect(score_map=score*coor_mask, geo_map=geometry, timer=timer,score_map_thresh=0.8,box_thresh=0.01)

改进思想2：

对score_map进行区域联通，找外接矩形。pixelLink的思想。

效果：no work

原因：本质原因还是score_map就不准确，所以得到的框也不准确。

def dilate_image(img, kernel_size=(3, 3), iter_size=5):
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, kernel_size)
    img_erode = cv2.dilate(img, kernel, iter_size)
    return img_erode

def findContours_func(input_image):
    gray=np.asarray(input_image*255,np.uint8)
    ret, imgbw = cv2.threshold(gray, 240, 255, cv2.THRESH_BINARY)
    img_dilate = dilate_image(np.asarray(imgbw))
    img, contours, hierarchy = cv2.findContours(
        img_dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    boxes_array=np.zeros([len(contours),9])
    for i,cnt in enumerate(contours):
        x, y, w, h = cv2.boundingRect(cnt)
        boxes_array[i,:8]=(4*x,4*y,4*(x+w),4*y,4*(x+w),4*(y+h),4*x,4*(y+h))

    return boxes_array

boxes=findContours_func(score.reshape(score.shape[1],score.shape[2]))

改进思想3：

网络最后层加lstm，将score_map提亮，抹均匀。CTPN的思想。

效果： work

def horizontal_vertical_lstm_together(input_data, rnn_size, scope_n="layer1"):
    with tf.variable_scope("MultiDimensionalLSTMCell-horizontal-" + scope_n):
        # input is (b, h, w, c)
        #horizontal
        _, _, _, c_h = input_data.get_shape().as_list()
        shape_h=tf.shape(input_data)
        b_h, h_h, w_h= shape_h[0],shape_h[1],shape_h[2]
        # transpose = swap h and w.
        new_input_data_h = tf.reshape(input_data, (b_h*h_h, w_h, c_h))  # horizontal.
        # Forward
        lstm_fw_cell = tf.contrib.rnn.LSTMCell(rnn_size//4)
        lstm_fw_cell = tf.contrib.rnn.DropoutWrapper(lstm_fw_cell, output_keep_prob=0.5)
        # Backward
        lstm_bw_cell = tf.contrib.rnn.LSTMCell(rnn_size//4)
        lstm_bw_cell = tf.contrib.rnn.DropoutWrapper(lstm_bw_cell, output_keep_prob=0.5)


        rnn_out_h, _ = tf.nn.bidirectional_dynamic_rnn(
                lstm_fw_cell, 
                lstm_bw_cell, 
                inputs=new_input_data_h,
                dtype=tf.float32, 
                time_major=False)
        rnn_out_h=tf.concat(rnn_out_h, 2)
        rnn_out_h = tf.reshape(rnn_out_h, (-1, h_h, w_h, rnn_size//2))
        #vertical
    with tf.variable_scope("MultiDimensionalLSTMCell-vertical-" + scope_n):
        new_input_data_v=tf.transpose(input_data,(0,2,1,3))
        _, _, _, c_v = new_input_data_v.get_shape().as_list()
        shape_v=tf.shape(new_input_data_v)
        b_v, h_v, w_v = shape_v[0],shape_v[1],shape_v[2]
        new_input_data_v = tf.reshape(new_input_data_v, (b_v*h_v, w_v, c_v))
        # Forward
        lstm_fw_cell = tf.contrib.rnn.LSTMCell(rnn_size//4)
        lstm_fw_cell = tf.contrib.rnn.DropoutWrapper(lstm_fw_cell, output_keep_prob=0.5)
        # Backward
        lstm_bw_cell = tf.contrib.rnn.LSTMCell(rnn_size//4)
        lstm_bw_cell = tf.contrib.rnn.DropoutWrapper(lstm_bw_cell, output_keep_prob=0.5)


        rnn_out_v, _ = tf.nn.bidirectional_dynamic_rnn(
                lstm_fw_cell, 
                lstm_bw_cell, 
                inputs=new_input_data_v,
                dtype=tf.float32, 
                time_major=False)
        rnn_out_v=tf.concat(rnn_out_v, 2)
        
        rnn_out_v = tf.reshape(rnn_out_v, (-1, h_v, w_v, rnn_size//2))
        rnn_out_v=tf.transpose(rnn_out_v,(0,2,1,3))
        rnn_out=tf.concat([rnn_out_h,rnn_out_v],axis=3)
        #rnn_out=tf.add(rnn_out_h,rnn_out_v)
        return rnn_out

g[3]=horizontal_vertical_lstm_together(g[3], 128, scope_n="layer1")

改进思想4：

将分类的dice_loss修改为cross_entrop，并基于UNet的思想，加入点距离边框的距离进行学习，使得中心的loss相对降低，边缘的loss相对提高。实现上没有进行除distance的操作，因为这样做会使得loss爆炸，而是使用乘（1-distance）的操作。

效果： work

def distance_balanced_sigmoid_crossentrop(y_true_cls, y_pred_cls,y_true_geo,
                     training_mask):
    eps = 1e-5
    labels=y_true_cls*training_mask
    logits=tf.nn.sigmoid(y_pred_cls*training_mask)
    min_distance=tf.abs(tf.minimum(tf.minimum(y_true_geo[:,:,:,0],y_true_geo[:,:,:,1]),tf.minimum(y_true_geo[:,:,:,2],y_true_geo[:,:,:,3])))
    min_distance=tf.expand_dims(min_distance,3)
    beta = 1 - tf.reduce_mean(labels)
    loss = -1*tf.reduce_mean(tf.div(beta * labels * tf.log(logits + eps),min_distance) +(1 - beta) * (1 - labels) * tf.log(1 - logits + eps))
    tf.summary.scalar('classification_distance_balanced_sigmoid_crossentrop_loss', loss)
return loss

改进思想5：

采用LovaszSoftmax，细节可以看论文，The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks

效果： work

改进思想6：

尝试opencv的接口，做cpu端的加速，需要将原始ckpt模型转化为pb模型，然后调用opencv接口做预测。具体需要改动和实现的细节可以参考，https://github.com/watersink/opencv-east

效果： work，opencv的结果和TensorFlow的结果又细微差别

改进思想7：

EAST对于长边的左右两端预测不准，经常会切去1,2个字，对此进行下面的改进。

首先需要说明，east在制作polygon时采用了shrink_poly的策略，这样来缓解标注的误差。

其中ri表示第i条边的长度，i=0,1,2,3，一共四条边。这里的计算直接求相邻2点之间的L2距离，然后取其中较小的一个。

实际边长r的计算如下，

r = [None, None, None, None]
for i in range(4):
    r[i] = min(np.linalg.norm(poly[i] - poly[(i + 1) % 4]),np.linalg.norm(poly[i] - poly[(i - 1) % 4]))

np.linalg.norm该函数默认表示求L2 norm。

这里的改进思想就是，对于短边可以取0.3倍的距离的shrink，而对于长边，shrink的太多，假如还是0.3的话，会导致训练完后，预测出现边界不准的情况。因此这里对于长边只shrink0.1。

修改后程序如下icdar.py，

def shrink_poly(poly, r):
    if np.linalg.norm(poly[0] - poly[1]) + np.linalg.norm(poly[2] - poly[3]) > \
                    np.linalg.norm(poly[0] - poly[3]) + np.linalg.norm(poly[1] - poly[2]):
        # first move (p0, p1), (p2, p3), then (p0, p3), (p1, p2)
        ## p0, p1
        R = 0.1
        theta = np.arctan2((poly[1][1] - poly[0][1]), (poly[1][0] - poly[0][0]))
        poly[0][0] += R * r[0] * np.cos(theta)
        poly[0][1] += R * r[0] * np.sin(theta)
        poly[1][0] -= R * r[1] * np.cos(theta)
        poly[1][1] -= R * r[1] * np.sin(theta)
        ## p2, p3
        theta = np.arctan2((poly[2][1] - poly[3][1]), (poly[2][0] - poly[3][0]))
        poly[3][0] += R * r[3] * np.cos(theta)
        poly[3][1] += R * r[3] * np.sin(theta)
        poly[2][0] -= R * r[2] * np.cos(theta)
        poly[2][1] -= R * r[2] * np.sin(theta)
        ## p0, p3
        R = 0.3
        theta = np.arctan2((poly[3][0] - poly[0][0]), (poly[3][1] - poly[0][1]))
        poly[0][0] += R * r[0] * np.sin(theta)
        poly[0][1] += R * r[0] * np.cos(theta)
        poly[3][0] -= R * r[3] * np.sin(theta)
        poly[3][1] -= R * r[3] * np.cos(theta)
        ## p1, p2
        theta = np.arctan2((poly[2][0] - poly[1][0]), (poly[2][1] - poly[1][1]))
        poly[1][0] += R * r[1] * np.sin(theta)
        poly[1][1] += R * r[1] * np.cos(theta)
        poly[2][0] -= R * r[2] * np.sin(theta)
        poly[2][1] -= R * r[2] * np.cos(theta)
    else:
        ## p0, p3
        # print poly
        R = 0.1
        theta = np.arctan2((poly[3][0] - poly[0][0]), (poly[3][1] - poly[0][1]))
        poly[0][0] += R * r[0] * np.sin(theta)
        poly[0][1] += R * r[0] * np.cos(theta)
        poly[3][0] -= R * r[3] * np.sin(theta)
        poly[3][1] -= R * r[3] * np.cos(theta)
        ## p1, p2
        theta = np.arctan2((poly[2][0] - poly[1][0]), (poly[2][1] - poly[1][1]))
        poly[1][0] += R * r[1] * np.sin(theta)
        poly[1][1] += R * r[1] * np.cos(theta)
        poly[2][0] -= R * r[2] * np.sin(theta)
        poly[2][1] -= R * r[2] * np.cos(theta)
        ## p0, p1
        R = 0.3
        theta = np.arctan2((poly[1][1] - poly[0][1]), (poly[1][0] - poly[0][0]))
        poly[0][0] += R * r[0] * np.cos(theta)
        poly[0][1] += R * r[0] * np.sin(theta)
        poly[1][0] -= R * r[1] * np.cos(theta)
        poly[1][1] -= R * r[1] * np.sin(theta)
        ## p2, p3
        theta = np.arctan2((poly[2][1] - poly[3][1]), (poly[2][0] - poly[3][0]))
        poly[3][0] += R * r[3] * np.cos(theta)
        poly[3][1] += R * r[3] * np.sin(theta)
        poly[2][0] -= R * r[2] * np.cos(theta)
        poly[2][1] -= R * r[2] * np.sin(theta)
    return poly

效果： work，对于边界的预测有改善

改进思想8：

训练的时候，加入旋转的数据增强操作。

def rotate_image_polys(im,text_polys,vis=False):
    #im:[height,width,channels]
    #text_polys:[[[x1,y1][x2,y2][x3,y3][x4,y4]],[[x1,y1][x2,y2][x3,y3][x4,y4]]]

    import math
    import random
    if vis:
        newimg = cv2.polylines(im.copy(), text_polys, 1, (255, 0, 0), 1)
        cv2.imwrite("before.jpg",newimg)

    rotate_angle=random.randint(-5,5)
    center_x=0
    center_y=0
    for n_tp in range(text_polys.shape[0]):
        for nn in range(4):
            text_polys[n_tp][nn][0]=abs((text_polys[n_tp][nn][0]-center_x)*math.cos(-rotate_angle*math.pi/180)-(text_polys[n_tp][nn][1]-center_y)*math.sin(-rotate_angle*math.pi/180)+center_x)
            text_polys[n_tp][nn][1]=abs((text_polys[n_tp][nn][0]-center_x)*math.sin(-rotate_angle*math.pi/180)-(text_polys[n_tp][nn][1]-center_y)*math.cos(-rotate_angle*math.pi/180)+center_y)


    text_polys = np.array(text_polys).astype(np.float64)
    text_polys = np.clip(text_polys, [0, 0], im.shape[:2][::-1])


    matrix = cv2.getRotationMatrix2D((int(im.shape[1]/ 2),int(im.shape[0] / 2)), rotate_angle, 1)
    im=cv2.warpAffine(im,matrix,(im.shape[1], im.shape[0]))


    if vis:
        newimg = cv2.polylines(im.copy(), text_polys, 1, (255, 0, 0), 1)
        cv2.imwrite("after.jpg",newimg)
    return im, text_polys

然后，在icdar.py的generator函数中调用。

                rd_scale = np.random.choice(random_scale)
                im = cv2.resize(im, dsize=None, fx=rd_scale, fy=rd_scale)
                im=np.expand_dims(im,2)
                text_polys *= rd_scale

                ##my rotate
                ##im,text_polys=rotate_image_polys(im,text_polys)
                ##my rotate


                # print rd_scale
                # random crop a area from image
                if np.random.rand() < background_ratio:
                    # crop background
                    im, text_polys, text_tags = crop_area(im, text_polys, text_tags, crop_background=True)
                    if text_polys.shape[0] > 0:
                        # cannot find background
                        continue

在测试的时候，多角度测试的集成学习方法，任意角度的旋转，可以参考，

def rotate_image(image, angle,keep_pixels=True):
    #image:rgb
    #angle:reverse close
    #keep_pixels:delete pixels or not
    (h, w) = image.shape[:2]
    (cX, cY) = (w // 2, h // 2)
 
    # grab the rotation matrix (applying the negative of the
    # angle to rotate clockwise), then grab the sine and cosine
    # (i.e., the rotation components of the matrix)
    M = cv2.getRotationMatrix2D((cX, cY), angle, 1.0)

    cos = np.abs(M[0, 0])
    sin = np.abs(M[0, 1])
    

    # compute the new bounding dimensions of the image
    nW = int((h * sin) + (w * cos))
    nH = int((h * cos) + (w * sin))
 
    if keep_pixels:
        # adjust the rotation matrix to take into account translation
        M[0, 2] += ((nW / 2) - cX)
        M[1, 2] += ((nH / 2) - cY)
 
        # perform the actual rotation and return the image
        return 255-cv2.warpAffine(255-image, M, (nW, nH))
    else:
        return 255-cv2.warpAffine(255-image, M, (w, h))

效果： work，

References：

https://github.com/KaimingHe/deep-residual-networks/tree/master/prototxt

https://github.com/huoyijie/AdvancedEAST

你可能感兴趣的:(OCR,OCR大趴踢)

ClaudeAPi接入 heikeb chatgpt java 人工智能
一，实现目标接入钉钉机器人支持群聊和私聊chatgpt体验：http://me.chat129.comchatgpt学习：http://www.chat129.com网上看了很多方案，因为Claude的api申请难度非常大，大部分都是说使用Slack，但是Slack只能免费使用一个月。作为一个完美主义怎么可能允许这样的事情发生。何如处理，抓网页。只能美，英，魔法这些都是入门小菜，这里不再赘述。自行
【信息学奥赛一本通】2040：筛选法找质数 repas-originse C++筛法质数算法 C++程序设计
【题目描述】用筛法求出n(2≤n≤1000)n(2≤n≤1000)以内的全部质数。【输入】输入nn。【输出】多行，由小到大的质数。【输入样例】10【输出样例】2357【代码】#includeusingnamespacestd;intmain
信息学奥赛一本通（2040：【例5.7】筛选法找质数）橙子教师信奥一本通（数组）
2040：【例5.7】筛选法找质数时间限制:1000ms内存限制:65536KB提交数:490通过数:335【题目描述】用筛法求出n(2≤n≤1000)n(2≤n≤1000)以内的全部质数。【输入】输入nn。【输出】多行，由小到大的质数。【输入样例】10【输出样例】2357【参考代码】#include#defineN1010inttable[N]={1,1};voidisprime(){inti,
HTML星球大冒险之路线图我自纵横2023 HTML教程 html 前端
第一章：欢迎来到HTML星球！1.1宇宙的基石：HTML是什么？比喻：HTML是网页世界的「乐高积木」，用标签搭建一切可见内容目标：理解HTML的作用，掌握第一个声明1.2认识HTML文档的「骨骼结构」趣味比喻：HTML文档像汉堡包是包装盒（根标签）是配料表（元信息）是汉堡本体（可见内容）示例：打印「Hello,HTML星球！」第二章：标签大狂欢：从基础到变形2.1文本标签的魔法咒语✨幽默教学：：
聊天模型集成指南三月七꧁ ꧂ langchain+llm microsoft 语言模型 prompt 人工智能自然语言处理开发语言 llama
文章目录聊天模型集成指南Anthropic聊天模型集成PaLM2聊天模型集成OpenAl聊天模型集成聊天模型集成指南随着GPT-4等大语言模型的突破，聊天机器人已经不仅仅是简单的问答工具，它们现在广泛应用于客服、企业咨询、电子商务等多种场景，为用户提供准确、快速的反馈。在这样的背景下，开发者们急需一套可以轻松切换、集成不同平台的工具。正是基于这样的需求，Anthropic、PaLM2和Op
React 和 Vue _使用区别开心小老虎 react知识点+组件 vue3知识点+组件前端知识点 vue.js react.js 前端
目录一、框架介绍1.Vue2.React二、框架结构1.创建应用2.框架结构三、使用区别1.单页面组成2.样式3.显示响应式数据4.响应式html标签属性5.控制元素显隐6.条件渲染7.渲染列表react和vue是目前前端比较流行的两大框架，前端程序员应该将两种框架都掌握，本文总结一些基本知识点的使用区别。一、框架介绍1.VueVue是一个框架，也是一个生态。其功能覆盖了大部分前端开发常见的需求。
北京工业大学计算机考研难度,北京工业大学考研好考吗？性价比怎么样？徐小疼北京工业大学计算机考研难度
学校介绍北京工业大学(北工大，BeijingUniversityofTechnology)，坐落于北京市，是一所以工为主，工、理、经、管、文、法、艺术、教育相结合的多科性市属重点大学，也是国家“211工程”建设高校、世界一流学科建设高校。目前学校拥有国家重点一级学科光学工程，国家重点二级学科材料学和结构工程，学校有7个学科跻身2019年QS世界大学排行榜前500，在QS发布的2019年中国大陆大学
【零基础JavaScript入门 | Day1】从“消费记账“案例学编程基础 ⭐表格制作+数据类型转换全解析 helbyYoung JavaScrip学习 javascript 学习
【零基础JavaScript入门|Day1】从"消费记账"案例学编程基础⭐表格制作+数据类型转换全解析今日学习重点：✅数据与现实的映射关系→网页表格如何承载生活数据✅变量容器的本质→用let管理三大消费支出✅隐式类型转换技巧→+prompt()输入处理的妙用✅模板字符串实战→动态生成消费报表案例亮点：1️⃣用户交互三部曲：通过prompt()实现饮食/交通/娱乐费用的分步输入2️⃣自动统计系统：t
主流架构模式全景解析：微服务 vs SOA vs 单体架构的终极抉择指南 Eqwaak00 分布式系统设计实战科技微服务架构
一、架构演进史：从巨石到微粒的进化之路（图示：1970s单体→2000sSOA→2010s微服务→2020s云原生）二、三大架构模式深度拆解2.1单体架构（MonolithicArchitecture）核心特征graphTDA[单体应用]-->B[用户界面]A-->C[业务逻辑]A-->D[数据访问]B-->E[Web/移动端]C-->F[订单处理]C-->G[支付处理]D-->H[MySQL]D
网络安全还值得学习吗？黑客呀计算机网络安全网络工程师 web安全学习安全
在信息化时代，网络安全行业备受关注，可谓是万人瞩目。而且网络安全也被贴上了前景好、需求大、潜力广、就业好、薪资高等标签，那么网络安全真的值得学习吗?我们一起来看看吧。答案是肯定的，网络安全是非常值得学习的技术。市场需求：随着互联网的普及和数字化转型的加速，网络安全问题日益凸显。企业、政府和个人对网络安全的需求不断增长，这导致了网络安全专业人才的稀缺。因此，从市场需求的角度来看，网络安全专业具有较大
第五章：HTML5 大升级：解锁未来技能我自纵横2023 HTML教程 html5 前端 html
第五章：HTML5大升级：解锁未来技能5.1语义化标签的「身份认证」一、语义化概念理解在HTML的旧时代，我们就像一群建筑工人，只能用一些通用的和标签来搭建网页，就好比用千篇一律的砖块盖房子，虽然能把房子盖起来，但很难从外观上看出房子的各个部分是做什么用的。而HTML5引入的语义化标签，就像是给每一块砖块都赋予了特殊的形状和用途，让网页的结构变得一目了然，就像给每个房间都贴上了清晰的标签，告诉搜索
算力网络技术创新驱动生态协同发展智能计算研究中心其他
内容概要算力网络作为数字经济发展的核心基础设施，正经历从单一性能提升向体系化技术协同的范式转变。当前技术创新主要聚焦三大维度：在架构层面，通过异构计算、量子计算与神经形态计算的融合，突破传统芯片制程限制；在调度层面，依托分布式计算与流批处理技术，实现跨边缘节点、工业互联网平台与超算中心的资源动态编排；在生态层面，围绕能效管理、安全标准与算法优化构建全链条能力，支撑金融风险评估、基因测序等高复杂度场
H100解锁生成式AI算力新纪元智能计算研究中心其他
内容概要英伟达H100GPU以Hopper架构为核心，重新定义了生成式AI的算力边界。其创新性设计聚焦三大技术支柱：第三代TensorCore通过稀疏计算与混合精度支持，显著提升矩阵运算效率；显存带宽优化技术结合HBM3高带宽内存，将数据吞吐量提升至3.35TB/s，有效缓解大规模模型训练中的显存墙问题；动态编程加速器则针对AI工作负载特征实现指令级优化。这些突破使H100在生成式AI训练中实现高
基于PySide6与PyCatia的CATIA几何体智能重命名工具开发实践 Python×CATIA工业智造 python 开发语言 CATIA二次开发
一、工具概述本工具基于CATIAV5/V6的二次开发接口，结合PySide6图形界面框架与PyCatia自动化库，实现了三大核心功能模块：几何体前缀批量添加、后缀动态追加、智能文本替换。该工具显著提升了工程师在大型零件体设计中的几何体命名管理效率，解决了传统手动操作易出错、耗时长的问题。二、技术架构解析1.分层架构设计classStats(QMainWindow):def__init__(self
1章5节：大模型术语解读与从生成到推理的演进 DAT｜R科学与人工智能人工智能
在人工智能的浩瀚宇宙中，大模型正以前所未有的速度演进，推动着科技变革的新浪潮。从多模态到通用模型，再到行业模型，人工智能的边界不断拓展，为各行各业带来了全新的机遇与挑战。本篇文章将深入剖析大模型相关的核心术语，探讨其内涵、应用及发展趋势，并回顾大模型从生成到推理的演进历程，解析全球科技巨头与国内前沿企业在这一领域的竞争与创新。让我们一同探索大模型的演进脉络，把握智能时代的发展脉搏。一、剖析大模型相
密码学：网络安全的基石与未来安全
在数字化时代，网络安全已成为全球关注的焦点。无论是个人隐私的保护，还是国家关键基础设施的安全，都离不开密码学这一核心技术。密码学不仅是信息安全的基石，更是现代社会中数据保密性、完整性和可用性的守护者。本文将从密码学的基本原理出发，结合最新技术发展，探讨其在网络安全中的核心作用。一、密码学的基本原理密码学的核心目标是通过数学方法保护信息的机密性、完整性和真实性。它主要分为两大领域：对称加密和非对称加
OA协同办公软件为守护企业数据安全出的这套方案 oa协同软件即时通讯数据安全
在信息化时代，安全性是每个企业都绕不开的话题。企业酷信通过多重安全防护，让你在处理日常业务时无需为信息安全担忧。这里没有复杂的技术术语，只有实实在在的保护。登录安全：给每次登录加把“锁”企业酷信不仅提供传统的用户名和密码保护，还结合多因子认证和图形校验码，给每一次登录都加了几把“锁”。更重要的是，采用了先进的RSA和MD5算法加密，确保即使密码泄露，数据依然安全。业务安全：小细节，大保障日常的业务
外包项目的三大来源渠道及注意事项后端
外包项目的三大来源渠道及注意事项在上一篇文章中，我们介绍了什么是外包以及外包的基本模式。今天，让我们深入探讨外包项目的主要来源渠道及其特点。一、朋友渠道特点：关系基础公司小伙伴推荐熟人介绍客户邀请合作优势：信任度高沟通成本低合作较为顺畅风险提示：避免因私人关系影响专业判断需要明确划分公私界限保持适当的业务距离二、家人渠道特点：亲朋帮忙情感因素强责任感较重注意事项：优势信任度最高沟通零障碍合作意愿强
五大股票金融数据API接口推荐：从实时行情到历史数据全覆盖 CryptoRzz 金融
摘要：本文将介绍五大主流的股票金融数据API接口，涵盖实时行情、历史数据、技术指标等功能，帮助开发者快速构建金融数据应用。（本文由deepseek生成）一、StockTVAPI1.核心优势全球覆盖：支持印度、美国、日本、韩国等10+国家的股票市场实时性强：提供WebSocket实时数据推送数据全面：包含股票、指数、期货、外汇、加密货币易于集成：提供多种语言的SDK和详细文档2.主要功能实时行情：支
【MYSQL学习】MySQL索引：删除索引的5大绝招你GET到了吗？墨瑾轩 MySql入门~精通 mysql 学习数据库
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣MySQL索引：删除索引的5大绝招你GET到了吗？引言❓在数据库操作中，索引是一个非常重要的概念。合理的索引设计可以显著提高查询性能，而不合理的索引则可能导致性能下降。但你知道如何有效地删除索引吗？今天，我们就来一场深入浅出的探索之旅，带你了解删除索引的5大绝
【超全总结】JMeter vs K6 vs Locust，性能测试工具终极对比！软件测试 jmeter 测试工具
引言在现代软件开发中，性能测试是保障系统稳定性和高并发能力的关键环节。然而，面对市面上众多的性能测试工具，我们该如何选择？今天，我们将对JMeter、K6、Locust进行全面对比，帮你找到最适合你的工具！1.工具概览工具语言适用场景优点缺点JMeterJava传统性能测试、WebAPI测试功能强大、插件丰富、支持GUI学习曲线陡峭，资源消耗大K6JavaScript现代DevOps、CI/CD集
AI 大模型应用数据中心的数据分析架构 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《AI大模型应用数据中心的数据分析架构》关键词：数据中心、AI大模型、数据分析、架构设计、应用实践摘要：本文深入探讨了AI大模型在数据中心数据分析架构中的应用，从数据中心背景、AI大模型架构与技术、数据处理与分析技术、AI大模型应用与实践等多个方面，全面解析了AI大模型如何助力数据中心实现高效数据分析和智能处理，为读者提供了系统的理论指导和实际案例分析。第一部分:数据中心背景与AI大模型概述第1章
入门到入土，Java学习 day17(Lambda表达式，集合进阶) 慕容魏 java 学习 python
publicstaticStringtoString(数组)把数组拼接成一个字符串publicstaticintbinarySearch(数组，查找的元素)二分查找法找元素publicstaticint[]copyOf(原数组，新数组长度)拷贝数组长度小就拷贝几个，长度一样完全拷贝，长度大后面补默认值publicstaticint[]copyOfRange(原数组，起始索引，结束索引)拷贝数组（指
人工智能概念 zhangpeng455547940 计算机人工智能
机器学习、深度学习、大模型机器学习提供框架，使得系统可以从数据中学习算法：线性回归、逻辑回归、支持向量机、决策树、随机森林、K近邻算法深度学习是实现这一目标的工具，模仿人脑，使用多层神经网络进行学习算法：多层感知器、卷积神经网络、循环神经网络、长短期记忆网络大模型指参数量巨大的深度学习模型人工智能应用：自然语言处理、图像识别与生成、语音识别、政务与企业服务...
HR SaaS平台排行榜：细数2025年中国最具商业价值的十大HR SaaS平台 weixin_54980836 大数据人工智能
在当今竞争激烈且瞬息万变的商业环境中，企业数字化转型已不再是可选项，而是生存与发展的必经之路。人力资源管理作为企业运营的核心支柱之一，正经历着前所未有的深刻变革。传统的HR管理模式已逐渐暴露出效率低下、数据整合困难、决策支持不足等问题，难以满足现代企业对精准、高效、智能人力资源管理的需求。在此背景下，HRSaaS系统应运而生，成为企业优化薪酬管理、提升人力资源效率、实现数字化转型的关键工具。本文将
为什么Redis对大 Key（Large Key）和大对象不友好？怎样优化？风一样的树懒 redis 数据库缓存
你好，我是风一样的树懒，一个工作十多年的后端专家，曾就职京东、阿里等多家互联网头部企业。公众号“吴计可师”，已经更新了近百篇高质量的面试相关文章，喜欢的朋友欢迎关注点赞Redis对大Key（LargeKey）和大对象不友好，主要源于其内存管理模型、单线程架构和数据结构特性。以下从性能影响、内存管理、集群限制三个维度解析原因，并提供优化方案：一、Redis对大Key不友好的核心原因1.性能瓶颈单线程
国家地理信息公共服务平台的天地图 gys9895 百度地图 js
文章目录一、国家地理信息公共服务平台的天地图二、地图转换1.GIS数据格式坐标转换（地球坐标WGS84、GCJ-02、火星坐标、百度坐标BD-09、国家大地坐标系CGCS2000）2.读入数据总结一、国家地理信息公共服务平台的天地图三大地图付费后，仍可用的免费商用地图APIFailedtoresolveloader:sass-loader如果是本地测试，那么对应的白名单设置为null第一步，在Vu
院士领衔、IEEE Fellow 坐镇，清华、上交大、复旦、同济等专家齐聚 2025 全球机器学习技术大会 CSDN资讯机器学习人工智能
随着Manus出圈，OpenManus、OWL迅速开源，OpenAI推出智能体开发工具，全球AI生态正经历新一轮智能体革命。大模型如何协同学习？大模型如何自我进化？新型强化学习技术如何赋能智能体？围绕这些关键问题，由CSDN&Boolan联合举办的「2025全球机器学习技术大会」将于4月18-19日在上海隆重举行。大会云集院士、10所高校科研工作者、近30家一线科技企业技术实战专家组成的超50位重
【大模型LLM面试合集】分布式训练_总结 X.AI666 大模型LLM面试合集面试分布式人工智能语言模型
9.总结1.数据并行数据并行，由于其原理相对比较简单，是目前使用最广泛的分布式并行技术。数据并行不仅仅指对训练的数据并行操作，还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。我们首先以PyTorch数据并行的发展（DataParallel、DistributedDataParallel、FullyShardedDataParallel）为主线进行讲述了数据并行的技术原理。同时，也简述了D
【vLLM 学习】使用 TPU 安装 HyperAI超神经 vLLM 学习人工智能 vLLM 深度学习 TPU 机器学习教程
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href=“https://v
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S