alw_123

Python识别验证码----数美图标点选

Python识别验证码----数美图标点选

写在前面
数据特点
获取数据
识别思路
- 按顺序抠出F4
- 定位f4
- 计算相似度
- - 打标签(~~偷懒~~ )
  - 训练孪生网络
  - 使用模型
识别结果
改进点

写在前面

近日某众打码平台被跑路的消息一出，脚本圈中一片哗然（~~我并不是脚本圈的，只是喜欢看群里人吹逼而已~~ ），仿佛再也听不到那句熟悉的广告语了。这也预示着，第三方打码平台不靠谱了。但打码功能有时候又必不可少，这时候怎么办呢？当然是自己自己动手丰衣足食啦！最近工作不是很忙，准备撸一个用Python识别验证码的系列文章，该系列计划囊括各种时下比较流行的验证码形式，如滑块、四则运算、点选、手势、空间推理、谷歌等。已经跑通了的所有代码都放在了我的知识星球上，需要的话请自取。话不多说，开撸！

数据特点

数美的图标点选和其他的图标点选差不多，要按顺序点击。

获取数据

正常人都知道这些数据肯定是要写爬虫来抓的（~~如果你单身至今，当我没说~~ ）。数美对于反爬这块还算良心，稍微分析下请求就会发现有些参数看似加密实则写死，所以构造下请求头和参数就能轻松获取到验证码图片的url。

识别思路

一个验证码是由两张图组成的，一个是后缀是_bg.jpg的背景图，一个是后缀是_fg.png的图标图。

首先想想看，要解决哪些问题，才能实现按顺序点击：

从图标图中按顺序(按顺序点击的依据)抠出4个图标，我愿称之为F4
在背景图中定位已经被旋转缩放后的4个图标，并抠出来，我愿称之为f4
计算出F4们与f4们之间的相似度（~~搞基配对~~ ）

按顺序抠出F4

稍微懂点CV的老铁应该知道，这种图好扣的很。转成灰度图，OTSU阈值分割，膨胀一下就能得到比较好的F4们的连通区域了。

# image是图标图
gray_img = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
   _, threshold_img = cv2.threshold(gray_img, 100, 255, cv2.THRESH_OTSU)
kernel = np.ones([3, 3], np.uint8)
dialte_img = cv2.dilate(threshold_img, kernel, 2)

结果就是酱紫。

有了上面的结果后，按顺序抠图就简单了。从左到右遍历下康康纵向的像素和是不是0就OJBK了。

# F4
roi_image = []

i = 0
while i < image.shape[1]:
     if(np.sum(dialte_img[:,i]) > 0):
          start_col = i
          while np.sum(dialte_img[:,i]) > 0:
              i += 1
          end_col = i
          # 抠图
          roi_image.append(image[:,start_col:end_col])
     else:
          i += 1

抠图效果

定位f4

如果有老铁看过我之前写那篇识别数美拼图滑块的流水账，估计会想着继续用模板匹配去背景图上找图标的位置。但如果你头铁试了一下的话，会发现，找的位置一点都！不！准！因为模板匹配没有旋转不变性和缩放不变性。所谓不变性就是变了等于没变。也就是说，模板匹配不适于去匹配已经被旋转和缩放后的目标，即使它们从人眼看来是一个东西。

本来想用SIFT来做定位的，但SIFT申请了专利，我opencv降版本都白嫖不了…

后来想想，算了，上YoloV5吧，反正YoloV5n对显卡要求不高，我这4G小霸王训练个定位图标的模型还是可以的。说干就干。

经过半个小时的标注，标注了90多张图。然后用YoloV5n pytorch版训练了一个13.9M的模型，mAP高达98！！！不得不说，Yolo牛逼！(如果各位看官对yolov5不熟，可以参考官方github)

有了模型之后，就需要改写一下官方提供的predict.py，因为predict.py太臃肿，而且所有的预测结果是画在图上的，就像酱紫。

但我们想要的结果是f4们的位置。所以像可视化啊、dump日志啊什么杂七杂八的全可以删掉。需要注意的是：predict.py里面有两种坐标表示方式，一种是xywh，还有一种是xyxy。xywh是目标矩形框的左上角的归一化后的坐标和矩形的归一化后的宽高。xyxy是目标矩形框的左上角坐标和右下角坐标，并且坐标没有被归一化。

至于用哪种方式表示位置的话，见仁见智了。反正都能互相转换。

我这边为了opencv好抠图，就用的xyxy，然后稍微封装了一下。

# pos是个列表，是用来抠f4们直接能用的坐标
pos = yolo_detector.detect(bg_img)
# 存放f4的列表
bg_roi_imgs = []
for p in pos:
	# 抠图
    bg_roi_imgs.append(bg_img[p[0]:p[1], p[2]:p[3]])

计算相似度

F4，f4都有了，那就差他们搞基配对了。搞基的逻辑其实也挺简单，大概酱紫。

# 按顺序存放好基友的矩形框
rects = []

for i in range(len(puzzle_images)):
    best_score = 0
    best_rect = None
    for j in range(len(bg_roi_imgs)):
        score = 计算相似度(puzzle_images[i], bg_roi_imgs[j])
        if dis > best_score:
            best_score = dis
            best_rect = [pos[j][2], pos[j][0], pos[j][3], pos[j][1]]
    rects.append(best_rect)

那么相似度怎么算？一开始我想这要不算个感知哈希？结果发现不太行。要不算个HOG特征然后算余弦距离？结果他喵的比感知哈希还拉跨…

算了，用孪生网络一把梭，不就是打标签嘛，我打还不行吗…

打标签(偷懒 )

至于打标签嘛，学过ML或DL的都知道，数据用业务场景的真实数据肯定是最好的，因为数据分布最为相似。但我很懒…我就投机取巧的做了图像增强。思路就是随便找了几张网图，然后把种子随机旋转，缩放得到贴图。再把贴图随机找个网图贴上去然后抠出来。

import cv2
import numpy as np
import os
import time

def random_rotate(img):
    rows, cols, channels = img.shape
    angle = [0, 20, 45, 60, -20, -45]
    aa = np.random.randint(len(angle))
    rotate = cv2.getRotationMatrix2D((rows * 0.5, cols * 0.5), angle[aa], 1)
    res = cv2.warpAffine(img, rotate, (cols, rows))
    return res

def random_resize(img):
    scale = [1.0, 1.2, 1.3,1.5, 1.7 ,2, 2.5]
    x = np.random.randint(len(scale))
    img = cv2.resize(img, (0, 0), fx=scale[x], fy=scale[x])
    return img

def gen_random_img(bg, fg):
    fg_ = fg.copy()
    fg_ = random_rotate(fg_)
    fg_ = random_resize(fg_)
    fg_r, fg_c = fg_.shape[0], fg_.shape[1]
    x = np.random.randint(bg.shape[1]-fg_c)
    y = np.random.randint(bg.shape[0]-fg_r)
    roi = bg[y:y+fg_r, x:x+fg_c].copy()
    for i in range(roi.shape[0]):
        for j in range(roi.shape[1]):
            if np.sum(fg_[i,j,:]) > 30:
                roi[i, j, 0] = fg_[i, j, 0]
                roi[i, j, 1] = fg_[i, j, 1]
                roi[i, j, 2] = fg_[i, j, 2]
    return roi

bgs = os.listdir('random_bg')

for fg_path in os.listdir('./images_background/'):
    filename = os.listdir(os.path.join('./images_background/', fg_path))[0]
    for i in range(100):
        bg_i = np.random.randint(len(bgs))
        bg = cv2.imread('random_bg/'+bgs[bg_i])
        fg = cv2.imread(os.path.join(os.path.join('./images_background/',fg_path),filename))
        roi = gen_random_img(bg, fg)
        cv2.imwrite(os.path.join(os.path.join('./images_background/',fg_path),str(round(time.time()*1000)))+'.jpg', roi)

然后就有了大概酱紫的数据集

训练孪生网络

pytorch版本的孪生网络github上有很多，选一个看得最顺眼的就行。我选的是backbone是VGG16，损失函数是三元组损失的。大概训练了7个epoch后精度就还行了(~~后来实验证明有点过拟合了~~ )。

使用模型

有了模型之后，直接调用模型预测就好，反正给的结果是个概率值。概率值越高，说明越像。

# 按顺序存放好基友的矩形框
rects = []

for i in range(len(puzzle_images)):
    best_score = 0
    best_rect = None
    for j in range(len(bg_roi_imgs)):
        score = siamese_model.detect_image(puzzle_images[i], bg_roi_imgs[j])
        if dis > best_score:
            best_score = dis
            best_rect = [pos[j][2], pos[j][0], pos[j][3], pos[j][1]]
    rects.append(best_rect)

这个时候rects里面就会有F4们在背景图中的位置了。

识别结果

为了方便查看识别结果，我把F4和背景图都贴到了一张图上，然后框框上的数字就是依次点击的顺序。

# 背景图
bg_img = cv2.imread(bg_path)
# F4们
fg_img = cv2.imread(fg_path)
# 新图
back = np.zeros([340, 600, 3], dtype=np.uint8)
# 获得依次点击的矩形框信息
rects = get_result(bg_img, fg_img, model, detector)

for i, rect in enumerate(rects):
    # 可视化
    bg_img = cv2.rectangle(bg_img, (rect[0], rect[1]), (rect[2], rect[3]), (0, 255, 255), 3)
    bg_img = cv2.putText(bg_img, str(i + 1), (rect[0], rect[1]), cv2.FONT_HERSHEY_SIMPLEX, 1.1, (0, 255, 255), 2)

back[:bg_img.shape[0], :bg_img.shape[1], :] = bg_img

# 把F4们贴到图的最下方
for i in range(fg_img.shape[0]):
    for j in range(fg_img.shape[1]):
        if fg_img[i, j, 0] != 0 and fg_img[i, j, 1] != 0 and fg_img[i, j, 2] != 0:
            back[i+bg_img.shape[0], j, 0] = fg_img[i, j, 0]
            back[i+bg_img.shape[0], j, 1] = fg_img[i, j, 1]
            back[i+bg_img.shape[0], j, 2] = fg_img[i, j, 2]

测试了下，依次点击的正确率大概65%的样子。

改进点

1.抠F4的时候我没考虑那种隔得很开的图标，比如下图中的AI会抠成A和I。可以考虑直接用定位f4的yolo模型来抠图，效果肯定比这个好。

2.因为懒，标注的数据太少，孪生网络的数据我只标注了50多种图标，实际上测试时图标种类远不止50多种，导致模型容易过拟合。比如下图中1和2的图标中都有类似s形的缝隙。模型就算错了。如果不懒，效果不会差。

3.构造一个网络结构做到端到端识别。

你可能感兴趣的:(天下无码,人工智能,深度学习,yolo,pytorch,验证码识别)

解决引入TransXNet模块后显存爆炸问题的全面指南 pk_xz123456 算法大数据 python 机器人数据挖掘深度学习
解决引入TransXNet模块后显存爆炸问题的全面指南前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.问题背景与现状分析1.1MF-PSN和TransXNet项目概述MF-PSN（Multi-FeaturePyramidStereoNetwork）是一个基于金字塔特征的多特征立体匹配网络，它通过构建多层次的特征金字塔来处理不同尺度的立体匹配问题
探索名门望族背后的秘密期待遇见最好的自己
20200824读书笔记（十七）朱熹家族186节朱熹家族。一个人是如何成人，成才，成事的？想搞懂自己与他人。有一天，我发现搞懂自己与他人还是不够的，还要搞懂人生，当我去探索人生的时候，我是否进入了一个全新的世界，不是为了学习历史，而是需要探索东方智慧。不是为了探索东方智慧，而是为了寻找人生答案。朱熹是一个从天理之人，从小想搞懂天下万物。把道和理都要研究透。因此成为了我要重点研究的对象之一。带着朱熹
【有所思】凡天下事，三规定天下金钟山人
2022年6月30日周四曲靖晴终于下定决心学习书法了，这是认真的，交了费，拜了师，摆好桌，选好贴，准备至少半年的纸和笔，做足功夫。刘老师帮我分析，确定从魏碑练习开始，要求放空忘记过去，照着写，放空自己，不发挥不走样。老师还告诉我“凡天下事，三规定天下”，我也觉得持有道理。何为三规，曰规律，曰规则，曰规划。试分析如下：一、找规律世间万事万物大到宇宙运行的规律，中到人性的规律，小到孩子不同心理发展阶段
早起第65日，学会拒绝，有取舍暮鼓晨钟安之若素
如果确实不想做某件事或者去某个地方，坦白拒绝。1、人们更容易接受真诚的表达真诚！！！现代社会发展倒是越来越快，科技越来越先进，人们之间的沟通交流越来越方便。但是人和人之间的距离感反而越来越远，因为科技联通的仅仅是表面，键盘背后你永远不可能看到对方的真实想法。互联网隐藏了人的本性，以至于真实成了最奢侈的一个品质。所以现在人么越来越喜欢原创的，因为互联网的效率越来越高。所谓的天下文章一大抄，以前是因为
《与爱逆行》四十三在煎熬中等待阿依迪
四十三在煎熬中等待这天下午我正睡觉，梦见自己坐着摇椅来回的晃，快被晃下来了，伸手想抓住点儿什么，就醒了，睁眼一看是杨凯，闭上眼睛又要睡，杨凯大声的喊：“别睡了，向天出事了！”我一激凌坐了起来。“我就知道，一说向天你就醒了。”我以为杨凯逗我，躺下又要睡。“别睡了，向天真的出事了！”“她能出什么事？要生孩子了？”“你别那么恶毒好不好？刚才向东给我打电话说向天在沙漠里出事了，他要开车去救援，问你去不去？
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
现代人工智能综合分类：大模型时代的架构、模态与生态系统司南锤 economics 人工智能分类数据挖掘
目录引言：人工智能的第四次浪潮与新分类的必要性第一节：大型模型范式的基础支柱1.1规模化假说：算力、数据与算法的三位一体1.2“涌现能力”之谜：当“更多”变为“不同”1.3自监督学习（SSL）革命第二节：大型模型的技术分类学2.1Transformer：现代人工智能的架构基石2.2架构分化：一种功能性分类2.3提升效率与规模：专家混合模型（MoE）2.4超越Transformer：下一代架构的探索
现在的人就是：需要的不多，想要的太多，病就是这么来的易水中医
养生是什么？我们带着偏见去看此观点，古人庄子思考的养生就是把养生放到后面，把逍遥放到前面。借用林杰老师说的观点就是天下无病，首先要在战略上去藐视敌人，在战术上才能真正地重视敌人。怎么养生，就是要跳出疾病，有很多人之所以不能够真正解决问题，是他解决的时候老在纠结，应该不应该，好还是不好，对还是不对。你一去想这个，你的能量就会专注在这个事情上了。所以解决养生的问题要跳出养生来看，这个是庄子给我们最好的
韩非子的“儒以文乱法” 落木萧萧
在春秋时代，是百家争鸣的时代，各种思想学说应运而生，各种思潮也是互相争霸，互相贬诉。法家的代表人物商鞅、韩非子就很推荐法家思想，认为国家在法制管理下，就能强大富裕，人民能够安居乐业。韩非子在他的《五蠢》文中就提出了“儒以文乱法”的论点，并举出如下例子：第一个论据：君臣关系如同父子关系就不会发生叛乱，就会天下平安无事，可是韩非子却举例子反驳了这种说法：“儒家和墨家都称颂先王，说他们博爱天下一切人，就
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
180天日更打卡（1）——回顾2020，展望2021 小云读书小站
2020年即将结束，回首这一年，发生了太多的事。因为疫情，呆在家里几个月，每天陪着孩子上网课。看似没干什么，其实一天下来，也是忙忙碌碌的。在这几个月里，不能开门营业，没有收入，经济压力随之而来，看着信用卡里的额度一点点减少，心里很是焦急，却也无奈。终于，疫情过去，孩子们开学了。又面临着儿子上初中找学校的事，因为我们是外地在这边做生意，属于外来人口，所以孩子上学比较麻烦。为孩子上学奔波在各个学校之间
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
丢西瓜——许沛霖和她的舍友们马森吐温
1.离开了几千公里的家乡来到这所大学。当初许沛霖脑海里只有一个想法，离家远越越好，去到一所谁也不认识她的城市。孤独的活下去。在许沛霖眼里，她的舍友都是永远长不大的孩子。宿舍一共八张床，结果只来了四个人。辅导员只好把她们的住宿费调到四人间的标准。许沛霖不同意。刚来到大学报道的第二天下午，就拿着录取通知书，一个人带着刚收拾完寝室的汗珠，大步流星的穿过食堂，两边的风景像后视镜一样的后退，大家都被这弱小的
【布谷書社“閱经典·習功夫”之庄子外篇·天道 0001】布谷鸟書社
图片发自App天道运而无所积，故万物成；帝道运而无所积，故天下归；圣道运而无所积，故海内服。明于天，通于圣，六通四辟于帝王之德者，其自为也，昧然无不静者矣！圣人之静也，非曰静也善，故静也。万物无足以挠心者，故静也。水静则明烛须眉，平中准，大匠取法焉。水静犹明，而况精神！圣人之心静乎！天地之鉴也，万物之镜也。夫虚静恬淡寂漠无为者，天地之平而道德之至也。故帝王圣人休焉。休则虚虚则实，实则伦矣。虚则静，
❤️午间能量加油站～536 16b243081175
命好不如习惯好。东汉陈蕃年少的时候，曾在庭院习读诗书。有一天，他父亲的老朋友薛勤来家里做客看到院子里杂草丛生，脏乱不堪，就问他为什么不打扫。陈蕃说：“大丈夫处世，当扫除天下，安事一室乎！我的志向是扫除天下，怎么在乎这一间房子是否干净呢？薛勤劝他说：“一屋不扫，何以扫天下”。陈蕃无言以对，慢慢改掉了眼高手低的毛病，不断成长，最终成了东汉太傅。《道德经》里讲：天下难事，必作于易；天下大事，必作于细。所
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
Unet源码实现（pytorch） wyn20001128 pytorch 人工智能 python
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它通过引入一种新颖的网络结构和训练策略解决了传统方法在数据量不足时面临的挑战。U-Net的主要思想是利用数据增强技术来高效利用有限的标注样本，并通过独特的网络设计来提高分割精度。主要贡献U-Net的主要贡献包括：1、数据增强策略：使用随机弹性变形和其他形式的数据增强来增加训练数据的多样性，从而在有限的数据集上训练出更强大的模型。2、U形网络结
pytorch的学习笔记 wyn20001128 算法
一cuda 2006年，NVIDIA公司发布了CUDA(ComputeUnifiedDeviceArchitecture)，是一种新的操作GPU计算的硬件和软件架构，是建立在NVIDIA的GPUs上的一个通用并行计算平台和编程模型，它提供了GPU编程的简易接口，基于CUDA编程可以构建基于GPU计算的应用程序。 CPU是用于负责逻辑性比较强的计算，GPU专注于执行高度线程化的并行处理任务。所以
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
2021-03-03 宇娟_ab03
2021.3.3日今天的推荐人培训，很有收获啊！说实话在共好这么长时间，一直没有说刻意的培训过，都是家长们口碑相传。我们几位老师也没有接受过营销相关的培训，所以今天闺蜜分享的陌生人沟通成交和师妹的总结以及现场打电话实操，看似很简单，但其实很有挑战，如果换做是我，我会怎么说呢？要好好总结，向她们学习。今天下午在陌生地方和陌生人话多了，心为物役了，以后多注意。
算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录推荐算法系统系列二算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南更多技术内容总结推荐算法系统系列二算
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
你还好吗 ZQJIA作曲家
今天下雨天，突然想起您的一句话，“你还好吗？”不禁泪如雨下。自从分班以后，我们就没有再联系，各自过着各自的生活。每当下起夜雨，让我想起我们的故事，《夜雨寄北》君问归期未有期，巴山夜雨涨秋池。何当共剪西窗烛，却话巴山夜雨时。分班之前，我们经常在一起学习，经常一起悠闲，经常一起逛街。你知道我的一切，我知道你的一切。你知道我胃不舒服，会给我买粥喝；我知道你生理反应，会给你买红糖姜，重要的是你一下雨就难受
压岁钱萍凭简单爱
今天是大年三十，是农历2019年的最后一天，晚上各家都要聚在一起包饺子。今天下午先生陪同婆婆出院回到家中开始准备包饺子的材料，邻居娟姐得知婆婆回来了，提着物品来看望，主动提出来帮忙包饺子。有了娟姐的帮忙我们包饺子快多了，先生顺势多准备了几样菜，两家人一起热热闹闹的集体吃年夜饭。饭后大家聚在一起一边看春晚一边聊天。几个孩子玩的愉快和睦，不忍心分开，时间来到了10点钟，不得不分开了。回到家中轩轩宝贝就
自嗨山里娃娃66
图片发自App最近确实很充实，参加遇见训练营，笔墨里的时光写作，一周要保证自己去五次瑜伽房，还得应付工作中不停的杂事和没完没了的各种考核。瑜伽房里，惠医生跟我说，福道全程贯通了，那天下班临时决定，走福道，翻山越岭回家，从洪山桥西客站入口进，至左海隧道口下，等于是翻越整个金牛山，其实早上刚做完训练营打卡，腿脚还是有点酸疼，可是还是有颗很强大的好奇心，贯通后的福道风景到底如何?走完全程要耗时多久呢？傍
2022-02-22 我_4b6f
保定影像之街道（三七二）2019年8月3日，星期六。农历己亥年辛未月壬申日（猪年）七月初三。河北省保定市：南一胡同南胡同。保定市，古称清苑、上谷、保州、保府...。因城池似靴，又称靴城。保定与北京相伴而生，保定之名取自“保卫大都、安定天下”之意。南一胡同，南北街道。以方位命名，因其位于西关大街东南侧而得名。
死囚李牧風
横行天下凭剑利，久困藩笼恨未期。徒然荡胸生层云，不过空折冲天翼。当年英发唯我狂，吞吐山河尽意气。十年剑成坤與倒，千尺白茫潜龙避。龙遁无形谓隐逸，虎落平阳被犬欺。世上岂容逍遥客，少年不群岂我意。众人皆醉我安醒，百兽震惶我亦鸣。人披狗彘得安乐，纵死不过头点地。
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他