qq 1735375343

基于opencv的试卷检测识别

如果有图像处理，图像识别的任务，欢迎下方评论或者私聊作者！

视频观看：

20211212

主界面：

选择图片后：

识别以后：

识别完成以后会自动截取不同的题目，然后保持到不同的文件夹中，分数会单独的保存到一个txt文本中。

手写数字数据集：

手写数字识别代码，建议不要直接用mnist手写数字数据集，因为使用这个数据集训练出来的网络，根本识别不了我自己写的数字，亲身体验！没办法，我只好自己制作了手写数据集，其实很简单。数据集如下所示：

其余的都差不多是这样，就不过多展示了。需要注意的是图片上面只有数字是黑色的，这样方面提取出数字，如果写错了，可以用一些图像编辑的软件将错的部分涂成白色即可，就和上图一样。
手写数字识别代码：

import tensorflow as tf
import cv2 as cv
import numpy as np
from get_data import *

model=tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128,activation='relu'),
    tf.keras.layers.Dense(128,activation='relu'),
    tf.keras.layers.Dense(128,activation='relu'),
    tf.keras.layers.Dense(10,activation='softmax')
])
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
              metrics=['sparse_categorical_accuracy'])
model.fit(x_train,y_train,batch_size=32,epochs=10,validation_split=0.1,validation_freq=1)
model.save('mode_2.h5')

是不是很简单呢？请看第四行：

from get_data import *

关于图像处理的部分在get_data.py这个代码中，下面是get_data.py的代码。

get_data.py

import numpy as np
import cv2 as cv

x_train=[]
y_train=[]


aa=9
for aa in range(10):
    src=cv.imread('data/{}.jpg'.format(aa))
    gray=cv.cvtColor(src,cv.COLOR_BGR2GRAY)
    thred=np.where(gray>150,255,0).astype('uint8')
    thred=255-thred
    #开闭运算
    k = np.ones((3, 3), np.uint8)
    #thred=cv.dilate(thred,k)
    thred = cv.morphologyEx(thred, cv.MORPH_CLOSE, k)

    cnts=cv.findContours(thred,cv.RETR_EXTERNAL,cv.CHAIN_APPROX_SIMPLE)[0]
    print(len(cnts))

    for i in cnts:
        area = cv.contourArea(i)
        if aa!=1:
            b=20
        else:b=15
        if area>=b:
            x, y, w, h = cv.boundingRect(i)
            cv.rectangle(src,(x,y),(x+w,y+h),(0,0,255),2)
            lkuo=thred[y:y+h,x:x+w]
            da = max(h, w)
            rate = da / 40
            ro = cv.resize(lkuo, (int(w / rate), int(h / rate)))
            h, w = ro.shape
            t, b = int((43 - h) / 2), 43 - h - int((43 - h) / 2)
            l, r = int((43 - w) / 2), 43 - w - int((43 - w) / 2)

            ro = cv.copyMakeBorder(ro, t, b, l, r, cv.BORDER_CONSTANT, value=0)

            ro = cv.resize(ro, (40, 40))
            ro = np.where(ro > 0, 255, 0).astype('float32')
            ro = ro / 255
            x_train.append(ro)
            y_train.append(aa)

x_train=np.array(x_train).astype('float32')
y_train=np.array(y_train).astype('float32')
y_train=np.reshape(y_train,(y_train.shape[0],1))
np.random.seed(1)
np.random.shuffle(x_train)
np.random.seed(1)
np.random.shuffle(y_train)
print(y_train)
if __name__=='__main__':
    pass

好了，到这里手写数字识别的部分已经完结了，后面可以直接调用我们训练好的网络就可以识别了，下面是关于试卷检测的代码：

import time

import cv2 as cv
import numpy as np
from tensorflow.keras.models import load_model
import os

model =load_model('mode.h5')
def zb(img,a):
    # b=np.sort(a,axis=0)
    idx = np.argsort(a, axis=0)
    aa = a[idx[:, 0]]
    idx12=np.argsort(aa[:2],axis=0)
    idx34 = np.argsort(aa[2:], axis=0)
    aa[:2]=aa[:2][idx12[:,1]]
    aa[2:]=aa[2:][idx34[:,1]]
    p1 = aa[0]
    p2 = aa[1]
    p3 = aa[3]
    p4 = aa[2]
    # rect=[p1,p2,p3,p4]
    # rect=np.array(rect)
    w=max(np.sqrt(np.sum(np.square(p4-p1))),np.sqrt(np.sum(np.square(p3-p2))))
    h=max(np.sqrt(np.sum(np.square(p2-p1))),np.sqrt(np.sum(np.square(p3-p4))))
    dst=np.array([[0,0],
                  [w - 1, 0],
                  [w - 1, h - 1],
                  [0, h - 1]],dtype='float32')

    xx=[p1,p4,p3,p2]
    aa=np.array(xx).astype('float32')
    M=cv.getPerspectiveTransform(aa,dst)
    warped=cv.warpPerspective(img,M,(int(w),int(h)))
    return warped
def draw(img,x1,y1,x2,y2,text=None,dr=True):
    if dr:
        cv.rectangle(img, (x1, y1), (x2, y2), (0, 255, 0), 1)
        cv.putText(img,text,(x1,y1-15),cv.FONT_HERSHEY_SIMPLEX,1,(0,255,0),2)
    src=warped_copy[y1:y2,x1:x2]
    return src
def chang_pic(ro):
    h,w=ro.shape
    da=max(h,w)
    rate=da/40
    ro=cv.resize(ro,(int(w/rate),int(h/rate)))
    h,w=ro.shape
    t,b=int((43-h)/2),43-h-int((43-h)/2)
    l,r=int((43-w)/2),43-w-int((43-w)/2)

    ro=cv.copyMakeBorder(ro,t,b,l,r,cv.BORDER_CONSTANT,value=0)

    ro=cv.resize(ro,(40,40))
    #cv.imshow('ro1', ro)
    ro=np.where(ro>0,255,0).astype('float32')
    ro=ro/255

    print('ro=',ro.shape)
    ro=np.reshape(ro,(1,40,40))
    pre=model.predict(ro)[0]
    true=np.argmax(pre)
    return str(true)

def shuzi(imgs):
    imgs=imgs[4:-4,4:-4]
    cc=max(imgs.shape[0],imgs.shape[1])
    imgs=cv.resize(imgs,(cc,cc))
    imgs=cv.cvtColor(imgs,cv.COLOR_BGR2GRAY)
    #cv.imshow('gray',imgs)
    thred = np.where(imgs > 215, 0, 255).astype('uint8')
    #cv.imshow('a11',thred)
    contours, hierarchy = cv.findContours(thred, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_NONE)
    lis=[]
    if len(contours)==0:
        return None
    contours_2=[]
    for i in contours:
        x, y, w, h = cv.boundingRect(i)
        area = cv.contourArea(i)
        if area>10:
            lis.append(x)
            contours_2.append(i)
        print(area)
    lis=np.array(lis)
    #contours_2=np.array(contours_2)
    idx=np.argsort(lis)
    print(idx)
    #contours_2=np.array(contours_2)
    contours_3=[]
    for id,ii in enumerate(idx):
        contours_3.append(contours_2[ii])
    #print(contours_2)
    ll=''
    for j in contours_3:
        x1, y1, w1, h1 = cv.boundingRect(j)
        lunkuo=thred[y1:y1+h1,x1:x1+w1]
        #cv.imshow('lh45',lunkuo)
        number=chang_pic(lunkuo)
        ll=ll+number
    return ll

nam='3.jpg'
image=cv.imread('./pic/'+nam)
def mmain(image):
    a=1000
    ratio=image.shape[0]/a
    orig=image.copy()

    image=cv.resize(image,(int(image.shape[1]/ratio),a))

    gray=cv.cvtColor(image,cv.COLOR_BGR2GRAY)
    gray=cv.GaussianBlur(gray,(5,5),0)
    #边缘检测
    edged=cv.Canny(gray,75,200)
    cv.imwrite('lk.jpg',edged)

    #轮廓检测
    cnts=cv.findContours(edged.copy(),cv.RETR_LIST,cv.CHAIN_APPROX_SIMPLE)[0]
    cnts=sorted(cnts,key=cv.contourArea,reverse=True)[0]
    #遍历轮廓
    # cnts=np.reshape(cnts,(cnts.shape[0],cnts.shape[2]))
    # print(cnts.shape)
    peri=cv.arcLength(cnts,True)
    approx=cv.approxPolyDP(cnts,0.02*peri,True)


    if len(approx)==4:
        screenCnt=approx
        cv.drawContours(image,[screenCnt],-1,(0,255,0),2)
        warped=zb(orig,screenCnt.reshape(4,2)*ratio)

        warped=cv.resize(warped,(724,1000))
        global warped_copy
        warped_copy=warped.copy()
        #cv.imwrite('pic/sjuan.jpg',warped)
        print(warped.shape)

        score1=draw(warped,96,85,138,125)
        score2=draw(warped,150,85,193,125)
        score3=draw(warped,200,85,245,125)
        score4=draw(warped,254,85,296,125)
        #识别分数
        num1 = shuzi(score1)

        print('num1=',num1)
        num2 = shuzi(score2)
        print(num2)
        num3 = shuzi(score3)
        print('num3=',num3)
        num4 = shuzi(score4)
        print('num4=',num4)
        s1= draw(warped, 96, 85, 138, 125,text=num1)
        s2 = draw(warped, 150, 85, 193, 125,text=num2)
        s3 = draw(warped, 200, 85, 245, 125,text=num3)
        s4 = draw(warped, 254, 85, 296, 125,text=num4)

        dati1_1=draw(warped,25,293,335,448,text='one')
        dati1_2=draw(warped,350,42,660,110,text='one')
        dati1=np.concatenate((dati1_1,dati1_2),axis=0)
        dati2=draw(warped,350,110,660,280,text='two')
        dati3=draw(warped,350,283,660,450,text='three')
        dati4=draw(warped,28,541,416,916,text='four')

        da1_1=draw(warped_copy,37,294,323,336,dr=False)
        da1_2 = draw(warped_copy, 37, 336, 323, 368, dr=False)
        da1_3 = draw(warped_copy, 37, 368, 323, 390, dr=False)
        da1_4= draw(warped_copy, 37, 390, 323, 442, dr=False)
        da1_5 = draw(warped_copy, 353, 46, 651, 111, dr=False)
        ddaa1=[da1_1,da1_2,da1_3,da1_4,da1_5]
        ddaa1_name=['da1_1','da1_2','da1_3','da1_4','da1_5']

        da2_1 = draw(warped_copy, 353, 120, 651, 166, dr=False)
        da2_2 = draw(warped_copy, 353, 166, 651, 192, dr=False)
        da2_3 = draw(warped_copy, 353, 195, 651, 218, dr=False)
        da2_4 = draw(warped_copy, 353, 222, 651, 252, dr=False)
        da2_5 = draw(warped_copy, 353, 250, 651, 282, dr=False)
        ddaa2=[da2_1,da2_2,da2_3,da2_4,da2_5]
        ddaa2_name=['da2_1','da2_2','da2_3','da2_4','da2_5']

        da3_1 = draw(warped_copy, 353, 281, 634, 322, dr=False)
        da3_2 = draw(warped_copy, 353, 322, 634, 346, dr=False)
        da3_3 = draw(warped_copy, 353, 346, 634, 378, dr=False)
        da3_4 = draw(warped_copy, 353, 378, 634, 400, dr=False)
        da3_5 = draw(warped_copy, 353, 400, 634, 442, dr=False)
        ddaa3=[da3_1,da3_2,da3_3,da3_4,da3_5]
        ddaa3_name=['da3_1','da3_2','da3_3','da3_4','da3_5']


        da4_1 = draw(warped_copy, 35, 551, 381, 617, dr=False)
        da4_2 = draw(warped_copy, 35, 617, 381, 700, dr=False)
        da4_3 = draw(warped_copy, 35, 700, 381, 786, dr=False)
        da4_4 = draw(warped_copy, 35, 786, 381, 912, dr=False)
        ddaa4=[da4_1,da4_2,da4_3,da4_4]
        ddaa4_name=['da4_1','da4_2','da4_3','da4_4']



        t1_1=draw(warped,97,136,140,160)
        t1_2=draw(warped,97,168,140,190)
        t1_3 = draw(warped, 97, 200, 140, 224)
        t1_4 = draw(warped, 97, 232, 140, 255)
        t1_5 = draw(warped, 97, 262, 140, 287)


        t2_1 = draw(warped, 150, 136, 192, 160)
        t2_2 = draw(warped, 150, 168, 192, 190)
        t2_3 = draw(warped, 150, 200, 192, 224)
        t2_4 = draw(warped, 150, 232, 192, 255)
        t2_5 = draw(warped, 150, 262, 192, 287)

        t3_1 = draw(warped, 200, 136, 245, 160)
        t3_2 = draw(warped, 200, 168, 245, 190)
        t3_3 = draw(warped, 200, 200, 245, 224)
        t3_4 = draw(warped, 200, 232, 245, 255)
        t3_5 = draw(warped, 200, 262, 245, 287)

        t4_1 = draw(warped, 253, 136, 297, 160)
        t4_2 = draw(warped, 253, 168, 297, 190)
        t4_3 = draw(warped, 253, 200, 297, 224)
        t4_4 = draw(warped, 253, 232, 297, 255)
        t4_5 = draw(warped, 253, 262, 297, 287)

        fen=[t1_1,t1_2,t1_3,t1_4,t1_5,
             t2_1,t2_2,t2_3,t2_4,t2_5,
             t3_1,t3_2,t3_3,t3_4,t3_5,
             t4_1,t4_2,t4_3,t4_4,t4_5]
        name=['t1_1','t1_2','t1_3','t1_4','t1_5',
             't2_1','t2_2','t2_3','t2_4','t2_5',
             't3_1','t3_2','t3_3','t3_4','t3_5',
             't4_1','t4_2','t4_3','t4_4','t4_5']

        ss=[num1,num2,num3,num4]
        fensu=0
        for iii in ss:
            try:
                fensu+=int(iii)
            except:pass
        print(fensu)
        #创建文件夹保存文件
        if not os.path.isdir("timu"):
            os.mkdir("timu")
        if not os.path.isdir("timu/score"):
            os.mkdir("timu/score")
        if not os.path.isdir("timu/one"):
            os.mkdir("timu/one")
        if not os.path.isdir("timu/two"):
            os.mkdir("timu/two")
        if not os.path.isdir("timu/three"):
            os.mkdir("timu/three")
        if not os.path.isdir("timu/four"):
            os.mkdir("timu/four")
        na=nam.split('.')[0]

        #保存大题
        for sce,wq in zip(ddaa1,ddaa1_name):
            cv.imwrite('timu/one/{}_{}.jpg'.format(na,wq),sce)
        for sce,wq in zip(ddaa2,ddaa2_name):
            cv.imwrite('timu/two/{}_{}.jpg'.format(na,wq),sce)
        for sce,wq in zip(ddaa3,ddaa3_name):
            cv.imwrite('timu/three/{}_{}.jpg'.format(na,wq),sce)
        for sce,wq in zip(ddaa4,ddaa4_name):
            cv.imwrite('timu/four/{}_{}.jpg'.format(na,wq),sce)


        #cv.imwrite('timu/{}_one.jpg'.format(na),dati1)
        # cv.imwrite('timu/{}_two.jpg'.format(na), dati2)
        # cv.imwrite('timu/{}_three.jpg'.format(na), dati3)
        # cv.imwrite('timu/{}_four.jpg'.format(na), dati4)

        #保存分数区域
        for ax,nna in zip(fen,name):
            cv.imwrite('timu/score/{}_{}.jpg'.format(na,nna), ax)
        #保存题目

        # cv.imwrite('warp.jpg',warped_copy)
        with open('score.txt','a') as f:
            f.write(str(num1)+'  '+str(num2)+'  '+str(num3)+'  '+str(num4)+'  '+str(fensu)+'\n')
        return warped,image
    else:
        return
if __name__=='__main__':
    img=cv.imread('./pic/2.jpg')
    warped, img = mmain(img)
    cv.imshow('q12',img)
    cv.waitKey(0)
    cv.destroyWindow()

下面是界面的部分代码：

import sys, cv2
from PyQt5.QtGui import *
from PyQt5.QtWidgets import *
from PyQt5.QtCore import *
from untitled import Ui_Dialog
from t1 import *

class My(QMainWindow,Ui_Dialog):
    def __init__(self):
        super(My,self).__init__()
        self.setupUi(self)
        self.pushButton.clicked.connect(self.pic)

        self.setWindowTitle('试卷检测')
        self.pushButton_2.clicked.connect(self.dis)
        self.setIcon()
    def setIcon(self):
        palette1 = QPalette()
        # palette1.setColor(self.backgroundRole(), QColor(192,253,123))   # 设置背景颜色
        palette1.setBrush(self.backgroundRole(), QBrush(QPixmap('22.png')))  # 设置背景图片
        self.setPalette(palette1)
        # self.setAutoFillBackground(True) # 不设置也可以

        # self.setGeometry(300, 300, 250, 150)
        #self.setWindowIcon(QIcon('22.jpg'))

    def pic(self):
        imgName, imgType = QFileDialog.getOpenFileName(self,
                                                       "打开图片",
                                                       "",
                                                       " *.jpg;;*.png;;*.jpeg;;*.bmp;;All Files (*)")

        img = cv2.imread(imgName)

        self.warped,self.img=mmain(img)
        h1,w1=self.warped.shape[0],self.warped.shape[1]
        self.warped=cv.resize(self.warped,(int(w1/(h1/750)),750))
        print(self.warped.shape)
        self.img = cv.resize(self.img, (int(w1 / (h1 / 750)), 750))
        try:
            self.warped=self.cv_qt(self.warped)
            self.img = self.cv_qt(self.img)
            self.label.setPixmap(QPixmap.fromImage(self.img))
        except:pass

    def cv_qt(self, src):
        h, w, d = src.shape
        bytesperline = d * w
        # self.src=cv.cvtColor(self.src,cv.COLOR_BGR2RGB)
        qt_image = QImage(src.data, w, h, bytesperline, QImage.Format_RGB888).rgbSwapped()
        return qt_image
    def dis(self):
        self.label.setPixmap(QPixmap.fromImage(self.warped))

if __name__ == '__main__':
    app = QApplication(sys.argv)
    # 初始化GUI窗口 并传入摄像头句柄
    win = My()
    win.show()
    sys.exit(app.exec_())

整体目录结构：

运行main.py即可使用。

下载链接：完整项目下载地址

PostgreSQL - pgvector 插件构建向量数据库并进行相似度查询花千树-010 RAG 数据库 postgresql AI编程
在现代的机器学习和人工智能应用中，向量相似度检索是一个非常重要的技术，尤其是在文本、图像或其他类型的嵌入向量的操作中。本文将介绍如何在PostgreSQL中安装pgvector插件，用于存储和检索向量数据，并展示如何通过Python脚本向数据库插入向量并执行相似度查询。一、安装PostgreSQL并配置pgvector插件1.安装PostgreSQL首先，确保你已经安装了PostgreSQL。可以
AI行业高压与人才健康：纪念Felix Hill，并探讨AI代码生成工具的价值前端
今天，我们怀着沉痛的心情悼念GoogleDeepMind研究科学家FelixHill，这位杰出的AI学者在41岁的年纪离开了我们。他的离世引发了我们对AI行业高压环境与人才健康问题的深刻反思。Felix生前曾公开表达AI行业前所未有的压力，这促使我们思考如何利用技术，例如AI代码生成器，来改善开发者的工作环境，提升效率，守护人才健康。FelixHill在自然语言处理和人工智能领域取得了令人瞩目的成
2024年AI浪潮：基础设施重构、模型演进与挑战并存前端
2024年，人工智能领域呈现出蓬勃发展的景象，投资持续增长、基础设施发生变革，技术应用加速落地。各大科技公司和初创企业纷纷涌入，试图在这一充满机遇的领域分一杯羹。本文将深入探讨2024年AI发展的三大核心趋势：AI基础设施的重构、模型发展的新趋势以及AI发展带来的挑战，并重点关注企业如何从AI投资中获得回报，以及AI智能体技术的巨大潜力。选择合适的AI代码生成器将成为企业提升效率的关键。AI基础设
直播预告丨精度优于AlphaFold，基于深度学习实现生物大分子及其互作的三维结构预测
「MeetAI4S」系列直播第6期将于1月15日19:00准时开播，HyperAI超神经有幸邀请到了南开大学统计与数据科学学院教授郑伟，他本次分享的主题是「AlphaFold3王座未稳，来自学术界的反超：基于深度学习的生物大分子及其互作的三维结构预测」。蛋白质的功能取决于其独特的三维结构，近年来，基于深度学习等人工智能技术的蛋白质结构预测发展迅猛，AlphaFold甚至获得了2024年诺贝尔化学奖
Gary Marcus 2025年AI预测：AGI仍在路上，务实发展才是王道前端
人工智能领域发展日新月异，各种预测层出不穷。知名人工智能专家GaryMarcus近期发布了对2025年AI发展趋势的25项预测，其中最引人注目的是：AGI（通用人工智能）不会在2025年出现。这与一些过于乐观甚至盲目乐观的预测形成了鲜明对比。本文将深入解读Marcus的预测，探讨其背后的逻辑，并结合当前AI技术发展现状进行分析。Marcus的预测整体基调是谨慎乐观，他既肯定了AI在特定领域的进步，
数据驱动销售预测的未来：ScriptEcho赋能高效决策前端
在瞬息万变的商业环境中，准确的销售预测是企业制定有效销售策略、实现业绩增长的基石。传统的销售预测方法往往依赖于人工分析和复杂的电子表格，效率低下，难以应对市场变化的快速冲击。然而，随着大数据的兴起和人工智能技术的飞速发展，数据驱动决策正成为现代企业提升竞争力的关键。本文将探讨销售预测面临的挑战与机遇，并重点介绍ScriptEcho如何通过AI赋能，提升销售预测的准确性和效率，助力企业实现数据驱动增
人类为何追求AGI？一个AI代码生成工具的思考前端
近年来，“AI写代码工具”的出现，无疑为软件开发领域带来了革命性的变化。而我们今天要探讨的，是关于人类对通用人工智能（AGI）的追求，以及这与AI辅助开发工具之间微妙的联系。文章开头就抛出了一个尖锐的问题：人类为何如此痴迷于AGI，而非将更多精力放在改善人类生活本身？文章作者表达了对AGI发展方向的担忧。他认为，目前对AGI的追求，更多地体现在创造能够取代人类的超级智能上，例如“少数派报告式”的行
AI代码生成工具的未来：杨立昆的洞见与AI革命前端
近年来，人工智能（AI）领域取得了令人瞩目的进展，特别是以大型语言模型为代表的AI技术，在自然语言处理、图像生成等领域展现出强大的能力。然而，深度学习先驱杨立昆（YannLeCun）却对现有的AI系统提出了尖锐的批评，他认为目前的AI系统“理解能力远不如猫”，缺乏对真实世界的理解和常识。这引发了人们对AI未来发展方向的思考，也为我们探讨AI代码生成工具，以及AI技术对人类社会的影响提供了新的视角。
零售业的AI赋能与前端开发效率革命：ScriptEcho 的助力前端
零售业正经历着前所未有的数字化转型，但同时也面临着巨大的挑战。库存管理混乱、个性化客户体验不足等问题，严重制约着零售企业的盈利能力。而人工智能（AI）的兴起，为解决这些问题提供了新的思路。通过AI驱动的实时库存管理和客户行为分析，零售企业可以显著提升运营效率和客户满意度。然而，构建这些AI赋能的零售应用，需要强大的前端开发能力，这正是AI代码生成器ScriptEcho能够发挥关键作用的地方。AI赋
AI赋能：2024年，如何用AI提升效率，我的15个实用技巧及2025年展望前端
2024年，人工智能技术突飞猛进，深刻地改变了我们的工作方式。作为一名科技领域的作者，我亲身体验了AI带来的效率提升。过去一年，我探索了各种AI工具，并将其应用于我的日常工作中，显著缩短了工作流程，节省了大量时间。本文将分享我在2024年使用AI提升生产力的15个实用技巧，并展望2025年AI可能带来的更多可能性。AI赋能下的高效创作：从代码到图像，全方位提升首先，AI极大地辅助了我的编程工作。对
AI时代的前端开发：技能提升与职业发展之路前端
在瞬息万变的科技时代，个人职业发展的重要性日益凸显。提升技能，不断学习，已经不再是锦上添花，而是立足之本，是我们在竞争激烈的职场中脱颖而出的关键。而人工智能（AI）技术的快速发展，为我们提供了前所未有的机遇，特别是对于前端开发领域，AI正以前所未有的速度改变着我们的工作方式和学习方式。AI赋能前端开发：个性化学习路径前端开发领域的技术栈庞大而复杂，涵盖HTML、CSS、JavaScript、各种框
AI赋能：加速产品开发，提升公司竞争力前端
在当今快节奏的商业环境中，产品开发效率直接关系到公司的生存和发展。然而，许多公司面临着产品开发周期长、成本高、市场响应速度慢等诸多挑战。这些挑战不仅延缓了产品上市时间，也增加了市场竞争的风险。因此，提高产品开发效率，成为企业提升核心竞争力的关键。而人工智能技术的应用，为我们提供了解决这些问题的有效途径。加速产品迭代，快速响应市场需求传统的软件开发流程往往冗长复杂，从需求分析、设计、编码到测试和上线
未来教育：AI知识库如何重塑学习体验知识管理知识库知识库软件
在科技日新月异的今天，教育领域正经历着前所未有的变革。人工智能（AI）技术的快速发展，特别是AI知识库的广泛应用，正在重塑我们的学习体验，使之变得更加高效、个性化和智能化。本文将深入探讨AI知识库如何影响未来教育，以及它如何为学习者提供前所未有的学习体验。一、AI知识库：教育领域的智能助手AI知识库，作为结合了人工智能技术的知识管理系统，不仅能够存储和处理海量信息，还能通过自然语言处理、机器学习等
AI赋能人力资源：效率提升新路径前端
引言人工智能(AI)正以前所未有的速度改变着各行各业，从自动驾驶到医疗诊断，AI的应用日益广泛。而人力资源领域，作为企业运营的核心环节，也正经历着AI带来的深刻变革。传统的人力资源管理面临诸多挑战，例如招聘效率低、候选人筛选精准度不足、员工培训成本高昂以及数据分析能力有限等。这些问题不仅影响企业的招聘速度和效率，也制约了企业的发展。为了应对这些挑战，越来越多的企业开始探索AI技术在人力资源领域的应
ai照片放大python源码_AI新时代-大牛教你使用python+Opencv完成人脸解锁（附源码）... weixin_39639505 ai照片放大python源码
好吧，伙计们，我回来了。说我拖更不写文章的可以过来用你的小拳拳狠命地捶我胸口....那么今天我们来讲关于使用python+opencv+face++来实现人脸验证及人脸解锁。代码量同样不多，你可以将这些代码运用在其它一些智能领域，如智能家居，进门的时候判断你是谁，也可以加入机器学习判断来的人是客人还是熟人。在讲之前我们会先适当的拓扑一下关于人脸识别的知识点。OK废话少说下面开始正是话题。解锁原理：
2025 年 JeecgBoot AI 低代码平台白皮书
引言随着人工智能技术的快速发展和数字化转型的深入推进，企业对AI应用的需求日益旺盛。然而，传统AI开发模式存在技术门槛高、开发周期长、成本高昂等问题，难以满足企业快速迭代和敏捷开发的需求。JeecgBoot作为一款优秀的开源低代码开发平台，拥有庞大的用户群体和丰富的功能模块。为了顺应技术发展趋势，满足用户需求，JeecgBoot计划向AI低代码平台转型，打造一款集低代码开发和AI能力于一体的新一代
AI大模型学习路线 liuhenghui5201 AI python AI 大模型
阶段1Python编程基础主要内容掌握的核心能力·Python基础语法·Python数据处理·函数·文件读写·异常处理·模块和包1、掌握Python开发环境基本配置；2、掌握运算符、表达式、流程控制语句、数组等的使用；3、掌握字符串的基本操作；4、初步建立面向对象的编程思维；5、熟悉异常捕获的基本流程及使用方式；6、掌握类和对象的基本使用方式。可解决的现实问题：熟练掌握人工智能Python语言，建
2024 年技术盘点与展望：从 AI 辅助到个人成长的多元探索 109702008 杂谈人工智能
一、引言2024年，技术领域的发展日新月异，我在这片汹涌的浪潮中不断探索与成长。这一年，我不仅见证了人工智能技术的飞速发展，还通过AI辅助创作、AI赋能编程以及参与各类竞赛与课程，实现了个人技术的显著提升与视野的拓展。本文将从总结盘点的角度，回顾我在技术领域的成长历程，并对未来进行展望。二、AI辅助创作：提升写作效率与质量在自然语言处理技术（NLP）的推动下，AI写作工具成为了我的得力助手。这些工
美图鉴赏-古风，OpenCV视频批量处理图苑 java 图像处理 AIGC opencv
publicstaticvoidmixBatch(StringoutputPath,ListvideoList,intclipDuration,intnumber,intmergeDuration,ProgressCallbackcallback)throwsException{//临时裁剪文件夹StringclipTempDir=outputPath+File.separator+"_clipT
使用QT+OpenCV+C++完成一个简单的图像处理工具 17´ 机器视觉 Qt c++qt opencv c++图像处理
目录前言初始化UI界面qss样式表优化界面QImage和Mat的类型转换按钮功能实现读取图像处理图像保存图像最终效果前言本项目在QtCreator中编写，使用qmake来配置OpenCV库，具体配置方法请看这篇文章从0到机器视觉工程师（六）:配置OpenCV和Qt环境-CSDN博客，UI界面使用代码的形式书写。接下来，让我们一起来完成这个项目吧。初始化UI界面代码boolMainWindow::I
【论文投稿】探秘计算机视觉算法：开启智能视觉新时代小周不想卷艾思科蓝学术会议投稿计算机视觉
目录引言一、计算机视觉算法基石：图像基础与预处理二、特征提取：视觉信息的精华萃取三、目标检测：从图像中精准定位目标四、图像分类：识别图像所属类别五、语义分割：理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中，计算机视觉宛如一颗璀璨的明珠，正深刻地改变着我们与世界的交互方式。从安防监控中的精准识别，到自动驾驶汽车的智能导航；从医疗影像的辅助诊断，到工业生产中的缺陷检测，计算
什么是多模态机器学习：跨感知融合的智能前沿非凡暖阳人工智能神经网络
在人工智能的广阔天地里，多模态机器学习（MultimodalMachineLearning）作为一项前沿技术，正逐步解锁人机交互和信息理解的新境界。它超越了单一感官输入的限制，通过整合视觉、听觉、文本等多种数据类型，构建了一个更加丰富、立体的认知模型，为机器赋予了接近人类的综合感知与理解能力。本文将深入探讨多模态机器学习的定义、核心原理、关键技术、面临的挑战以及未来的应用前景，旨在为读者勾勒出这一
使用Llama 3.2-Vision多模态LLM与您的图像聊天 AI程序猿人 llama transformer pytorch 深度学习大模型应用人工智能大模型
介绍将视觉能力与大型语言模型（LLMs）结合的多模态LLM（MLLM）正在通过多模态LLM革命性地改变计算机视觉领域。这些模型结合了文本和视觉输入，展示了在图像理解和推理方面的出色能力。虽然这些模型以前只能通过API访问，但最近的开源选项现在允许本地执行，使其在生产环境中更具吸引力。在此教程中，我们将学习如何使用开源的Llama3.2-Vision模型与图像进行聊天，你会对其OCR、图像理解和推理
谷歌吹响反击号角：2025年Gemini用户目标5亿，AI大战一触即发！ that's boy 人工智能 chatgpt openai AI工具 AI编程 google gemini
人工智能领域的竞争日趋白热化，谷歌CEO桑达·皮采亲自下场，为GeminiAI定下了雄心勃勃的目标：到2025年底，用户突破5亿！面对ChatGPT的强势崛起，谷歌能否成功逆袭？本文将深入剖析谷歌的战略布局、Gemini的技术优势以及未来AI竞争的格局。谷歌的反击：5亿用户的雄心壮志在过去几年，OpenAI凭借ChatGPT的强大实力，几乎垄断了AI领域的聚光灯。谷歌虽然在AI技术研究方面一直处于
AI大模型如何赋能电商行业，引领变革虞书欣的C 人工智能开发语言
•个性化推荐：利用机器学习算法分析用户的历史购买记录、浏览行为和喜好，生成个性化的产品推荐列表，提升用户的购买意愿和满意度。•优化用户体验：•智能搜索引擎：运用自然语言处理技术，优化搜索引擎，让用户能够通过自然语言进行搜索。•虚拟客服：通过聊天机器人和语音助手，提供24/7的客户支持，快速解答用户咨询。•图像识别：利用计算机视觉技术，用户可以通过拍照识别商品，快速找到相似商品或进行排版搭配推荐。•
AI大模型引领医疗变革：十大创新应用场景塑造智慧医疗新时代和老莫一起学AI 人工智能自动化数据库学习语言模型大模型
前言在人工智能技术的迅猛发展中，AI大模型以其无与伦比的数据处理能力和深度学习能力，正逐步成为医疗健康领域变革的引领者。本文旨在深入探讨AI大模型在医疗领域的十大创新应用场景，展示其如何显著提升医疗服务效率、赋能临床决策，并推动整个行业向智能化转型。一、智能化诊疗：精准辅助，提升诊断效率AI大模型凭借对海量医疗数据的深度分析，能够协助医生进行更为精准的诊断。例如，百度灵医大模型凭借强大的数据处理能
Delphi代码编写标准指南好大的牛角
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！·日月光华精华区文章阅读发信人:Delphii(Delphi),信区:VCL标题:Delphi编码规则发信站:日月光华站(FriSep712:03:072001),站内信件Delphi代码编写标准指南■■■■■■
4.opencv函数--cv2.findContours xf8964 openCV openCV python findContours
该函数是查找图片轮廓，函数接收二值图片，函数原型cv2.findContours(image,mode,method,contours=None,hierarchy=None,offset=None)参数说明：image：原图mode：轮廓的检索模式，有四种，常用的是cv2.RETR_EXTERNAL枚举说明cv2.RETR_EXTERNAL表示只检测外轮廓cv2.RETR_LIST检测的轮廓不建
“AI 自动化效能评估系统：开启企业高效发展新征程上海拔俗网络 java 团队开发
在当今数字化飞速发展的时代，企业面临着日益激烈的市场竞争，如何提升效率、降低成本成为了企业生存与发展的关键。AI自动化效能评估系统应运而生，它如同一把智能钥匙，为企业开启了高效发展的新征程。AI自动化效能评估系统，简单来说，就是利用人工智能技术对企业的各项业务流程、生产环节以及员工工作表现等进行全方位、自动化的评估。它能够快速收集海量的数据，并通过先进的算法模型对这些数据进行深度分析，从而精准地判
3d系统误差分析 Ai智享结构光 3d 数码相机计算机视觉
系统标定重投影误差预估在计算机视觉和三维重建领域中，评估一个相机系统标定精度的重要指标。通过比较真实的三维点在图像中的投影位置与标定模型计算出的投影位置之间的差异，来衡量标定的准确性。以下是对这一概念的详细解析：什么是系统标定？系统标定(SystemCalibration)是指对一个视觉系统（例如单目相机、双目相机系统或结构光系统）进行参数标定的过程，包括：内参标定：相机的内部参数（如焦距、光心、
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

基于opencv的试卷检测识别

from get_data import *

你可能感兴趣的:(opencv,人工智能,计算机视觉)