查尔char

BP神经网络实现手写数字识别Python实现，带GUI手写画板

BP神经网络实现手写数字识别

BP神经网络模型
用tkinter编写用于手写输入的画板
程序运行的效果截图

在B站看了一个机器学习基础的视频（链接）后，发现到资料里面有一个用BP神经网络对手写数字进行分类的模型。有一天晚上躺在床上，突然灵感一来，何不把这个样本改造成一个真正可以进行手写数字识别的程序？用手机查了一下tkinter画图（对tkinter比较熟），稍微看了一下感觉应该可以实现，就下决定把它做出来，一方面也可以巩固学到的知识。一共花了20多个小时，80%的时候花在调教tkinter上了。。。

GitHub下载链接：点我
CSDN资源中心下载链接：点我

下面就是整个程序的内容。

需要导入的模块

import tkinter
from tkinter import *
from tkinter import ttk, Frame, Tk, messagebox, Menu
from PIL import Image, ImageDraw
import pickle
import csv
import numpy as np
from sklearn.datasets import load_digits
from sklearn.preprocessing import LabelBinarizer
from sklearn.model_selection import train_test_split

BP神经网络模型

这个模型有3层神经网络，每层神经元个数分别为64,100,50 。
数据集来自于sklearn自带的手写数字数据集。
数据集的每个样本有64个特征，这是由8x8的图片提取每一个像素的灰度值得来的。每一个样本最后还有一个手动添加的偏置值。
每个样本的标签是手写图片对应的数字，即0~9 。通过one-hot编码后，变成10个输出。（刚接触神经网络，对于这一点的其实我不是很理解，10个输出和1个输出具体有什么差别？）
所以神经网络的输入是65个值，输出是10个值。

def sigmoid(x):
    return 1/(1+np.exp(-x))

def dsigmoid(x):
    return x*(1-x)

class NeuralNetwork:
    def __init__(self,layers):  # (64,100,50,10)
        # 权值的初始化，范围-1到1
        self.U = np.random.random((layers[0]+1,layers[1]+1))*2-1
        self.V = np.random.random((layers[1]+1,layers[2]+1))*2-1
        self.W = np.random.random((layers[2]+1,layers[3]))*2-1
        
    def train(self,X,y,X_test,y_test,lr=0.11,epochs=10000):
        # 添加偏置
        temp = np.ones([X.shape[0],X.shape[1]+1])
        temp[:,0:-1] = X  # 最后一列都是1
        X = temp
        
        for n in range(epochs+1):
            i = np.random.randint(X.shape[0]) # 随机选取一个数据
            x = [X[i]]
            x = np.atleast_2d(x)  # 转为2维数据 (1, 65)

            L0 = sigmoid(np.dot(x,self.U))
            L1 = sigmoid(np.dot(L0,self.V))  # 隐层输出
            L2 = sigmoid(np.dot(L1,self.W))  # 输出层输出
            
            L2_delta = (y[i]-L2)*dsigmoid(L2)
            L1_delta= L2_delta.dot(self.W.T)*dsigmoid(L1)
            L0_delta= L1_delta.dot(self.V.T)*dsigmoid(L0)
            
            self.W += lr*L1.T.dot(L2_delta)
            self.V += lr*L0.T.dot(L1_delta)
            self.U += lr*x.T.dot(L0_delta)
            
            #每训练1000次预测一次准确率
            if n%1000==0:
                predictions = []
                for j in range(X_test.shape[0]):
                    o = self.predict(X_test[j])
                    predictions.append(np.argmax(o)) # 获取预测结果
                self.accuracy = np.mean(np.equal(predictions,y_test))
                print('epoch:',n,'accuracy:',self.accuracy)
        
    def predict(self,x):
        #添加偏置
        temp = np.ones(x.shape[0]+1)
        temp[0:-1] = x
        x = temp
        x = np.atleast_2d(x) # 转为2维数据
        
        L0 = sigmoid(np.dot(x,self.U))
        L1 = sigmoid(np.dot(L0,self.V))  # 隐层输出
        L2 = sigmoid(np.dot(L1,self.W))  # 输出层输出
        
        return L2

用tkinter编写用于手写输入的画板

接下来的是，用tkinter做一个手写输入的GUI界面。这样才算是一个完整的手写输入识别程序。

class Window(Frame):
    
    def __init__(self, master= None):
        super().__init__()
        self.master = master
        self.init_window()
        
        # 记录最后绘制图形的id
        self.lastDraw = 0
        
        # 前景色
        self.foreColor = '#000000'
        self.backColor = '#FFFFFF'
        
        #控制是否允许画图的变量，1：允许，0：不允许
        self.yesno = tkinter.IntVar(value=0)
        #控制画图类型的变量 
        self.what = tkinter.IntVar(value=1)

        # 记录鼠标位置的变量
        self.X = tkinter.IntVar(value=0)
        self.Y = tkinter.IntVar(value=0)

        self.samples = np.array([])  # 保存手写数字的样本
        self.labels = np.array([])  # 保存样本对应的数字标签

        
    def init_window(self):
        self.master.title('手写数字识别demo')
        
        menubar = Menu(self.master)
        self.master.config(menu=menubar)
        
        menu = Menu(menubar)
        menu.add_command(label="训练新的模型", command=self.retrainning)
        menu.add_command(label="训练新的模型（含新样本）", command=self.train_with_newsample)
        menu.add_command(label="关于", command=self.aboutme)
        menubar.add_cascade(label="菜单", menu=menu)

        self.frame_info = ttk.LabelFrame(self.master, text='Info: ' )
        self.frame_info.place(x=15,y=0)
        self.infoLabel = ttk.Label(self.frame_info, text="使用提示: 写字→载入模型→数字识别→保存样本(可选)",anchor="center",font=("微软雅黑",9))
        self.infoLabel.pack(fill=tkinter.BOTH, expand=tkinter.YES)
        
        self.frame_pad = ttk.LabelFrame(self.master, text="写字区")
        self.frame_pad.place(x=10, y=50, width=200, height=200)
        
        # 创建画布
        image = tkinter.PhotoImage()
        self.canvas = tkinter.Canvas(self.frame_pad, bg='white', width=200, height=200)
        self.canvas.create_image(120, 120, image=image)
        self.canvas.bind('', self.onLeftButtonMove)
        self.canvas.bind('', self.onLeftButtonDown)
        self.canvas.bind('', self.onLeftButtonUp)
        self.canvas.pack(fill=tkinter.BOTH, expand=tkinter.YES)
        self.base = Image.new("RGB", (200, 200), (255,255,255))
        self.d = ImageDraw.Draw(self.base)
        
        action_frame = ttk.Frame(root)
        action_frame.place(x=225,y=65,width=70,height=150)
        button_cl = ttk.Button(action_frame, text="重写", command=self.Clear)        
        button_cl.pack(pady=5)
        button_start = ttk.Button(action_frame, text="载入模型", command=self.load_model)
        button_start.pack(pady=15)
        button_reg = ttk.Button(action_frame, text="数字识别", command=self.predict)
        button_reg.pack(pady=5)  
       
        self.frame2 = ttk.LabelFrame(self.master, text="数字识别结果")
        self.frame2.place(x=320, y=50, width=150, height=150)
        image2 = tkinter.PhotoImage()
        self.canvas2 = tkinter.Canvas(self.frame2, bg='white', width=200, height=200)
        self.canvas2.create_image(120, 120, image=image2)
        self.canvas2.pack(fill=tkinter.BOTH, expand=tkinter.YES)
        
        self.label = ttk.Label(self.master, text="输入数字作\n为样本标签",anchor="center",font=("微软雅黑",10))
        self.label.place(x=290,y=215,width=120,height=60)
        self.numEntry = Entry(self.master)
        self.numEntry.place(x=250,y=230,width=50,height=30)
        button_save = ttk.Button(self.master, text="保存样本", command=self.saveSample)
        button_save.place(x=400,y=230,width=70,height=30)


    # 按住鼠标左键移动，画图
    def onLeftButtonMove(self,event):
        # global lastDraw
        if self.yesno.get()==0:
            return
        if self.what.get()==1:
            #使用当前选择的前景色绘制曲线
            # canvas.create_line(X.get(), Y.get(), event.x, event.y, width=8, fill=foreColor)
            self.canvas.create_oval(self.X.get(), self.Y.get(), event.x, event.y, width=8, fill=self.foreColor)
            self.d.line([self.X.get(), self.Y.get(), event.x, event.y],
                    width=8,
                    fill='black')

            self.X.set(event.x)
            self.Y.set(event.y)
        
        # 鼠标左键单击，允许画图
    def onLeftButtonDown(self,event):
        self.yesno.set(1)
        self.X.set(event.x)
        self.Y.set(event.y)
        if self.what.get()==4:
            self.canvas.create_text(event.x, event.y, text=text)

    # 鼠标左键抬起，不允许画图
    def onLeftButtonUp(self,event):
        self.yesno.set(0)
        self.lastDraw = 0
        
    # 添清除
    def Clear(self):
        # pillow的img对象重新画成白色的
        self.d.rectangle([0,0,200,200],fill='white')
        
        # 删除tkinter canvas的所有对象
        for item in self.canvas.find_all():
            self.canvas.delete(item)
        for item in self.canvas2.find_all():
            self.canvas2.delete(item)
            
        self.label['text'] = "输入数字作\n为样本标签"
        self.label['foreground'] = ['black']

    # 训练模型
    def trainning(self,newSample=None):
        digits = load_digits()  # 载入数据
        X = digits.data  # 数据
        y = digits.target  # 标签
        # 输入数据归一化
        X -= X.min()
        X /= X.max()

        if newSample is not None:
            X = np.concatenate((X, newSample[:,:-1]))
            y = np.concatenate((y, newSample[:,-1].astype(int)))
            
        nm = NeuralNetwork([64,100,50,10]) # 创建网络

        X_train,X_test,y_train,y_test = train_test_split(X,y)
        # labels_train = LabelBinarizer().fit_transform(y_train)
        # labels_test = LabelBinarizer().fit_transform(y_test)
        # 用numpy进行onehot得到的是浮点数，须要修改一下数据格式。
        labels_train = np.eye(10)[y_train].astype(np.int16)
        labels_test = np.eye(10)[y_test].astype(np.int16)

        print('start')
        nm.train(X_train,labels_train,X_test,y_test,epochs=20000)
        print('end')
        
        return nm


    def train_with_newsample(self):
        try:
            new_samples = np.genfromtxt('mysamples.csv', delimiter=',')
            
            if len(new_samples) > 5:
                self.model = self.trainning(newSample=new_samples)
            else:
                self.infoLabel['text'] = '提示：mysamples.csv文件没有足够的新样本'
                self.infoLabel['foreground'] = ['red']
        except:
            self.infoLabel['text'] = '提示：当前目录未找到mysamples.csv文件，或数据格式有误！'
            self.infoLabel['foreground'] = ['red']
        
        
    def retrainning(self):
        print('retrainning...')
        self.infoLabel['text'] = '提示：正在训练新的模型。。。'
        self.infoLabel['foreground'] = ['blue']
        self.model = self.trainning()
            
        with open('nmModel.pkl', 'wb') as pkl:
            pickle.dump(self.model, pkl, pickle.HIGHEST_PROTOCOL)
            self.infoLabel['text'] = '提示：新模型训练完成！'
            self.infoLabel['foreground'] = ['blue']

        
    def load_model(self):
        try:
            pkl = open('nmModel.pkl', 'rb')
            self.model = pickle.load(pkl)
            
        except:
            self.infoLabel['text'] = '提示：未找到本地模型，正在训练新的模型。'
            self.infoLabel['foreground'] = ['red']
            self.model = self.trainning()
            
            with open('nmModel.pkl', 'wb') as pkl:
                pickle.dump(self.model, pkl, pickle.HIGHEST_PROTOCOL)
        finally:
            self.infoLabel['text'] = '提示：模型加载完成'
            self.infoLabel['foreground'] = ['blue']
            

    def predict(self):
        
        preproces = self.pre_job()
        if not preproces:
            return
        
        for item in self.canvas2.find_all():
            self.canvas2.delete(item)

        try:
            result = self.model.predict(self.test)
        except AttributeError:
            self.canvas2.create_text(18, 65,
            text = '模型未加载\n或加载失败\n请重载模型',
            font = ("微软雅黑", 16, "bold"),
            fill= "red",
            anchor = W,
            justify = LEFT)

            return
        
        print(np.argmax(result))
        
        titleFont = ("微软雅黑", 50, "bold")
        self.canvas2.create_text(45, 65,
            text = np.argmax(result),
            font = titleFont,
            fill= "Turquoise",
            anchor = W,
            justify = LEFT)

    def pre_job(self):
        img = self.base
        x,y = img.size
        img = img.convert('L')
        raw_data = img.load()
        
        "这里有点奇怪，横纵颠倒了？"
        "行列和横纵坐标"
        L = [[raw_data[j, i] for j in range(img.size[0])] for i in range(img.size[1])]
        L_arry = np.array(L)
        print(L_arry.shape)
        
        row_member = L_arry.sum(axis=1) < 245*img.size[0]
        col_member = L_arry.sum(axis=0) < 245*img.size[1]

        # 图片裁剪的边缘
        r_cs = row_member.cumsum()
        
        if r_cs.max() < 2:
            # 过滤少于2行非白色像素，即没有画数字的情况
            self.canvas2.create_text(15, 38,
            text = '请先在写字\n区写数字',
            font = ("微软雅黑", 18, "bold"),
            fill= "red",
            anchor = W,
            justify = LEFT)
            
            return
            
        y_min =np.argwhere(r_cs == 1)[0,0] - 1 # 第一个非纯白的列
        y_max = r_cs.argmax() + 1

        c_cs = col_member.cumsum()
        x_min = np.argwhere(c_cs == 1)[0,0] - 1
        x_max = c_cs.argmax() + 1
        
        # 要裁剪成矩形，需要检查一下横竖边
        x_len = x_max - x_min
        y_len = y_max - y_min
        if y_len - x_len > 0:
            x_min = x_min - int(1/2 * (y_len - x_len))
            if x_min < 0:
                x_min = 0
            x_max = x_min + y_len
        elif y_len - x_len < 0:
            y_min = y_min - int(1/2 * (x_len - y_len))
            if y_min < 0:
                y_min = 0
            y_max = y_min + x_len
            
        new = img.crop((x_min, y_min, x_max, y_max))
        print(new.size)
        
        new = new.resize((8, 8))  # 裁剪成和训练数据一样的尺寸
        new_data = new.load()
        new_array = np.array([[new_data[j, i] for j in range(8)] for i in range(8)])
        print(new_array.shape)
        
        test = (255 - new_array) / 255
        
        self.test = np.r_[test.ravel()]
            
        print(self.test)

        return 'Done'


    def saveSample(self):
        target = self.numEntry.get()
        print(type(target))
        
        try:
            print(self.test.shape)
        except:
            preproces = self.pre_job()
            if not preproces:
                return
        
        if target.isdigit():
            print(self.test.shape)
            if self.test.shape != (64,):
                self.label['text'] = '样本数据格式\n有误，请重试'
                self.label['foreground'] = ['red']
                return
            
            print(target)
            self.label['foreground'] = ['black']
            
            with open('mysamples.csv','a', newline='') as csvfile:
                # obj = self.test.append(int(target))
                obj = self.test.tolist()
                obj.append(int(target))
                print(obj)
                writer = csv.writer(csvfile)
                writer.writerow(obj)
                print('Save!')
                
                self.label['text'] = '保存成功'
                self.label['foreground'] = ['blue']

        else:
            self.label['text'] = '先输入数字作\n为样本的标签'
            self.label['foreground'] = ['red']

            
    def aboutme(self):
        messagebox.showinfo("关于","\n\n基于神经网络和sklearn的digit数据集编写的手写数字识别demo\n\n"
                                   "Recognizer for handwritten numeral-v0.01\n\n"
                                   "                                         Copyright by 查尔Char\n"
                                   "                                          All Rights Reserved")

最后再加上主程序运行的声明，就完成了。

if __name__ == '__main__':
    root = Tk()
    sw = root.winfo_screenwidth()
    sh = root.winfo_screenheight()
    ww = 500
    wh = 300
    x = (sw-ww) / 2 - 100
    y = 200
    root.geometry("%dx%d+%d+%d" % (ww, wh, x, y))
    app = Window(root)
    root.mainloop()

程序运行的效果截图

二层神经网络的效果

三层神经网络的效果（和两层的效果感觉差别不大）

初步测试，感觉7较难识别正确，很大概率会被识别为3 。

当然，这神经网络是一个很简单的系统，还有sklearn里面对于图像的处理我也不清楚，只是按照个人理解进行转换，正确率比较低也可能跟我数据转换有关系。

菜单里面放了一个把新的手写样本加入到训练数据里的选项。方便对错误率比较高的数字进行训练。
通过简单的修改，这个程序也可以变成识别手写英文字母的（大概？）。

基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
【Python机器学习】2.2. 聚类分析算法理论：K均值聚类(KMeans Analysis)、KNN(K近邻分类)、均值漂移聚类(MeanShift) SomeB1oody Python机器学习机器学习算法 python 聚类分类算法
喜欢的话别忘了点赞、收藏加关注哦（关注即可查看全文），对接下来的教程有兴趣的可以关注专栏。谢谢喵！(=･ω･=)2.2.1.K均值聚类(KMeansAnalysis)K均值算法是以空间中K个点为中心进行聚类，对最靠近他们的对象归类，是聚类算法中最为基础但也最为重要的算法。数学原理计算数据点与各簇中心点的距离：dist(xi,ujt){dist}(x_i,u_j^t)dist(xi,ujt)然后根据
Python多版本环境管理UV 坐吃山猪 Python python uv 开发语言
Python多版本环境管理UV1-参考网址Python虚拟环境UV管理工具-官网Python虚拟环境UV管理工具-快速开始pyproject.toml使用指导2-核心知识点1）python项目维护requirements.txt2）python机器学习环境Anaconda3）python轻量级环境管理uv4）uvx快速上手使用3-上手实操1-安装UV虚拟环境管理工具UV官网安装教程#Windows
机器学习专栏博文汇总 python游乐园机器学习机器学习人工智能合集
本篇汇集了Python游乐园中机器学习专栏博文，会持续更新，需要的小伙伴可以收藏一下Python机器学习实战：基于不同机器学习算法的鸢尾花数据集分析机器学习常见问题：过拟合及其处理方式结构化数据和非结构化数据的区别是什么如何选择合适的机器学习算法来处理非结构化数据可用于文本分析的机器学习算法都有哪些Python机器学习实战：遗传算法机器学习基础：什么是启发式算法机器学习中常用的调节参数的方法（附P
00_01 python机器学习_环境搭建辛　欣机器学习 python sklearn
机器学习环境的搭建Windows+Python3Python3下载地址python环境设置安装尽量安装在自定义目录下,方便查找,其他选项都用默认值就行.安装成功后,cmd里输入python校验.下载用于机器学习的虚拟环境的包>python-mpipvirtualenv初始化虚拟环境#进入到自定义要保存环境的位置>cdxxxxxx#.venv是新创建的用于存放机器学习必要包的文件夹,名字可以随意起,
Python机器学习实战：使用Flask构建机器学习API AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：使用Flask构建机器学习API作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域，模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程，难以实现模型的自动化、可视化和复现。为了解决这一问题，将机器学习模型封装成可访问的API变得越来越流行。Fla
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务1.背景介绍1.1问题的由来翻译是跨语言沟通的重要桥梁，随着全球化进程的加速，翻译需求日益增长。传统的机器翻译方法主要依赖于规则和统计方法，如基于短语的翻译、基于统计的机器翻译等。然而，这些方法难以处理复杂的语言现象，翻译质量参差不齐。近年来，随着深度学习技术的快速发展，基于神经网络序列到序列（Sequence-to-Seq
python 支持向量机回归_深入浅出python机器学习---支持向量机SVM 笔记0114-2020 weixin_39864387 python 支持向量机回归
题前故事：小D最近也交了一个女朋友，但是这个女孩好像非常情绪化，喜怒无常，让小D捉摸不透，小D女朋友的情绪完全不是“线性可分”的，于是小D想到了SVM算法，也就是大名鼎鼎的一一支持向量机。支持向量机理解引入首先需要知道线性可分和线性不可分的概念我们提取样本特征是“是否有妹子”和“是否有好吃的”这两项的时候，能够很容易用图中的直线把男生的情绪分成“开心”和“不开心”两类，这种情况下我们说样本是线性可
python程序员工资高吗？ lmseo5hy python培训 python程序员
据统计数据显示，北京Python平均薪资为18860元，Python不同岗位薪资范围为：Python全栈开发工程师（10k-20K）、Python运维开发工程师（15k-20K）、Python高级开发工程师（15k-30K）、Python大数据工程师（15K-30K）、Python机器学习工程师（15k-30K）、Python架构师（20k-40k）等，相比于Java、PHP、C#等其他的编程语言
Python 机器学习基础之算法链与管道【算法链与管道/预处理进行参数选择/构建管道/在网格搜索中使用管道】的简单说明仙魁XAN Python 机器学习基础+实战案例 python 机器学习算法链管道网格搜索
Python机器学习基础之算法链与管道【算法链与管道/预处理进行参数选择/构建管道/在网格搜索中使用管道】的简单说明目录Python机器学习基础之算法链与管道【算法链与管道/预处理进行参数选择/构建管道/在网格搜索中使用管道】的简单说明一、简单介绍二、算法链与管道1、算法链与管道的概念2、使用Pipeline的示例3、关键点说明三、用预处理进行参数选择四、构建管道五、在网格搜索中使用管道1、举例说
Python 机器学习基础之模型评估与改进【评估指标与评分】的简单说明仙魁XAN Python 机器学习基础+实战案例 python 机器学习模型评估与改进评估指标与评分召回率
Python机器学习基础之模型评估与改进【评估指标与评分】的简单说明目录Python机器学习基础之模型评估与改进【评估指标与评分】的简单说明一、简单介绍二、评估指标与评分1、牢记最终目标2、二分类指标1）错误类型2）不平衡数据集3）混淆矩阵4）考虑不确定性5）准确率-召回率曲线6）受试者工作特征（ROC）与AUC3、多分类指标4、回归指标5、在模型选择中使用评估指标附录一、参考文献一、简单介绍Py
深入探索Python机器学习算法：模型评估数据攻城小狮子 Python机器学习 python 机器学习算法 sklearn 人工智能
深入探索Python机器学习算法：模型评估文章目录深入探索Python机器学习算法：模型评估模型评估1.数据集划分1.1划分原则和方法1.2交叉验证技术1.3不同数据集划分方法的适用性2.评估指标分析2.1分类任务评估指标2.2回归任务评估指标2.3不同评估指标的选择和比较3.模型评估的注意事项3.1避免数据泄露问题3.2评估指标的稳定性和可靠性模型评估1.数据集划分1.1划分原则和方法在机器学习
深入解析Python机器学习库Scikit-Learn的应用实例 caihuayuan5 面试题汇总与解析 spring boot java 后端大数据课程设计
深入解析Python机器学习库Scikit-Learn的应用实例随着人工智能和数据科学领域的迅速发展，机器学习成为了当下最炙手可热的技术之一。而在机器学习领域，Python作为一种功能强大且易于上手的编程语言，拥有庞大的生态系统和丰富的机器学习库。其中，Scikit-Learn作为Python中一个重要的机器学习库，包含了许多常用的机器学习算法和工具，可用于数据挖掘、数据分析和预测建模等应用场景。
python数据预处理技术与实践期末考试_Python机器学习手册：从数据预处理到深度学习... 坂田月半
内容简介O'ReillyMedia,Inc．介绍第1章向量、矩阵和数组1.0简介1.1创建一个向量1.2创建一个矩阵1.3创建一个稀疏矩阵1.4选择元素1.5展示一个矩阵的属性1.6对多个元素同时应用某个操作1.7找到最大值和最小值1.8计算平均值、方差和标准差1.9矩阵变形1.10转置向量或矩阵1.11展开一个矩阵1.12计算矩阵的秩1.13计算行列式1.14获取矩阵的对角线元素1.15计算矩阵
PYTHON机器学习小项目教程：预测鸢尾花种类 jackispy python 机器学习人工智能
我们将使用经典的鸢尾花数据集来构建一个分类模型，该数据集包含150个样本，每个样本有四个特征：花萼长度、花萼宽度、花瓣长度和花瓣宽度。目标是根据这些特征预测鸢尾花的种类（山鸢尾、变色鸢尾或维吉尼亚鸢尾）。一、环境配置首先，确保你已经安装了必要的库。如：pandas、numpy等，命令如下所示pipinstallnumpypandasscikit-learnmatplotlib[-i镜像源网站]二、
【Rust】——使用Drop Trait 运行清理代码和Rc＜T＞引用计数智能指针 Y小夜 Rust（官方文档重点总结）rust 开发语言后端
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，Python机器学习等主页链接：Y小夜-CSDN博客目录使用DropTrait运行清理代码通过std::mem::drop提早丢弃值
Python机器学习库之scikit-llm使用详解 Rocky006 python 开发语言
概要Pythonscikit-llm库是一个用于机器学习的强大工具，它基于scikit-learn库并扩展了一些机器学习算法和功能，可以帮助开发者更轻松地进行机器学习模型的训练和评估。安装可以使用pip工具来安装Pythonscikit-llm库：pip install scikit-llm安装完成后，就可以开始使用scikit-llm库进行机器学习任务了。特性支持多种机器学习算法，如线性回归、逻
Python机器学习舆情分析项目案例分享数澜悠客数字化转型 python 机器学习开发语言
数据收集与准备1.数据收集多样化数据源：从社交媒体平台（如微博、Twitter）、新闻网站、论坛等多渠道收集数据，以获取更全面的舆情信息。可以使用Python的requests库和网页解析库（如BeautifulSoup）进行网页数据爬取，使用Tweepy库获取Twitter数据。数据标注：对于监督学习，需要对收集到的数据进行标注，标记为积极、消极或中性等类别。可以使用人工标注的方式，也可以利用半
python 学习路线 Coding Happily python 学习 windows
学习顺序《python编程：从入门到实践》《Head-FirstPython》《“笨方法”学python3》《PythonCookbook》《Python机器学习基础教程》《FluentPython》《Python编程》《Python编程：从入门到实践》变量变量命名：仅用小写和下划线。变量本质:指向特定的值。字符串在字符串中使用变量：f’{varies1}{varies2}’更早版本:‘{}{}’
Python机器学习实战：独热编码 python游乐园机器学习 python 机器学习人工智能
独热编码（One-HotEncoding）是一种用于将分类数据转换为适合机器学习算法处理的数值型数据的编码技术。基本概念在机器学习中，很多算法要求输入的数据是数值型的，但实际数据中常常包含分类变量，比如颜色（红、绿、蓝）、性别（男、女）等。独热编码就是为了解决这个问题而设计的，它将每个类别变量转换为一个二进制向量。原理对于一个具有n个不同类别的分类变量，独热编码会创建一个长度为n的二进制向量。在这
【Python三方库】Python机器学习开源库之dlib库的简介、安装、使用方法、示例代码、注意事项等详细攻略 I'mAlex Python三方库 python 机器学习开源
dlib是一个强大且多功能的库，广泛应用于计算机视觉领域。本文详细介绍了dlib的简介、安装及使用方法，包括面部检测、特征点检测和人脸识别等功能。通过这些基本功能的示例，你可以逐步深入了解并实际应用dlib库，解决更多复杂的计算机视觉问题。掌握dlib库不仅能提升你的编程技能，还能为你以后在计算机视觉领域的研究与应用打下坚实的基础。希望这篇文章能让你更好地理解和使用dlib库，开启你的计算机视觉之
Python机器学习实战：主成分分析(PCA)的原理和实战操作 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python机器学习实战：主成分分析(PCA)的原理和实战操作1.背景介绍1.1什么是主成分分析(PCA)？主成分分析（PrincipalComponentAnalysis，PCA）是一种常用的无监督学习算法，用于数据降维和特征提取。它通过线性变换将原始高维数据映射到低维空间，同时保留数据的主要特征和信息。PCA的目标是找到数据中最主要的方向（主成分），沿着这些方向对数据进行投影，从而实现降维。1
Python机器学习实战：人脸识别技术的实现和挑战 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python机器学习实战：人脸识别技术的实现和挑战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：人脸识别技术,模型训练,多人识别,动态人脸检测,应用场景1.背景介绍1.1问题的由来随着科技的进步和互联网的普及，人脸识别技术因其在安全验证、生物特征识别、智能监控等多个领域的广泛应用而迅速崛起。从传统的门禁系统到现代的人脸支付、社交媒体的自动登
python（scikit-learn）实现k均值聚类算法嘿哈哈哈哈哈哈机器学习聚类 python 算法机器学习人工智能
k均值聚类算法原理详解示例为链接中的例题直接调用python机器学习的库scikit-learn中k均值算法的相关方法fromsklearn.clusterimportKMeansimportnumpyasnpimportmatplotlib.pyplotaspltx=np.array([[0,2],[0,0],[1,0],[5,0],[5,2]])#计算k均值聚类kmeans=KMeans(n_
Scikit-learn提供了哪些机器学习算法以及如何使用Scikit-learn进行模型训练和评估 Java资深爱好者机器学习 scikit-learn 算法
Scikit-learn库的使用一、Scikit-learn提供的机器学习算法Scikit-learn（通常简称为sklearn）是一个广泛使用的Python机器学习库，它提供了多种用于数据挖掘和数据分析的算法。Scikit-learn支持的机器学习算法可以大致分为以下几类：分类算法：支持向量机（SVM）随机森林（RandomForest）逻辑回归（LogisticRegression）朴素贝叶斯
超实用的Python机器学习教程 - 基于scikit - learn库 AI_DL_CODE 人工智能 python 机器学习人工智能
一、机器学习简介机器学习的定义与概念机器学习是一门多领域交叉学科，它涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。简单来说，机器学习是让计算机从数据中学习规律并进行预测或决策的技术。它旨在构建能够自动从数据中学习模式并进行改进的算法，而无需被明确编程来执行特定任务。例如，我们可以让机器学习算法通过分析大量的历史天气数据来预测未来的天气情况，或者通过分析用户的购物历史来推荐可能感兴趣
Python 机器学习基础之【常用机器学习库】 NumPy 数值计算库仙魁XAN Python 机器学习基础+实战案例 python 机器学习 numpy 数值计算
Python机器学习基础之【常用机器学习库】NumPy数值计算库目录Python机器学习基础之【常用机器学习库】NumPy数值计算库一、简单介绍二、Numpy基础1、安装NumPy2、导入NumPy3、创建数组4、数组操作5、常用函数6、矩阵运算7、广播机制8、随机数三、在机器学习中使用到Numpy的简单示例1、数据预处理1.1数据归一化1.2数据标准化2、特征工程1.1多项式特征3、简单线性回归
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

BP神经网络实现手写数字识别Python实现，带GUI手写画板