【手写数字识别】数据挖掘实验二

文章目录

  • Ⅰ、项目任务要求
    • 任务描述:
    • 主要任务要求(必须完成以下内容但不限于这些内容):
  • II、方法思想及实现原理陈述(20分)
    • 算法思想和实现原理
    • 数据集描述
    • 实验运行环境描述
    • 不同方法对MNIST数据集分类识别结果分析(不同方法识别对比率表及结果分析)
  • III、实验结果分析(30分)
  • IV、代码实现(50分)
  • V、小组分工及贡献比

用PyTorch实现MNIST手写数字识别(最新,非常详细)

Ⅰ、项目任务要求

任务描述:

  • 图像识别(Image Recognition)是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。机器学习领域一般将此类识别问题转化为分类问题。

  • 手写识别是常见的图像识别任务。计算机通过手写体图片来识别出图片中的字,与印刷字体不同的是,不同人的手写体风格迥异,大小不一,造成了计算机对手写识别任务的一些困难。 数字手写体识别由于其有限的类别(0~9共10个数字)成为了相对简单的手写识别任务。

  • 此实验内容:分别采用决策树、KNN、朴素贝叶斯、SVM、BP、softmax、adaboost、袋装八种浅层学习分类方法中的任意二种方法(适于二人组)或 三种(适于三人组)对MNIST公共数据集、HWDG私有数据集进行分类,并写出实验结果分析。

  • 说明:也可以多选方法做,比如四种、五种等。

主要任务要求(必须完成以下内容但不限于这些内容):

  • 1、采用MNIST公共数据集或采用HWDG数据集为私有数据集,用爬虫工具或手工制作,有0-9手写数字共10类,样本总数不少于60个(相当于找60个人,每人都手写0-9数字,分别做好标签存成图片后再制成样本集。)
  • 2、简述算法思想和实现原理。
  • 3、写出实验结果分析:
    • (1) 数据集描述。包括数据集介绍、训练集和测试集介绍等。

    • (2) 实验运行环境描述。如开发平台、编程语言、调参情况等。

    • (3) 不同方法对MNIST数据集分类识别结果分析(不同方法识别对比率表及结果分析)。
      【手写数字识别】数据挖掘实验二_第1张图片

    • (4) 不同方法对HWDG数据集分类识别结果分析(不同方法识别率对比表及结果分析)。结果对比表如上表格式所示。

II、方法思想及实现原理陈述(20分)

算法思想和实现原理

数据集描述

  • MNIST是一个包含数字0~9的手写体图片数据集,图片已归一化为以手写数 字为中心的28*28规格的图片。
  • MNIST由训练集与测试集两个部分组成,各部分 规模如下:
    • 训练集:60,000个手写体图片及对应标签
    • 测试集:10,000个手写体图片及对应标签
      【手写数字识别】数据挖掘实验二_第2张图片

实验运行环境描述

不同方法对MNIST数据集分类识别结果分析(不同方法识别对比率表及结果分析)

III、实验结果分析(30分)

。。。。。。(按照项目任务要求详细分析实验结果)

IV、代码实现(50分)

。。。。。。(以附件形式上交,代码中关键行加注释)

V、小组分工及贡献比

你可能感兴趣的:(【数据科学与大数据技术】,数据挖掘,人工智能)