神经网络中的数据格式(很重要)

简介

神经网络只能识别数字,即int或float,我们的文本啊,图片啊,语音啊都要转化为相应的数字才能处理,我们针对不同的载体,每种类型的数字格式是不同的

数据格式

现实生活中的数据格式:

  • 结构化数据(数据表(班级名单、股票价格))
  • 非结构化数据(序列(文本)、图片、视频)

神经网络中可以使用的数据:

  • 数据表-2D——形状=(样本数、特征数)
    一般可以使用csv或者excel存储,样本数为行数,特征数为列数

  • 序列表-3D——形状=(样本数、步长、特征数)
    一般称为3D张量,通常用来表示文本。一段话(一个样本)一般在280以内,使用one-hot编码表示将1个数据变为128个数据,就得到了格式(1,280,128)
    神经网络中的数据格式(很重要)_第1张图片

  • 图像表-4D——形状=(样本数、宽、高、通道数)
    神经网络中的数据格式(很重要)_第2张图片

  • 视频类-5D——形状=(样本数、帧数、宽、高、通道数)
    神经网络中的数据格式(很重要)_第3张图片

你可能感兴趣的:(机器学习与深度学习,神经网络,深度学习,人工智能)