数据及数据特征

概念

  1. 数据的总体叫做数据集(datasets)
  2. 每行数据成为样本(sample)
  3. 除了最后一列, 每一列称为特征(feature)
  4. 最后一列称为标记(label)

以分号作为列向量的分隔如

(5.1; 3.5; 1.4; 0.2; 0) == (

5.1

3.5

1.4

0.2

0

)

label

 

特征

萼片长度

萼片宽度

花瓣长度

花瓣宽度

种类

5.1

3.5

1.4

0.2

Se(0)

7.0

3.2

4.7

1.4

Ve(1)

6.3

3.3

6

2.6

Vi(2)

 

特征向量X(5.1; 3.5; 1.4; 0.2; 0) 约定俗称为列向量

 

 

X 大写称为矩阵

y小写为向量

 

第i样本行X(i)  第i行第j个特征值为 X(i)j

 

数据及数据特征_第1张图片

特征空间(featrue space)

特征为坐标轴组成的空间坐标系

一般分析时, 特征空间为二维甚至一维

 

数据及数据特征_第2张图片

特征工程了解一下

 

28*28 灰度图

 

你可能感兴趣的:(机器学习,算法)